天天看点

TensorFlow.NET机器学习入门【5】采用神经网络实现手写数字识别(MNIST)

 从这篇文章开始,终于要干点正儿八经的工作了,前面都是准备工作。这次我们要解决机器学习的经典问题,MNIST手写数字识别。

首先介绍一下数据集。请首先解压:TF_Net\Asset\mnist_png.tar.gz文件

 文件夹内包括两个文件夹:training和validation,其中training文件夹下包括60000个训练图片validation下包括10000个评估图片,图片为28*28像素,分别放在0~9十个文件夹中。

程序总体流程和上一篇文章介绍的BMI分析程序基本一致,毕竟都是多元分类,有几点不一样。

1、BMI程序的特征数据(输入)为一维数组,包含两个数字,MNIST的特征数据为28*28的二位数组;

2、BMI程序的输出为3个,MNIST的输出为10个;

网络模型构建如下:

这个网络里用到了两个新方法,需要解释一下:

1、Flatten方法:这里表示拉平,把28*28的二维数组拉平为含784个数据的一维数组,因为二维数组无法进行运算;

2、Rescaling 方法:就是对每个数据乘以一个系数,因为我们从图片获取的数据为每一个位点的灰度值,其取值范围为0~255,所以乘以一个系数将数据缩小到1以内,以免后面运算时溢出。

其它基本和上一篇文章介绍的差不多,全部代码如下:

TensorFlow.NET机器学习入门【5】采用神经网络实现手写数字识别(MNIST)
TensorFlow.NET机器学习入门【5】采用神经网络实现手写数字识别(MNIST)

View Code

另有两点说明:

1、由于对图片的读取比较耗时,所以我采用了一个方法,就是把读取到的数据序列化到一个二进制文件中,下次直接从二进制文件反序列化即可,大大加快处理速度。

2、我没有采用validation图片进行评估,只是简单选了20个样本测试了一下。

【相关资源】

 源码:Git: https://gitee.com/seabluescn/tf_not.git

项目名称:NN_MultipleClassification_MNIST

目录:查看TensorFlow.NET机器学习入门系列目录

签名区:

如果您觉得这篇博客对您有帮助或启发,请点击右侧【推荐】支持,谢谢!

继续阅读