人工智能 tensorflow框架-->MNIST手写字符数据集 06

1.下载MNIST数据集:

 

 

2.1数据集分成两部分:60000行的训练集 trainxxx  (包含手写数字的图片imagexxx 和 手写数字对应的标签labelxxx)

                                     10000行的测试集 t10kxxx    (同上)

2.2分成以上两部分是因为在机器学习模型设计时必须有一个单独的测试数据集不用于训练而是用来评估这个模型的性能,从而更加容易把设计的模型推广到其他数据集上(泛化)。

2.3image每一张图片包含28X28个像素点,即每张图是28X28=784维向量空间里面的点

784

2.4在MNIST数据集中 trainxxx-imagesxxx文件是一个形状为【60000,784】的张量,第一个维度用来索引图片(共有60000个索引),第二个维度数字用来索引每张图片的像素点(共784个像素点)。在此张量里的每一个元素都表示某张图片里的某个像素的强度值,强度值介于0和1之间。

2.5label每一张标签的数字值对应手写图中的值,介于0到9的数字,数字n将表示成一个只有在第n维度(从0开始)数字为1的10维向量,比如标签0将表示成(【1,0,0,0,0,0,0,0,0,0】),因此trainxxx-labels文件是一个【60000,10】的数字矩阵。

 

posted @ 2017-10-26 19:05  imlvbu  阅读(984)  评论(0编辑  收藏  举报