Fashion MNIST数据集简介

本人在编写tensorflow的期中测试之中,了解到Fashion MNIST数据集,在此做以简介,以供大家参考
前言
关于环境这里不再赘述:详细可以查看本人之前的博客:
安装tensorflow开发环境
了解Fashion-MNIST数据集
Fashion-MNIST数据集与MNIST手写数字数据集不一样。但他们都有共同点就是都是灰度图片。
Fashion-MNIST数据集是各类的服装图片总共10类。下面列出了中英文对应表,方便接下来的学习。
| 中文 | 英文 |
|---|---|
| t-shirt | T恤 |
| trouser | 牛仔裤 |
| pullover | 套衫 |
| dress | 裙子 |
| coat | 外套 |
| sandal | 凉鞋 |
| shirt | 衬衫 |
| sneaker | 运动鞋 |
| bag | 包 |
| ankle boot | 短靴 |
下载数据集
默认下载在C:\\Users\\用户\\.keras\\datasets路径下。
mnist = tf.keras.datasets.fashion_mnist(train_x,train_y),(test_x,test_y) = mnist.load_data()
数据集分类
这里对从网上下载的数据集进行一个说明。
| 文件名 | 数据说明 |
|---|---|
| train_x | 训练数据图片集 |
| train_y | 训练数据标签集 |
| test_x | 测试数据图片集 |
| test_y | 测试数据标签集 |
数据集格式
print("train_x的样本数",len(train_x))
print("train_y的样本数",len(train_y))
print("test_x的样本数",len(test_x))
print("test_y的样本数",len(test_y))print("train_x的形状",train_x.shape)
print("train_y的形状",train_y.shape)
print("test_x的形状",test_x.shape)
print("test_x的形状",test_y.shape)

训练数据集共60k张图片,各个服装类型的数据量一致也就是说每种6k。
测试数据集共10k张图片,各个服装类型的数据量一致也就是说每种100。
数据集均采用28281的灰度照片。
这些图像是28x28的NumPy数组,像素值在0到255之间。标签是一个整数数组,范围从0到9。这些与形象所代表的服装类别相对应


