Fashion MNIST数据集简介
本人在编写tensorflow的期中测试之中,了解到Fashion MNIST数据集,在此做以简介,以供大家参考
前言
关于环境这里不再赘述:详细可以查看本人之前的博客:
安装tensorflow开发环境
了解Fashion-MNIST数据集
Fashion-MNIST数据集与MNIST手写数字数据集不一样。但他们都有共同点就是都是灰度图片。
Fashion-MNIST数据集是各类的服装图片总共10
类。下面列出了中英文对应表,方便接下来的学习。
中文 | 英文 |
---|---|
t-shirt | T恤 |
trouser | 牛仔裤 |
pullover | 套衫 |
dress | 裙子 |
coat | 外套 |
sandal | 凉鞋 |
shirt | 衬衫 |
sneaker | 运动鞋 |
bag | 包 |
ankle boot | 短靴 |
下载数据集
默认下载在C:\\Users\\用户\\.keras\\datasets
路径下。
mnist = tf.keras.datasets.fashion_mnist(train_x,train_y),(test_x,test_y) = mnist.load_data()
数据集分类
这里对从网上下载的数据集进行一个说明。
文件名 | 数据说明 |
---|---|
train_x | 训练数据图片集 |
train_y | 训练数据标签集 |
test_x | 测试数据图片集 |
test_y | 测试数据标签集 |
数据集格式
print("train_x的样本数",len(train_x))
print("train_y的样本数",len(train_y))
print("test_x的样本数",len(test_x))
print("test_y的样本数",len(test_y))print("train_x的形状",train_x.shape)
print("train_y的形状",train_y.shape)
print("test_x的形状",test_x.shape)
print("test_x的形状",test_y.shape)
训练数据集共60k张图片,各个服装类型的数据量一致也就是说每种6k。
测试数据集共10k张图片,各个服装类型的数据量一致也就是说每种100。
数据集均采用28281的灰度照片。
这些图像是28x28的NumPy数组,像素值在0到255之间。标签是一个整数数组,范围从0到9。这些与形象所代表的服装类别相对应