如何使用 Python 和 TensorFlow 下载并探索 Fashion MNIST 数据集?


TensorFlow 是 Google 提供的一个机器学习框架。它是一个开源框架,与 Python 结合使用,可以实现算法、深度学习应用程序等等。它用于研究和生产目的。

可以使用以下代码行在 Windows 上安装 ‘tensorflow’ 包:

pip install tensorflow

‘Fashion MNIST’ 数据集包含各种服装的图像。它包含超过 7 万件属于 10 个不同类别的服装的灰度图像。这些图像是低分辨率的 (28 x 28 像素)。

我们使用 Google Colaboratory 来运行以下代码。Google Colab 或 Colaboratory 帮助在浏览器上运行 Python 代码,无需任何配置,并可免费访问 GPU(图形处理单元)。Colaboratory 建立在 Jupyter Notebook 之上。

以下是代码:

示例

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt

print("The tensorflow version used is ")
print(tf.__version__)
print("The dataset is being loaded")
fashion_mnist = tf.keras.datasets.fashion_mnist
print("The dataset is being classified into training and testing data ")
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

print("The dimensions of training data ")          
print(train_images.shape)

print("The number of rows in the training data")
print(len(train_labels))

print("The column names of dataset")
print(train_labels)
print("The dimensions of test data ")          
print(test_images.shape)
print("The number of rows in the test data")
print(len(test_labels))

代码来源 https://tensorflowcn.cn/tutorials/keras/classification

输出

The tensorflow version used is
2.4.0
The dataset is being loaded
The dataset is being classified into training and testing data
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
32768/29515 [=================================] - 0s 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
26427392/26421880 [==============================] - 0s 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
8192/5148 [===============================================] - 0s 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz
4423680/4422102 [==============================] - 0s 0us/step
The dimensions of training data
(60000, 28, 28)
The number of rows in the training data
60000
The column names of dataset
[9 0 0 ... 3 0 5]
The dimensions of test data
(10000, 28, 28)
The number of rows in the test data
10000

解释

  • 导入了所需的包。

  • 确定正在使用的 TensorFlow 版本。

  • 加载 Fashion MNIST 数据集,可以直接从 TensorFlow 访问 Fashion MNIST 数据集。

  • 接下来,数据被分割成训练数据集和测试数据集。

  • 数据集总共有 70000 行,其中 60000 张图像用于训练,10000 张图像用于评估模型将图像分类到不同标签的学习效果。

  • 这是一个分类问题,其中数据集中的每张图像都分配了一个特定的标签。

  • 这些图像是服装,并为其分配了相应的标签。

  • 训练和测试数据集的行数、形状以及数据集的列名都显示在控制台上。

更新于:2021年1月20日

163 次查看

开启你的职业生涯

完成课程获得认证

开始学习
广告