如何使用 Python 和 TensorFlow 下载并探索 Fashion MNIST 数据集?
TensorFlow 是 Google 提供的一个机器学习框架。它是一个开源框架,与 Python 结合使用,可以实现算法、深度学习应用程序等等。它用于研究和生产目的。
可以使用以下代码行在 Windows 上安装 ‘tensorflow’ 包:
pip install tensorflow
‘Fashion MNIST’ 数据集包含各种服装的图像。它包含超过 7 万件属于 10 个不同类别的服装的灰度图像。这些图像是低分辨率的 (28 x 28 像素)。
我们使用 Google Colaboratory 来运行以下代码。Google Colab 或 Colaboratory 帮助在浏览器上运行 Python 代码,无需任何配置,并可免费访问 GPU(图形处理单元)。Colaboratory 建立在 Jupyter Notebook 之上。
以下是代码:
示例
import tensorflow as tf import numpy as np import matplotlib.pyplot as plt print("The tensorflow version used is ") print(tf.__version__) print("The dataset is being loaded") fashion_mnist = tf.keras.datasets.fashion_mnist print("The dataset is being classified into training and testing data ") (train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data() class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot'] print("The dimensions of training data ") print(train_images.shape) print("The number of rows in the training data") print(len(train_labels)) print("The column names of dataset") print(train_labels) print("The dimensions of test data ") print(test_images.shape) print("The number of rows in the test data") print(len(test_labels))
代码来源 − https://tensorflowcn.cn/tutorials/keras/classification
输出
The tensorflow version used is 2.4.0 The dataset is being loaded The dataset is being classified into training and testing data Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz 32768/29515 [=================================] - 0s 0us/step Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz 26427392/26421880 [==============================] - 0s 0us/step Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz 8192/5148 [===============================================] - 0s 0us/step Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz 4423680/4422102 [==============================] - 0s 0us/step The dimensions of training data (60000, 28, 28) The number of rows in the training data 60000 The column names of dataset [9 0 0 ... 3 0 5] The dimensions of test data (10000, 28, 28) The number of rows in the test data 10000
解释
导入了所需的包。
确定正在使用的 TensorFlow 版本。
加载 Fashion MNIST 数据集,可以直接从 TensorFlow 访问 Fashion MNIST 数据集。
接下来,数据被分割成训练数据集和测试数据集。
数据集总共有 70000 行,其中 60000 张图像用于训练,10000 张图像用于评估模型将图像分类到不同标签的学习效果。
这是一个分类问题,其中数据集中的每张图像都分配了一个特定的标签。
这些图像是服装,并为其分配了相应的标签。
训练和测试数据集的行数、形状以及数据集的列名都显示在控制台上。
广告