如何在 Python 中使用 TensorFlow 预处理 Fashion MNIST 数据?


TensorFlow 是 Google 提供的一个机器学习框架。它是一个开源框架,与 Python 结合使用可以实现算法、深度学习应用程序等等。它用于研究和生产目的。

可以使用以下代码行在 Windows 上安装 “tensorflow” 包:

pip install tensorflow

张量 (Tensor) 是 TensorFlow 中使用的一种数据结构。它有助于连接数据流图中的边。这个数据流图被称为“数据流图”。张量只不过是多维数组或列表。

“Fashion MNIST” 数据集包含各种服装的图像。它包含超过 7 万件属于 10 个不同类别的服装的灰度图像。这些图像是低分辨率的 (28 x 28 像素)。我们使用 Google Colaboratory 来运行以下代码。Google

Colab 或 Colaboratory 帮助在浏览器上运行 Python 代码,无需任何配置,并可免费访问 GPU(图形处理单元)。Colaboratory 建立在 Jupyter Notebook 之上。

以下是代码片段:

示例

plt.figure()
plt.imshow(train_images[0])
plt.colorbar()
plt.grid(False)
plt.show()

train_images = train_images / 255.0

test_images = test_images / 255.0

plt.figure(figsize=(12,12))
for i in range(15):
    plt.subplot(5,5,i+1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    plt.imshow(train_images[i], cmap=plt.cm.binary)
    plt.xlabel(class_names[train_labels[i]])
plt.show()

代码来源https://tensorflowcn.cn/tutorials/keras/classification

输出

解释

  • 在训练网络之前,需要预处理输入数据集。

  • 在检查图像并在控制台上显示后,可以确定像素值范围在 0 到 255 之间。

  • 首先将这些像素值缩放至 0 到 1 的范围。

  • 为此,将每个像素值除以 255。

  • 训练数据集和测试数据集必须以相同的方式进行预处理。

  • 这确保了在训练和评估期间提供相同类型的数据。

  • 为了确保数据格式正确,请在控制台上显示前几张图像以及每张图像所属的类别名称。

更新于:2021年1月20日

183 次浏览

开启你的职业生涯

完成课程获得认证

开始学习
广告
© . All rights reserved.