如何在 Python 中使用 TensorFlow 预处理 Fashion MNIST 数据?
TensorFlow 是 Google 提供的一个机器学习框架。它是一个开源框架,与 Python 结合使用可以实现算法、深度学习应用程序等等。它用于研究和生产目的。
可以使用以下代码行在 Windows 上安装 “tensorflow” 包:
pip install tensorflow
张量 (Tensor) 是 TensorFlow 中使用的一种数据结构。它有助于连接数据流图中的边。这个数据流图被称为“数据流图”。张量只不过是多维数组或列表。
“Fashion MNIST” 数据集包含各种服装的图像。它包含超过 7 万件属于 10 个不同类别的服装的灰度图像。这些图像是低分辨率的 (28 x 28 像素)。我们使用 Google Colaboratory 来运行以下代码。Google
Colab 或 Colaboratory 帮助在浏览器上运行 Python 代码,无需任何配置,并可免费访问 GPU(图形处理单元)。Colaboratory 建立在 Jupyter Notebook 之上。
以下是代码片段:
示例
plt.figure() plt.imshow(train_images[0]) plt.colorbar() plt.grid(False) plt.show() train_images = train_images / 255.0 test_images = test_images / 255.0 plt.figure(figsize=(12,12)) for i in range(15): plt.subplot(5,5,i+1) plt.xticks([]) plt.yticks([]) plt.grid(False) plt.imshow(train_images[i], cmap=plt.cm.binary) plt.xlabel(class_names[train_labels[i]]) plt.show()
代码来源 − https://tensorflowcn.cn/tutorials/keras/classification
输出


解释
在训练网络之前,需要预处理输入数据集。
在检查图像并在控制台上显示后,可以确定像素值范围在 0 到 255 之间。
首先将这些像素值缩放至 0 到 1 的范围。
为此,将每个像素值除以 255。
训练数据集和测试数据集必须以相同的方式进行预处理。
这确保了在训练和评估期间提供相同类型的数据。
为了确保数据格式正确,请在控制台上显示前几张图像以及每张图像所属的类别名称。
广告
数据结构
网络
关系数据库管理系统 (RDBMS)
操作系统
Java
iOS
HTML
CSS
Android
Python
C 语言编程
C++
C#
MongoDB
MySQL
Javascript
PHP