如何在 TensorFlow 中使用 Dataset.map 创建图像和标签对的数据集?


通过转换路径组件列表,然后将标签编码为整数格式来创建 (图像,标签) 对。‘map’ 方法有助于创建对应于 (图像,标签) 对的数据集。

阅读更多: 什么是 TensorFlow 以及 Keras 如何与 TensorFlow 协作创建神经网络?

我们将使用花卉数据集,其中包含数千朵花的图像。它包含 5 个子目录,每个类别都有一个子目录。

我们正在使用 Google Colaboratory 来运行以下代码。Google Colab 或 Colaboratory 帮助在浏览器上运行 Python 代码,无需任何配置即可免费访问 GPU(图形处理单元)。Colaboratory 建立在 Jupyter Notebook 之上。

print("The 'num_parallel_calls' is set so that multiple images are loaded and processed in parallel")
train_ds = train_ds.map(process_path, num_parallel_calls=AUTOTUNE)
val_ds = val_ds.map(process_path, num_parallel_calls=AUTOTUNE)

for image, label in train_ds.take(1):
   print("The shape of image is : ", image.numpy().shape)
   print("The label is : ", label.numpy())

输出

The 'num_parallel_calls' is set so that multiple images are loaded and processed in parallel
The shape of image is :   (180, 180, 3)
The label is :   0

代码来源:https://tensorflowcn.cn/tutorials/load_data/images

解释

  • 多个图像被同时加载和处理。
  • ‘map’ 方法用于创建包含 (图像,标签) 对的数据集。
  • 它被迭代,并且形状的维度和标签在控制台上显示。

更新于: 2021年2月19日

197 次查看

启动你的 职业生涯

通过完成课程获得认证

开始学习
广告