如何在 TensorFlow 中使用 Dataset.map 创建图像和标签对的数据集?
通过转换路径组件列表,然后将标签编码为整数格式来创建 (图像,标签) 对。‘map’ 方法有助于创建对应于 (图像,标签) 对的数据集。
阅读更多: 什么是 TensorFlow 以及 Keras 如何与 TensorFlow 协作创建神经网络?
我们将使用花卉数据集,其中包含数千朵花的图像。它包含 5 个子目录,每个类别都有一个子目录。
我们正在使用 Google Colaboratory 来运行以下代码。Google Colab 或 Colaboratory 帮助在浏览器上运行 Python 代码,无需任何配置即可免费访问 GPU(图形处理单元)。Colaboratory 建立在 Jupyter Notebook 之上。
print("The 'num_parallel_calls' is set so that multiple images are loaded and processed in parallel") train_ds = train_ds.map(process_path, num_parallel_calls=AUTOTUNE) val_ds = val_ds.map(process_path, num_parallel_calls=AUTOTUNE) for image, label in train_ds.take(1): print("The shape of image is : ", image.numpy().shape) print("The label is : ", label.numpy())
输出
The 'num_parallel_calls' is set so that multiple images are loaded and processed in parallel The shape of image is : (180, 180, 3) The label is : 0
代码来源:https://tensorflowcn.cn/tutorials/load_data/images
解释
- 多个图像被同时加载和处理。
- ‘map’ 方法用于创建包含 (图像,标签) 对的数据集。
- 它被迭代,并且形状的维度和标签在控制台上显示。
广告