如何使用TensorFlow和预训练模型构建训练和验证数据集？

可以使用TensorFlow和预训练模型，借助`image_dataset_from_directory`方法构建训练和验证数据集。此方法将批次大小、图像大小以及是否需要混洗作为参数，分别用于训练数据或验证数据。

我们将了解如何利用来自预训练网络的迁移学习来对猫和狗的图像进行分类。

图像分类迁移学习背后的直觉是，如果一个模型是在大型通用数据集上训练的，那么这个模型可以有效地作为视觉世界的通用模型。它已经学习了特征映射，这意味着用户不必从头开始，在大型数据集上训练大型模型。

我们使用Google Colaboratory运行以下代码。Google Colab或Colaboratory帮助在浏览器上运行Python代码，无需任何配置，并可免费访问GPU（图形处理单元）。Colaboratory构建在Jupyter Notebook之上。

示例

print("Training dataset")
train_dataset = image_dataset_from_directory(train_dir,
   shuffle=True,
   batch_size=BATCH_SIZE,
   image_size=IMG_SIZE)
print("Validation dataset")
validation_dataset = image_dataset_from_directory(validation_dir,
shuffle=True,
batch_size=BATCH_SIZE,
image_size=IMG_SIZE)

代码来源 −https://tensorflowcn.cn/tutorials/images/transfer_learning

输出

Training dataset
Found 2000 files belonging to 2 classes.
Validation dataset
Found 1000 files belonging to 2 classes.

解释

训练和验证数据集是使用下载的猫和狗图像构建的。

AmitDiwan

更新于：2021年2月25日

137 次浏览

启动您的职业生涯

完成课程获得认证

开始学习