- PyTorch 教程
- PyTorch - 主页
- PyTorch - 简介
- PyTorch - 安装
- 神经网络的数学构建块
- PyTorch - 神经网络基础知识
- 机器学习的通用工作流
- 机器学习与深度学习
- 实现第一个神经网络
- 神经网络到功能块
- PyTorch - 术语
- PyTorch - 加载数据
- PyTorch - 线性回归
- PyTorch - 卷积神经网络
- PyTorch - 循环神经网络
- PyTorch - 数据集
- PyTorch - 卷积简介
- 从头开始训练卷积
- PyTorch - 卷积中的特征提取
- PyTorch - 卷积的可视化
- 使用卷积处理序列
- PyTorch - 词嵌入
- PyTorch - 递归神经网络
- PyTorch 有用资源
- PyTorch - 快速指南
- PyTorch - 有用资源
- PyTorch - 讨论
PyTorch - 加载数据
PyTorch 包含一个名为 TorchVision 的包,用于加载和准备数据集。它包含两个基本函数,分别是 Dataset 和 DataLoader,可帮助转换和加载数据集。
数据集
数据集用于读取和转换给定数据集中的数据点。实现的基本语法如下所示 −
trainset = torchvision.datasets.CIFAR10(root = './data', train = True, download = True, transform = transform)
DataLoader 用于混洗和批处理数据。它可以用于并行加载具有多进程工作程序的数据。
trainloader = torch.utils.data.DataLoader(trainset, batch_size = 4, shuffle = True, num_workers = 2)
示例: 加载 CSV 文件
我们使用 Python 包 Panda 加载 csv 文件。原始文件具有以下格式:(图像名称、68 个地标 - 每个地标都有 x、y 坐标)。
landmarks_frame = pd.read_csv('faces/face_landmarks.csv') n = 65 img_name = landmarks_frame.iloc[n, 0] landmarks = landmarks_frame.iloc[n, 1:].as_matrix() landmarks = landmarks.astype('float').reshape(-1, 2)
广告