- Scrapy 教程
- Scrapy - 主页
- Scrapy 基本概念
- Scrapy - 综述
- Scrapy - 环境
- Scrapy - 命令行工具
- Scrapy - 爬虫
- Scrapy - 选择器
- Scrapy - 项目
- Scrapy - 项目加载器
- Scrapy - Shell
- Scrapy - 项目管道
- Scrapy - Feed 导出
- Scrapy - 请求和响应
- Scrapy - 链接提取器
- Scrapy - 设置
- Scrapy - 异常
- Scrapy 实时项目
- Scrapy - 创建项目
- Scrapy - 定义一个项目
- Scrapy - 第一个爬虫
- Scrapy - 爬取
- Scrapy - 提取项目
- Scrapy - 使用项目
- Scrapy - 关注链接
- Scrapy - 爬取的数据
- Scrapy 有用资源
- Scrapy - 快速指南
- Scrapy - 有用资源
- Scrapy - 讨论
Scrapy - 定义一个项目
说明
项目是用于收集从网站爬取数据的容器。你必须通过定义你的项目来启动你的爬虫。要定义项目,请编辑**first_scrapy**目录(自定义目录)下的items.py文件。items.py如下所示 −
import scrapy class First_scrapyItem(scrapy.Item): # define the fields for your item here like: # name = scrapy.Field()
MyItem类从scrapy已经为我们构建的Item继承,并且包含许多预定义对象。例如,如果你想要从网站中提取名称、网址和描述,你需要为这三个属性定义字段。
因此,让我们添加我们要收集的那些项目 −
from scrapy.item import Item, Field class First_scrapyItem(scrapy.Item): name = scrapy.Field() url = scrapy.Field() desc = scrapy.Field()
广告