- Scrapy 教程
- Scrapy - 首页
- Scrapy 基本概念
- Scrapy - 概述
- Scrapy - 环境
- Scrapy - 命令行工具
- Scrapy - 爬虫
- Scrapy - 选择器
- Scrapy - 项目
- Scrapy - 项目加载器
- Scrapy - Shell
- Scrapy - 项目管道
- Scrapy - 数据导出
- Scrapy - 请求 & 响应
- Scrapy - 链接提取器
- Scrapy - 设置
- Scrapy - 异常
- Scrapy 实时项目
- Scrapy - 创建项目
- Scrapy - 定义项目
- Scrapy - 第一个爬虫
- Scrapy - 爬取
- Scrapy - 提取项目
- Scrapy - 使用项目
- Scrapy - 跟踪链接
- Scrapy - 抓取数据
- Scrapy 有用资源
- Scrapy - 快速指南
- Scrapy - 有用资源
- Scrapy - 讨论
Scrapy - 项目
描述
Scrapy 过程可用于使用爬虫从网页等来源提取数据。Scrapy 使用Item 类生成输出,其对象用于收集抓取的数据。
声明项目
您可以使用类定义语法以及如下所示的字段对象来声明项目:
import scrapy class MyProducts(scrapy.Item): productName = Field() productLink = Field() imageURL = Field() price = Field() size = Field()
项目字段
项目字段用于显示每个字段的元数据。由于字段对象上的值没有限制,因此可访问的元数据键不包含元数据参考列表。字段对象用于指定所有字段元数据,并且您可以根据项目的要求指定任何其他字段键。字段对象可以通过 Item.fields 属性访问。
使用项目
在使用项目时,可以定义一些常用函数。有关更多信息,请点击此 链接。
扩展项目
可以通过声明原始项目的子类来扩展项目。例如:
class MyProductDetails(Product): original_rate = scrapy.Field(serializer = str) discount_rate = scrapy.Field()
您可以使用现有的字段元数据通过添加更多值或更改现有值来扩展字段元数据,如下面的代码所示:
class MyProductPackage(Product): name = scrapy.Field(Product.fields['name'], serializer = serializer_demo)
项目对象
项目对象可以使用以下类指定,该类根据给定参数提供新的初始化项目:
class scrapy.item.Item([arg])
Item 提供了构造函数的副本,并提供了一个额外的属性,该属性由字段中的项目给出。
字段对象
字段对象可以使用以下类指定,其中 Field 类不发出其他过程或属性:
class scrapy.item.Field([arg])
广告