Scrapy - 定义一个项目



说明

项目是用于收集从网站爬取数据的容器。你必须通过定义你的项目来启动你的爬虫。要定义项目,请编辑**first_scrapy**目录(自定义目录)下的items.py文件。items.py如下所示 −

import scrapy  

class First_scrapyItem(scrapy.Item): 
   # define the fields for your item here like: 
      # name = scrapy.Field()

MyItem类从scrapy已经为我们构建的Item继承,并且包含许多预定义对象。例如,如果你想要从网站中提取名称、网址和描述,你需要为这三个属性定义字段。

因此,让我们添加我们要收集的那些项目 −

from scrapy.item import Item, Field  

class First_scrapyItem(scrapy.Item): 
   name = scrapy.Field() 
   url = scrapy.Field() 
   desc = scrapy.Field() 
广告