- Scrapy 教程
- Scrapy - 首页
- Scrapy 基本概念
- Scrapy - 概述
- Scrapy - 环境
- Scrapy - 命令行工具
- Scrapy - 爬虫
- Scrapy - 选择器
- Scrapy - 项目
- Scrapy - 项目加载器
- Scrapy - Shell
- Scrapy - 项目管道
- Scrapy - 数据导出
- Scrapy - 请求 & 响应
- Scrapy - 链接提取器
- Scrapy - 设置
- Scrapy - 异常
- Scrapy 实时项目
- Scrapy - 创建项目
- Scrapy - 定义项目
- Scrapy - 第一个爬虫
- Scrapy - 爬取
- Scrapy - 提取项目
- Scrapy - 使用项目
- Scrapy - 跟踪链接
- Scrapy - 爬取数据
- Scrapy 有用资源
- Scrapy - 快速指南
- Scrapy - 有用资源
- Scrapy - 讨论
Scrapy - 异常
描述
不规则事件被称为异常。在 Scrapy 中,异常的发生原因包括配置缺失、从项目管道中丢弃项目等。以下是 Scrapy 中提到的异常及其应用列表。
DropItem
项目管道利用此异常在任何阶段停止处理项目。可以写成:
exception (scrapy.exceptions.DropItem)
CloseSpider
此异常用于使用回调请求停止爬虫。可以写成:
exception (scrapy.exceptions.CloseSpider)(reason = 'cancelled')
它包含一个名为 reason (str) 的参数,用于指定关闭的原因。
例如,以下代码展示了此异常的使用:
def parse_page(self, response): if 'Bandwidth exceeded' in response.body: raise CloseSpider('bandwidth_exceeded')
IgnoreRequest
此异常由调度器或下载器中间件用于忽略请求。可以写成:
exception (scrapy.exceptions.IgnoreRequest)
NotConfigured
它表示配置缺失的情况,应在组件构造函数中引发。
exception (scrapy.exceptions.NotConfigured)
如果以下任何组件被禁用,则可以引发此异常。
- 扩展
- 项目管道
- 下载器中间件
- 爬虫中间件
NotSupported
当任何功能或方法不受支持时,会引发此异常。可以写成:
exception (scrapy.exceptions.NotSupported)
广告