- Scrapy 教程
- Scrapy - 首页
- Scrapy 基本概念
- Scrapy - 概述
- Scrapy - 环境
- Scrapy - 命令行工具
- Scrapy - 爬虫 (Spiders)
- Scrapy - 选择器 (Selectors)
- Scrapy - 项目 (Items)
- Scrapy - 项目加载器 (Item Loaders)
- Scrapy - Shell
- Scrapy - 项目管道 (Item Pipeline)
- Scrapy - 数据导出 (Feed exports)
- Scrapy - 请求 & 响应 (Requests & Responses)
- Scrapy - 链接提取器 (Link Extractors)
- Scrapy - 设置
- Scrapy - 异常
- Scrapy 实战项目
- Scrapy - 创建项目
- Scrapy - 定义项目
- Scrapy - 第一个爬虫
- Scrapy - 爬取
- Scrapy - 提取项目
- Scrapy - 使用项目
- Scrapy - 跟踪链接
- Scrapy - 爬取数据
- Scrapy 有用资源
- Scrapy - 快速指南
- Scrapy - 有用资源
- Scrapy - 讨论
Scrapy - Web 服务
描述
运行中的 Scrapy 网络爬虫可以通过JSON-RPC进行控制。它由 `JSONRPC_ENABLED` 设置启用。此服务通过JSON-RPC 2.0协议提供对主爬虫对象的访问。访问爬虫对象的端点是:
https://127.0.0.1:6080/crawler
下表包含一些显示 Web 服务行为的设置:
序号 | 设置 & 描述 | 默认值 |
---|---|---|
1 | JSONRPC_ENABLED 这是一个布尔值,决定是否启用 Web 服务及其扩展。 |
True |
2 | JSONRPC_LOGFILE 这是用于记录发送到 Web 服务的 HTTP 请求的文件。如果未设置,则将使用标准的 Scrapy 日志。 |
None |
3 | JSONRPC_PORT 这是 Web 服务的端口范围。如果设置为 None,则端口将动态分配。 |
[6080, 7030] |
4 | JSONRPC_HOST 这是 Web 服务应监听的接口。 |
'127.0.0.1' |
广告