Python - HTTP 响应



HTTP 或超文本传输协议基于客户端-服务器模型。通常,Web 浏览器是客户端,托管网站的计算机是服务器。服务器在收到客户端的请求后,会生成响应并以特定格式将其发送回客户端。

服务器在接收和解释请求消息后,会以 HTTP 响应消息进行响应。

  • A Status-line
  • Zero or more header (General|Response|Entity) fields followed by CRLF
  • An empty line (i.e., a line with nothing preceding the CRLF) indicating the end of the header fields
  • Optionally a message-body

以下部分解释了 HTTP 响应消息中使用的每个实体。

消息状态行

状态行由协议版本、数字状态码及其关联的文本短语组成。这些元素用空格 SP 字符分隔。

Status-Line = HTTP-Version SP Status-Code SP Reason-Phrase CRLF

HTTP 版本

支持 HTTP 版本 1.1 的服务器将返回以下版本信息。

HTTP-Version = HTTP/1.1

状态码

状态码元素是一个 3 位整数,其中状态码的第一位定义了响应的类别,后两位没有任何分类作用。第一位有 5 个值。

序号 代码和描述
1 1xx: 信息性

表示请求已收到,并且处理仍在继续。

2 2xx: 成功

表示操作已成功接收、理解并接受。

3 3xx: 重定向

表示必须采取进一步的操作才能完成请求。

4 4xx: 客户端错误

表示请求包含语法错误或无法完成。

5 5xx: 服务器错误

表示服务器未能完成一个明显有效的请求。

HTTP 状态码是可扩展的,HTTP 应用程序不需要理解所有已注册状态码的含义。

使用 Python Requests

在下面的 Python 程序中,我们使用 urllib3 模块发出 HTTP GET 请求并接收包含数据的响应。它还提供响应代码,该代码也由模块中的函数管理。PoolManager 对象处理连接池的所有细节,并处理线程安全。

import urllib3
http = urllib3.PoolManager()

resp = http.request('GET', 'https://tutorialspoint.com/robots.txt')
print resp.data

# get the status of the response
print resp.status

运行上述程序后,我们得到以下输出:

User-agent: *
Disallow: /tmp
Disallow: /logs
Disallow: /rate/*
Disallow: /cgi-bin/*
Disallow: /videotutorials/video_course_view.php?*
Disallow: /videotutorials/course_view.php?*
Disallow: /videos/*
Disallow: /*/*_question_bank/*
Disallow: //*/*/*/*/src/*

200
广告