- Python - 网络编程
- Python - 网络介绍
- Python - 网络环境
- Python - Internet 协议
- Python - IP 地址
- Python - DNS 查找
- Python - 路由
- Python - HTTP 请求
- Python - HTTP 响应
- Python - HTTP 标头
- Python - 自定义 HTTP 请求
- Python - 请求状态代码
- Python - HTTP 身份验证
- Python - HTTP 数据下载
- Python - 连接重用
- Python - 网络接口
- Python - 套接字编程
- Python - HTTP 客户端
- Python - HTTP 服务器
- Python - 构建 URL
- Python - WebFrom 提交
- Python - 数据库和 SQL
- Python - Telnet
- Python - 电子邮件信息
- Python - SMTP
- Python - POP3
- Python - IMAP
- Python - SSH
- Python - FTP
- Python - SFTP
- Python - Web 服务器
- Python - 数据上传
- Python - 代理服务器
- Python - 目录列表
- Python - 远程过程调用
- Python - RPC JSON 服务器
- Python - Google 地图
- Python - RSS 源
Python - 构建 URL
Requests 模块可以帮助我们构建 URL 并动态地操作 URL 值。可以以编程方式获取 URL 的任何子目录,然后用新值替换其中的一部分以构建新的 URL。
Build_URL
下面的示例使用 urljoin 获取 URL 路径中的不同子文件夹。urljoin 方法用于向基本 URL 中添加新值。
from requests.compat import urljoin base='https://stackoverflow.com/questions/3764291' print urljoin(base,'.') print urljoin(base,'..') print urljoin(base,'...') print urljoin(base,'/3764299/') url_query = urljoin(base,'?vers=1.0') print url_query url_sec = urljoin(url_query,'#section-5.4') print url_sec
当我们运行上述程序时,我们得到如下输出 −
https://stackoverflow.com/questions/ https://stackoverflow.com/ https://stackoverflow.com/questions/... https://stackoverflow.com/3764299/ https://stackoverflow.com/questions/3764291?vers=1.0 https://stackoverflow.com/questions/3764291?vers=1.0#section-5.4
拆分 URL
除了主地址外,还可以将 URL 拆分为很多部分。如下所示,附加的参数(用于特定查询或附加到 URL 上的标记)通过使用 urlparse 方法来拆分。
from requests.compat import urlparse url1 = 'https://docs.pythonlang.cn/2/py-modindex.html#cap-f' url2='https://docs.pythonlang.cn/2/search.html?q=urlparse' print urlparse(url1) print urlparse(url2)
当我们运行上述程序时,我们得到如下输出 −
ParseResult(scheme='https', netloc='docs.python.org', path='/2/py-modindex.html', params='', query='', fragment='cap-f') ParseResult(scheme='https', netloc='docs.python.org', path='/2/search.html', params='', query='q=urlparse', fragment='')
广告