- Python——网络编程
- Python——网络简介
- Python——网络环境
- Python——因特网协议
- Python——IP 地址
- Python——DNS 查找
- Python——路由
- Python——HTTP 请求
- Python——HTTP 响应
- Python——HTTP 标头
- Python——自定义 HTTP 请求
- Python——请求状态代码
- Python——HTTP 身份验证
- Python——HTTP 数据下载
- Python——连接重用
- Python——网络接口
- Python——套接字编程
- Python——HTTP 客户端
- Python——HTTP 服务器
- Python——构建 URL
- Python——Web 表单提交
- Python——数据库和 SQL
- Python——Telnet
- Python——电子邮件消息
- Python——SMTP
- Python——POP3
- Python——IMAP
- Python——SSH
- Python——FTP
- Python——SFTP
- Python——Web 服务器
- Python——上传数据
- Python——代理服务器
- Python——目录列表
- Python——远程过程调用
- Python——RPC JSON 服务器
- Python——Google 地图
- Python——RSS 提要
Python——RSS 提要
RSS(富网站摘要)是用于传递定期更改的网络内容的一种格式。很多新闻相关网站、网络日志和其他在线发布者会以 RSS 提要的形式将他们的内容分发给需要的人。在 python 中,我们借助以下程序包来阅读和处理这些提要。
pip install feedparser
提要结构
在下面的示例中,我们获取提要的结构,以便我们可以进一步分析我们想处理的提要的哪些部分。
import feedparser NewsFeed = feedparser.parse("https://timesofindia.indiatimes.com/rssfeedstopstories.cms") entry = NewsFeed.entries[1] print entry.keys()
当我们运行上述程序时,我们会获得以下输出 -
['summary_detail', 'published_parsed', 'links', 'title', 'summary', 'guidislink', 'title_detail', 'link', 'published', 'id']
提要标题和帖子
在下面的示例中,我们读取 rss 提要的标题和头部。
import feedparser NewsFeed = feedparser.parse("https://timesofindia.indiatimes.com/rssfeedstopstories.cms") print 'Number of RSS posts :', len(NewsFeed.entries) entry = NewsFeed.entries[1] print 'Post Title :',entry.title
当我们运行上述程序时,我们会获得以下输出 -
Number of RSS posts : 5 Post Title : Cong-JD(S) in SC over choice of pro tem speaker
提要详情
根据上述条目结构,我们可以使用 python 程序从提要获取必要详情,如下所示。由于条目是一个字典,我们利用其键来生成所需的值。
import feedparser NewsFeed = feedparser.parse("https://timesofindia.indiatimes.com/rssfeedstopstories.cms") entry = NewsFeed.entries[1] print entry.published print "******" print entry.summary print "------News Link--------" print entry.link
当我们运行上述程序时,我们会获得以下输出 -
Fri, 18 May 2018 20:13:13 GMT ****** Controversy erupted on Friday over the appointment of BJP MLA K G Bopaiah as pro tem speaker for the assembly, with Congress and JD(S) claiming the move went against convention that the post should go to the most senior member of the House. The combine approached the SC to challenge the appointment. Hearing is scheduled for 10:30 am today. ------News Link-------- https://timesofindia.indiatimes.com/india/congress-jds-in-sc-over-bjp-mla-made-pro-tem-speaker-hearing-at-1030-am/articleshow/64228740.cms
广告