当前位置：首页 > 工具软件 > Python feedparser > 使用案例 >

Python爬虫 - rss解析器feedparser

薛利

2023-12-01

本篇博客介绍一个利器，叫做feedparser，这个库使我们轻松实现从任何RSS或者Atom订阅源得到一些我们想要的内容。想对比原网页，rss返回的数据更简洁。另外，要注意，这个库只适用于支持rss的网站

一、安装

pip install feedparser

二、简单测试

测试链接为我的csdn博客rss订阅，测试的时候遇到了一个坑：可以看到下面代码中的链接是没有www.的，这样写在Windows上是没有问题的，但是在Linux(我的服务器为Centos7)上返回的会是一个空list，大家复制链接的时候一定要注意。

import feedparser

def rss():
    file = feedparser.parse('https://blog.csdn.net/weixin_44110998/rss/list')
    for i in file.entries:
    	print(i.title,'：',i.link)

说明：

返回的数据经过.entries处理后的结果是一个list；
list里是多个字典，每个字典就是每篇文章的一些主要内容（详情请运行上述代码）
直接使用字典获取value的方法即可，比如我想获取文章标题，只需要.title即可

类似资料：

相关阅读

Python并发爬虫常用实现方法解析 python爬虫常用的模块分析 python 中xpath爬虫实例详解 python并发爬虫实用工具tomorrow实用解析 python爬虫模拟登录人人网过程解析

相关文章

[实例]爬虫下载小说 [实例]爬虫抓取网页实战-Swing实现简单爬虫 Python爬虫实战：王者荣耀全套皮肤采集 XML 解析器

相关问答

python爬虫 - https认证如何用代码实现？小程序的爬虫能爬动态数据吗?PythonValueError:太多的值无法为爬虫程序解包 Python-Apache Tika单页解析器围棋之旅练习#10：爬虫

相关文档

Python 原生爬虫教程爬虫课件 Python 爬虫学习系列教程 WebMagic 爬虫框架中文文档宇润爬虫框架 Yurun Crawler 帮助文档