当前位置：首页 > 工具软件 > Requests-HTML > 使用案例 >

requests-html库初识 + 无资料解BUG之 I/O error : encoder error，Python爬虫第30例

吕德惠

2023-12-01

本篇博客是《爬虫 120 例》的第 30 例，新学习一个爬虫框架 requests-html，该框架作者就是 requests 的作者，所以盲猜就很好用啦。

知识铺垫工作

requests-html 模块安装使用 pip install requests-html 即可，官方手册查询地址：https://requests-html.kennethreitz.org/，官方并没有直接的中文翻译，在检索过程中，确实发现了一版中文手册，在文末提供。

先看一下官方对该库的基本描述：

Full JavaScript support!（完全支持 JS，这里手册还重点标记了一下，初学阶段可以先忽略）
CSS Selectors (a.k.a jQuery-style, thanks to PyQuery).（集成了 pyquery 库，支持 css 选择器）
XPath Selectors, for the faint at heart.（支持 XPath 选择器）
Mocked user-agent (like a real web browser).（mock UA 数据，这点不错）
Automatic following of redirects.（自动跟踪重定向）
Connec

类似资料：

相关阅读

python爬虫beautifulsoup库使用操作教程全解(python爬虫基础入门)python爬虫基于requests模块的get请求实现详解 Python使用requests及BeautifulSoup构建爬虫实例代码 python爬虫之xpath的基本使用详解 Python基于BeautifulSoup和requests实现的爬虫功能示例

相关文章

[实例]爬虫下载小说 [实例]爬虫抓取网页网络爬虫是什么实战-Swing实现简单爬虫 Python爬虫实战：王者荣耀全套皮肤采集

相关问答

javacv 资料?网络爬虫 - 如何解决爬虫切片时只能获取单个数据项的问题?python爬虫 - https认证如何用代码实现？小程序的爬虫能爬动态数据吗?python - 爬虫requests.get无限刷新加载，呈现卡死特征，如何处理？

相关文档

Python 原生爬虫教程爬虫课件 Python 爬虫学习系列教程 WebMagic 爬虫框架中文文档初识 Spring Security