当前位置：首页 > 面试题库 >

使用Python获取网页内容？

杜河

2023-03-14

问题内容：

我正在使用Python 3.1，如果有帮助的话。

无论如何，我正在尝试获取此网页的内容。我用Google搜索了一下，尝试了不同的方法，但是它们没有用。我猜想这应该是一件容易的事，但是…我做不到。：/。

urllib，urllib2的结果：

>>> import urllib2
Traceback (most recent call last):
  File "<pyshell#0>", line 1, in <module>
    import urllib2
ImportError: No module named urllib2
>>> import urllib
>>> urllib.urlopen("http://www.python.org")
Traceback (most recent call last):
  File "<pyshell#2>", line 1, in <module>
    urllib.urlopen("http://www.python.org")
AttributeError: 'module' object has no attribute 'urlopen'
>>>

谢谢杰森。：D。

import urllib.request
page = urllib.request.urlopen('http://services.runescape.com/m=hiscore/ranking?table=0&category_type=0&time_filter=0&date=1519066080774&user=zezima')
print(page.read())

问题答案：

由于您使用的是Python 3.1，因此需要使用新的Python 3.1
API
。

尝试：

urllib.request.urlopen('http://www.python.org/')

或者，看起来您正在使用Python 2示例。用Python 2编写，然后使用2to3工具进行转换。在Windows上，2to3.py位于\ python31
\ tools \ scripts中。别人可以指出在其他平台上可以找到2to3.py吗？

编辑

这些天来，我使用6编写了Python 2和3兼容的代码。

from six.moves import urllib
urllib.request.urlopen('http://www.python.org')

假设您已经安装了六个，并且可以在Python 2和Python 3上运行。

类似资料：

使用python刮取动态javascript内容网页

我试图刮这个网站：https://ec.europa.eu/research/mariecurieactions/how-to/find-job_en使用Python。首先，我注意到我感兴趣的表实际上位于以下url：https://ec.europa.eu/assets/eac/msca/jobs/import-jobs_en.htm 然而，请求BS4只给我超文本标记语言的页面源。我假设这是因为
Python-使用Python网页抓取JavaScript页面

问题内容：我正在尝试开发一个简单的网页抓取工具。我想提取没有代码的文本。我实现了这个目标，但是我发现在某些加载了的页面中，我没有获得良好的结果。例如，如果一些代码添加了一些文本，则看不到它，因为当我调用我得到的原始文本没有添加文本（因为在客户端执行了）。因此，我正在寻找一些解决此问题的想法。问题答案：一旦安装了，请确保二进制文件在当前路径中可用：例举个例子，我用以下HTML代码创建
如何使用套接字获取网页使用python

问题内容：我知道使用urllib2来获取网页很容易，但是我想知道是否有使用套接字实现获取网页功能的示例，我在Google上搜索了很多，我没有在其中找到任何示例，请问有什么帮助吗？问题答案：这是我鞭打的东西。它不会捕获异常来处理错误。青年汽车
Python下使用Scrapy爬取网页内容的实例

本文向大家介绍Python下使用Scrapy爬取网页内容的实例，包括了Python下使用Scrapy爬取网页内容的实例的使用技巧和注意事项，需要的朋友参考一下上周用了一周的时间学习了Python和Scrapy，实现了从0到1完整的网页爬虫实现。研究的时候很痛苦，但是很享受，做技术的嘛。首先，安装Python，坑太多了，一个个爬。由于我是windows环境，没钱买mac, 在安装的时候遇到各种各
使用Python进行网页抓取

问题内容：我想从网站上获取每天的日出/日落时间。是否可以使用Python抓取网络内容？使用什么模块？有没有可用的教程？问题答案：结合使用urllib2和出色的BeautifulSoup库：
使用Python抓取多个网页

我想刮从多个网站与类似的网址的，如https://woollahra.ljhooker.com.au/our-team, https://chinatown.ljhooker.com.au/our-team和https://bondibeach.ljhooker.com.au/our-team. 我已经写了一个脚本，第一个网站的工作，但我不知道如何告诉它从其他两个网站刮。我的代码：有没有一种方

相关阅读

使用PhantomJS获取JSON页面内容 Python requests获取网页常用方法解析使用Python请求获取HEAD内容 ios 获取或修改网页上的内容使用python和selenium抓取动态网页

相关文章

Python input()函数：获取用户输入的字符串 Python traceback模块：获取异常信息 7.5.1 WebView(网页视图)基本用法 Selenium WebDriver滚动网页审查网页元素

相关问答

使用java代码获取完整的网页使用selenium python网页驱动滚动网页无法使用JSoup获取页面的完整内容使用Python从多个网页中提取日期使用python LXML从html网页中提取信息

相关工具

获取网页的所有图片 Eclipse搜索引擎网页应用接口半月笔记网页版解析html网页的数据飞岩走壁网页游戏

相关文档

网页安全配色手册机器学习：使用 Python MIP 移动网页加速器开发文档物联网应用开发 IoT Studio 使用指南 Python 取证中文教程