当前位置: 首页 > 面试题库 >

如何使用Python读取URL的内容?

云项禹
2023-03-14
问题内容

当我将其粘贴到浏览器中时,以下方法起作用:

http://www.somesite.com/details.pl?urn=2344

但是,当我尝试使用Python读取URL时,没有任何反应:

 link = 'http://www.somesite.com/details.pl?urn=2344'
 f = urllib.urlopen(link)           
 myfile = f.readline()  
 print myfile

我需要对URL进行编码,还是没有看到什么?


问题答案:

要回答您的问题:

import urllib

link = "http://www.somesite.com/details.pl?urn=2344"
f = urllib.urlopen(link)
myfile = f.read()
print(myfile)

您需要read(),而不是readline()

编辑(2018-06-25):自Python
3起,旧版urllib.urlopen()被替换为urllib.request.urlopen()(有关详细信息,请参阅https://docs.python.org/3/library/urllib.request.html#urllib.request.urlopen中的注释)


或者,只需在此处获取此库:http :
//docs.python-requests.org/en/latest/并认真使用它即可:)

import requests

link = "http://www.somesite.com/details.pl?urn=2344"
f = requests.get(link)
print(f.text)


 类似资料:
  • 问题内容: 当我卷曲到API调用链接时http://example.com/passkey=wedsmdjsjmdd 我以csv文件格式获取员工输出数据,例如: 如何使用python解析。 我试过了: 但它不起作用,我出现了一个错误 谢谢! 问题答案: 您需要替换为urllib.urlopen或urllib2.urlopen。 例如 这将输出以下内容 最初的问题被标记为“ python-2.x”,

  • 问题内容: 我正在尝试使用Node.js从URL中读取内容,但似乎只有一堆字节。我显然做错了事,但不确定。这是我目前拥有的代码: 任何见识将不胜感激。 问题答案: 尝试使用客户端的on错误事件来查找问题。

  • 我有上面的编码来提取使用硒 - 蟒蛇的href链接。我想提取每个人的个人资料“董事会成员”中的内容。我知道如何逐个提取它们,但不知道如何编写循环来执行此操作。 以下是我的代码: 任何想法都很感谢!

  • 问题内容: 和: 当我运行它时,我得到: 所以utf 无法正常工作,但是如果我返回编码的url:并粘贴在url栏中,我会正确地: 问题答案: 为您提供UTF-8字节序列,因此URLReader.read也为您提供UTF-8字节序列 但是您尝试在未指定编码器的情况下使用进行解码,即Java将使用您的系统默认编码进行解码(不是UTF-8) 尝试: 更新资料 这是我机器上的完整工作代码: 别忘了将\逃逸

  • 问题内容: 如何读取和处理DOCX文件中表格的每个单元格的内容? 我在Windows 7和PyWin32上使用Python 3.2来访问MS-Word文档。 我是一个初学者,所以我不知道访问表格单元格的正确方法。到目前为止,我只是这样做: 问题答案: 这是在Python 2.7中对我有效的方法: 要查看您的文档有多少张表: 然后,您可以通过索引选择所需的表。请注意,与python不同,COM索引从

  • 我写了一个简单的关于在客户端和服务器之间发送/接收消息的套接字教程。我使用DataOutputStream在流中写入字符串,但是如果我使用BufferedReader,服务器无法读取它 如果我使用PrintWriter来写(客户端),它可以工作。 这里怎么了?非常感谢。 1.客户: 2.服务器: