除此之外的所有站点都在解析,但是这里有大约10秒的延迟,
import urllib.request
from bs4 import BeautifulSoup
def get_html(url):
response = urllib.request.urlopen(url)
return response.read()
def main():
print(get_html('http://bashinform.ru/news/'))
if __name__ == '__main__':
main()
发生以下错误:
Traceback(最近一次调用last):文件“D:\ Timur \ OpenServer \ domains \ Parser \ Parser . py”,第13行,main()文件“D:\ Timur \ OpenServer \ domains \ Parser \ Parser . py”,第9行,main print(get _ html(' bashin form . ru/news '))文件“D:\ Timur \ OpenServer \ domains \ Parser \ Parser . py”,第5行,get _ html response = URL lib . request . urloopen(URL)文件“C: \ Users \ 1 \ AppData urllib \ request.py”,第223行,在urlopen返回opener.open (url,data,timeout)文件“C:\ Users \ 1 \ AppData \ Local \ Programs \ Python \ Python 36-32 \ lib \ urllib \ request . py”,第526行,在open response = self。 _open (req,data)文件“C:\ Users \ 1 \ AppData \ Local \ Programs \ Python \ Python 36-32 \ lib \ URL lib \ request . py”,第544行,in _open '_open ',req)文件“C:\ Users \ 1 \ AppData \ Local \ Programs \ Python \ Python \ Python 36-32 \ lib \ URL lib \ request . py”,第504行,in _call_chain result = func (* args)文件“C:\ Users \ 1 \ AppData \ Local \ Programs \ Python \ Python urllib \ request.py”,第1346行,在http_open返回self . do _ open(http . client . http connection,req)文件“C:\ Users \ 1 \ AppData \ Local \ Programs \ Python \ Python 36-32 \ lib \ URL lib \ request . py”,第1321行,在do_open r = h.getresponse()文件“C:\ Users \ 1 \ AppData \ Local \ Programs \ Python \ Python 36-32 \ lib \ http \ client . py”中 _read_status()文件“C:\ Users \ 1 \ AppData \ Local \ Programs \ Python \ Python 36-32 \ lib \ http \ client . py”,第258行,in _ read _ status line = str(self . FP . readline(_ max line 1),“iso-8859-1”)文件“C:\ Users \ 1 \ AppData \ Local \ Programs \ Python \ Python 36-32 \ lib \ socket . py”,第586行,in readinto返回self。_ sock . recv _ into(b)time out error:[WinError 10060]尝试连接不成功,因为在要求的时间内从另一台计算机没有收到所需的响应,或者已经建立的连接因已经连接的计算机的错误响应而中断[在19.5秒内完成]
错误 WinError 10060
表示您无法成功连接到主机。当我尝试在浏览器中访问该网站时,浏览器会在 url 前面加上 www
(您的 python 代码不会自动执行此操作)。尝试将网址更改为 http://www.bashinform.ru/news/
(包括 www
)。
您应该使用请求模块
import random
import requests
agents = [
'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko)',
'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko)']
headers = {"User-Agent":random.choice(agents)}
url = "http://bashinform.ru/news/"
response = requests.get(url,headers=headers)
print(response.text)
'<!doctype html>\n<html lang="ru">\n........
问题内容: 前三行工作正常。当我再次尝试将字符串解析为日期时,出现错误。我该如何解决? 错误看起来像这样: 问题答案: 为我工作。在模式末尾使用“ SSSZ”而不是“ SZ”。
错误:第 1 行的解析错误:函数搜索(sour ^ 期望“字符串”、“数字”、“空”、“真”、“假”、“{”、“[”,得到“未定义” 代码:
我实现了以下REST调用: 也是一个提供和使用application/x-protobuf的提供者类: 我的pom。xml看起来像: 我的小部件。原型: 选项java_package=“example”;选项java\u outer\u classname=“WidgetsProtoc”; 对于http://localhost:8080/RESTfulExample/widgets我得到以下错误消
问题内容: 我已经阅读了 为什么在尝试在数据库中加载Blob时会出现java.lang.AbstractMethodError?,下载了我能找到的所有11g jdbc驱动程序,并将它们作为库和/或jar文件添加到了我的NetBeans应用程序中。我仍然不断收到相同的AbstractMethodError,这让我很生气!任何指导将不胜感激! 错误信息: 问题答案: 问题的原因是软件不兼容(jar文件
问题内容: 我正在尝试解析一个字符串,但是很不幸,去的月份不正确(一月而不是六月) 玩 问题答案: 问题是您的时区偏移在布局中定义不正确:参考偏移为。您将定义为,因此将被解释为月份,并删除先前定义的月份。并且由于您的工作偏移也将被分析为一月。 以下示例适用于我的游乐场
当我试图从netbean部署我的web应用程序时,我得到以下错误: 那是什么?为什么我会犯这个错误? 以下是来自的代码片段: 以下是netbeans服务器设置中的快照: