当前位置：首页 > 工具软件 > Newspaper > 使用案例 >

newspaper3k遇到SSLError解决方案

戚锦

2023-12-01

使用newspaper3k爬取新闻网页的正常写法

article = Article(url, language="en")
article.download()
article.parse()

但是在爬取某些网站时会遇到SSLError的报错（代理问题）

解决方案是：

首先你需要有一个proxy IP，根据需要修改即可

proxies = {
    "http": "http://127.0.0.1:7890",
    "https": "http://127.0.0.1:7890",
}

将article.download()改用request方法，并带上上一步的proxies

article = Article(url, language="en")
html = request.get(url, verify=False, proxies=proxies)
article.set_html(html.text)
article.parse()

然后就可以顺利爬取到你想要的新闻网页了

类似资料：

相关阅读

Android webview 遇到android.os.FileUriExposedException错误解决办法 Android getBackground().setAlpha遇到问题解决办法 json解析时遇到英文双引号报错的解决方法 Swift 3中使用FMDB遇到的问题与解决方法 ubuntu14.04 使用中遇到的问题及解决方法集锦

相关文章

诺瓦星云解决方案面经华为解决方案测试面经经纬恒润-解决方案工程师荣耀1面解决方案测试面经联想解决方案产品经理面经

相关问答

如何解决Android Studio执行Gradle任务时遇到的问题？vue.js - 如何解决Vue脚手架安装时遇到的问题？mysql存储过程遇到问题，谁来看看怎么解决？macos - Tauri 应用提交到 Mac App Store 时遇到 CFBundleExecutable 错误怎么解决？找不到codingbat阵列挑战的解决方案

相关文档

与 TensorFlow 的初次相遇 HTTP2 讲解 LeetCode 题解图解 HTTP 理解 Linux 进程