当前位置：首页 > 面试题库 >

保存网页源代码的固有方式

邵逸明

2023-03-14

问题内容：

我已经阅读了很多有关Web抓取的答案，这些答案涉及BeautifulSoup，Scrapy等执行Web抓取的问题。

有没有办法从网络浏览器中保存页面的源代码呢？

也就是说，Python中是否有一种方法可以将其指向网站，并使其仅使用标准Python模块将页面的源代码保存到文本文件中？

这是我去的地方：

import urllib

f = open('webpage.txt', 'w')
html = urllib.urlopen("http://www.somewebpage.com")

#somehow save the web page source

f.close()

我知道的不多-但是正在寻找代码来实际提取页面的源代码，以便可以编写它。我收集到urlopen只是建立了连接。

也许有等效的readlines（）用于读取网页的行？

问题答案：

您可以尝试urllib2：

import urllib2

page = urllib2.urlopen('http://stackoverflow.com')

page_content = page.read()

with open('page_content.html', 'w') as fid:
    fid.write(page_content)

类似资料：

C#获取网页源代码的方法

本文向大家介绍C#获取网页源代码的方法，包括了C#获取网页源代码的方法的使用技巧和注意事项，需要的朋友参考一下本文实例讲述了C#获取网页源代码的方法。分享给大家供大家参考。具体如下：希望本文所述对大家的C#程序设计有所帮助。
获取网页源代码

<?php $http = HttpRequest::newSession(); $response = $http->get('http://www.baidu.com/'); $content = $response->body(); // 网页源码
Python Selenium-修改网页的源代码

问题内容：我正在使用Pythonselenium来自动化我的出勤记录。一切正常，现在我想尝试通过修改源代码来尝试。我见过几篇文章，指出可以使用它对其进行修改并且适用于JavaScript，但就我而言，我需要在标记下修改源代码。我可以使用修改源代码。以下是标签的源代码：我试图做到这一点。以下是我的代码：但是上面的代码给了我以下错误： selenium.common.exceptions.Web
Python selenium-修改网页的源代码

我正在使用Python selenium来自动化我的考勤输入。它的工作很好，现在我想尝试修改源代码。我看到很少的帖子说明可以使用修改它，并且它适用于JavaScript，但是在我的例子中，我需要修改标记下的源代码。我能够使用修改源代码。以下是标记的源代码：我尝试使用来实现。下面是我的代码：但上面的代码给了我以下错误： selenium.common.exceptions.WebDriverEx
使用Python和BeautifulSoup（将网页源代码保存到本地文件中）

问题内容：我正在使用Python 2.7 + BeautifulSoup 4.3.2。我正在尝试使用Python和BeautifulSoup在网页上获取信息。因为该网页位于公司网站中，并且需要登录和重定向，所以我将目标页面的源代码页面复制到一个文件中，并将其另存为C：\中的“ example.html”，以方便练习。这是原始代码的一部分：到目前为止，我得出的代码是：这只是测试的第一步，因
源代码应以UTF-8格式保存

问题内容：将您的源代码保存为UTF-8格式有多重要？ Windows上的Eclipse默认使用CP1252字符编码。CP1251格式意味着可以保存非UTF-8字符，并且如果您从Word文档中复制并粘贴以进行注释，我已经看到这种情况。我问的原因是因为出于习惯，我将Maven编码设置为UTF-8格式，最近它捕获了一些不可映射的错误。（更新）请添加执行此操作的任何原因以及为什么，应该知道一些常见的

相关阅读

python 获取网页编码方式实现代码 python保存网页图片到本地的方法如何保存完整的网页 Python解析网页源代码中的115网盘链接实例使用Python Selenium保存网页

相关文章

7.5.6 WebView处理网页返回的错误码信息 1.11 反编译APK获取代码&资源网页构成巨人网络，9.23笔试AK代码，C++Kafka源码的总览

相关问答

使用java代码获取完整的网页如何在android studio中保存代码保护Java源代码不被访问[关闭]有没有对齐/识别代码行的VS代码快捷方式？[副本]汇流宏的源代码

相关工具

openparty 网站源码获取网页的所有图片解析html网页的数据半月笔记网页版图片下载和保存

相关文档

uCore OS 实验指导书和源码网址代码整洁的 JavaScript 阅读 express 源码 Laravel 源码详解 Tendermint 源码分析