当前位置: 首页 > 面试题库 >

如何保存完整的网页

吉玉宸
2023-03-14
问题内容

有什么方法可以使用WebDriver保存完整的网页吗?

当前,我执行getPageSource(),然后将所有内容放入html本地文件中,但是保存的页面的形状不好(奇怪的字符,没有图像,所有元素向下偏移)

请参阅以下我使用的代码:

   @Test
   public void testSomeThing(){
     FirefoxDriver driver = new FirefoxDriver();
     driver.get("http://google.com");
     String pageSource = driver.getPageSource();
     writeInFile(System.getProperty("user.dir")+"/target/logs/testPage.html", pageSource);
   }

   public static void writeInFile(String sFileName, String sTextToWrite){
         FileWriter outFile;
         General.sendComments("Write to file: " + sFileName);
         try {
                outFile = new FileWriter(sFileName);
                PrintWriter out = new PrintWriter(outFile);
                out.print(sTextToWrite);
                out.close();
         } catch (IOException e) {
                // TODO Auto-generated catch block
                e.printStackTrace();
         }
   }

有人可以建议我使用WebDriver在Firefox中保存完整网页的方法吗?例如自动?


问题答案:

奇怪的字符可能与写入文件的编码有关。

其他问题可能与以下事实有关:正在加载静态html文件,相对url不再指向该文件。所有的javascript,css和图片文件都将丢失。



 类似资料:
  • 问题内容: 我正在使用以下代码使用Python保存网页: 问题 :此代码将html保存为基本html,而不包含javascript,图像等。我想将网页保存为完整(就像我们在浏览器中有选择) 更新 :我现在正在使用以下代码保存webapge的所有js / images / css文件,以便可以将其保存为完整的网页,但是仍然像基本html一样保存了我的输出html: 问题答案: 尝试使用seleniu

  • 我想下载一个网页的完整html,我已经写了一些代码来做到这一点。然而,当我回头看下载的html时,我发现只有大约一半的html存在。我认为这是因为网页是动态的,当你与网页交互时,会加载更多的信息。我一直在尝试使用PhantomJS与ChromeDriver Manager协调一致地执行此操作,但运气不佳。这是只下载部分html的代码(我再次相信,因为页面是动态的): 这是我对PhantomJS的尝

  • 问题内容: 我刚刚开始学习数据库设计,并且我正在与Oracle 11G和SQL Developer一起工作。 我对数据库有以下3条业务规则: 每个官员必须注册一个并且只能注册一个保险公司。每个保险公司可以注册一名或多名官员 每个保险公司必须提供至少五种不同类型的保险类型。每种保险类型最多可以由4个保险公司提供,或者根本不提供 每个保险类型可以由一个或多个官员来订阅。每个官员最多可以订阅同一家公司提

  • 问题内容: 目前,我有一个只能下载给定页面的脚本。 现在我想 下载网页中的所有文件 ,包括,,和 图像文件 (同我们得到任何网站的CTRL-S)。 我当前的代码是: 我访问了许多问题,但它们都只下载了。 问题答案: 以下实现使您能够获取HTML子网站。为了获得您需要的其他文件,可以对其进行更完善的开发。我为您设置了变量,以设置要解析的最大sub_websites。 Python3版本,2019年。

  • 我想使用CarrierWave gem将我上传的图像的完整url保存在rails应用程序中。我在创建操作后更新条目,但它不起作用。然而,当我输入变量时,会出现完整的url,但它只保存标识符… 卡控制器,after_action方法: 我的卡型号: 我的完整日志: SQL(0.3ms)插入“卡片”(“letter_id”、“title”、“substitle”,“image_url”、“cta_bu

  • 嗨,我如何在Windows电脑上使用任何浏览器拍摄网页的完整屏幕截图? 每当我用PrintScreen截图时,它只截图显示页面,但我希望截图的高度为整页。我们能拍完整的截图吗,包括隐藏的八张? 抱歉我英语不好。 我有firefox和chrome。