当前位置：首页 > 面试题库 >

使用Java代码获取完整的网页

车辰龙

2023-03-14

问题内容：

我想实现一个Java方法，该方法以URL作为输入并将整个网页（包括CSS，图像，JS（所有相关资源））存储在磁盘上。我已经使用Jsoup
html解析器来获取html页面。现在，我想实现的唯一选择是使用jsoup获取页面，现在解析html内容并将相对路径转换为绝对路径，然后再次请求获取javascript，图像等并将其保存在磁盘上。我还阅读了有关HTML清洁器，htmlunit解析器的信息，但我认为在所有这些情况下，我都必须解析html内容以获取图像，css和javascript文件。

任何建议，无论我在想正确与否。还是有任何简单的方法来完成此任务？

问题答案：

基本上，您可以使用Jsoup做到这一点：

 Document doc = Jsoup.connect("http://rabotalux.com.ua/vacancy/4f4f800c8bc1597dc6fc7aff").get();
         Elements links = doc.select("link");
         Elements scripts = doc.select("script");
        for (Element element : links) {
              System.out.println(element.absUrl("href"));
        }
        for (Element element : scripts) {
              System.out.println(element.absUrl("src"));
        }

等等，包括图片和所有相关资源。

但是， 如果您的站点使用javaScript创建了一些元素，则Jsoup将跳过它，因为它无法执行javaScript

类似资料：

使用java代码获取完整的网页

我想实现一个java方法，它将URL作为输入，并将包括css、图像、js(所有相关资源)在内的整个网页存储在我的磁盘上。我已经使用Jsoup html解析器来获取html页面。现在，我想实现的唯一选项是使用jsoup获取页面，现在解析html内容，将相对路径转换为绝对路径，然后发出另一个获取javascript、图像等的请求。并将它们保存在磁盘上。我也读过html cleaner和htmlunit
如何使用Selenium和Java获取完整网页的屏幕截图？

问题内容：如何使用Selenium WebDriver 拍摄整个网页的屏幕快照（全屏屏幕截图），而不仅仅是部分（从上到下）？我的代码：（ Java绑定）关于如何解决这个问题的任何想法？问题答案： LE：我看到很多人都对整页的截图感兴趣，所以我想我可能会用一些肯定的答案（银色子弹）来更新答案。有很多Web测试框架可以（只需最少的设置和工作）即可生成整页的屏幕截图。
使用Jsoup获取完整的HTML

我正在刮网页使用JSoup库通过选择类属性，其中包含"nav"字符串。这是获取网站超文本标记语言的代码：正如您所看到的，id=“varPreviewMenu”的ul元素包含Jsoup检索到的HTML不包含的li元素。我怎样才能得到那些元素？
从完整的网址获取域名

问题内容：假设有人输入这样的网址：我想返回：不这是我现在拥有的代码但这又回来了问题答案：检查下面的代码，它应该做的很好。
9.3.3 完整的代码

以下是完整的用户代理字符串检测脚本，包括检测呈现引擎、平台、Windows 操作系统、移动设备和游戏系统。 var client = function() { //呈现引擎 var engine = {ie: 0,gecko: 0,webkit: 0,khtml: 0,opera: 0,//完整的版本号ver: null }; //浏览器 var browser = {//主要浏览器ie: 0,f
获取网页源代码

<?php $http = HttpRequest::newSession(); $response = $http->get('http://www.baidu.com/'); $content = $response->body(); // 网页源码

相关阅读

C#获取网页源代码的方法哪里可以获得rt.jar的完整源代码？通过javascript通过ajax请求获取页面的完整html源代码获取PHP中的完整URL 从C＃网站获取HTML代码

相关文章

PHP 完整表单实例 Jackson-完整数据绑定巨人网络，9.23笔试AK代码，C++Java Eclipse如何调试代码 InnoDB的内存应用整体架构源码

相关问答

Java ArrayBlockingQueue获取源代码如何在Java中模拟LdapTemboard并获得完整的代码覆盖如何获取完整的内存使用统计信息使用php到javascript代码获取值如何获取Express中的完整url？

相关工具

获取网页的所有图片 openparty 网站源码 Google 眼镜的核心代码 PHP代码生成器 Google Glass 模板代码

相关文档

代码整洁的 JavaScript Android Gradle 用户指南（不完整）Effective Modern C++ 中文版（不完整）互联网 Java 工程师进阶知识完全扫盲 Nginx 开发从入门到精通（不完整）