当前位置: 首页 > 面试题库 >

获取浏览器呈现的html + javascript

钱星华
2023-03-14
问题内容

我需要一个命令行工具(或Javascript / PHP,但我认为命令行是一种方式)来进行渲染并获取URL的渲染内容,但是重要的是我不仅要渲染CSS /
Html / images,还要渲染Javascript。

例如,诸如“ renderengine http://www.google.es
outputfile.html”之类的命令和网络内容(已解析的html和javascript执行)都保存在outputfile.html中。

我需要这个,因为我需要获取像groshshark这样的完整javascript网站的结果,该网站使用javascript /
ajax加载所有内容,而抓取工具则什么也找不到,只有基本的HTML空模板(因为在使用ajax / javscript后加载)

是否存在支持Javascript(例如V8)的Linux浏览器引擎,该引擎输出结果以保存在文件中?


问题答案:

尝试从www.phantomjs.org访问phantomjs,您可以轻松地修改包含的rasterize.js来导出呈现的HTML。它基于webkit,并且可以对目标站点的javascript进行全面评估,从而允许您调整超时或根据需要首先执行自己的代码。我个人使用它来保存完全渲染的kickout.js模板的硬拷贝HTML文件版本。

它执行javascript,所以我只是做了类似的事情并将控制台输出保存到文件中:

var markup = page.evaluate(function(){return document.documentElement.innerHTML;});
console.log(markup);
phantom.exit();


 类似资料:
  • 有人能给出在“https://network.axial.net/a/company/business-team-san-francisco/”这样的网站上使用JSoup的正确方法吗?

  • 我试图在一些servlet和jsp之间添加一个过滤器,以便在显示jsp之前登录的用户。问题是,我试图检索浏览器的网址,这是转发到登录页面,但我找不到如何。我尝试在过滤器中获取URI,并将其作为请求的属性发送给Connexion servlet,但是,它不起作用。

  • 本文向大家介绍javascript 获取浏览器版本,包括了javascript 获取浏览器版本的使用技巧和注意事项,需要的朋友参考一下 工作中需要通过JS去获取当前使用的浏览器的名字以及版本号,网上大堆资料都有一个关键词是 navigator.appName,但是这个方法获取的浏览器的名字只有两种要么是IE要么就是Netscap,倒是可以用来判断是否使用了IE,但是我想获取具体的浏览器产品名字比如

  • 我想获得由Selenium启动的浏览器的PID。有什么办法能搞定吗?