当前位置: 首页 > 面试题库 >

我可以使用Watir在没有监视器的情况下从Linux服务器上的网站抓取数据吗?

郏博瀚
2023-03-14
问题内容

我可以使用Watir从不带监视器的Linux服务器上的网站(使用AJAX)上抓取数据吗?(linode.com)?


问题答案:

做这件事有很多种方法:

  1. 使用HtmlUnit或Celerity或watir-webdriver(通过远程Selenium2 / WebDriver服务器)。

  2. 使用真实的浏览器+虚拟X服务器(Xvfb)。我建议使用watir-webdriver的Firefox驱动程序和Headless gem,这是从Ruby控制它的简单方法。

这基本上是速度和现实之间的权衡。如果网站有任何复杂的JavaScript或无效的HTML,我个人将使用#2,但是两种方法都值得研究。

对于未来,我一直在关注这个项目,这看起来像一个很棒的主意。



 类似资料:
  • 我不想再使用powermock了。因为junit5开始模拟静态类。因此,我试图摆脱powermock方法。 当我使用PowerMock时,我可以很容易地发现一个具有私有构造函数的类,然后我调用静态方法。 这是我代码的一部分(当我使用PowerMock时) 在我做了MessageValidationUtils.class的间谍对象后,我正在测试这个: 经过一些研究,我找不到任何与监视一个具有私有构造

  • 问题内容: 我正在尝试创建一个与SurveyMonkey API交互的基于Java的本地客户端。 SurveyMonkey需要使用OAuth 2.0的长期访问令牌,我对此不太熟悉。 我已经搜索了几个小时,但我认为答案是否定的,但我只想确定一下: 我是否可以编写一个与SurveyMonkey交互的简单Java客户端, 而无需在某些云中设置自己的重定向服务器 ? 我觉得必须拥有自己的在线服务才能接收O

  • 问题内容: 是否有可用的Tomcat API或配置可以告诉应用程序(可能在启动时)在没有请求的情况下在哪个端口上运行? 想象一个场景,其中有两个Web应用程序在同一个Tomcat中运行,并且其中一个需要从另一个中调用Web服务。我们不希望该请求离开Tomcat(如果您使用Apache服务器名称或绝对URL,则该请求将发出并再次返回,并且可以转到任何实例)并再次进入。为此,我知道机器名称,但无法获取

  • 问题内容: 我想问一下我是否可以在没有安装Web服务器的情况下运行php。我是否必须像CGI一样使用php并通过命令行运行我的页面?如果是这样,我必须通过安装php选择哪些步骤?我是说偏好设置为CGI以及该步骤之后的组件? 我安装了php 5.3.3,但似乎无法正常工作,我收到几则消息,提示缺少php5ts.dll,当我将该文件放在ext文件夹中时,会出现其他错误消息。是否需要使用任何配置文件或步

  • 问题内容: 好的,现在我真的负担不起任何服务的费用。我希望能够使用租用的服务器(基于Linux)拍摄屏幕截图,并将其输出到屏幕上。 我知道有很多服务可以执行此操作,但是它们通常都有限制或水印,或者您必须等待从队列中获取屏幕截图。 有什么办法可以自己截取屏幕截图,然后稍后再缓存它们或其他内容吗?我使用的是PHP,但不仅限于此。我只是在Linux服务器上,所以GD的适当功能无法正常工作。帮帮我!:)

  • 问题内容: 我需要执行以下查询(例如): 出于安全原因,我的客户不允许我创建链接服务器。我执行该查询所依据的用户可以访问两个表。是否可以在不使用链接服务器的情况下使其工作?谢谢。 问题答案: 您可以使用OPENROWSET,它需要连接信息,用户名和密码… 尽管我了解客户认为与他们的数据保持永远在线的连接存在风险,但这就是您锁定帐户的原因。OPENROWSET表示以纯文本形式包含连接信息。