当前位置: 首页 > 面试题库 >

如何使用Perl动态获取Web内容?

沈飞翼
2023-03-14
问题内容

这有点棘手。我猜有一个网页,它使用某种AJAX来基于搜索查询提取内容。当我使用Perl中的get来获取页面时,它将获取php /
html后面的脚本代码,但不会获取手动搜索查询时显示的结果。我需要能够获取结果页面的内容。无论如何,在Perl中有这样做吗?


问题答案:

看一下Selenium
RC
WWW::SeleniumPerl中的模块。使用它们,您可以控制真正的Web浏览器。

另一个选项是WWW::HtmlUnit使用HtmlUnit Java库在没有Web浏览器的情况下执行JavaScript。
WWW::HtmlUnit使用Inline :: Java授予Perl访问该库的权限。我发现在安装时,最好对“您是否要构建JNI扩展?”这个问题说不。



 类似资料:
  • 问题内容: 我想使用Python在这样的网页上抓取“正在寻找这些作者:”框中的内容:http : //academic.research.microsoft.com/Search?query=lander 不幸的是,盒子的内容是由JavaScript动态加载的。通常在这种情况下,我可以阅读Javascript来了解发生了什么,或者可以使用Firebug之类的浏览器扩展来了解动态内容的来源。这次没有

  • 问题内容: 我想用动态表创建Jasper报告。 例如: 用户1-5张桌子 用户2-3张桌子 用户3-6桌 我尝试使用列表选项,但是我的表不可见,并且页面数正在增加。 杰森数据。 是我的报表数据集,是列表数据,也是我要在表中显示的数据。 注意 如果我删除 并把 然后,使用空值创建两个表。 问题答案: 对主报表的查询将其保留为空白(并保留mainDataSet节点) 将字段定义为 该传递给 因此指向

  • 如何获取webcontent元数据类别 补充文章(长userId、长groupId、长folderId、长classNameId、长classPK、String articleId、boolean autoArticleId、双版本、地图标题图、地图描述图、字符串内容、字符串DDMSStructureKey、字符串ddmTemplateKey、字符串布局UUID、int-displayDateMo

  • 问题内容: 免责声明:我在StackOverflow上看到过许多其他类似的帖子,并尝试以相同的方式进行操作,但是它们似乎在此网站上不起作用。 我正在使用Python-Scrapy从koovs.com获取数据。 但是,我无法获得动态生成的产品尺寸。具体来说,如果有人可以引导我从此链接的下拉菜单中获取“不可用”尺寸标签,我将不胜感激。 我可以静态获取尺寸列表,但这样做只能得到尺寸列表,但不能获得其中的

  • 问题内容: 我正在尝试抓取一个网站,但我没有得到某些要素,因为这些要素是动态创建的。 我在node.js中使用了cheerio,下面是我的代码。 此代码返回空响应,因为加载页面时,该页面为空。 内容尚未添加。 如何使用node.js获取这些元素?如何抓取具有动态内容的页面? 问题答案: 干得好;

  • 问题内容: 我正在使用CKEditor。我使用页面方法使用ajax保存表单值。 但是CKEditor值的内容无法保存到表中。 我不回发页面。 我该怎么办? 问题答案: 首先,您应该在页面中包含ckeditor和jquery连接器脚本, 然后创建一个文本区域 将ckeditor附加到文本区域,在我的项目中,我使用如下代码: 提交时使用以下内容获取内容: 而已!:)