当前位置: 首页 > 面试题库 >

在Node.js / Express中,如何“下载”页面并获取其HTML?

史洛城
2023-03-14
问题内容

在代码内部,我想下载“
http://www.google.com”并将其存储在字符串中。我知道如何在python的urllib中做到这一点。但是,如何在Node.JS +
Express中做到这一点?


问题答案:

使用node.js,您可以只使用http.request方法

http://nodejs.org/docs/v0.4.7/api/all.html#http.request

此方法内置在节点中,您只需要http。

如果您只想执行GET,则可以使用http.get

http://nodejs.org/docs/v0.4.7/api/all.html#http.get

var options = {
  host: 'www.google.com',
  port: 80,
  path: '/index.html'
};

http.get(options, function(res) {
  console.log("Got response: " + res.statusCode);
}).on('error', function(e) {
  console.log("Got error: " + e.message);
});

(来自node.js文档的示例)

您还可以使用mikeal的请求模块

https://github.com/mikeal/request



 类似资料:
  • 问题内容: 我想获取使用表单从页面传递的数据,并在重定向的页面中使用该数据。 我的客户端有以下表​​格: 我的服务器中有这个脚本: 问题答案: 使用)中间件: 然后,表单值将在req.body上: 设置允许bodyParser接受包括嵌套对象在内的表单数据中的json之类的数据。例如,使用javascript发送而不是使用传统HTML格式发送的名称/值对。如果不需要,可以将扩展值设置为false。

  • 问题内容: 使用Selenium WebDriver for Java,是否可以在给定URL的情况下获取网页的HTML? 我知道,一旦在浏览器中加载了网页,就可以使用WebDriver.getPageSource()获得HTML。但是,为了提高效率,是否可以在不先将页面加载到浏览器中的情况下获取HTML? 问题答案: 您可以使用无头浏览器来实现。 无头浏览器是没有图形用户界面的Web浏览器。 该程

  • 问题内容: Python 是否有任何方法可以将整个页面及其内容( 图像,css )下载到给定URL的本地文件夹中。并更新本地html文件以选择本地内容。 问题答案: 您可以使用该模块下载单个URL,但这只会返回数据。它不会解析HTML并自动下载CSS文件和图像等内容。 如果要下载“整个”页面,则需要解析HTML并找到需要下载的其他内容。您可以使用Beautiful Soup之类的内容 来解析检索到

  • 我需要使用htmlUnit webDriver在不同页面中下载不同的文件。我在页面上循环,对于每个页面,我都单击输入字段以触发下载。对于第一次下载,我单击HtmlInputElement(提交按钮),它会将文件还给我。之后,HtmlPage变成了未预期的页面。检查UnexcpetedPage中的Web响应,我仍然发现文件已经下载。如何解决? 代码:[……]

  • //步骤1:创建文档-对象文档Document=new Document(); 提前道谢。

  • 问题内容: 我正在使用Express,它从静态目录加载AngularJS。通常,我会要求Express为其提供我和所有正确的Angular文件等。在我的Angular应用中,我有这些路由设置,它们替换了内容: 在我的主页上,我有到的链接,该链接将成功加载模板并将我定向到或指定的任何ID。问题是当我尝试将浏览器定向到页面或刷新页面时,请求将发送到Express / Node服务器,该服务器返回。 我