当前位置：首页 > 面试题库 >

在Node.js / Express中，如何“下载”页面并获取其HTML？

史洛城

2023-03-14

问题内容：

在代码内部，我想下载“
http://www.google.com”并将其存储在字符串中。我知道如何在python的urllib中做到这一点。但是，如何在Node.JS +
Express中做到这一点？

问题答案：

使用node.js，您可以只使用http.request方法

http://nodejs.org/docs/v0.4.7/api/all.html#http.request

此方法内置在节点中，您只需要http。

如果您只想执行GET，则可以使用http.get

http://nodejs.org/docs/v0.4.7/api/all.html#http.get

var options = {
  host: 'www.google.com',
  port: 80,
  path: '/index.html'
};

http.get(options, function(res) {
  console.log("Got response: " + res.statusCode);
}).on('error', function(e) {
  console.log("Got error: " + e.message);
});

（来自node.js文档的示例）

您还可以使用mikeal的请求模块

https://github.com/mikeal/request

类似资料：

如何从Express（Node.js）中的表单获取数据

问题内容：我想获取使用表单从页面传递的数据，并在重定向的页面中使用该数据。我的客户端有以下表格：我的服务器中有这个脚本：问题答案：使用）中间件：然后，表单值将在req.body上：设置允许bodyParser接受包括嵌套对象在内的表单数据中的json之类的数据。例如，使用javascript发送而不是使用传统HTML格式发送的名称/值对。如果不需要，可以将扩展值设置为false。
Java Selenium：如何在不首先加载页面的情况下获取网页的HTML？

问题内容：使用Selenium WebDriver for Java，是否可以在给定URL的情况下获取网页的HTML？我知道，一旦在浏览器中加载了网页，就可以使用WebDriver.getPageSource（）获得HTML。但是，为了提高效率，是否可以在不先将页面加载到浏览器中的情况下获取HTML？问题答案：您可以使用无头浏览器来实现。无头浏览器是没有图形用户界面的Web浏览器。该程
下载HTML页面及其内容

问题内容： Python 是否有任何方法可以将整个页面及其内容（图像，css ）下载到给定URL的本地文件夹中。并更新本地html文件以选择本地内容。问题答案：您可以使用该模块下载单个URL，但这只会返回数据。它不会解析HTML并自动下载CSS文件和图像等内容。如果要下载“整个”页面，则需要解析HTML并找到需要下载的其他内容。您可以使用Beautiful Soup之类的内容来解析检索到
如何合并pdf文档并在其中添加页面

//步骤1：创建文档-对象文档Document=new Document（）；提前道谢。
HtmlUnit：下载文件后获取意外页面

我需要使用htmlUnit webDriver在不同页面中下载不同的文件。我在页面上循环，对于每个页面，我都单击输入字段以触发下载。对于第一次下载，我单击HtmlInputElement（提交按钮），它会将文件还给我。之后，HtmlPage变成了未预期的页面。检查UnexcpetedPage中的Web响应，我仍然发现文件已经下载。如何解决？代码：[……]
如何在Express中获取URL参数？

问题内容：我在从URL：获取值方面遇到问题。帮助我更正我的控制器代码。我无法获得价值。我的代码如下：：：：问题答案：快递4.x 要获取URL参数的值，请使用req.params 如果要获取查询参数，请使用req.query 快递3.x URL参数查询参数

在Node.js / Express中，如何“下载”页面并获取其HTML？

相关阅读

相关文章

相关问答

相关工具

相关文档