Puppeteer 是一个控制 headless Chrome 的 Node.js API 。它是一个 Node.js 库,通过 DevTools 协议提供了一个高级的 API 来控制 headless Chrome。它还可以配置为使用完整的(非 headless)Chrome。
在浏览器中手动完成的大多数事情都可以通过使用 Puppeteer 完成,下面是一些入门的例子:
生成屏幕截图和 PDF 页面
检索 SPA 并生成预渲染内容(即“SSR”)
从网站上爬取内容
自动提交表单,UI测试,键盘输入等
创建一个最新的自动测试环境。使用最新的 JavaScript 和浏览器功能,在最新版本的 Chrome 中直接运行测试
捕获网站的时间线跟踪,以帮助诊断性能问题
Puppeteer 安装 安装第三方库:puppeteer npm i puppeteer 安装谷歌 Chromium:若 npm 安装失败,需要手动下载 chromium 并解压至相应文件夹 语法 基本语法 API 分层结构 Browser: 对应一个浏览器实例,一个 Browser 可以包含多个 BrowserContext BrowserContext: 对应浏览器一个上下文会话,就像我们
本文来自网易云社区 作者:唐钊 最近在看 node 爬虫相关的一些东西,我记得还是很久以前常用的 node 爬虫工具还是 superagengt+cherrio,他们的思路是通过发起 http 请求然后截取 respone 的内容,但是随着前端mvvm等框架的盛行,现在更多的内容是异步加载了,所以通过这种传统的爬虫方式已经很难抓取到我们想要的内容了,那么Puppeteer又有什么亮点呢?接下来我们
Puppeteer 是 Chrome 开发团队在 2017 年发布的一个 Node.js 包,用来模拟 Chrome 浏览器的运行。 Puppeteer 是什么 Puppeteer 是 Node.js 工具引擎 Puppeteer 提供了一系列 API,通过 Chrome DevTools Protocol 协议控制 Chromium/Chrome 浏览器的行为 Puppeteer 默认情况下是以
DO NOT USE! This project does not work anymore due to changes in Chrome. Use the Chrome DevTools protocol in chromedp instead! headlessChrome �� Support only for Ubuntu on Docker for now. Mac appears
自 v1.7.0 以来的每个版本我们都发布了两个包: puppeteer puppeteer-core puppeteer 是浏览器自动化的 产品。安装后,它会下载一个版本的 Chromium,然后使用puppeteer-core 驱动工作。作为最终用户产品,puppeteer 支持一堆方便的 PUPPETEER_* env 变量来调整行为。 puppeteer-core 是一个 库 来帮助驱动任
Puppeteer 模块提供了一种启动 Chromium 实例的方法。 下面就是使用 Puppeteer 进行自动化的一个典型示例: const puppeteer = require('puppeteer'); puppeteer.launch().then(async browser => { const page = await browser.newPage(); await p
jest-puppeteer 允许你使用 Jest & Puppeteer 运行测试。 # for jest 22~23npm install --save-dev jest-puppeteer@3.9.0 puppeteer jest# for jest 24+npm install --save-dev jest-puppeteer puppeteer jest 需要 Jest v22 及以上
Puppeteer Sharp 是官方 Node.JS Puppeteer API 的 .NET 端口。 相关链接 API 文档 StackOverflow Issues 用法 截屏 using var browserFetcher = new BrowserFetcher();await browserFetcher.DownloadAsync();await using var browser
Puppeteer 是用 JavaScript 测试 Web 应用程序的框架。