Chrome Headless 页面渲染采集

优质
小牛编辑
116浏览
2023-12-01

支持使用 Chrome Headless 渲染页面及JS后,采集页面内容。

此功能建议在 Swoole v4.5.3 正式版中使用

配置

@app.beans:

[
    'ChromeDownloader'  =>  [
        'path'      =>  '', // 可执行文件路径或http接口地址
        'options'   =>  [], // 创建浏览器的参数
    ],
]
Docker 下使用建议 path 填 http 接口地址,即:http://{host}:{port}/json

注解

@Downloader 注解中,指定 classChromeDownloader

@ChromeNavigation

Chrome 导航注解

类名:\Yurun\Crawler\Module\Downloader\Annotation\ChromeNavigation

参数:

名称描述默认值
eventName等待事件名称(DOMContentLoaded/load/networkIdle)load
timeout超时时间,单位:毫秒30000

安装

Docker

docker pull alpeware/chrome-headless-trunk
docker run -d -p 9222:9222 alpeware/chrome-headless-trunk

apt

apt install chromium-browser