当前位置：首页 > 软件库 > 应用工具 > 网络爬虫 >

lightcrawler

轻型爬虫

授权协议 ISC

开发语言 JavaScript

所属分类应用工具、网络爬虫

软件类型开源软件

地区不详

投递者帅银龙

操作系统跨平台

开源组织无

适用人群未知

软件概览

lightcrawler 可以抓取网站并通过 Google lighthouse 运行网站。

npm install --save-dev lightcrawler

lightcrawler --url https://atom.io/ --config lightcrawler-config.json

lightcrawler-config.json看起来像这样：

{
  "extends": "lighthouse:default",
  "settings": {
    "crawler": {
      "maxDepth": 2,
      "maxChromeInstances": 5
    },
    "onlyCategories": [
      "Accessibility",
      "Performance",
      "Best Practices"
    ],
    "onlyAudits": [
      "accesskeys",
      "aria-allowed-attr",
      "external-anchors-use-rel-noopener",
      "geolocation-on-start",
      "no-document-write",
      "no-mutation-events",
      "no-old-flexbox",
      "time-to-interactive",
      "user-timings",
      "viewport",
      "without-javascript"
    ]
  }
}

相关资料

15 爬虫与反爬虫

有的时候，当我们的爬虫程序完成了，并且在本地测试也没有问题，爬取了一段时间之后突然就发现报错无法抓取页面内容了。这个时候，我们很有可能是遇到了网站的反爬虫拦截。我们知道，网站一方面想要爬虫爬取网站，比如让搜索引擎爬虫去爬取网站的内容，来增加网站的搜索排名。另一方面，由于网站的服务器资源有限，过多的非真实的用户对网站的大量访问，会增加运营成本和服务器负担。因此，有些网站会设置一些反爬虫的措施。我
爬虫

这一章将会介绍使用一些新的模块(optparse,spider)去完成一个爬虫的web应用。爬虫其实就是一个枚举出一个网站上面的所有链接，以帮助你创建一个网站地图的web应用程序。而使用Python则可以很快的帮助你开发出一个爬虫脚本. 你可以创建一个爬虫脚本通过href标签对请求的响应内容进行解析，并且可以在解析的同时创建一个新的请求，你还可以直接调用spider模块来实现，这样就不需要自己去写
详解Android轻量型数据库SQLite

本文向大家介绍详解Android轻量型数据库SQLite，包括了详解Android轻量型数据库SQLite的使用技巧和注意事项，需要的朋友参考一下数据库是Android存储方案的核心，在Andorid中SQLite非常轻量，而且执行sql语句甚至比MySQL还要快。 SQLiteDatabase 是 Android 中操作数据库的核心类之一，使用SQLiteDatabase可以打开数据库，也可以
通用爬虫和聚焦爬虫

根据使用场景，网络爬虫可分为通用爬虫和聚焦爬虫两种. 通用爬虫通用网络爬虫就是捜索引擎抓取系统，目的是将互联网上的所有的网页下载到本地，形成一个互联网内容的镜像备份。它决定着整个搜索引擎内容的丰富性和时效性，因此它的性能优劣直接影响着搜索引擎的效果。通用搜索引擎（Search Engine）工作原理第一步：抓取网页搜索引擎网络爬虫的基本工作流程如下：首先选取一部分的初始UR
爬虫项

爬虫项是什么呢？比如采集文章列表、文章详情页，他们都是不同的采集项。定义示例：继承Yurun\Crawler\Module\Crawler\Contract\BaseCrawlerItem类。 <?php namespace Yurun\CrawlerApp\Module\YurunBlog\Article; use Imi\Bean\Annotation\Bean; use Yurun\C
python爬虫爬取淘宝商品信息

本文向大家介绍python爬虫爬取淘宝商品信息，包括了python爬虫爬取淘宝商品信息的使用技巧和注意事项，需要的朋友参考一下本文实例为大家分享了python爬取淘宝商品的具体代码，供大家参考，具体内容如下效果图：更多内容请参考专题《python爬取功能汇总》进行学习。以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持呐喊教程。

lightcrawler

同类工具

相关阅读

相关文章

相关问答

相关文档