当前位置：首页 > 软件库 > 开发工具 > Python开发工具 >

Zicada

爬虫规则录制客户端

授权协议 GPL

开发语言 Python

所属分类开发工具、 Python开发工具

软件类型开源软件

地区国产

投递者松骏俊

操作系统跨平台

开源组织无

适用人群未知

软件概览

Zicada系统最基本的功能就是录制爬虫抓取的页面规则。将抓取规则划分为登录页、列表页、详情页以及翻页，自由定制。 Zicada系统分为本地模式和远程模式。

Zicada 系统的 exe 免安装文件请前往百度云，密码7ekw

本地模式

在文件的根目录下有一个zicada.exe文件，双击，默认账号/密码：admin/admin123 进入系统后，可为你的URL创建任务，录制的时候，先要选择抓取的环节，Ctrl+鼠标左键，即可录制web页面中的元素。当单击无法打开页面链接的时候，Alt+鼠标左键，即可打开页面元素的链接。点击完成即可将录制的脚本保存到本地sqlite3数据库。

远程模式

远程模式除了需要客户端之外，还需要一个服务端：服务端的jar包，密码：mweo，SQL，密码：kvs5, 需要修改数据库配置。远程模式需要在本地模式下进行配置远程服务端的信息，退出后，再以远程身份登录默认的远程客户端的账号/密码:admin/admin123 远程模式最大的好处在于，将录制的脚本信息同步到远程的MySQL数据库

使用者可以自行处理这些录制的脚本，比如爬虫等。

相关资料

15 爬虫与反爬虫

有的时候，当我们的爬虫程序完成了，并且在本地测试也没有问题，爬取了一段时间之后突然就发现报错无法抓取页面内容了。这个时候，我们很有可能是遇到了网站的反爬虫拦截。我们知道，网站一方面想要爬虫爬取网站，比如让搜索引擎爬虫去爬取网站的内容，来增加网站的搜索排名。另一方面，由于网站的服务器资源有限，过多的非真实的用户对网站的大量访问，会增加运营成本和服务器负担。因此，有些网站会设置一些反爬虫的措施。我
爬虫

这一章将会介绍使用一些新的模块(optparse,spider)去完成一个爬虫的web应用。爬虫其实就是一个枚举出一个网站上面的所有链接，以帮助你创建一个网站地图的web应用程序。而使用Python则可以很快的帮助你开发出一个爬虫脚本. 你可以创建一个爬虫脚本通过href标签对请求的响应内容进行解析，并且可以在解析的同时创建一个新的请求，你还可以直接调用spider模块来实现，这样就不需要自己去写
通用爬虫和聚焦爬虫

根据使用场景，网络爬虫可分为通用爬虫和聚焦爬虫两种. 通用爬虫通用网络爬虫就是捜索引擎抓取系统，目的是将互联网上的所有的网页下载到本地，形成一个互联网内容的镜像备份。它决定着整个搜索引擎内容的丰富性和时效性，因此它的性能优劣直接影响着搜索引擎的效果。通用搜索引擎（Search Engine）工作原理第一步：抓取网页搜索引擎网络爬虫的基本工作流程如下：首先选取一部分的初始UR
爬虫项

爬虫项是什么呢？比如采集文章列表、文章详情页，他们都是不同的采集项。定义示例：继承Yurun\Crawler\Module\Crawler\Contract\BaseCrawlerItem类。 <?php namespace Yurun\CrawlerApp\Module\YurunBlog\Article; use Imi\Bean\Annotation\Bean; use Yurun\C
node+express制作爬虫教程

本文向大家介绍node+express制作爬虫教程，包括了node+express制作爬虫教程的使用技巧和注意事项，需要的朋友参考一下最近开始重新学习node.js，之前学的都忘了。所以准备重新学一下，那么，先从一个简单的爬虫开始吧。什么是爬虫百度百科的解释：爬虫即网络爬虫，是一种自动获取网页内容的程序。是搜索引擎的重要组成部分，因此搜索引擎优化很大程度上就是针对爬虫而做出的优化。通俗一
urllib.robotparser — 互联网爬虫控制

测试访问权限 # urllib_robotparser_simple.py from urllib import parse from urllib import robotparser AGENT_NAME = 'PyMOTW' URL_BASE = 'https://pymotw.com/' parser = robotparser.RobotFileParser() parser.set_

同类工具

Ninja-IDE Nuitka wxGlade PyPE TestSteps Pyright Pydata Py-Spy

相关阅读

nodejs制作小爬虫功能示例 python制作最美应用的爬虫 Python制作爬虫抓取美女图 Python制作豆瓣图片的爬虫 Python制作简单的网页爬虫

相关文章

[实例]爬虫下载小说 [实例]爬虫抓取网页第一个Python爬虫程序 Linux文件（目录）命名规则实战-Swing实现简单爬虫

相关问答

录制音频并从nodejs流到客户端不同用户的Esper规则创建用户的Firestore规则小程序的爬虫能爬动态数据吗?口水：时间限制规则

相关文档

爬虫课件 Python 原生爬虫教程 WebMagic 爬虫框架中文文档 Python 爬虫学习系列教程宇润爬虫框架 Yurun Crawler 帮助文档