当前位置：首页 > 软件库 > 应用工具 > 网络爬虫 >

YaCy

网页爬虫

授权协议 GPL

开发语言 Java Perl

所属分类应用工具、网络爬虫

软件类型开源软件

地区不详

投递者卢作人

操作系统跨平台

开源组织无

适用人群未知

软件官网

软件文档

官方下载

软件概览

YaCy基于p2p的分布式Web搜索引擎.同时也是一个Http缓存代理服务器.这个项目是构建基于p2p Web索引网络的一个新方法.它可以搜索你自己的或全局的索引,也可以Crawl自己的网页或启动分布式Crawling等.

使用案例

YaCy

REF web search by the people, for the people

相关资料

[实例]爬虫抓取网页

主要内容：导入所需模块,拼接URL地址,向URL发送请求,保存为本地文件,函数式编程修改程序本节讲解第一个 Python 爬虫实战案例：抓取您想要的网页，并将其保存至本地计算机。首先我们对要编写的爬虫程序进行简单地分析，该程序可分为以下三个部分：拼接 url 地址发送请求将照片保存至本地明确逻辑后，我们就可以正式编写爬虫程序了。导入所需模块本节内容使用 urllib 库来编写爬虫，下面导入程序所用模块：拼接URL地址定义 URL 变量，拼接 url 地址。代码如下所示：
基于C#实现网页爬虫

本文向大家介绍基于C#实现网页爬虫，包括了基于C#实现网页爬虫的使用技巧和注意事项，需要的朋友参考一下本文实例为大家分享了基于C#实现网页爬虫的详细代码，供大家参考，具体内容如下 HTTP请求工具类：功能： 1、获取网页html 2、下载网络图片多线程爬取网页代码：截图：以上就是本文的全部内容，希望对大家的学习有所帮助。
python爬虫爬取网页数据并解析数据

本文向大家介绍python爬虫爬取网页数据并解析数据，包括了python爬虫爬取网页数据并解析数据的使用技巧和注意事项，需要的朋友参考一下 1.网络爬虫的基本概念网络爬虫（又称网络蜘蛛，机器人），就是模拟客户端发送网络请求，接收请求响应，一种按照一定的规则，自动地抓取互联网信息的程序。只要浏览器能够做的事情，原则上，爬虫都能够做到。 2.网络爬虫的功能网络爬虫可以代替手工做很多事情，比如可以
Python制作简单的网页爬虫

本文向大家介绍Python制作简单的网页爬虫，包括了Python制作简单的网页爬虫的使用技巧和注意事项，需要的朋友参考一下 1.准备工作：工欲善其事必先利其器，因此我们有必要在进行Coding前先配置一个适合我们自己的开发环境，我搭建的开发环境是：操作系统：Ubuntu 14.04 LTS Python版本：2.7.6 代码编辑器：Sublime Text 3.0 这次的网络爬虫需求背景我打算
Java中的网络爬虫。下载网页问题

我正在尝试开发一个小的网络爬虫，它下载网页并搜索特定部分的链接。但当我运行这段代码时，“href”标记中的链接会变短。如：原文链接：“/kids-toys-action-figures-accessories/b/ref=toys_hp_catblock_actnfig？ie=utf8&node=165993011&pf_rd_m=atvpdkikx0der&pf_rd_s=merchandis
python动态网页批量爬取

本文向大家介绍python动态网页批量爬取，包括了python动态网页批量爬取的使用技巧和注意事项，需要的朋友参考一下四六级成绩查询网站我所知道的有两个：学信网（http://www.chsi.com.cn/cet/）和99宿舍（http://cet.99sushe.com/），这两个网站采用的都是动态网页。我使用的是学信网，好了，网站截图如下：网站的代码

YaCy

同类工具

相关阅读

相关文章

相关问答

相关文档