DungProxy

代理 IP 池
授权协议 Apache
开发语言 Java
所属分类 服务器软件、 代理服务器软件
软件类型 开源软件
地区 国产
投 递 者 米项禹
操作系统 跨平台
开源组织
适用人群 未知
 软件概览

DungProxy是一个代理IP服务,他包括一个代理IP资源server端和一系列适配中心IP资源得客户端。server负责代理IP资源的收集维护。client则是一系列方便用户使用得API,他屏蔽了代理IP下载、代理IP选取、IP绑定、IP切换等比较复杂逻辑。用户只需要引入client即可方便使用代理IP服务。

DungProxy主要用在爬虫,它是为突破目标网站封堵而实现的一个网络层封装。

DungProxy实现了对httpclient较为深度的定制,将一些适合爬虫的特性做成了默认,同时支持了多个用户并发登录。

DungProxy实现了对webmagic的适配,支持自动集成代理池,支持在webmagic多个账户登录爬取数据。

DungProxy有一个server,他以极小的服务器资源收集了互联网百万级别的代理IP,并使用一种反馈叠加验证的调度模型高效的维护了大概一万的活跃IP,并将这些IP作为dungproxy的默认数据源,提供默认的代理服务。

 DungProxy实现了在免费代理IP资源上面构建的稳定爬虫代理服务。

  • dungpxoy设计的目的就是为了突破爬虫目标网站的封禁策略的。因为httpclient是根据浏览器标准来实现的一个框架,很多时候默认策略容易被目标网站发现。dungproxy则实现以下方案。 提供代理服务 dungproxy本身提供了一个server,用来收集互联网上海量的代理IP。并通过我们独特的算法对其清洗打分。我们使用历史数据对当前IP可用性推测的原理来动态调整IP探测频率,使用快速降权的

 相关资料
  • 注解 @ProxyPool 声明代理 IP 池,在爬虫对象或者爬虫项对象上声明,则请求时自动从代理 IP 池中取出代理IP 类名:\Yurun\Crawler\Module\Crawler\Annotation\ProxyPool 参数: 名称 描述 默认值 class 代理 IP 池名 args 实例化参数 method 获取 IP 的方式:random(随机)、next(下一个) 代理 IP

  • 本文将讲述如何配置和启用 ip-masq-agent。 创建 ip-masq-agent 要创建 ip-masq-agent,运行下面的 kubectl 命令: kubectl create -f https://raw.githubusercontent.com/kubernetes-incubator/ip-masq-agent/master/ip-masq-agent.yaml 关于 ip-

  • http代理 <?php $http = HttpRequest::newSession(); $response = $http->proxy('127.0.0.1', 808) // 常见的http代理这样用 ->get('https://www.baidu.com/'); $content = $response->body(); // 网页源码 sock

  • 本文向大家介绍node.js 抓取代理ip实例代码,包括了node.js 抓取代理ip实例代码的使用技巧和注意事项,需要的朋友参考一下 node.js实现抓取代理ip 主要文件:index.js 包支持 : package.json 本地需要安装mongodb数据库,用于存储抓取到的ip,目前还未实现ip验证。写这个主要是处于好奇。 上面的代码就可以实现抓取ip代理网站的ip并存到mongodb数

  • 本文向大家介绍java代理实现爬取代理IP的示例,包括了java代理实现爬取代理IP的示例的使用技巧和注意事项,需要的朋友参考一下 仅仅使用了一个java文件,运行main方法即可,需要依赖的jar包是com.alibaba.fastjson(版本1.2.28)和Jsoup(版本1.10.2) 如果用了pom,那么就是以下两个: 完整的代码如下: 以上这篇java代理实现爬取代理IP的示例就是小编

  • 我已经在EC2上安装了Kafka软件。我的问题是从AWS外部连接到经纪人。这一切都从内部为我工作。 因此,我可以启动代理,并且 kafka 控制台生产者和消费者都可以工作(来自同一服务器)。我有端口 2181 和 9092 打开到远程位置,朝向我想使用 producer 的位置。所以从我的开发(本地)机器.如果我做telnet 9092 - 它会连接我。如果我尝试使用Kafka控制台生产者,我会收