当前位置：首页 > 软件库 > 应用工具 > 网络爬虫 >

Snoopy

网站内容采集器

授权协议 GPL

开发语言 PHP

所属分类应用工具、网络爬虫

软件类型开源软件

地区不详

投递者孙志

操作系统跨平台

开源组织无

适用人群未知

软件官网

官方下载

软件概览

Snoopy 是一个强大的网站内容采集器（爬虫）。提供获取网页内容，提交表单等功能。

使用案例

PHP爬虫最全总结-phpQuery，PHPcrawer，snoopy框架中文介绍

1.几种常用的PHP爬虫框架对比 1.1 phpQuery 优势：类似jquery的强大搜索DOM的能力。 pq()是一个功能强大的搜索DOM的方法，跟jQuery的$()如出一辙，jQuery的选择器基本上都能使用在phpQuery上，只要把“.”变成“->”,Demo如下(对应我的github的Demo5) <?php require('phpQuery/phpQuery.php'); p
php采集类Snoopy的运用和一点缺陷补充

1.需求：本公司作为C方，需要把A平台的数据通过定时任务脚本导入到B平台； 2.需求分析：（1）怎么获取A平台的数据？（2）怎么把从A平台的数据导入到B平台？ 3.需求实施：（1）通过postman采用get方式调试A平台的开放接口，可以成功返回数据；（2）在php脚本，通过下载Snoopy.class.php拓展类并引入，以get方式请求接口，可以成功返回
snoopy 简介及使用

Snoopy是一个php类，用来模拟浏览器的功能，可以获取网页内容，发送表单。Snoopy正确运行需要你的服务器的PHP版本在4以上，并且支持PCRE（Perl Compatible Regular Expressions），基本的LAMP服务都支持。Snoopy类的官网下载地址为：http://snoopy.sourceforge.net/ 一、Snoopy的一些特点: 　　1.抓取网页的内容
Simple snoopy example

// Shows how an example how you can use the Snoopy class for doing HTTP requests to other websites. // (Source: http://codedump.jonasjohn.de/ - Public domain) // // You need the Snoopy class from http
snoopy类学习

Snoopy是一个php类，用来模拟浏览器的功能，可以获取网页内容，发送表单。 Snoopy的一些特点: 1抓取网页的内容 fetch 2 抓取网页的文本内容 (去除HTML标签) fetchtext 3抓取网页的链接，表单 fetchlinks fetchform 4 支持代理主机 5支持基本的用户名/密码验证 6 支持设置 user_agent, referer(来路), cookies 和
绕过Snoopy的记录功能

不讲原理，感兴趣请看http://blog.rchapman.org/posts/Bypassing_snoopy_logging/，这个只适合老版本内核的Linux 查看是否有snoopy加载了 ldd `which ls` 输出类似如下就是snoopy被加载了 [ryan@buggy ~]# ldd `which ls` /usr/local/lib/snoopy.so (0x
snoopy类学习(二）

Snoopy是一个php类，用来模拟浏览器的功能，可以获取网页内容，发送表单。 Snoopy 正确运行需要你的服务器的 PHP 版本在 4 以上，并且支持 PCRE（Perl Compatible Regular Expressions），基本的 LAMP 服务都支持。下载snoopy Snoopy的一些特点: 1抓取网页的内容 fetch 2 抓取网页的文本内容 (去除HTML标签)
snoopy类

Snoopy是什么? Snoopy是一个php类，用来模仿web浏览器的功能，把不仅能完成模拟http请求的页面的抓取，还能完成发送表单的任务。 Snoopy的一些特点: 1抓取网页的内容 fetch 2 抓取网页的文本内容 (去除HTML标签) fetchtext 3抓取网页的链接，表单 fetchlinks fetchform 4 支持代理主机 5支持基本的用户名/密码验证 6 支持设置 us
snoopy 实例

上一篇介绍了snoopy，下面来说说snoopy可以做什么查看原文 1获取指定url内容 $url = "http://www.taoav.com" ; include( "snoopy.php" ); $snoopy = new Snoopy ; $snoopy -> fetch ( $url ); //获取所有内容 echo $snoopy -> results ; //显示结果 //可选以
Snoopy中文手册

名称: Snoopy - the PHP net client v1.2.2 概要: include "Snoopy.class.php"; $snoopy = new Snoopy; $snoopy->fetchtext("http://www.php.net/"); print $snoopy->results; $snoopy->fetchli
snoopy的使用

Snoopy是什么? Snoopy是一个php类，用来模仿web浏览器的功能，它能完成获取网页内容和发送表单的任务。 Snoopy的一些特点: 1抓取网页的内容 fetch 2 抓取网页的文本内容 (去除HTML标签) fetchtext 3抓取网页的链接，表单 fetchlinks fetchform 4 支持代理主机 5支持基本的用户名/密码验证 6 支持设置 user_agent, refe
SNOOPY 实现模拟登陆

采集论坛第一步就是要模拟登陆,由于各个站点登录表单各不相同，验证方式又是多种多样，所以直接提交用户名密码到登录页面就比较繁琐。所以我们采用cookie来模拟登陆无疑是最佳捷径。对象www.discuz.net 用户名liuyuntest 密码123456 一首先我们手工登录下，记录下cookie dznet_cookietime=2592000;dznet_onlineusernum=78
php Snoopy使用实例

Snoopy的一些特点: 1抓取网页的内容 fetch 2 抓取网页的文本内容 (去除HTML标签) fetchtext 3抓取网页的链接，表单 fetchlinks fetchform 4 支持代理主机 5支持基本的用户名/密码验证 6 支持设置 user_agent, referer(来路), cookies 和 headercontent(头文件) 7支持浏览器重定向，并能控制重定向深度 8
Snoopy类详细说明

snoopy是一个php类，用来模仿web浏览器的功能，它能完成获取网页内容和发送表单的任务。下面是它的一些特征： 1、方便抓取网页的内容 2、方便抓取网页的文字（去掉HTML代码） 3、方便抓取网页的链接 4、支持代理主机 5、支持基本的用户/密码认证模式 6、支持自定义用户agent,referer,cookies和header内容 7、支持浏览器转向，并能控制转向深度 8、能把网页
Snoopy PHP

Snoopy PHP网页抓取工具 snoopy是一个php类，用来模仿web浏览器的功能，它能完成获取网页内容和发送表单的任务。下面是它的一些特征： 1、方便抓取网页的内容 2、方便抓取网页的文字（去掉HTML代码） 3、方便抓取网页的链接 4、支持代理主机 5、支持基本的用户/密码认证模式 6、支持自定义用户agent,referer,cookies和header内容 7、支持浏览器转向，并能
PHP采集类snoopy详细介绍(snoopy使用教程)

Snoopy是一个php类，用来模拟浏览器的功能，可以获取网页内容，发送表单，可以用来开发一些采集程序和小偷程序，本文章详细介绍snoopy的使用教程。 Snoopy的一些特点: 抓取网页的内容 fetch 抓取网页的文本内容 (去除HTML标签) fetchtext 抓取网页的链接，表单 fetchlinks fetchform 支持代理主机支持基本的用户名/密码验证支持设置 user_ag
snoopy总结

Snoopy是什么? Snoopy是一个php类，用来模仿web浏览器的功能，它能完成获取网页内容和发送表单的任务。 Snoopy的一些特点: 1抓取网页的内容 fetch 2 抓取网页的文本内容 (去除HTML标签) fetchtext 3抓取网页的链接，表单 fetchlinks fetchform 4 支持代理主机 5支持基本的用户名/密码验证 6 支持设置 user_agent, refe
php snoopy

snoopy是一个php类，用来模仿web浏览器的功能，它能完成获取网页内容和发送表单的任务。下面是它的一些特征： 1、方便抓取网页的内容 2、方便抓取网页的文字（去掉HTML代码） 3、方便抓取网页的链接 4、支持代理主机 5、支持基本的用户/密码认证模式 6、支持自定义用户agent,referer,cookies和header内容 7、支持浏览器转向，并能控制转向深度 8、能把网页中的链接
snoopy采集类

1抓取网页的内容 fetch 2 抓取网页的文本内容 (去除HTML标签) fetchtext 3抓取网页的链接，表单 fetchlinks fetchform 4 支持代理主机 5支持基本的用户名/密码验证 6 支持设置 user_agent, referer(来路), cookies 和 header content(头文件) 7支持浏览器重定向，并能控制重定向深度 8能把网页中的链接扩展成高
php 采集snoopy类

来源 http://snoopy.sourceforge.net/ Snoopy的一些特点: 抓取网页的内容 fetch 抓取网页的文本内容 (去除HTML标签) fetchtext 抓取网页的链接，表单 fetchlinks fetchform 支持代理主机支持基本的用户名/密码验证支持设置 user_agent, referer(来路), cookies 和 header content(
Snoopy的简单介绍和简单应用

Snoopy是什么? Snoopy是一个php类，用来模仿web浏览器的功能，把不仅能完成模拟http请求的页面的抓取，还能完成发送表单的任务。 Snoopy的一些特点: 1抓取网页的内容 fetch 2 抓取网页的文本内容 (去除HTML标签) fetchtext 3抓取网页的链接，表单 fetchlinks fetchform 4 支持代理主机 5支持基本的用户名/密码验证 6 支持设置 us
基于Snoopy的模拟登录

<?php $url = "http://test.xxxx.com/web/index.php?c=user&a=login&"; include("Snoopy.class.php"); $snoopy = new Snoopy; $snoopy->agent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:42.0) Gecko/20100101
一.php的Snoopy类

一.使用方法： 1、先下载Snoopy类，下载地址：http://sourceforge.net/projects/snoopy/ 2、先实例化一个对象，然后调用相应的方法即可获取抓取的网页信息示例： include 'snoopy/Snoopy.class.php'; $snoopy = new Snoopy(); $sourceURL = "http://xxxxxxxxx"; $sno

Snoopy

同类工具

相关阅读

相关文章

相关问答

相关文档