当前位置：首页 > 软件库 > 应用工具 > 浏览器 >

Spynner

可编程Web浏览器Python模块

授权协议未知

开发语言 Python

所属分类应用工具、浏览器

软件类型开源软件

地区不详

投递者司徒啸

操作系统跨平台

开源组织无

适用人群未知

软件官网

软件文档

官方下载

软件概览

Spynner是一个可编程Web浏览器Python模块。支持AJAX。

Spynner是一个有状态，可编程Web浏览器Python模块。它基于 PyQT 和 WebKit构建。支持 Javascript, AJAX,和所有其它WebKit能够处理的技术(Flash, SVG, ...)。Spynner利用 JQuery。

使用Spynner你可以模拟一个Web浏览器，没有图形用户界面，可以完成加载页面、触发事件、填写表单等操作。

使用案例

Spynner的安装过程

想要用python来获取动态网页的内容，搜索到Spynner可以实现JQuery的调用。安装Spynner花了好几个小时才完成。记录一下： Spynner的使用依赖于PyQt，而PyQt又依赖于Sip，所以安装步骤是：1）先安装Sip；2）安装PyQt；3）安装Spynner。 1、Sip安装下载链接：https://sourceforge.net/projects/pyqt/files/si
spynner模拟浏览器爬取链接

之前用了scrapy框架谢了一个爬取链接的爬虫，但是不能获取到post的链接，ajax动态加载的链接，一些需要交互后才能得到的链接也没法获取到，因此想要采用spynner模拟浏览器请求页面，对请求过程中的数据包进行处理记录，同时采用spynner模拟浏览器进行一些简单的交互获取到其他链接。 01 spynner简介 spynner对QtWebkit进行了封装，使各种浏览器操作更加简单易用。webk
Selenium 与 Spynner 切换frame（iframe）方法对比

在模拟操作网页过程中经常会遇到框架网页或者有iframe的网页，处理不当的话就会定位不到元素，很是让人头痛。之前遇到典型的例子就是腾讯的登录框，很多都是用iframe加载的，只要能够定位到iframe，定位对应的元素非常简单。在主要用selenium之前用spynner比较多，spynner的优势在于可以直接看操作过程，劣势在于用户少、文档简单、坑比较多。 spynner 在spynner中，
python spynner库

问题来源：很早之前，学习Pythonweb编程的时候，就涉及一个Python的urllib。可以用urllib.urlopen("url").read()可以轻松读取页面上面的静态信息。但是，随着时代的发展，也来越多的网页中更多的使用javascript、jQuery、PHP等语言动态生成页面信息。因此，用urllib再去抓取页面HTML就不足以达到我们想要的效果。解决思路：
scrapy+spynner获取ajax中的内容（以微信公众号为例）

现在越来越多的网站的使用ajax来动态加载数据，scrapy只能获取静态html中的数据，对于动态加载的就无能为力了 spynner是一个模拟浏览器加载的工具，可以在后台模拟ajax加载后的网页，然后再通过scrapy进行爬取原理就是在scrapy的中间件设置spynner模块加载微信公众号里面的内容，文字可以直接加载出来，但是图片使用的是ajax技术，如果我们成功获取到了图片的src则我们就
Spynner访问网页

我又在东搞西搞了，用Spynner访问网页，Spynner是什么，是一个操控一个无GUI的Webkit核心实现http访问的python模块，可以做爬虫呢，爬些需要使用js运行才有结果的网页最好. 今天终于也实现在树莓派Raspberry pi的linux上跑Spynner程序，需要用到xvfb，不然的话会出现cannot connect x server的提示 xvfb安装: sudo apt
Python spynner 解决中文不显示

spynner Spynner是一个可编程Web浏览器Python模块。支持AJAX。 Spynner是一个有状态，可编程Web浏览器Python模块。它基于 PyQT 和 WebKit构建。支持 Javascript, AJAX,和所有其它WebKit能够处理的技术(Flash, SVG, ...)。Spynner利用 JQuery。使用Spynner你可以模拟一个Web浏览器，没有图形用户
安装Spynner依赖库记录

重装系统总是烦 python可用 spynner库作为模拟浏览器，但是安装起来相当烦，在此记录下需要安装的库 sudo easy_install spynner 在安装autopy时出问题了 autopy需要了很X11的文件 sudo apt-get install libx11-dev mesa-common-dev libglu1-mesa-dev libxrandr-dev libxi-d
关于Spynner以及browser类---怎样解析动态网页

1. 使用Spynner基于Webkit从最底层模拟浏览器行为，从而爬取动态网页信息。 2. webkit是开源的web浏览器引擎，Iphone 苹果 ios 的safari、谷歌的chrome浏览器都是基于这个框架来开发的。webkit 还支持移动设备和手机，包括iphone和android手机都是使用webkit做为浏览器的核心。 3. 由于是直接使用浏览器引擎，所以能够访问和修改浏览器的各
Scrapy框架结合Spynner采集需进行js,ajax动态加载的网页并提取网页信息（以采集微信公众号文章列表为例）.....

对于网页的采集有这样几种: 1.静态网页 2.动态网页（需进行js,ajax动态加载数据的网页） 3.需进行模拟登录后才能采集的网页 4.加密的网页 3，4的解决方案和思路会在后续blog中陈述现在只针对1，2的解决方案与思路：一.静态网页对于静态网页的采集解析方法很多很多！java,python都提供了很多的工具包或框架，例如java的httpclient,Htmlunit

Spynner

同类工具

相关阅读

相关文章

相关问答

相关文档