当前位置：首页 > 软件库 > Web应用开发 > HTML解析器 >

mechanize

Python的HTML解析

授权协议 BSD

开发语言 Python

所属分类 Web应用开发、 HTML解析器

软件类型开源软件

地区不详

投递者谢同化

操作系统 Linux

开源组织无

适用人群未知

软件官网

软件概览

当您希望与 Web 页面中找到的内容进行某种比较复杂的交互时，您需要使用 mechanize 库

示例代码：

import re
from mechanize import Browser

br = Browser()
br.open("http://www.example.com/")
# follow second link with element text matching regular expression
response1 = br.follow_link(text_regex=r"cheese\s*shop", nr=1)
assert br.viewing_html()
print br.title()
print response1.geturl()
print response1.info()  # headers
print response1.read()  # body
response1.close()  # (shown for clarity; in fact Browser does this for you)

br.select_form(name="order")
# Browser passes through unknown attributes (including methods)
# to the selected HTMLForm (from ClientForm).
br["cheeses"] = ["mozzarella", "caerphilly"]  # (the method here is __setitem__)
response2 = br.submit()  # submit current form

# print currently selected form (don't call .submit() on this, use br.submit())
print br.form

使用案例

WWW：：Mechanize使用手册

Mechanize使用手册（翻译）。 http://blog.codingmylife.com/?p=51 1,715 views, Ruby , by Allen Dang. 开始使用 [WWW::Mechanize](http://mechanize.rubyforge.org/mechanize/classes/WWW/Mechanize.html) ————————— 本教程的目的是帮
Mechanize实现网站404监控

【前言】网站的404监控，其实要用到的就urllib2和re这两个模块，urllib2用来处理请求，re正则表达式用来处理html页面。其中，处理html页面（找出页面的全部links），也可使用BeautifulSoup，简单方便。这里，将介绍如何使用mechanize模块实现网站的404监控。主要内容包括： 1、实现过程中常见的问题答疑； 2、多线程中的线程安全问题； mechanize
通过python爬虫mechanize库爬取本机的ip地址

需求分析最近，各平台更新的ip属地功能非常火爆，因此呢，也出现了许多新的网络用语，比如说“xx加几分”，“xx扣大分”等等，非常的有趣啊可是呢，最近一个小伙伴和我说，“仙草哥哥，我也想查看一下自己的ip地址，可是我不会啊，我应该怎么样才能查看到自己的ip地址呢？” 关于如何查看自己的ip地址，这个我记得我在很早之前已经写过了，有兴趣的话可以查看一下我的这篇文章，当然这次呢，我会换一个复古的方式
python模块学习---mechanize(模拟浏览器)

mechanize是非常合适的模拟浏览器的模块。它的特点主要有： 1 http,https协议等。 2 简单的HTML表单填写。 3 浏览器历史记录和重载。 4 Referer的HTTP头的正确添加(可选)。 5 自动遵守robots.txt的。 6 自动处理HTTP-EQUIV和刷新。所以你可以用mechanize来完成一些自动化浏览器想要做的事情，比如自动登录表单，自动填写表单等。首先你
python mechanize使用

遇到了一些坑,这个mechanize不支持js代码,如果遇到了 <button id="submit" type="button" οnclick="sign(this,'signin')" class="btn btn-banner mt10">提交</button> 这样的js代码怎么都通不过...要是有人知道怎么弄欢迎告诉我. 起因是要褥packethub上的羊毛,然后查了一下脚本,发现了
pyhton mechanize 学习笔记

1:简单的使用 import mechanize # response = mechanize.urlopen("http://www.hao123.com/") request = mechanize.Request("http://www.hao123.com/") response = mechanize.urlopen(request) print response.geturl() pr
通过python爬虫mechanize库爬取本机的ip地址

需求分析最近，各平台更新的ip属地功能非常火爆，因此呢，也出现了许多新的网络用语，比如说“xx加几分”，“xx扣大分”等等，非常的有趣啊可是呢，最近一个小伙伴和我说，“仙草哥哥，我也想查看一下自己的ip地址，可是我不会啊，我应该怎么样才能查看到自己的ip地址呢？” 关于如何查看自己的ip地址，有兴趣的话可以查看一下我的这篇文章，当然这次呢，我会换一个复古的方式，使用mechanize进行爬取
Python：mechanize模拟浏览器行为

Python有许许多多有趣的模块，每当自己需要解决某个问题的时候，Python总能冒出来一两个让你惊喜的小玩意。比如说用于数值计算的Numpy(强大而方便的矩阵能力)，用于数据分析的Pandas(和R语言有非常多相似的功能，在读写各种文件以及数据处理上会让人有种把excel、R、机器学习融合起来使用的感觉)，用于爬虫内容提取的BeautifulSoup(点对点的精准数据获取，使用非常方便)，以及最
python mechanize自动登录程序

放假回来了，很久没更新博客了，以后得常更新，今天给大家分享下python第3方的模块包：mechanize。 mechanize是非常合适的模拟浏览器的模块，它的特点主要有： 1 http,https协议等。 2 简单的HTML表单填写。 3 浏览器历史记录和重载。 4 Referer的HTTP头的正确添加(可选)。 5 自动遵守robots.txt的。 6 自动处理HTTP-EQUIV和刷新。
multi_mechanize开源python压力测试框架

因为工作需要，需要自己做压力测试，然后就寻找免费的测试框架，然后说python不错，然后就找到了这个基于python的测试框架multi_mechanize。然后在网上搜了下关于这个multi_mechanize的东西，发现资料比较少，然后就找到这玩意的官网，搜集点资料，在自己机器上也试安装了下。发现还是蛮酷的。下面介绍下安装过程，当然这是基于linux的，我是用cygwin安装的先安装py
Python使用Mechanize模块编写爬虫的要点解析

这篇文章主要介绍了Python使用Mechanize模块编写爬虫的要点解析,作者还讲解了Mechanize程序占用内存过高问题的相关解决方法,需要的朋友可以参考下 mechanize是对urllib2的部分功能的替换，能够更好的模拟浏览器行为，在web访问控制方面做得更全面。结合beautifulsoup和re模块，可以有效的解析web页面，我比较喜欢这种方法。下面主要总结了使用mechaniz
Python mechanize set_代理和internet选项代理设置

除了上述步骤外，如果需要，还必须使用凭据进行身份验证，才能使用http代理。否则，mechanize知道使用代理，但不知道如何进行身份验证。有关详细信息，请参见：mechanizeDocbr = mechanize.Browser() # Explicitly configure proxies (Browser will attempt to set good defaults). # Not
Mechanize对WEB的操作

与网页交互(Interacting With a Web Page) 通过Mechanize模拟自然的浏览器行为来完成与网页之间的交互. # Mechanize的安装 Mechanize的安装请查看 -> Ruby library的安装 # 使用Mechanize时,需要在脚本头部注明 require 'mechanize' # Mechanize object的设定 agent
python模块介绍- multi-mechanize 通用的性能测试工具

简介 Multi-Mechanize 是一个开源的性能和负载测试框架，它并发运行多个 Python 脚本对网站或者服务生成负载(组合事务)。测试输出报告保存为HTML或JMeter的兼容的XML。Multi-Mechanize最常用于web性能和可扩展性(scalability)测试，也适用于任何python可以访问的API。尤其适合后台性能测试。稍微懂点编程的话，这个工具会远强过商业的性能测试工
Mechanize模拟浏览器

简介： Mechanize 是一个 Python 模块，用于模拟浏览器。由于考虑到爬虫所需要的是数据，所以该模块完全可以绕过验证码，直接使用 Cookie 登录就可以了。但是 Mechanize 模块使用 Cookie 登录，Cookie 的生存期较短，而且该模块也不支持 JavaScript。总体来说，该模块在面对验证码问题，算是个非常好的办法，应推荐使用。该模块的具体用法如下使用方法一 i

mechanize

同类工具

相关阅读

相关文章

相关问答

相关文档