我对python机械化的代理支持有疑问。我正在制作一些Web客户端脚本,我想在我的脚本中插入代理支持功能。
例如,如果我有:
params = urllib.urlencode({'id':id, 'passwd':pw})
rq = mechanize.Request('http://www.example.com', params)
rs = mechanize.urlopen(rq)
如何在我的机械化脚本中添加代理支持?每当我打开此www.example.com
网站时,我都希望它通过代理。
您使用mechanize.Request.set_proxy(host,type)(至少从0.1.11开始)
假设运行在localhost:8888的http代理
req = mechanize.Request("http://www.google.com")
req.set_proxy("localhost:8888","http")
mechanize.urlopen(req)
应该管用。
问题内容: 我想知道是否有类似Java的Perl / Python机械化的东西。 谢谢! 问题答案: 看看HtmlUnit。它类似于Perl的WWW :: Mechanize 。还有一个Perl版本,名为WWW :: HtmlUnit (它使用Inline :: Java 将Java库的方法公开给Perl)。
问题内容: 我有一个带有按钮的表单,希望能够单击它。 我已经尝试过,但是会出现以下错误: 也不起作用,因为它的类型是按钮并且不提交。 有任何想法吗?谢谢。 问题答案: 单击在 纯HTML 的形式什么都不做。为了执行任何操作,必须包含 javascript 。 并且不运行 javascript 。 因此,您的选择是: 自己阅读JavaScript并模拟其效果 使用运行JavaScript代码 我会做
问题内容: 我试图登录到http://www.magickartenmarkt.de网站,并在会员区域(https://www.magickartenmarkt.de/?mainPage=showWants)进行一些分析。我看到了其他示例,但是我不明白为什么我的方法行不通。我为第一种方法确定了正确的形式,但尚不清楚它是否有效。在第二种方法中,重播网页向我显示我无权访问会员区。 我很乐意提供任何帮助
问题内容: 关闭。 此问题不符合堆栈溢出准则。它当前不接受答案。 想改善这个问题吗? 更新问题,使其成为Stack Overflow的主题。 3年前关闭。 改善这个问题 我想知道是否有类似PHP的Mechanize或BeautifulSoup? 问题答案: SimpleTest为您提供类似的功能: http://www.simpletest.org/en/browser_documentation
问题内容: 我正在尝试使用Python填写并提交表单,但无法检索结果页面。我已经尝试过机械化和urllib / urllib2方法来发布表单,但是都遇到了问题。 我要检索的表单在这里:http: //zrs.leidenuniv.nl/ul/start.php。该页面以荷兰语显示,但这与我的问题无关。可能值得注意的是,表单操作重定向到http://zrs.leidenuniv.nl/ul/quer
问题内容: 很抱歉不得不问这样的事情,但是python的机械化文档似乎确实很缺乏,我无法弄清楚。.他们仅举一个例子,我可以通过以下链接找到它: 但是我不想使用正则表达式,我只想根据其URL跟随链接,我该怎么做..还有什么“ nr”有时用于跟随链接? 谢谢你的任何信息 问题答案: 接受一个对象或关键字arg(例如)。 列出所有链接。 列出其URL与正则表达式匹配的所有链接。 列出其链接文本与正则表达