我们可以通过python 来实现这样一个简单的爬虫猜密码功能。下面就看看如何使用python来实现这样一个功能。
这里我们知道用户的昵称为:heibanke
密码是30以内的一个数字,要使用requests库循环提交来猜密码
主要需要用到的库是requests库
安装requests库
pip install requests
要使用到的request库的功能是表单的提交
requests.post(url,data)#通过post()语言向网址url发生data
首先查看网页源码,找到需要提交的内容的参数名称
可以看到需要提交的昵称的name=“username”,密码的name=“password”
requests传入网址的data中中需要包含这两个参数
url = "http://www.heibanke.com/lesson/crawler_ex01/" params = {'username':'heibanke','password': str(password)} r = requests.post(url,data=params)
建立循环,密码从1开始猜,不对就+1,直至猜中。
关键在于如何判断猜错了没?
首先看看猜错了的显示:
我们可以读取出该页面的文字,检测文字中有没有"错误"二字,有就代表提交的密码错误,没有就表示正确。要实现此功能,需要用到find()函数
find()函数介绍:
函数原型:find(str, pos_start, pos_end)
解释:
•str:被查找“字串”
•pos_start:查找的首字母位置(从0开始计数。默认:0)
•pos_end: 查找的末尾位置(默认-1)
返回值:如果查到:返回查找的第一个出现的位置。否则,返回-1。
example:
str = "0123" print str.find("2",1,-1) #2 print str.find("1") #0,首次出现的位置
完整程序:
import requests password=0 while True: url = "http://www.heibanke.com/lesson/crawler_ex01/" params = {'username':'heibanke','password': str(password)} r = requests.post(url,data=params)
if r.text.find(u"错误")>0:#判断某次输入是否正确 password=password+1 else: print password#,最后打印出password为6,居然输入06,006,0006都是对的 break
运行结果password为6
python应用最多的场景还是web快速开发、爬虫、自动化运维:写过简单网站、写过自动发帖脚本、写过收发邮件脚本、写过简单验证码识别脚本。 爬虫在开发过程中也有很多复用的过程,这里总结一下,以后也能省些事情。
本文向大家介绍使用requests库制作Python爬虫,包括了使用requests库制作Python爬虫的使用技巧和注意事项,需要的朋友参考一下 使用python爬虫其实就是方便,它会有各种工具类供你来使用,很方便。Java不可以吗?也可以,使用httpclient工具、还有一个大神写的webmagic框架,这些都可以实现爬虫,只不过python集成工具库,使用几行爬取,而Java需要写更多的行
本文向大家介绍python爬虫beautifulsoup库使用操作教程全解(python爬虫基础入门),包括了python爬虫beautifulsoup库使用操作教程全解(python爬虫基础入门)的使用技巧和注意事项,需要的朋友参考一下 【python爬虫基础入门】系列是对python爬虫的一个入门练习实践,旨在用最浅显易懂的语言,总结最明了,最适合自己的方法,本人一直坚信,总结才会使人提高 1
python爬虫时显示 [WinError 10061] 由于目标计算机积极拒绝,无法连接。 import csv import random import time import pandas as pd import requests from bs4 import BeautifulSoup import matplotlib.pyplot as plt plt.rcParams["font
根据使用场景,网络爬虫可分为 通用爬虫 和 聚焦爬虫 两种. 通用爬虫 通用网络爬虫 就是 捜索引擎抓取系统,目的是将互联网上的所有的网页下载到本地,形成一个互联网内容的镜像备份。 它决定着整个搜索引擎内容的丰富性和时效性,因此它的性能优劣直接影响着搜索引擎的效果。 通用搜索引擎(Search Engine)工作原理 第一步:抓取网页 搜索引擎网络爬虫的基本工作流程如下: 首先选取一部分的初始UR
本文向大家介绍Python爬虫之UserAgent的使用实例,包括了Python爬虫之UserAgent的使用实例的使用技巧和注意事项,需要的朋友参考一下 问题: 在Python爬虫的过程中经常要模拟UserAgent, 因此自动生成UserAgent十分有用, 最近看到一个Python库(fake-useragent),可以随机生成各种UserAgent, 在这里记录一下, 留给自己爬虫使用。