本文实例讲述了python登录豆瓣并发帖的方法。分享给大家供大家参考。具体如下:
这里涉及urllib、urllib2及cookielib常用方法的使用
登录豆瓣,由于有验证码,采取的办法是将验证码图片下载到同目录下,查看图片后输入验证码即可登录、发帖
帖子内容写死在代码中了
# -- coding:gbk -- import sys, time, os, re import urllib, urllib2, cookielib loginurl = 'https://www.douban.com/accounts/login' cookie = cookielib.CookieJar() opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie)) params = { "form_email":"your email", "form_password":"your password", "source":"index_nav" #没有的话登录不成功 } #从首页提交登录 response=opener.open(loginurl, urllib.urlencode(params)) #验证成功跳转至登录页 if response.geturl() == "https://www.douban.com/accounts/login": html=response.read() #验证码图片地址 imgurl=re.search('<img id="captcha_image" src="(.+?)" alt="captcha" class="captcha_image"/>', html) if imgurl: url=imgurl.group(1) #将图片保存至同目录下 res=urllib.urlretrieve(url, 'v.jpg') #获取captcha-id参数 captcha=re.search('<input type="hidden" name="captcha-id" value="(.+?)"/>' ,html) if captcha: vcode=raw_input('请输入图片上的验证码:') params["captcha-solution"] = vcode params["captcha-id"] = captcha.group(1) params["user_login"] = "登录" #提交验证码验证 response=opener.open(loginurl, urllib.urlencode(params)) ''' 登录成功跳转至首页 ''' if response.geturl() == "http://www.douban.com/": print 'login success ! ' print '准备进行发帖' p={"ck":""} c = [c.value for c in list(cookie) if c.name == 'ck'] if len(c) > 0: p["ck"] = c[0].strip('"') addtopicurl="http://www.douban.com/group/python/new_topic" res=opener.open(addtopicurl) html=res.read() m= re.search('<input type="hidden" name="topic_id" value="(.+?)">', html) p["topic_id"] = m.group(1) m= re.search('<input type="hidden" name="topic_id_sig" value="(.+?)">', html) p["topic_id_sig"] = m.group(1) p["rev_title"] = 'title' p["rev_text"] = 'send body' p["rev_submit"] = '好了,发言' request=urllib2.Request(addtopicurl) request.add_header("User-Agent","Mozilla/5.0 (Windows NT 6.1) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.57 Safari/536.11") request.add_header("Accept-Charset", "GBK,utf-8;q=0.7,*;q=0.3") request.add_header("Origin", "http://www.douban.com") request.add_header("Referer", "http://www.douban.com/group/python/new_topic") opener.open(request, urllib.urlencode(p))
希望本文所述对大家的Python程序设计有所帮助。
本文向大家介绍python selenium登录豆瓣网过程解析,包括了python selenium登录豆瓣网过程解析的使用技巧和注意事项,需要的朋友参考一下 登录流程: 实例化一个driver,然后driver.get()发送请求 最重要的:切换iframe子框架,因为豆瓣的网页中的登录那部分是一个ifrme,必须切换才能寻找到对应元素 利用selenium切换到账号密码登录 利用seleniu
本文向大家介绍Python实现豆瓣图片下载的方法,包括了Python实现豆瓣图片下载的方法的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了Python实现豆瓣图片下载的方法。分享给大家供大家参考。具体分析如下: 1 用 tk 封装一下 2 用户可以自己输入图片url 希望本文所述对大家的Python程序设计有所帮助。
本文向大家介绍Python爬豆瓣电影实例,包括了Python爬豆瓣电影实例的使用技巧和注意事项,需要的朋友参考一下 文件结构 html_downloader.py - 下载网页html内容 html_outputer.py - 输出结果到文件中 html_parser.py: 解析器:解析html的dom树 spider_main.py - 主函数 综述 其实就是使用了urllib2和Beauti
本文向大家介绍Python制作豆瓣图片的爬虫,包括了Python制作豆瓣图片的爬虫的使用技巧和注意事项,需要的朋友参考一下 前段时间自学了一段时间的Python,想着浓一点项目来练练手。看着大佬们一说就是爬了100W+的数据就非常的羡慕,不过对于我这种初学者来说,也就爬一爬图片。 我相信很多人的第一个爬虫程序都是爬去贴吧的图片,嗯,我平时不玩贴吧,加上我觉得豆瓣挺良心的,我就爬了豆瓣首页上
本文向大家介绍基于豆瓣API+Angular开发的web App,包括了基于豆瓣API+Angular开发的web App的使用技巧和注意事项,需要的朋友参考一下 一、扯淡的说 name:【豆瓣搜索】 最近关注了下豆瓣的API,发现豆瓣开放平台需要加强API文档撰写啊....但是有个可喜的发现豆瓣V2接口提供了搜索接口。最近在用phantom弄些爬虫,想想,真是美丽极了!有个豆瓣的接口,我都不用去
今天面试了豆瓣算法岗,我一番自我介绍完之后,最后说自己学习能力强。然后面试官就说:我们先写一个基础的算法题吧。然后就给出了一个算法题,无奈自己LeetCode刷的真的还不太够,写了半个小时都没有写出来。