当前位置：首页 > 编程笔记 >

python爬取51job中hr的邮箱

皇甫德庸

2023-03-14

本文向大家介绍python爬取51job中hr的邮箱，包括了python爬取51job中hr的邮箱的使用技巧和注意事项，需要的朋友参考一下

本文实例为大家分享了python爬取51job中hr的邮箱具体代码，供大家参考，具体内容如下

#encoding=utf8
import urllib2
import cookielib
import re
import lxml.html
from _ast import TryExcept
from warnings import catch_warnings

f = open('/root/Desktop/51-01.txt','a+')

def read(city):
  url = 'http://www.51job.com/'+city
  cj = cookielib.MozillaCookieJar() 
  cookie_support = urllib2.HTTPCookieProcessor(cj) 
  opener = urllib2.build_opener(cookie_support) 
  opener.addheaders = [('User-agent','Mozilla/5.0 (X11; Linux x86_64; rv:38.0) Gecko/20100101 Firefox/38.0 Iceweasel/38.3.0')]
  urllib2.install_opener(opener)
  response = urllib2.urlopen(url)
  http = response.read()
  rex = 'http://jobs.51job.com/hot/.*?html'
  value = re.findall(rex, http)
  for i in value:
    print i
    try:
      readpage(i)
    except:
      pass
    
def readpage(url):
  cj = cookielib.MozillaCookieJar() 
  cookie_support = urllib2.HTTPCookieProcessor(cj) 
  opener = urllib2.build_opener(cookie_support) 
  opener.addheaders = [('User-agent','Mozilla/5.0 (X11; Linux x86_64; rv:38.0) Gecko/20100101 Firefox/38.0 Iceweasel/38.3.0')]
  urllib2.install_opener(opener)
  html = urllib2.urlopen(url,timeout = 2).read()
  doc = lxml.html.fromstring(html)
  rex = r'[\w\.-]+@(?:[A-Za-z0-9]+\.)+[A-Za-z]+'
  results = doc.xpath('//div[@class="tmsg inbox"]/div[@class="con_msg"]/div[@class="in"]/p/text()')
  for i in results:
    xx = re.compile(rex)
    for j in xx.findall(i):
      print j
      f.write(j+'\n')
      f.flush()
  

if __name__ == '__main__':
  city_list = ['zhangjiagang','zhanjiang','zhaoqing','zibo']
  for i in city_list:
    f.write(i+'\n')
    f.flush()
    try:
      read(i)
    except:
      pass
  f.flush()
  f.close()

city_list大家自己整理一下，只能帮你们到这里了，谢谢大家的阅读，继续关注小牛知识库更多精彩内容。

类似资料：

python爬虫爬取图片的简单代码

本文向大家介绍python爬虫爬取图片的简单代码，包括了python爬虫爬取图片的简单代码的使用技巧和注意事项，需要的朋友参考一下 Python是很好的爬虫工具不用再说了，它可以满足我们爬取网络内容的需求，那最简单的爬取网络上的图片，可以通过很简单的方法实现。只需导入正则表达式模块，并利用spider原理通过使用定义函数的方法可以轻松的实现爬取图片的需求。 1、spider原理 spider就是定
python爬虫爬取淘宝商品信息

本文向大家介绍python爬虫爬取淘宝商品信息，包括了python爬虫爬取淘宝商品信息的使用技巧和注意事项，需要的朋友参考一下本文实例为大家分享了python爬取淘宝商品的具体代码，供大家参考，具体内容如下效果图：更多内容请参考专题《python爬取功能汇总》进行学习。以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持呐喊教程。
python 爬取微信文章

本文向大家介绍python 爬取微信文章，包括了python 爬取微信文章的使用技巧和注意事项，需要的朋友参考一下本人想搞个采集微信文章的网站，无奈实在从微信本生无法找到入口链接，网上翻看了大量的资料，发现大家的做法总体来说大同小异，都是以搜狗为入口。下文是笔者整理的一份python爬取微信文章的代码，有兴趣的欢迎阅读
Python爬虫爬取美剧网站的实现代码

本文向大家介绍Python爬虫爬取美剧网站的实现代码，包括了Python爬虫爬取美剧网站的实现代码的使用技巧和注意事项，需要的朋友参考一下一直有爱看美剧的习惯，一方面锻炼一下英语听力，一方面打发一下时间。之前是能在视频网站上面在线看的，可是自从广电总局的限制令之后，进口的美剧英剧等貌似就不在像以前一样同步更新了。但是，作为一个宅diao的我又怎甘心没剧追呢，所以网上随便查了一下就找到一个能用迅雷
python爬虫之爬取百度音乐的实现方法

本文向大家介绍python爬虫之爬取百度音乐的实现方法，包括了python爬虫之爬取百度音乐的实现方法的使用技巧和注意事项，需要的朋友参考一下在上次的爬虫中，抓取的数据主要用到的是第三方的Beautifulsoup库，然后对每一个具体的数据在网页中的selecter来找到它，每一个类别便有一个select方法。对网页有过接触的都知道很多有用的数据都放在一个共同的父节点上，只是其子节点不同。在上次
Python爬虫爬取、解析数据操作示例

本文向大家介绍Python爬虫爬取、解析数据操作示例，包括了Python爬虫爬取、解析数据操作示例的使用技巧和注意事项，需要的朋友参考一下本文实例讲述了Python爬虫爬取、解析数据操作。分享给大家供大家参考，具体如下：爬虫当当网 http://search.dangdang.com/?key=python&act=input&page_index=1 获取书籍相关信息面向对象思想利用不

相关阅读

python爬虫之爬取百度音乐的实现方法 Python爬虫爬取、解析数据操作示例 python爬虫爬取某站上海租房图片 Python爬虫爬取新闻资讯案例详解 Python爬虫：通过关键字爬取百度图片

相关文章

Python爬取全国火锅店并可视化展示用Python爬取美食网站3032个菜谱并分析第一个Python爬虫程序 [实例]爬虫抓取网页中信银行hr面

相关问答

在Selenium中查找隐藏的超链接（Python网络爬行）获取Python中浮点的“位”？无法从Gmail获取IMAP中的邮件正文爬虫python ，为什么偶尔出现list out of range ，爬不出数据的情况？在Jmeter的线程组中爬升

相关工具

hr AEAI HR 神箭手云爬虫快邮邮职

相关文档

Python 原生爬虫教程 Python 爬虫学习系列教程 Python 取证中文教程爬虫课件 WebMagic 爬虫框架中文文档