当前位置：首页 > 编程笔记 >

一则python3的简单爬虫代码

盛柏

2023-03-14

本文向大家介绍一则python3的简单爬虫代码，包括了一则python3的简单爬虫代码的使用技巧和注意事项，需要的朋友参考一下

不得不说python的上手非常简单。在网上找了一下，大都是python2的帖子，于是随手写了个python3的。代码非常简单就不解释了，直接贴代码。

#test rdp
import urllib.request
import re<br>
#登录用的帐户信息
data={}
data['fromUrl']=''
data['fromUrlTemp']=''
data['loginId']='12345'
data['password']='12345'
user_agent='Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
#登录地址
#url='http://192.168.1.111:8080/loginCheck'
postdata = urllib.parse.urlencode(data) 
postdata = postdata.encode('utf-8')
headers = { 'User-Agent' : user_agent }
#登录 
res = urllib.request.urlopen(url,postdata)
#取得页面html<br>strResult=(res.read().decode('utf-8'))
#用正则表达式取出所有A标签
p = re.compile(r'<a href="(.*?)".*?>(.*?)</a>')
for m in p.finditer(strResult):
    print (m.group(1))#group(1)是href里面的内容，group(2)是a标签里的文字

关于cookie、异常等处理看了一下，没有花时间去处理，毕竟只是想通过写爬虫来学习python。

类似资料：

python爬虫爬取图片的简单代码

本文向大家介绍python爬虫爬取图片的简单代码，包括了python爬虫爬取图片的简单代码的使用技巧和注意事项，需要的朋友参考一下 Python是很好的爬虫工具不用再说了，它可以满足我们爬取网络内容的需求，那最简单的爬取网络上的图片，可以通过很简单的方法实现。只需导入正则表达式模块，并利用spider原理通过使用定义函数的方法可以轻松的实现爬取图片的需求。 1、spider原理 spider就是定
PHP一个简单的无需刷新爬虫

本文向大家介绍PHP一个简单的无需刷新爬虫，包括了PHP一个简单的无需刷新爬虫的使用技巧和注意事项，需要的朋友参考一下由于只是一个小示例，所以过程化简单写了，小菜随便参考，大神大可点解接下的入表库当然就不写了，那些更小意思了~就此别过吧~ 总结以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，谢谢大家对呐喊教程的支持。如果你想了解更多相关内容请查看下面相
分享一个简单的java爬虫框架

本文向大家介绍分享一个简单的java爬虫框架，包括了分享一个简单的java爬虫框架的使用技巧和注意事项，需要的朋友参考一下反复给网站编写不同的爬虫逻辑太麻烦了,自己实现了一个小框架可以自定义的部分有: 请求方式(默认为Getuser-agent为谷歌浏览器的设置),可以通过实现RequestSet接口来自定义请求方式储存方式(默认储存在f盘的html文件夹下),可以通过SaveUtil接口来
nodeJs爬虫获取数据简单实现代码

本文向大家介绍nodeJs爬虫获取数据简单实现代码，包括了nodeJs爬虫获取数据简单实现代码的使用技巧和注意事项，需要的朋友参考一下本文实例为大家分享了nodeJs爬虫获取数据代码，供大家参考，具体内容如下效果图：以上就是nodeJs爬虫获取数据的相关代码，希望对大家的学习有所帮助。
python爬虫 - python3 爬虫，请问这是什么编码？

原始content： decode('utf-8')报错： UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe8 in position 1: invalid continuation byte decode('utf-8', 'ignore')： decode('gbk', 'ignore')： decode('utf-16', 'ig
php实现简单爬虫的开发

本文向大家介绍php实现简单爬虫的开发，包括了php实现简单爬虫的开发的使用技巧和注意事项，需要的朋友参考一下有时候因为工作、自身的需求，我们都会去浏览不同网站去获取我们需要的数据，于是爬虫应运而生，下面是我在开发一个简单爬虫的经过与遇到的问题。开发一个爬虫，首先你要知道你的这个爬虫是要用来做什么的。我是要用来去不同网站找特定关键字的文章，并获取它的链接，以便我快速阅读。按照

相关阅读

php实现简单爬虫的开发 PHP实现简单爬虫的方法 Android编写简单的网络爬虫 Python制作简单的网页爬虫 python3.7简单的爬虫实例详解

相关文章

网络爬虫是什么 [实例]爬虫下载小说 [实例]爬虫抓取网页 JDBC简单示例代码 Go语言代码风格清晰、简单

相关问答

网络爬虫 - 如何解决爬虫切片时只能获取单个数据项的问题?小程序的爬虫能爬动态数据吗?Storm爬虫中的ES查询异常围棋之旅练习#10：爬虫 Scrapy爬虫提取URL，但错过了一半回调

相关工具

神箭手云爬虫百度云分享爬虫最简单代码实现九宫格简单UITableViewDemo 简单CMS

相关文档

爬虫课件 Python 原生爬虫教程 WebMagic 爬虫框架中文文档 Python 爬虫学习系列教程宇润爬虫框架 Yurun Crawler 帮助文档