本文实例讲述了Python CSV文件模块的使用。分享给大家供大家参考,具体如下:
1、CSV模块使用html" target="_blank">流程
1、导入模块
impport CSV
2、打开文件(xxx.csv)
with open('xxx.csv','a',encoding='utf-8') as f:
a 追加写
a+ 追加写读(先写后读)
r 只读
r+读写,先读后写
w 只写
w+写读 先写后读
3、初始化写入对象
writer = csv.wirter()
4、写入数据
writer.writerow(['孙悟空', '兰陵王'])
案例:
猫眼电影top10榜单的爬取
1、网址:url
2、目标:爬取自己想要的文件
3、保存本地:csv文件
4、步骤
第一页:https://maoyan.com/board/4?offset=0
第4页:https://maoyan.com/board/4?offset=30
第n页:offset=(n-1)*10
'<div class="movie-item-info".*?title="(.*?)".*?class="star">(.* ?)</p>.*?class="releasetime">(.*?)</p>',re.S
练习:爬取猫王top10信息
from urllib import request import re import time import csv class MaoyanSpider(object): def __init__(self): self.headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"} self.page = 1 # 用来计数 def get_page(self, url): req = request.Request(url, headers=self.headers) res = request.urlopen(req) html = res.read().decode('utf-8') # 直接调用解析函数 self.parse_page(html) def parse_page(self,html): p=re.compile('<div class="movie-item-info">.*?title="(.*?)".*?class="star">(.*?)</p>.*?class="releasetime">(.*?)</p>',re.S) #p=re.compile('<div class="movie-item-info">.*?title="(.*?)".*?class="star">(.* ?)</p>.*?class="releasetime">(.*?)</p>',re.S) r_list = p.findall(html) # 直接调用保存函数 # r_list:[('霸王别姬','张国荣','1993'),(),()] self.write_csv(r_list) # 保存数据函数 def write_csv(self,r_list): with open('猫眼电影top10.csv','a') as f: writer = csv.writer(f) # 依次写入每个电影信息 for r_t in r_list: film = [ r_t[0].strip(), r_t[1].strip(), r_t[2].strip() ] writer.writerow(film) #主函数 def work_om(self): for pn in range(0,41,10): url = 'https://maoyan.com/board/4?offset=%s'%str(pn) self.get_page(url) print('第%d页爬取成功'%self.page) self.page += 1 time.sleep(4) if __name__ =='__main__': begin = time.time() spider = MaoyanSpider() spider.work_om() end = time.time() print("执行时间%.2f"%(end - begin))
运行截图:
更多Python相关内容感兴趣的读者可查看本站专题:《Python操作Excel表格技巧总结》、《Python编码操作技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》
希望本文所述对大家Python程序设计有所帮助。
按钮 颜色传感器 蜂鸣器 陀螺仪 冷光线 多路触摸传感器 温湿度传感器 摇杆 旋钮 LED LED 面板 LED 灯带 光线传感器 双路红外开关 电机 显示屏 人体红外传感器 测距传感器 8分显示 舵机 土壤湿度传感器 声音传感器 温度传感器 语音识别
模块可以分配到文件/目录的层次结构中。让我们将可见性小节例子 的代码拆开分到多个文件中: $ tree . . |-- my | |-- inaccessible.rs | |-- mod.rs | `-- nested.rs `-- split.rs 在 split.rs 文件: // 此声明将会查找名为 `my.rs` 或 `my/mod.rs` 的文件,并将该文件的内容插入到 /
6.4.3 编程案例:文本文件分析 本节讨论一个文件分析程序,其功能是输入一个文本文件,对文件内容进行分词(将字符流划分为单词),然后统计文件中的字符数、单词数、每个单词的出现次数以及行数,最 后输出统计结果。按出现频率前 n 名的单词。这种分析在很多应用中都会用到,例如自然语 言处理、文档相似性比较、搜索引擎等。 分析程序的算法设计是直接了当的,其核心是对多个指标进行累积计数。其中,对字符 数和
本文向大家介绍Django日志及中间件模块应用案例,包括了Django日志及中间件模块应用案例的使用技巧和注意事项,需要的朋友参考一下 基于邮件通知的服务监控和告警系统 主要功能点: 配置专用日志格式记录耗时 日志格式: 处理器 日志实例 编写请求耗时统计功能的中间件 获取日志实例 业务逻辑功能编写 request时间,路径,response时间 配置定时任务统计指标并通过邮件发送 分析日志的任务
本文向大家介绍Python配置文件解析模块ConfigParser使用实例,包括了Python配置文件解析模块ConfigParser使用实例的使用技巧和注意事项,需要的朋友参考一下 一、ConfigParser简介 ConfigParser 是用来读取配置文件的包。配置文件的格式如下:中括号“[ ]”内包含的为section。section 下面为类似于key-value 的配置内容。 中括号“
创建文件分类 接口 POST https://cloud.minapp.com/userve/v1/file-category/ 参数说明 Content-Type: application/json 参数 类型 必填 说明 name String Y 文件分类的名称 代码示例 var axios = require('axios').create({ withCredentials: tru