当前位置: 首页 > 编程笔记 >

如何在Python对Excel进行读取

崔绍辉
2023-03-14
本文向大家介绍如何在Python对Excel进行读取,包括了如何在Python对Excel进行读取的使用技巧和注意事项,需要的朋友参考一下

  在python自动化中,经常会遇到对数据文件的操作,比如添加多名员工,但是直接将员工数据写在python文件中,不但工作量大,要是以后再次遇到类似批量数据操作还会写在python文件中吗?

  应对这一问题,可以将数据写excel文件,针对excel 文件进行操作,完美解决。

  本文仅介绍python对excel的操作

安装xlrd 库

  xlrd库 官方地址:https://pypi.org/project/xlrd/

  pip install xlrd

       笔者在安装时使用了 pip3 install xlrd

  原因:笔者同时安装了python2 和 python3

  如果pip的话会默认将库安装到python2中,python3中不能直接调用。

  那么到底是使用pip 还是pip3进行安装呢?

    如果系统中只安装了Python2,那么就只能使用pip。

    如果系统中只安装了Python3,那么既可以使用pip也可以使用pip3,二者是等价的。

    如果系统中同时安装了Python2和Python3,则pip默认给Python2用,pip3指定给Python3用。 

Xlrd 库简单的使用

  以如下excel文件为例进行操作

  文件名为demo,有两个sheet,名为工作表1和工作表2

  工作表1中有如下数据

简单的使用

# coding=utf-8

import xlrd

# 打开文件
data = xlrd.open_workbook('file/demo.xlsx')

# 查看工作表
data.sheet_names()
print("sheets:" + str(data.sheet_names()))

# 通过文件名获得工作表,获取工作表1
table = data.sheet_by_name('工作表1')

# 打印data.sheet_names()可发现,返回的值为一个列表,通过对列表索引操作获得工作表1
# table = data.sheet_by_index(0)

# 获取行数和列数
# 行数:table.nrows
# 列数:table.ncols
print("总行数:" + str(table.nrows))
print("总列数:" + str(table.ncols))

# 获取整行的值 和整列的值,返回的结果为数组
# 整行值:table.row_values(start,end)
# 整列值:table.col_values(start,end)
# 参数 start 为从第几个开始打印,
# end为打印到那个位置结束,默认为none
print("整行值:" + str(table.row_values(0)))
print("整列值:" + str(table.col_values(1)))

# 获取某个单元格的值,例如获取B3单元格值
cel_B3 = table.cell(3,2).value
print("第三行第二列的值:" + cel_B3)

运行后结果

项目中使用

  获得所有的数据

# coding=utf-8

import xlrd

def read_xlrd(excelFile):
 data = xlrd.open_workbook(excelFile)
 table = data.sheet_by_index(0)

 for rowNum in range(table.nrows):
  rowVale = table.row_values(rowNum)
  for colNum in range(table.ncols):
   if rowNum > 0 and colNum == 0:
    print(int(rowVale[0]))
   else:
    print(rowVale[colNum])
  print("---------------")

 # if判断是将 id 进行格式化
 # print("未格式化Id的数据:")
 # print(table.cell(1, 0))
 # 结果:number:1001.0


if __name__ == '__main__':
 excelFile = 'file/demo.xlsx'
 read_xlrd(excelFile=excelFile)

结果

如果在项目中使用则可将内容方法稍为做修改,获得所有的数据后,将每一行数据作为数组进行返回

# coding=utf-8

import xlrd

def read_xlrd(excelFile):
 data = xlrd.open_workbook(excelFile)
 table = data.sheet_by_index(0)
 dataFile = []

 for rowNum in range(table.nrows):
  # if 去掉表头
  if rowNum > 0:
   dataFile.append(table.row_values(rowNum))

 return dataFile


if __name__ == '__main__':
 excelFile = 'file/demo.xlsx'
 print(read_xlrd(excelFile=excelFile))

结果

以上就是如何在Python对Excel进行读取的详细内容,更多关于python对Excel读取的资料请关注小牛知识库其它相关文章!

 类似资料:
  • 本文向大家介绍使用Python对Excel进行读写操作,包括了使用Python对Excel进行读写操作的使用技巧和注意事项,需要的朋友参考一下 学习Python的过程中,我们会遇到Excel的读写问题。这时,我们可以使用xlwt模块将数据写入Excel表格中,使用xlrd模块从Excel中读取数据。下面我们介绍如何实现使用Python对Excel进行读写操作。 Python版:3.5.2 通过pi

  • 问题内容: 我使用模块启动一个子流程并连接到它的输出流()。我希望能够在它的标准输出上执行非阻塞读取。在调用之前,是否有方法使不阻塞或检查流中是否有数据?我希望它是可移植的,或者至少在和下工作。 这是我目前的操作方式(如果没有可用数据,则会阻塞): 问题答案: ,,不会在这种情况下帮助。 不管使用什么操作系统,一种可靠的读取流而不阻塞的方法是使用:

  • 希望你能帮助我。 我有一个文件夹,里面有几个结构相似的. xlsx文件(注意,有些文件可能大于50MB)。我想把它们组合在一起,(最终)把它们发送到数据库。但是在那之前,我需要提高这段代码的性能,因为有时处理所有这些文件需要很多时间。 问题代码如下: 有什么建议吗? 我在某处读到将 Excel 文件转换为 CSV 可能会提高性能,但我应该在附加文件之前还是在连接所有内容之后执行此操作?考虑到df_

  • 本文向大家介绍python读取excel进行遍历/xlrd模块操作,包括了python读取excel进行遍历/xlrd模块操作的使用技巧和注意事项,需要的朋友参考一下 我就废话不多说了,大家还是直接看代码吧~ 补充知识:Python遍历一个文件夹下有几个Excel文件及每个Excel文件有几个Sheet 一、 解决问题: 工作中常会遇到合并Excel文件的需求,Excel文件数量不确定,里面的Sh

  • 问题内容: 想象一下这个目录结构: 我正在编码,我需要从中导入一些东西。我该怎么办? 我尝试过,但是得到了“未打包的相对导入尝试”。 我四处搜寻,但只发现骇客。有没有一种干净的方法? 问题答案: 每个人似乎都想告诉你应该做什么,而不仅仅是回答问题。 问题是你通过将作为参数传递给解释器而将模块作为运行。 从PEP 328: 相对导入使用模块的属性来确定该模块在包层次结构中的位置。如果模块的名称不包含

  • 我想找到配对的数量,一个很大的数字。如果我给数字n,并要求确定配对的数量,这样 <代码>S(x) 而constants是