当前位置: 首页 > 知识库问答 >
问题:

使用Python提取和合并Excel数据

傅翰池
2023-03-14

我有一个Excel(.xlsx)文件,大约有40张工作表。每个工作表具有相同的结构,但包含不同的数据。我想从每张表中提取信息并将其合并为一张,将每张表中的信息一张叠在另一张上。我需要从中提取的信息有两个:

  1. 表名,总是在单元格E3中找到
  2. 感兴趣的单元格区域,总是在行72-85和列E-V之间找到

提取的信息将粘贴在合并工作表的第2-15行中,工作表名称在一列中,所有其他信息在其旁边的列中。然后,从提取的下一张纸中提取的信息将粘贴到第16-29行,依此类推。

我是Python的新手,我正在运行Python 3.6.1。我已经找到了如何使用Python组合Excel文件的解决方案,但没有从Excel表中的指定单元格中提取信息片段的解决方案

任何指导都会很有帮助。

更新1:我设法加载到一个数据帧的面积我的一个工作表使用。

import pandas as pd
cis = pd.ExcelFile(r"C:\mypath\myfile.xlsx") 
df1 = cis.parse('1. Consumers', skiprows=[0,1,2,3,4,5,6],parse_cols=[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15]).drop([13])

但是,我仍然需要将工作表名称添加到数据框中,然后在所有工作表上运行相同的循环,最后将来自每个工作表的信息附加到一个数据框/文件中。

共有1个答案

萧远
2023-03-14

这应该足以让你开始:

xls = pd.ExcelFile('excel_file_path.xls')
for sheet in xls.sheet_names:
    df = pd.read_excel(file_name, sheetname=sheet)

如果你已经非常熟悉excel,你会很快学会熊猫。你绝对应该考虑使用Python的jupyter笔记本。Jupyter笔记本将基本上创建一个像用户界面这样的电子表格,具有大量的内置功能,用于运行分析和操作数据。

参考资料:

使用熊猫阅读同一工作簿中的多张工作表

链接到jupyter笔记本文档

熊猫教程

使用pandas for python的实用业务解决方案

 类似资料:
  • 问题内容: 我有包含多个工作表的Excel文件,每个工作表看起来都像这样(但更长): 第一列实际上是四个垂直合并的单元格。 当我使用pandas.read_excel阅读此内容时,我得到一个看起来像这样的DataFrame: 如何让Pandas理解合并的单元格,或者快速方便地删除NaN并按适当的值分组?(一种方法是重置索引,逐步查找值并将NaN替换为值,传入天数列表,然后将索引设置为该列。但是似乎

  • 我正在构建一个函数,读取excel文件中可用的数据。 我在Spring项目中使用Apache POI。 但是,我在阅读合并单元格时遇到了困难。我需要的是得到如图所示的红色高亮显示的内容。

  • 问题内容: 我的Python代码处理了以下文本: 您能建议我如何从内部提取数据吗?我的想法是将其放入具有以下格式的CSV文件中:。 我希望没有正则表达式会很困难,但实际上我仍然在反对正则表达式。 我或多或少地通过以下方式使用了代码: 理想情况下是将每个td竞争以某个数组进行竞争。上面的HTML是python的结果。 问题答案: 获取BeautifulSoup并使用它。这很棒。

  • 本文向大家介绍如何用python合并多个excel文件,包括了如何用python合并多个excel文件的使用技巧和注意事项,需要的朋友参考一下 安装模块 1、找到对应的模块  http://www.python-excel.org/ 2、用 pip install 安装 因为使用的是 python3,所以安装的时候采用 pip3。 XlsxWriter 示例 先看看简单的演示: 运行结果如下: 合

  • 问题内容: 有没有更有效的方法来对预先指定的bin中的数组取平均值?例如,我有一个数字数组以及一个与该数组中bin的开始和结束位置相对应的数组,我只想取这些bin中的均值?我下面有执行此操作的代码,但我想知道如何减少和改进它。谢谢。 问题答案: 它可能更快更容易使用: 替代方法是使用: 自己尝试哪个更快… :)

  • 本文向大家介绍python使用PIL和matplotlib获取图片像素点并合并解析,包括了python使用PIL和matplotlib获取图片像素点并合并解析的使用技巧和注意事项,需要的朋友参考一下 python 版本 3.x 首先安装 PIL 由于PIL仅支持到Python 2.7,加上年久失修,于是一群志愿者在PIL的基础上创建了兼容的版本,名字叫Pillow,支持最新Python 3.x,又