我想使用python的Pandas库读取.xlsx文件,并将数据移植到postgreSQL表中。
到目前为止,我所能做的就是:
import pandas as pd
data = pd.ExcelFile("*File Name*")
现在,我知道该步骤已成功执行,但是我想知道如何解析已读取的excel文件,以便可以了解excel中的数据如何映射到变量数据中的数据。
我没弄错,数据就是Dataframe对象。因此,我如何解析此dataframe对象以逐行提取每一行。
我通常会DataFrame
为每个工作表创建一个包含的字典:
xl_file = pd.ExcelFile(file_name)
dfs = {sheet_name: xl_file.parse(sheet_name)
for sheet_name in xl_file.sheet_names}
更新:在pandas 0.21.0+版本中,您可以通过传递sheet_name=None
给read_excel
:
dfs = pd.read_excel(file_name, sheet_name=None)
在0.20及sheetname
更低版本中,它是而不是sheet_name
(现在已弃用,而改为上面的名称):
dfs = pd.read_excel(file_name, sheetname=None)
我需要帮助在阅读xlsx文件,也使用密码解锁,正如上面所做的。
因此,我一直在使用Python3.2和OpenPyXL的iterable工作簿,如这里的“优化阅读器”示例所示。 当我尝试使用此策略读取从简单文档中提取的一个或多个文件时,就会出现问题。zip存档(手动和通过python zipfile包)。当我调用我得到“A”和我得到1,当要求打印每个单元格的值时,如下所示: 它打印A1、A2、A3、A4、A5、A6和A7中的值,而不管文件实际有多大。文件本身没
问题内容: 我需要在Java应用程序中读取Excel 2007 XLSX文件。有谁知道一个很好的API来完成这项任务? 问题答案: AFAIK还没有可用的xlsx库。但是有些旧的xls: 一个库是jxls,它内部使用已经提到的POI。 其他2个链接:处理Excel文件,用于读写Excel XLS文档文件的Java库 。
我正在使用的读取XLSX文件。我收到一个错误。后来,对java类使用增加了堆大小,仍然会重复同样的错误。 在上面的代码段中,执行停止在处,并抛出指定的错误。谁能建议更好的方法来读取大的XLSX文件。
问题内容: 我正在尝试在Java中阅读excel。我有以下代码。 我导入了poi.3.6jar和poi.ooxml-3.6 jar。当我运行该程序时,出现以下错误消息。 我不明白为什么会出现此错误消息。请帮助我。 问题答案: 将文件添加到您的类路径。
该编码能够读取excel文件中的小数据...但不读取excel文件中的大数据文件....如何进一步修改代码?