当前位置: 首页 > 面试题库 >

使用Python读取Excel中的合并单元格

苏选
2023-03-14
问题内容

我正在尝试使用xlrd读取带有Python的Excel合并单元格。

我的Excel :(请注意,第一列已合并到三行中)

    A   B   C
  +---+---+----+
1 | 2 | 0 | 30 |
  +   +---+----+
2 |   | 1 | 20 |
  +   +---+----+
3 |   | 5 | 52 |
  +---+---+----+

在此示例中,我想将第一列的第三行读取为等于2,但它返回''。您是否知道如何获得合并单元格的价值?

我的代码:

all_data = [[]]
excel = xlrd.open_workbook(excel_dir+ excel_file)
sheet_0 = excel.sheet_by_index(0) # Open the first tab

for row_index in range(sheet_0.nrows):
    row= ""
    for col_index in range(sheet_0.ncols):
        value = sheet_0.cell(rowx=row_index,colx=col_index).value             
        row += "{0} ".format(value)
        split_row = row.split()   
    all_data.append(split_row)

我得到的是:

'2', '0', '30'
'1', '20'
'5', '52'

我想要得到什么:

'2', '0', '30'
'2', '1', '20'
'2', '5', '52'

问题答案:

我只是试过了,它似乎适用于您的示例html" target="_blank">数据:

all_data = []
excel = xlrd.open_workbook(excel_dir+ excel_file)
sheet_0 = excel.sheet_by_index(0) # Open the first tab

prev_row = [None for i in range(sheet_0.ncols)]
for row_index in range(sheet_0.nrows):
    row= []
    for col_index in range(sheet_0.ncols):
        value = sheet_0.cell(rowx=row_index,colx=col_index).value
        if len(value) == 0:
            value = prev_row[col_index]
        row.append(value)
    prev_row = row
    all_data.append(row)

返回

[['2', '0', '30'], ['2', '1', '20'], ['2', '5', '52']]

它跟踪上一行的值,如果当前行的相应值为空,则使用它们。

请注意,上面的代码不会检查给定的单元格是否实际上是单元格合并集合的一部分,因此在该单元格确实为空的情况下,它可能会复制先前的值。不过,这可能会有所帮助。

附加信息:

随后,我找到了一个文档页面,该页面讨论了一种merged_cells属性,可以用来确定合并的各个单元格范围中包含的单元格。文档说它是“
0.6.1版的新功能”,但是当我尝试将其与xlrd-0.9.3一起使用时,pip出现了错误

NotImplementedError:formatting_info =还没有实现

我并不特别倾向于开始使用不同版本的xlrd来测试该merged_cells功能,但是如果以上代码不足以满足您的需求并且遇到与我相同的错误,也许您可​​能会对这样做感兴趣formatting_info=True



 类似资料:
  • 问题内容: 我有包含多个工作表的Excel文件,每个工作表看起来都像这样(但更长): 第一列实际上是四个垂直合并的单元格。 当我使用pandas.read_excel阅读此内容时,我得到一个看起来像这样的DataFrame: 如何让Pandas理解合并的单元格,或者快速方便地删除NaN并按适当的值分组?(一种方法是重置索引,逐步查找值并将NaN替换为值,传入天数列表,然后将索引设置为该列。但是似乎

  • 我正在构建一个函数,读取excel文件中可用的数据。 我在Spring项目中使用Apache POI。 但是,我在阅读合并单元格时遇到了困难。我需要的是得到如图所示的红色高亮显示的内容。

  • 我想完全读取Excel表并使用AJAX将每一行发送到另一个页面进行处理。所以我使用了以下代码将excel表数据转换为JSON数组(库中提供的参考PHPExcel示例): 这里是上传文件的位置,要读取该位置以使用AJAX将行单独发送到另一个页面。我在javascript中使用作为 但是excel工作表包含一些合并单元格,因此PHPExcel无法读取这些合并单元格中的值。因此,这些单元格中的值被读取为

  • 问题内容: 还有其他方法可以使用Apache POI库在Excel中合并单元格? 我正在尝试使用以下内容,但无法正常工作 问题答案: 您可以使用 该示例将从B2合并到E2。请记住,它是基于零的索引(例如POI版本3.12)。 有关详细信息,请参见《BusyDeveloper指南》。

  • 我试着用下面的方法,但它不起作用

  • 我有一个. xlsx格式的Excel文件。我通过合并单元格以形成各种列来存储数据。我正在通过JavaWeb应用程序读取Excel文件并将其数据保存到数据库(MySQL)。但是当我从合并的单元格中读取时,我会得到空值以及存储在列和标题中的内容。我使用Apache POI。我的代码是: 我在网上搜索了答案,但没有找到任何相关的。

  • 我正在尝试使用Apache POI来读取旧的(2007年之前和XLS)Excel文件。我的程序走到行的末尾并进行迭代,直到找到非null或非空的内容。然后它迭代几次并获取这些细胞。该程序可以很好地读取Office 2010中的XLSX和XLS文件。 我收到以下错误消息: 排队的时候: 根据代码: 其中是文档中最后一个不为空或null的单元格。当我尝试打印第一个不为空或null的单元格时,它不会打印

  • 我有一个对象列表,我试图为每个对象指定三行,我使用的"Office Open Xml库"有以下例程: 然而,它弹出一个错误,说不能合并已经合并的单元格。 所以问题是如何在Excel中合并两个以上的单元格?