当前位置: 首页 > 面试题库 >

用熊猫在excel中着色细胞

谢翰学
2023-03-14
问题内容

我需要一些帮助。所以我有这样的事情

import pandas as pd
path = '/Users/arronteb/Desktop/excel/ejemplo.xlsx'
xlsx = pd.ExcelFile(path)
df = pd.read_excel(xlsx,'Sheet1')
df['is_duplicated'] = df.duplicated('#CSR')
df_nodup = df.loc[df['is_duplicated'] == False]
df_nodup.to_excel('ejemplo.xlsx', encoding='utf-8')

所以基本上这个程序将ejemplo.xlsx(ejemplo是西班牙语的例子,只是文件名)加载到df(a
DataFrame)中,然后检查特定列中的重复值。它将删除重复项并再次保存文件。该部分正常工作。问题在于,除了删除重复项之外,我还需要用不同的颜色(例如黄色)突出显示包含它们的单元格。


问题答案:

您可以创建一个函数来突出显示…

def highlight_cells():
    # provide your criteria for highlighting the cells here
    return ['background-color: yellow']

然后将突出显示功能应用于数据框…

df.style.apply(highlight_cells)


 类似资料:
  • 问题内容: 我试图在熊猫中绘制一些数据,并且内置的绘图功能可以方便地在每列中绘制一行。我要做的是根据我进行的分类为每行手动分配颜色。 以下作品: 但是,当我的索引是整数时,它将不再起作用并抛出为KeyError: 我的理解是,当使用整数索引时,它必须以某种方式从0开始。这是我的猜测,因为以下内容同样适用: 我的问题是: 这是怎么回事 假设我有一个不是从0开始或不是由连续数字组成的整数索引,那么我如

  • 我正在从pandas输出一个csv文件,其中包含一些用于latex报告的调查文本。一些响应在其响应中带有逗号,因此熊猫将数据输出为 通过将字段用双引号括起来,显然可以处理字段中的逗号。 我希望上面看起来像这样: 通过将所述字段包装在{}中,因为这是latex包可以理解的分隔符。 有没有办法告诉熊猫。要做这个吗? 我已经尝试了以下方法 当然,当我需要“}”时,它会用“{”关闭文本包装 更新当我使用p

  • 我是新的Python熊猫和工作在一个小的应用程序,在那里我想读我的excel文件有数据在印地语。 我面临的问题是,熊猫不能阅读印地语单词,正在放置一些任意的“?”符号。 我曾尝试将编码添加到utf-8,但也不起作用。 我的Excel数据: Python代码: 输出: 任何帮助都是值得赞赏的。提前感谢。

  • 问题内容: 我必须解析一个XML文件,该文件为我提供Excel样式的日期时间。例如:。 熊猫是否提供将该数字转换为常规对象的方法? 问题答案: 好的,我认为最简单的方法是从浮点数构造a并将其添加到以下标量日期时间中: 好的,似乎Excel的日期有点奇怪,谢谢@ayhan:

  • 问题内容: 我有以下数据框: 列由列中的日期向前移了一些。我想生成一个列,该列由date上的column的值组成。(最好是在逻辑中的Excel VLOOKUP公式会做到这一点。我不是在寻找简单的这里,是因为在现实之间的转移和并不总是等于)。 我尝试过,但是这很可能过于简单,并产生了错误。 问题答案: 我认为您需要按列: 与以下内容相同:

  • 我试图在pandas中绘制一些数据,内置的plot函数可以方便地为每列绘制一行。我想做的是根据我所做的分类手动为每一行指定一种颜色。 以下工作: 但是,当我的索引是整数时,它不再工作,并作为KeyError抛出: 我的理解是,当使用整数索引时,它必须从0开始。这是我的猜测,因为以下方法也有效: 我的问题是: 这里发生了什么 编辑: 我意识到,即使在第一种情况下,代码也没有达到我预期的效果。似乎只有