当前位置：首页 > 面试题库 >

像Qlik一样在pandas数据框中的列中计算唯一值？

终子昂

2023-03-14

问题内容：

如果我有这样的表：

df = pd.DataFrame({
         'hID': [101, 102, 103, 101, 102, 104, 105, 101],
         'dID': [10, 11, 12, 10, 11, 10, 12, 10],
         'uID': ['James', 'Henry', 'Abe', 'James', 'Henry', 'Brian', 'Claude', 'James'],
         'mID': ['A', 'B', 'A', 'B', 'A', 'A', 'A', 'C']
})

我可以count(distinct hID)在Qlik中提出5个唯一的hID。我该如何在Python中使用Pandas数据框？还是一个numpy数组？同样，如果这样做，count(hID)我将在Qlik中得到8。在大熊猫中做这件事的等效方法是什么？

问题答案：

计算不同的值，使用nunique：

df['hID'].nunique()
5

仅计算非空值，请使用count：

df['hID'].count()
8

计算包括空值在内的总值，请使用size属性：

df['hID'].size
8

使用布尔索引：

df.loc[df['mID']=='A','hID'].agg(['nunique','count','size'])

或使用query：

df.query('mID == "A"')['hID'].agg(['nunique','count','size'])

输出：

nunique    5
count      5
size       5
Name: hID, dtype: int64

类似资料：

计算Python列表中的唯一值

问题内容：我已经在处理以下代码，但是似乎找不到一种方法来计算字谜列表中唯一值的数量。如果我只是打印出：我会得到列表的总价值，但其中包括重复项。我试图将列表转换为集合，然后再删除掉重复项，但是还没有任何运气。谢谢！问题答案：使用。仅包含唯一值：
如何计算数据帧中每列的唯一性？

下面有一段代码，它创建了数据框中每列中缺失值的汇总表。我希望我可以构建一个类似的表来计算唯一的值，但是DataFrame没有唯一的（）方法，只有每一列是独立的。（资料来源：https://stackoverflow.com/a/39734251/7044473）如何为唯一值实现相同的功能？
如何在mysql中计算唯一列值

问题内容：这是我的数据是独特的。我需要显示每张卡的所有详细信息和总时间，例如：问题答案： SELECT卡号，用户名，表名，总和（小时）从表_1 GROUP BY卡号，用户名，表名开始
熊猫数据框中选定列和计数中值的唯一组合

问题内容：我将数据存储在pandas数据框中，如下所示：所以，我的数据看起来像这样我想将其转换为另一个数据框。预期的输出可以在以下python脚本中显示：因此，我的预期输出如下所示实际上，我可以使用以下命令来找到所有组合并对其进行计数：但是，事实证明，此类组合在单个列中。我想将组合中的每个值分隔到不同的列中，并且还要为计数结果增加一列。有可能这样做吗？请问您有什么建议吗？先感谢您。问
每组用pandas计算唯一值

问题内容：我需要在每笔数据中都计算唯一值我尝试但是我想得到问题答案：您需要：如果需要字符：或正如乔恩所说：您可以像这样保留列名：区别在于返回一个Series并返回一个DataFrame。
使用pandas groupby计算唯一值

问题内容：我有以下形式的数据：组内的非空值始终相同。我想对每个组（如果存在）的非空值进行一次计数，然后找到每个值的总数。我目前正在以以下方式（笨拙和低效）进行此操作：我敢肯定，有一种方法可以更干净地执行此操作，而无需使用循环，但是我似乎无法解决问题。任何帮助将非常感激。问题答案：我认为您可以使用：的另一种解决方案，然后创建new by ，将其重塑为by和last ：

相关阅读

使用pandas groupby计算唯一值 Python Pandas：带有aggfunc的数据透视表=计数唯一唯一在Pandas数据框中查找唯一值，而不考虑行或列的位置计算唯一值的数量在python中计算唯一单词

相关文章

中国移动设计院算法一面唯品会——数开，一面 tp图像算法一面华为云计算一面北森云计算一面

相关问答

为数据框中的每一行和特定列计算列表中的出现次数为熊猫数据框中的唯一行分配列值[重复]如何根据一列中的唯一值在另一列中建立索引列出列值在数据帧中不唯一的行 [重复]在数据框中创建值_计数列

相关工具

Tiny分布式计算框架 Axiom计算机代数系统数据库处理框架 Flurry统计数据ANE 功能齐全的计算器

相关文档

像计算机科学家一样思考（C++版）像计算机科学家一样思考 Python 第二版 Python 和 Pandas 数据分析教程 Python Pandas 中文教程数据挖掘算法