当前位置: 首页 > 知识库问答 >
问题:

将计数器应用于唯一列上的值[重复]

袁运良
2023-03-14

我的数据是这样的

同一用户可以有多个班次ID。所以在护士id列中,我有重复id。

我想在新的州为唯一的护士创建计数器。

现在当我

Counter(df["new_stat"])

它给

Counter({'D': 15123, 'R': 29300, 'not_active': 2581, 'N': 21455})

但是它也会计算ID的重复值。

如何在new_stat上为唯一的nurse_id创建计数器?

共有1个答案

夹谷斌蔚
2023-03-14

熊猫解决方案是SeriesGroupBy。值\u计数

df.groupby('nurse_id')['new_stat'].value_counts().reset_index(name='count')

DataFrameGroupBy.size

df.groupby(['nurse_id','new_stat']).size().reset_index(name='count')

如果需要每组计数器对象是可能的使用字典理解与系列构造函数:

pd.Series({k: Counter(v['new_stat']) for k, v in df.groupby('nurse_id')})
 类似资料:
  • 问题内容: 我需要在列上计算不同的值,例如: 结果必须是: 3 。我的查询是: 但它返回:2.我还测试了: 但它返回三行: 我怎样才能将空值算作1值,并使用distinct来避免对重复值进行计数? 我正在学习高级SQL,他们希望我对所有解决方案有以下要求: 尝试最小化解决查询所需的子查询数。此外,不允许使用以下构造: 在FROM或SELECT中选择。允许您有子查询(在WHERE或HAVING中进行

  • 问题内容: 我有以下json 我想计算重复的名字 重复计数3 不可重复的名字计数 非重复计数2 我试图计算存储桶的数量,但似乎计算所有存储桶是重复的还是非重复的 问题答案: 好吧,我在这里利用了几种聚合。以下是我使用过的列表。列表的顺序是聚合的执行顺序。 对于重复 术语汇总 统计数据桶汇总 对于非重复 术语汇总 桶选择器 (作为子集合) 总和桶选择器 汇总查询: 响应 注意,在上面的响应中,我们有

  • 问题内容: 如果我有三列: 我想计算一下表格中有多少唯一的电子邮件,我该怎么做? 如下语句: 给我总数。 我试过了 但这似乎并没有给我期望的数字。 问题答案: 采用 提供唯一的电子邮件ID,然后简单地对其进行计数。

  • 问题内容: 我已经在处理以下代码,但是似乎找不到一种方法来计算字谜列表中唯一值的数量。如果我只是打印出:我会得到列表的总价值,但其中包括重复项。 我试图将列表转换为集合,然后再删除掉重复项,但是还没有任何运气。 谢谢! 问题答案: 使用。仅包含唯一值:

  • 问题内容: 我有以下独特的约束 我正在尝试防止两个问题处于活动状态时具有相同的问题编号(IS_ACTIVE值= 1)。 一切似乎都很好,直到我第二次不得不提一个问题。 我需要仅在IS_ACTIVE = 1时应用约束 问题答案: 您可以创建一个基于函数的唯一索引 这利用了以下事实:Oracle b树索引不存储数据,而叶块数据将完全为NULL。

  • 我想计算唯一标签值的数量。有点像 例如,如果我的度量“hello_info”有标签a和b,我想计算唯一a的数量。这里a=“1”、“2”、“3”的计数为3。