系列中唯一元素的数量:
In [1]: id_numbers = pd.Series([111, 112, 112, 114, 115, 118, 114, 118, 112]) In [2]: id_numbers.nunique() Out[2]: 5
获取系列中的独特元素:
In [3]: id_numbers.unique() Out[3]: array([111, 112, 114, 115, 118], dtype=int64) In [4]: df = pd.DataFrame({'Group': list('ABAABABAAB'), 'ID': [1, 1, 2, 3, 3, 2, 1, 2, 1, 3]}) In [5]: df Out[5]: Group ID 0 A 1 1 B 1 2 A 2 3 A 3 4 B 3 5 A 2 6 B 1 7 A 2 8 A 1 9 B 3
每组中唯一元素的数量:
In [6]: df.groupby('Group')['ID'].nunique() Out[6]: Group A 3 B 2 Name: ID, dtype: int64
在每个组中获取唯一元素:
In [7]: df.groupby('Group')['ID'].unique() Out[7]: Group A [1, 2, 3] B [1, 3] Name: ID, dtype: object
问题内容: 我有一个重复的行的DataFrame。我想获得一个具有唯一索引且没有重复项的DataFrame。可以丢弃重复的值。这可能吗?做完了吗? 问题答案: In [29]: df.drop_duplicates() Out[29]: b c 1 2 3 3 4 0 7 5 9
问题内容: 给定下面的数组,我想知道是否有一种简单的方法可以将此数组转换为仅具有唯一值的数组? 给出: 将其变成这样的结果数组,保留原始顺序: 问题答案: 在Java 8中,用于获取数组的唯一元素 最简单的方法是从数组创建集合。 然后您可以使用以下方法检索数组: 如果要维护订单,请使用 LinkedHashSet; 如果要对订单进行排序,请使用 TreeSet 。
问题内容: 我有一个像下面的pandasDataFrame。 我想通过“ ID”对此分组,并获得每个分组的第二行。后来我也需要获得第三和第四名。请向我解释一下如何仅获取每个组的第二行。 我尝试按照以下方式给出第一和第二。 相反,我只需要获取第二行。由于ID 4和6没有第二行,因此无需忽略它们。 问题答案: 我 认为 第n种方法应该做到这一点: 在0.13中,另一种方法是使用cumcount: …这
问题内容: 我有一张桌子和and collums。 我想得到每个的总数。我正在尝试以下查询: 我也试过这个查询 但是没有得到实际的结果。我想要以上数据的结果: 问题答案: 您只需要使用而不是即可。因此,请尝试以下查询: 看到这个SQLFiddle 让您使用聚合函数,如,,, ,等而只是删除重复。
问题内容: 我有一个看起来像这样的数据框: 如何求和并计算,以得到一个看起来像这样的新数据框? 我知道如何求和 或 计数: 但不是两者都要做! 问题答案: 尝试这个: 或者如果您不想重置索引: 要么 演示:
我有这个HTML列表 和一个通过AJAX添加新名称的表单,多个由逗号分隔的add。响应是一个包含姓名的列表 我尝试在列表中按字母顺序插入这些名称,如下面的示例https://jsfidle.net/vqu3s/7/