当前位置: 首页 > 面试题库 >

如何获取一列中最频繁出现的值的数量?

葛嘉悦
2023-03-14
问题内容

我有一个数据框,我想知道给定列有多少次最频繁的值。

我尝试通过以下方式进行操作:

items_counts = df['item'].value_counts()
max_item = items_counts.max()

结果,我得到:

ValueError: cannot convert float NaN to integer

据我了解,在第一行中,我得到了一系列,其中列中的值用作键,而这些值的频率用作值。因此,我只需要在系列中找到最大的值,由于某种原因,它不起作用。有人知道如何解决这个问题吗?


问题答案:

看起来您的列中可能有一些空值。您可以使用删除它们df = df.dropna(subset=['item'])。然后df['item'].value_counts().max()应为您提供最大计数,并df['item'].value_counts().idxmax()应为您提供最频繁的值。



 类似资料:
  • 问题内容: 我有一个数字数组,我想知道该数组中哪个数字最常见。数组有时有5-6个整数,有时有10-12个,有时甚至更多- 数组中的整数也可以不同。因此,我需要一个可以与数组的不同长度和值一起使用的函数。 一个例子: 另一个例子: 现在,我正在寻找一个给出0(在第一个示例中)的函数,因为它在此数组中是3倍,而数组中的另一个整数(1)在数组中仅是2倍。或第二个例子是4。 看起来很简单,但是我找不到解决

  • 问题内容: 我有一个表Orders(id_trip,id_order),表Trip(id_hotel,id_bus,id_type_of_trip)和表Hotel(id_hotel,name)。 我想在表Orders中获得最常入住的酒店的名称。 问题答案: 分布中的“最常出现的值”是统计学中的一个不同概念,带有一个技术名称。它称为发行版的MODE。Oracle具有此功能。https://docs.

  • 问题内容: 如何在SQL表的给定列中找到最频繁的值? 例如,对于该表,它应该返回,因为它是最频繁的值: 问题答案: 替换和。如果要查看列的最常用值,请增加。

  • 问题内容: 我想与Lucene交流一些经常出现的短语。我从TXT文件中获取了一些信息,并且由于没有短语信息而失去了很多上下文,例如“信息检索”被索引为两个单独的词。 怎样获得这样的短语?我在互联网上找不到任何有用的东西,所有的建议,链接,提示,尤其是示例都值得赞赏! 编辑: 我只按标题和内容存储我的文档: 因为对于我而言,最重要的是文件的内容。标题通常根本不是描述性的(例如,我有很多PDF学术论文

  • 所以,问题是,我有一个由30个随机重复的数字组成的列表,我必须找到最频繁的数字以及重复的次数。 例如:列表是,从这个列表中,我希望显示的结果是11、4次7、4次。 我一直在努力,但我似乎迷路了,我不能清楚地找出一种方法,超越了制作列表和为列表中的i写作:

  • 我有一个有83列4000行的pandas数据帧。我打算使用这些数据进行logistic回归,因此希望将我的列缩小到那些丢失数据最少的列。 乔希

  • 问题内容: 如何获取ArrayList的最后一个值? 我不知道ArrayList的最后一个索引。 问题答案: 以下是接口的一部分(由ArrayList实现): 是元素类型。如果列表为空,则抛出。你可以在此处找到整个API文档。

  • 我有一个数据集 我希望能够返回像(显示独特的值和频率)这样的东西