当前位置: 首页 > 面试题库 >

如何在非唯一列中按日期对pandas DataFrame条目进行分组

鞠建安
2023-03-14
问题内容

熊猫DataFrame包含名为的列"date",其中包含非唯一datetime值。我可以使用以下方法将该行中的行分组:

data.groupby(data['date'])

但是,这会将数据按datetime值分割。我想按“日期”列中存储的年份对这些数据进行分组。此页面显示了在使用时间戳作为索引的情况下如何按年份分组,在我的情况下情况并非如此。

如何实现此分组?


问题答案:

我正在使用熊猫0.16.2。这对我的大型数据集具有更好的性能:

data.groupby(data.date.dt.year)

使用dt选项和玩弄weekofyeardayofweek等变得更加容易。



 类似资料:
  • 问题内容: 获取目录中所有文件的列表的最佳方法是什么,按日期排序[创建| 修改],在Windows机器上使用python? 问题答案: 这@Greg Hewgill是答案的更详细的版本。这是最符合问题要求的。它区分了创建日期和修改日期(至少在Windows上如此)。 例:

  • 我在一个项目中工作,涉及到获取用户上传的帖子。我在字典中检索用户帖子并将它们添加到数组中。当用户发布一些东西时,我有该帖子的创建日期。现在问题来了,当我在集合视图中加载这些post时,每当我运行代码时,post就会被洗牌。

  • 我正在为我叔叔做一个应用程序,他让我做来挑战我。我认为这是学习颤振/飞镖的绝佳机会。我有这段代码(下面),但我需要它按日期时间组织一个列表(第77行)。每个条目至少有一个字符串id、一个DateTime变量、一个字符串名称和一些正文文本。

  • 我有这样一个情况: 我必须对进行排序,该列表还包含的ID,排序必须为: null

  • 问题内容: 我将MongoDB与Node.JS结合使用。我有一个包含日期和其他行的集合。日期是一个JavaScript 对象。 如何按日期排序此收藏集? 问题答案: 只需对@JohnnyHK答案进行一些修改 在许多用例中,我们希望返回最新记录(例如最新更新/插入)。

  • 我有下面的列表,我试着按日期时间重新排序。 我想以最远到期日期最先显示的方式重新排序列表: 我尝试过的(更新)- 在排序函数上,我收到了这个错误(通过上述修复解决):