假设我有一个像下面这样的数据,有名称、类和日期
Name class Date
A 7th grade 1/1/2016
A 7th grade 1/2/2016
A 7th grade 1/3/2016
A 7th grade 1/4/2016
A 7th grade 1/5/2016
A 7th grade 1/6/2016
A 7th grade 1/7/2016
B 8th grade 1/8/2016
B 8th grade 1/9/2016
B 8th grade 1/10/2016
C 9th grade 1/11/2016
C 9th grade 1/12/2016
C 9th grade 1/13/2016
C 9th grade 1/14/2016
C 9th grade 1/15/2016
C 9th grade 1/16/2016
C 9th grade 1/17/2016
C 9th grade 1/18/2016
C 9th grade 1/19/2016
C 9th grade 1/20/2016
C 9th grade 1/21/2016
C 9th grade 1/22/2016
我正在寻找一个输出,这将给我的每个名字的值计数,他们各自的等级和最早的日期和最新的日期。我的输出是,
Name grade count earlydate latestdate
A 7thgrade 7 1/1/2016 1/7/2016
B 8th grade 3 1/8/2016 1/10/2016
C 9th grade 12 1/11/2016 1/22/2016
我能够找到每个名字的计数,
data.groupby('name','grade').count()
or
data.groupby('name','grade').size()
但无法在“日期”列中找到“最早日期”和“最晚日期”。
有人能帮我吗?
pandas groupby中的最大和最小日期
可能是这样的:
data.groupby('name','grade').agg({'date' : [np.min, np.max]}).count()
问题内容: 我在Java中有三个约会:a,b,c。这些日期中的任何一个或所有日期都可以为空。在没有大量if- else块的情况下确定a,b,c中最早日期的最有效方法是什么? 问题答案: 无法避免空值检查,但是通过一些重构,您可以使其变得更轻松。 创建一个安全地比较两个日期的方法: 然后结合调用: 实际上,您可以将此方法用作任何通用方法:
当我试图获取groupby之后的最早和最晚日期时,我发现max结果将附在min之后: 有没有一种方法可以通过使用GroupBy得到以下结果?
我需要根据日期对列进行分组。 我使用下面的内容将我的开始时间列拆分为日期和时间。我想在COUNT栏中计算每个日期的发生次数。 例如 我该怎么做?
问题内容: 如果我有一个表列,,, 并且我想运行一个sql查询以获取数据集中最早的记录。 您可以在查询中执行此操作,还是需要在事实之后循环? 我想获取该记录的所有字段。 问题答案: 如果您只想要日期: 如果您需要所有信息: 尽可能避免循环。循环通常会导致游标,游标几乎从来没有必要,而且常常效率很低。
对于我的具体情况,n=4,但可能有一天需要n=5或n=6。 我需要的顶级描述:我有一个表单,允许我将名称和日期添加到跳转日志中。我需要构建一个查询,该查询将显示每个跳转器的四个最近跳转,每个日期有一列。 我的表单将数据存储在“JUMP”表中,该表有3个字段:JUMPID、NAME、DATE。示例数据如下所示: 我现在使用的查询返回每个跳线最近的4次跳转,但将所有日期存储在同一列中。查询是: 此查询
问题内容: 我正在尝试在名称和最近日期(WRT左手数据框)上合并两个数据框。在我的研究中,我在这里发现了一个类似的问题,但它也没有说明名称。从上面的问题来看,似乎没有一种方法可以执行合并操作,但是我看不到另一种不使用pandas合并功能的方法来执行两个参数联接。 有没有办法做到这一点与合并?如果不是,那么合适的方法是什么呢? 我将发布我尝试过的内容的副本,但这是在日期上进行准确合并的尝试,因此无法