当前位置: 首页 > 知识库问答 >
问题:

将分组按回添加到数据帧[重复]

吴单鹗
2023-03-14

我有一个数据框在熊猫如下,这是存储团队赢得的名称和体育场的名称,它赢了如下

d={"Winner":["Team1","Team2","Team3","Team1","Team2","Team1"],
         "Stadium":["S1","S2","S3","S1","S2","S1"]}

score=pd.DataFrame.from_dict(d)

现在,我已经在上面的数据框上与group by进行了一些计算,以找到每支球队的数量以及在体育场赢得的比赛,如下所示:

 score.groupby(by=["Stadium","Winner"]).size().reset_index()

现在,我想将这些计数值添加回我的数据帧。

我面临多个分组列的问题。

任何帮助。

共有1个答案

戚逸清
2023-03-14

这就是合并的目的:

score.merge(
    score.groupby(by=["Stadium","Winner"]).size().reset_index(),
    on=["Stadium", "Winner"]
)
 类似资料:
  • 我使用的是Spark 1.6,我想在数据帧中添加一列。新列实际上是一个常量序列:Seq(“-0”、“-1”、“-2”、“-3”) 这是我的原始数据帧: root--user\u name:string(nullable=true) |--test\u name:string(nullable=true) |user_name|test_name| ------------ ------------

  • 我想按多个列对熊猫数据框进行分组。每个Row都有一个整数、一个Name和一个额外的数值。我希望最终的Dataframe包含Name具有最高整数的每一行。 通过分组数据帧,只有第0行应该消失。第3行和第4行仍应包括在数据框中。

  • 向pandas对象添加空列的最简单方法是什么?我偶然发现的最好的东西是 有没有一种不那么反常的方法?

  • 我正在读取一个csv文件到。这个csv文件由四列和一些行组成,但没有标题行,我想添加它。我一直在尝试以下方法: 但当我应用代码时,我得到以下错误: 这个错误到底意味着什么?在python中,向我的csv文件/df添加标题行的干净方法是什么?

  • 我有一个熊猫数据框,如下所示。 我根据按数据帧分组。分组数据框在概念上如下所示。 现在,我正在寻找一个内置API,它将给我最大作业数的。对于上面的示例,-2具有最大计数。 更新:我希望具有最大作业计数,而不是具有最大作业计数的。对于上述示例,如果,则输出为。这能做到吗?

  • 我有一个来自excel电子表格的数据框,其中我找到了每个域出现的频率。我想添加域频率计数到它的相应域。 下面是查找频率并尝试将其添加到相应域的代码。 当我从数据帧打印出频率时: