当前位置：首页 > 面试题库 >

如何用熊猫将多行合并为单行

穆理

2023-03-14

问题内容：

我需要将多行合并为单行，这将是简单的带有空间的连接

    View of my dataframe:
  tempx        value
0  picture1         1.5
1  picture555       1.5
2  picture255       1.5
3  picture365       1.5
4  picture112       1.5

我希望数据帧像这样转换：（空格分隔）tempx值

  Expected output:
  tempx                                                       value
  0     picture1 picture555 picture255 picture365 picture112  1.5

  or
  as a python dict
  {1.5:{picture1 picture555 picture255 picture365 picture112}}

我试过的

 df_test['tempx']=df_test['tempx'].str.cat(sep=' ')

这行得通，但是它将所有列中的行合并在一起，如下所示：

      tempx        value
0  picture1 picture555 picture255 picture365 picture112 1.5
1  picture1 picture555 picture255 picture365 picture112 1.5
2  picture1 picture555 picture255 picture365 picture112 1.5
3  picture1 picture555 picture255 picture365 picture112 1.5
4  picture1 picture555 picture255 picture365 picture112 1.5

有什么优雅的解决方案吗？

问题答案：

您可以使用groupby和apply功能join：

print df.groupby('value')['tempx'].apply(' '.join).reset_index()
   value                                              tempx
0    1.5  picture1 picture555 picture255 picture365 pict...

类似资料：

熊猫基于列将两行合并为一行

我有两排像这样的，我希望将它们合并为一个单独的：不知道如何在熊猫身上做到这一点。任何提示都将受到高度赞赏！提前谢谢
如何将多行数据合并为一？

问题内容：我正在使用SQL Server2008。我具有下表中的数据：我想以这种格式获取数据：我怎样才能做到这一点？问题答案：使用PIVOT您可以执行以下操作产生查看有效的Data.SE示例在不支持PIVOT的数据库中，您可以改为对表进行多次联接。尽管您可能还是想这样做，但是正如GBN所指出的那样，因为我们没有使用聚合。查看有效的Data.SE示例
熊猫：如何将一列中的文本拆分为多行？

我正在处理一个大的csv文件，下一列的最后一列有一个文本字符串，我想用一个特定的分隔符来分割。我想知道是否有一种简单的方法可以使用pandas或python来实现这一点？我想按空格分割，然后按列中的冒号分割，但是每个单元格将导致不同数量的列。我有一个重新排列列的函数，所以列在工作表的末尾，但是我不确定从那里做什么。我可以在excel中使用内置的函数和一个快速宏来完成，但是我的数据集有太多的记录需
将多行合并为一行

问题内容：我正在尝试不同的JOIN查询，但没有得到想要的结果。我有2张桌子：我找不到想要的结果。我想得到以下结果：问题答案：您不能具有这样的动态列数，但是可以将数据连接成字符串：或者您可以使用或手动旋转行（我更喜欢后一种方法，对我来说似乎更灵活，但是在某些情况下可以大大减少代码量）：您还可以将前面的语句转换为动态SQL，如下所示：
熊猫df.iterrows（）并行化

问题内容：我想并行化以下代码：由于每一行都可以独立处理，因此我尝试使用它，但是我不知道如何共享DataFrame。我也不确定这是否是与熊猫并行化的最佳方法。有什么帮助吗？问题答案：就像@Khris在他的评论中说的那样，您应该将数据帧分成几个大块，并并行地遍历每个块。您可以将数据帧任意分成随机大小的块，但是根据您计划使用的进程数将数据帧分成大小相等的块更有意义。幸运的是，已经有人想出了如何为
如何合并 pyspark 和熊猫数据帧

我有一个非常大的 pyspark 数据帧和一个较小的熊猫数据帧，我读入如下：这两个数据帧都包含标记为“A”和“B”的列。我想创建另一个 pyspark 数据帧，其中只有 df1 中的那些行，其中“A”和“B”列中的条目出现在中同名的列中。也就是说，使用 df2 的列“A”和“B”过滤 df1。通常我认为这将是一个连接（通过实现），但是如何将熊猫数据帧与 pyspark 数据帧连接起来？我负

相关阅读

将多行合并为一行MySQL 熊猫合并-如何避免重复的列熊猫分组后并行应用 SQL 2005合并/将多行合并为一列大熊猫：在多列上合并（合并）两个数据框

相关文章

Oracle合并数据 GitLab合并请求 GitLab合并请求如何将用户需求转化为产品需求？产品岗面试题：为什么共享单车涨价了，骑行的人还是如此的多

相关问答

熊猫：如何使用多索引运行支点？用熊猫读取并合并文件[副本]在熊猫中将一行转换为列根据条件替换和合并熊猫中的行熊猫-将列转换为int并强制NaN

相关工具

熊猫Flash播放器利用plist进行多语言切换单一label多颜色多字体 Cocos2d-X 单机麻将猫国建设者

相关文档

Java 并发性和多线程如何成为优秀的程序员变现猫接入文档 v1.4 上云如此简单如何使用 Gitbook 来做笔记