当前位置：首页 > 面试题库 >

如何在pandas中合并/合并列？

西门山

2023-03-14

问题内容：

我有一个带有4列的（example-）数据框：

data = {'A': ['a', 'b', 'c', 'd', 'e', 'f'],
    'B': [42, 52, np.nan, np.nan, np.nan, np.nan],  
    'C': [np.nan, np.nan, 31, 2, np.nan, np.nan],
    'D': [np.nan, np.nan, np.nan, np.nan, 62, 70]}
df = pd.DataFrame(data, columns = ['A', 'B', 'C', 'D'])

    A   B       C       D
0   a   42.0    NaN     NaN
1   b   52.0    NaN     NaN
2   c   NaN     31.0    NaN
3   d   NaN     2.0     NaN
4   e   NaN     NaN     62.0
5   f   NaN     NaN     70.0

我现在想将B，C和D列合并/合并到新的E列，如本例所示：

data2 = {'A': ['a', 'b', 'c', 'd', 'e', 'f'],
    'E': [42, 52, 31, 2, 62, 70]}
df2 = pd.DataFrame(data2, columns = ['A', 'E'])

    A   E
0   a   42
1   b   52
2   c   31
3   d   2
4   e   62
5   f   70

我在这里发现了一个非常类似的问题，但这在A列的末尾添加了合并的列B，C和D：

0      a
1      b
2      c
3      d
4      e
5      f
6     42
7     52
8     31
9      2
10    62
11    70
dtype: object

感谢帮助。

问题答案：

选项1
使用assign和drop

In [644]: cols = ['B', 'C', 'D']

In [645]: df.assign(E=df[cols].sum(1)).drop(cols, 1)
Out[645]:
   A     E
0  a  42.0
1  b  52.0
2  c  31.0
3  d   2.0
4  e  62.0
5  f  70.0

选项2
使用分配和drop

In [648]: df['E'] = df[cols].sum(1)

In [649]: df = df.drop(cols, 1)

In [650]: df
Out[650]:
   A     E
0  a  42.0
1  b  52.0
2  c  31.0
3  d   2.0
4  e  62.0
5  f  70.0

选项3 最近，我喜欢第3个选项。
使用groupby

In [660]: df.groupby(np.where(df.columns == 'A', 'A', 'E'), axis=1).first() #or sum max min
Out[660]:
   A     E
0  a  42.0
1  b  52.0
2  c  31.0
3  d   2.0
4  e  62.0
5  f  70.0

In [661]: df.columns == 'A'
Out[661]: array([ True, False, False, False], dtype=bool)

In [662]: np.where(df.columns == 'A', 'A', 'E')
Out[662]:
array(['A', 'E', 'E', 'E'],
      dtype='|S1')

类似资料：

Pyton中Pandas 合并 101

问题内容：如何执行与pandas（LEFT| RIGHT| FULL）（INNER| OUTER）的联接？合并后如何为缺失的行添加NaN？合并后如何去除NaN？我可以合并索引吗？与pandas交会吗？如何合并多个DataFrame？ merge?join?concat?update?Who? What? Why?! … 和更多。我已经看到这些重复出现的问题，询问有关熊猫合并功能的各个方
如何在Oracle中将2列合并（合并）为1？

问题内容：我有3个文本字段，其中用户键入表名和2个需要合并的列名。如何将2列值合并（合并）为1？我使用oracle 11g企业版问题答案：串联？
如何在JGit中合并？

问题内容：如何在JGit中合并？假设我要与分支合并，该怎么做？问题答案：要合并，您可以在之后使用（在org.eclipse.jgit.api包中）。为了给您提供示例，因为Jgit确实缺少示例：我没有尝试该代码，因此它可能并不完美，但这只是一个开始。而且我没有包括进口。使用JGit开发意味着基于Javadoc的许多尝试
Pandas merge合并操作

主要内容：使用how参数合并Pandas 提供的 merge() 函数能够进行高效的合并操作，这与 SQL 关系型数据库的 MERGE 用法非常相似。从字面意思上不难理解，merge 翻译为“合并”，指的是将两个 DataFrame 数据表按照指定的规则进行连接，最后拼接成一个新的 DataFrame 数据表。 merge() 函数的法格式如下： pd.merge(left, right, how='inner', on=
如何在字符串包含上合并pandas？

问题内容：我有2个数据框，我想将它们合并到一个公共列上。但是，我要合并的列不是同一字符串，而是另一个中包含一个字符串，如下所示：我想要的结果如下：问题答案：新答案这是一种基于pandas / numpy的方法。旧答案这是左联接行为的一种解决方案，因为它不会保留不匹配任何值的值。这比上面的numpy / pandas解决方案要慢，因为它使用两个嵌套循环来构建python列表。
在pandas中合并两个数据框

问题内容：我正在使用下面的代码合并两个csv（数据帧）：我有以下CSV文件文件1：文件2：合并后如果您注意到student_id的开头附加了0，应该将其视为文本，但是在合并并使用函数后，它将其转换为数字并删除了前导0。即使在to_csv之后，如何将列保持为“文本”？我认为它的to_csv函数可以再次保存为数字添加了dtype = {‘student_id’：str}。问题答案：

相关阅读

在pandas中合并两个数据框如何在R中合并列表？合并pandas数据框列表如何在Windows的GIT中合并？如何在Java中合并路径？

相关文章

RxJava 合并运算符树上启发式合并 Pillow图像分离与合并 PDFBox合并多个PDF文档 Python Pandas聚合函数

相关问答

合并在postgresql中合并行如何进行深度合并而不是浅合并？如何在星火SQL中合并地图列？合并和合并排序将在合并排序算法中运行多少次？

相关工具

并元广电融合 CDN IOS中解析并显示Gif文件 Pandas 公共集合框架包

相关文档

Java 并发中文教程 Python 并发中文教程 SQL 合计函数 Erlang 并发编程 C++并发编程