当前位置：首页 > 面试题库 >

如果所有行的列中只有一个值，则在Pandas数据框中折叠行

国高杰

2023-03-14

问题内容：

我有以下DF

         col1  |  col2   | col3   | col4   | col5  | col6
    0    -     |   15.0  |  -     |  -     |   -   |  -
    1    -     |   -     |  -     |  -     |   -   |  US
    2    -     |   -     |  -     |  Large |   -   |  -
    3    ABC1  |   -     |  -     |  -     |   -   |  -
    4    -     |   -     |  24RA  |  -     |   -   |  -
    5    -     |   -     |  -     |  -     |   345 |  -

我想将行折叠成一个如下

    output DF:
         col1  |  col2    | col3   | col4   | col5  | col6
    0    ABC1  |   15.0   |  24RA  |  Large |   345 |  US

我不想遍历列，但想使用熊猫来实现这一点。

问题答案：

选项0
超级简单

pd.concat([pd.Series(df[c].dropna().values, name=c) for c in df], axis=1)

   col1  col2  col3   col4   col5 col6
0  ABC1  15.0  24RA  Large  345.0   US

每列可以处理多个值吗？
我们当然可以！

df.loc[2, 'col3'] = 'Test'

   col1  col2  col3   col4   col5 col6
0  ABC1  15.0  Test  Large  345.0   US
1   NaN   NaN  24RA    NaN    NaN  NaN

选项1
使用np.where像外科医生一样的通用解决方案

v = df.values
i, j = np.where(np.isnan(v))

s = pd.Series(v[i, j], df.columns[j])

c = s.groupby(level=0).cumcount()
s.index = [c, s.index]
s.unstack(fill_value='-')  # <-- don't fill to get NaN

   col1  col2  col3   col4 col5 col6
0  ABC1  15.0  24RA  Large  345   US

df.loc[2, 'col3'] = 'Test'

v = df.values
i, j = np.where(np.isnan(v))

s = pd.Series(v[i, j], df.columns[j])

c = s.groupby(level=0).cumcount()
s.index = [c, s.index]
s.unstack(fill_value='-')  # <-- don't fill to get NaN

   col1  col2  col3   col4 col5 col6
0  ABC1  15.0  Test  Large  345   US
1     -     -  24RA      -    -    -

选项2
mask 制作null然后stack摆脱它们

否则我们可以

# This should work even if `'-'` are NaN
# but you can skip the `.mask(df == '-')`
s = df.mask(df == '-').stack().reset_index(0, drop=True)
c = s.groupby(level=0).cumcount()
s.index = [c, s.index]
s.unstack(fill_value='-')

   col1  col2  col3   col4 col5 col6
0  ABC1  15.0  Test  Large  345   US
1     -     -  24RA      -    -    -

类似资料：

连接pandas数据框中的所有列

问题内容：我有多个pandas数据框，它们的列数可能不同，这些列的数量通常在50到100之间。我需要创建一个最终列，该列只是所有列的连接。基本上，该列第一行中的字符串应该是所有列第一行中的字符串的总和（并置）。我在下面编写了循环，但我觉得可能有更好的更有效的方法来执行此操作。有关如何执行此操作的任何想法问题答案：解决方案，但输出是，因此必须转换为和：另一个具有function的解决方案，但
如何展开/折叠Angular中的所有行

问题内容：我已经成功创建了一个函数来切换我的各个行以使用以下方式打开和关闭：和有关更多代码，请参见plunkr。请注意，“菜单”中的展开/折叠按钮。但是，我现在想不出一种方法来打开和关闭所有行。我希望能够以某种方式在行上运行for循环，然后在需要时调用toggle，但是我这样做的尝试失败了。在下面看到它们：关于如何正确切换所有行的任何想法？问题答案：将该指令与和指令结合使用，我们可以
Python-如何在pandas数据框的列中将所有NaN值替换为零

问题内容：我有一个数据框如下当我尝试将一个函数应用于“金额”列时，出现以下错误。我已经尝试过使用数学模块中的来应用函数。我已经尝试过属性。我已经尝试过的属性。我还尝试过在函数中使用语句。我还看了这篇文章如何在R数据帧中用零替换NA值？同时查看其他文章。我尝试过的所有方法均无效或无法识别NaN。任何提示或解决方案将不胜感激。问题答案：我相信DataFrame.fillna()会为你做到这一
两个pandas数据框中共有的列的列表

问题内容：我正在考虑对每个具有大量列的数据帧进行合并操作。不想结果有两个具有相同名称的列。我正在尝试查看两个框架之间共有的列名列表：我该如何在Index对象上操作该NumPy布尔数组，使其仅返回公用列的列表？问题答案：使用或：后一种选择的替代语法：
Python -如果列中的值在一组值的列表中，则过滤数据帧行

问题内容：我有一个：我可以过滤库存编号‘600809’如下的行：我想将一些股票的所有行汇总在一起，例如[‘600809’,‘600141’,‘600329’]。这意味着我想要这样的语法：由于大熊猫不接受上述命令，如何实现目标？问题答案：使用isin方法。。
如果没有数据，则根据两个表中两个列的值选择一个新列

如果没有数据，如何根据两个表中两个列的值选择新列。提前谢了。

相关阅读

Python -如果列中的值在一组值的列表中，则过滤数据帧行如何在pandas数据框列中选择一个值范围？如果行中的任何值等于零，则将其删除到pandas数据框中快速删除只有一个不同值的数据框列在pandas中，如何从基于另一个数据框的数据框中删除行？

相关文章

中信银行大数据中心数分一面面经中金所技术有限公司（Java一面）特变电工 Java 只有一面美团一面只有半小时中信银行有面试嘛

相关问答

如果一列中的值存在于另一列中，则筛选行如果只有一个值[duplicate],则返回一个值的Java8收集器如果Pandas dataframe[duplicate]中的特定列中存在空值，则删除行如何基于在“水果”列中发现的多个值删除所有行？我在Mysql中只有一个值

相关工具

自定义Table View折叠效果图片任意形状折叠 ios所支持的所有字体获取网页的所有图片数据库处理框架

相关文档

Python 和 Pandas 数据分析教程 Python Pandas 中文教程 KDB+ 高性能列式数据库中文教程 Pandas 函数手册 Porter 数据同步中间件