当前位置：首页 > 面试题库 >

从熊猫数据框中删除NaN值并调整表的形状

夏弘文

2023-03-14

问题内容：

给定一个数据列NaN，其中的各个列中散布着s，该数据框如何转换以NaN从列中删除所有？

样本数据框

import pandas as pd
import numpy as np

# dataframe from list of lists
list_of_lists = [[ 4., 7., 1., np.nan],
                 [np.nan, np.nan, 3., 3.],
                 [ 4., 9., np.nan, np.nan],
                 [np.nan, np.nan, 7., 9.],
                 [np.nan, 2., np.nan, 2.],
                 [4., np.nan, np.nan, np.nan]]

df_from_lists = pd.DataFrame(list_of_lists, columns=['A', 'B', 'C', 'D'])

# dataframe from list of dicts
list_of_dicts = [{'A': 4.0, 'B': 7.0, 'C': 1.0},
                 {'C': 3.0, 'D': 3.0},
                 {'A': 4.0, 'B': 9.0},
                 {'C': 7.0, 'D': 9.0},
                 {'B': 2.0, 'D': 2.0},
                 {'A': 4.0}]

df_from_dicts = pd.DataFrame(list_of_dicts)

显示数据框

     A    B    C    D
0  4.0  7.0  1.0  NaN
1  NaN  NaN  3.0  3.0
2  4.0  9.0  NaN  NaN
3  NaN  NaN  7.0  9.0
4  NaN  2.0  NaN  2.0
5  4.0  NaN  NaN  NaN

预期产量

     A    B    C    D
0  4.0  7.0  1.0  3.0
1  4.0  9.0  3.0  9.0
2  4.0  2.0  7.0  2.0

问题答案：

您需要apply使用dropna，仅需要为重置索引创建numpy array并重新分配Series：

df.apply(lambda x: pd.Series(x.dropna().values))

样品：

df = pd.DataFrame({'B':[4,np.nan,4,np.nan,np.nan,4],
                   'C':[7,np.nan,9,np.nan,2,np.nan],
                   'D':[1,3,np.nan,7,np.nan,np.nan],
                   'E':[np.nan,3,np.nan,9,2,np.nan]})

print (df)
     B    C    D    E
0  4.0  7.0  1.0  NaN
1  NaN  NaN  3.0  3.0
2  4.0  9.0  NaN  NaN
3  NaN  NaN  7.0  9.0
4  NaN  2.0  NaN  2.0
5  4.0  NaN  NaN  NaN

df1 = df.apply(lambda x: pd.Series(x.dropna().values))
print (df1)
     B    C    D    E
0  4.0  7.0  1.0  3.0
1  4.0  9.0  3.0  9.0
2  4.0  2.0  7.0  2.0

类似资料：

如何从熊猫数据框中删除行列表？

我有一个数据帧df：然后我想删除列表中指示的具有某些序列号的行，假设这里是然后离开：如何或什么功能可以做到这一点？
Python从熊猫数据框中删除停用词

问题内容：我想从“ tweets”列中删除停用词。如何遍历每一行和每一项目？问题答案：使用列表理解返回值：
在熊猫数据框中删除全零的行

问题内容：我可以使用功能来删除将部分或全部列设置为的行。是否存在用于删除所有列的值为0的行的等效函数？在此示例中，我们要删除数据帧的前4行。谢谢！问题答案：事实证明，这可以向量化的方式很好地表达：
熊猫数据框：用行平均值替换NaN

问题内容：我正在尝试学习熊猫，但请对以下内容感到困惑。我想用行平均值替换NaN是一个数据框。因此，类似的东西应该可以工作，但是由于某种原因，它对我来说是失败的。我是否想念任何东西，我做错了什么？是因为其未执行；但是这样的事情看起来很好问题答案：如评论所述，fillna的axis参数为NotImplemented。注意：这在这里很重要，因为您不想用第n行平均值填写第n列。现在，您需要遍历
Python-检测并排除熊猫数据框中的异常值

问题内容：我有一个只有几列的熊猫数据框。现在我知道某些行是基于某个列值的离群值。例如 “ Vol”列的所有值都在周围，12xx而一个值是4000（离群值）。现在，我想排除具有Vol此类列的行。因此，从本质上讲，我需要在数据帧上放置一个过滤器，以便我们选择某一列的值在均值例如3个标准差以内的所有行。有什么优雅的方法可以做到这一点？问题答案：如果你的数据框中有多个列，并且希望删除至少一
从数组中删除nan值

我想弄清楚如何从我的数组中删除nan值。我的数组看起来像这样：如何从中删除值？

相关阅读

如何从熊猫数据框中的字符串项中删除数字如何删除熊猫数据框中具有重复列值的行？如何根据条件删除熊猫数据框中的列？如何在熊猫数据框中删除唯一行？如何从熊猫数据框中选择的列表中检查值？

相关文章

DB2删除数据库 CouchDB删除数据库 MariaDB删除数据库 PostgreSQL 删除数据库 MongoDB删除数据库

相关问答

基于列值删除熊猫中的数据帧行基于特定（非零）值[重复]删除数据框（熊猫）中的行熊猫：根据阈值条件删除列如何计算熊猫数据帧中某列中的 NaN 值？如何删除熊猫数据帧中列的重复值的行？

相关工具

熊猫Flash播放器数据库处理框架动态调整UITableViewCell的高度仿天猫App可打开列表多级树形目录列表

相关文档

数据采集从入门到放弃 Excel 数据透视表应用大全鲜活的数据数据可视化指南 Porter 数据同步中间件 Nginx 开发从入门到精通（不完整）