当前位置：首页 > 面试题库 >

pandas通过非Nan值之前和之后的值来填充Nan

云承天

2023-03-14

问题内容：

我想补df的nan平均相邻元件。

考虑一个数据框：

df = pd.DataFrame({'val': [1,np.nan, 4, 5, np.nan, 10, 1,2,5, np.nan, np.nan, 9]})
    val
0   1.0
1   NaN
2   4.0
3   5.0
4   NaN
5   10.0
6   1.0
7   2.0
8   5.0
9   NaN
10  NaN
11  9.0

我想要的输出是：

    val
0   1.0
1   2.5
2   4.0
3   5.0
4   7.5
5   10.0
6   1.0
7   2.0
8   5.0
9   7.0 <<< deadend
10  7.0 <<< deadend
11  9.0

我研究了其他解决方案，例如包含NaN的Fillcell之前和之后的平均值，但这在连续两个或多个np.nans的情况下不起作用。

任何帮助是极大的赞赏！

问题答案：

使用ffill+bfill除以2：

df = (df.ffill()+df.bfill())/2

print(df)
     val
0    1.0
1    2.5
2    4.0
3    5.0
4    7.5
5   10.0
6    1.0
7    2.0
8    5.0
9    7.0
10   7.0
11   9.0

编辑：
如果包含第一个和最后一个元素，NaN则使用（[Dark` 建议）：

df = pd.DataFrame({'val':[np.nan,1,np.nan, 4, 5, np.nan, 
                          10, 1,2,5, np.nan, np.nan, 9,np.nan,]})
df = (df.ffill()+df.bfill())/2
df = df.bfill().ffill()

print(df)
     val
0    1.0
1    1.0
2    2.5
3    4.0
4    5.0
5    7.5
6   10.0
7    1.0
8    2.0
9    5.0
10   7.0
11   7.0
12   9.0
13   9.0

类似资料：

使用NaN以外的填充值初始化Pandas DataFrame

假设我初始化一个空数据帧如下：生成的具有以下形式有没有一种pythonic方法可以将s替换为其他值，例如？当然，一种方法是简单地将其指定为数据：也许有更简洁的方法？
Python-pandas：每组均值填充缺失值

问题内容：这应该很简单，但是我发现的最接近的内容是这篇文章： pandas：填充组中的缺失值，但我仍然无法解决我的问题。假设我有以下数据框我想在每个“名称”组中用平均值填写，即我不确定要去哪里：问题答案：一种方法是使用：
用最后一个非空值填充空值-Oracle SQL

问题内容：我有一个包含4列的表格：项目，年份，月份，金额。Amount的某些值是null，当发生这种情况时，我想用以前的非null的Amount值来填充这些值。当只有一个空值时，我可以使用LAG函数轻松地做到这一点，但是当连续有多个空值时，我不确定如何处理它。以下是该表的外观示例，其中添加了要在查询中添加的内容的列：我有两个想法，我似乎无法投入工作来实现自己想要的东西。首先，我要使用LAG，但
我想通过在pyspark中填充NaN来加入两个DataFrame？

我想在pyspark中以如下方式连接两个数据帧df1： df2 看起来像：我想以这样的方式连接两个数据帧，使其看起来像：我做了什么：但是，不幸的是，这对我来说并不奏效。任何形式的帮助或暗示都将非常感谢。
在Pandas DataFrame中找到第一个和最后一个非NaN值

问题内容：我有按日期索引的熊猫。有许多列，但仅在部分时间序列中填充了许多列。我想找到非值第一个和最后一个值的位置，以便提取日期并查看特定列的时间序列有多长时间。有人能指出我正确的方向，如何去做这样的事情吗？提前致谢。问题答案： @ behzad.nouri的解决方案完美工作，返回第一个和最后不使用Series.first_valid_index和Series.last_valid_index
在numpy数组中向前填充NaN值的最有效方法

问题内容：示例问题作为一个简单的示例，请考虑以下定义的numpy数组：其中，像这样在控制台输出：我现在想按行“向前填充” array中的值。我的意思是用左侧最接近的有效值替换每个值。所需的结果如下所示：到目前为止尝试过我试过使用for循环：我还尝试过使用熊猫数据框作为中间步骤（因为熊猫数据框具有非常整洁的内置方法用于正向填充）：以上两种策略都能产生预期的结果，但是我一直在想：仅使用

相关阅读

用最后一个非零值填充1d numpy数组的零值 Python Pandas：如何删除nan和-inf值 pandas df.corr（）返回NaN，尽管数据已填充 pandas DataFrame：用列的平均值替换nan值如何用NaN替换pandas中的值？

相关文章

Java数组填充 JasperReports 填充报表 ones加面（三面技术面通过之后所谓的技术沟通已经挂了）之后群面姐绝对勇往直前！通过反射访问结构体成员的值

相关问答

Java流过滤器值之和 NA_real_和NaN之间的区别中如何填充以前的值；分离弦？如何在熊猫的NaN值之间均衡地重新分配值？。append()，prepend()，。在()和之后。之前()

相关工具

然之《PHP之道》耀西之门鲨鱼之心亡命之徒

相关文档

结构之法算法之道 Elixir 进阶之 Mix 和 OTP 入门 Flask 之旅 Python 之旅 Powershell 攻击指南黑客后渗透之道