插值缺失值2d python

封飞

2023-03-14

问题内容：

我有一个二维数组（或矩阵，如果愿意的话），其中一些缺失值表示为 NaN。缺失值通常沿着一个轴位于一条带中，例如：

1   2   3 NaN   5
2   3   4 Nan   6
3   4 Nan Nan   7
4   5 Nan Nan   8
5   6   7   8   9

我想NaN用一些合理的数字代替。

我研究了delaunay三角剖分，但是发现的文档很少。

我尝试使用astropy‘convolve’，因为它支持2d数组的使用，并且非常简单。问题在于，卷积不是插值，而是将所有值都移向平均值（可以通过使用窄核来缓解）。

这个问题应该是该帖子的自然二维扩展。有没有一种方法可以插值NaN二维数组中的/缺失值？

问题答案：

是的，您可以使用scipy.interpolate.griddata和屏蔽数组，还可以选择使用参数的插值类型，method通常'cubic'可以很好地完成工作：

import numpy as np
from scipy import interpolate


#Let's create some random  data
array = np.random.random_integers(0,10,(10,10)).astype(float)
#values grater then 7 goes to np.nan
array[array>7] = np.nan

看起来像这样plt.imshow(array,interpolation='nearest') ：

在此处输入图片说明

x = np.arange(0, array.shape[1])
y = np.arange(0, array.shape[0])
#mask invalid values
array = np.ma.masked_invalid(array)
xx, yy = np.meshgrid(x, y)
#get only the valid values
x1 = xx[~array.mask]
y1 = yy[~array.mask]
newarr = array[~array.mask]

GD1 = interpolate.griddata((x1, y1), newarr.ravel(),
                          (xx, yy),
                             method='cubic')

这是最终结果：

在此处输入图片说明

请注意，如果nan值在边缘且被nan值包围，则无法对thay进行插值并将其保留nan。您可以使用fill_value参数进行更改。

这取决于您的数据类型，您必须执行一些测试。例如，您可以故意对一些好的数据进行蒙版，尝试使用具有蒙版值的数组尝试不同种类的插值，例如三次，线性等，并计算插值与您之前蒙版的原始值之间的差，然后查看方法返回您的细微差别。

您可以使用如下形式：

reference = array[3:6,3:6].copy()
array[3:6,3:6] = np.nan
method = ['linear', 'nearest', 'cubic']

for i in method:
    GD1 = interpolate.griddata((x1, y1), newarr.ravel(),
                              (xx, yy),
                                 method=i)
    meandifference = np.mean(np.abs(reference - GD1[3:6,3:6]))
    print ' %s interpolation difference: %s' %(i,meandifference )

这给出了这样的内容：

   linear interpolation difference: 4.88888888889
   nearest interpolation difference: 4.11111111111
   cubic interpolation difference: 5.99400137377

当然，这是针对随机数的，因此结果可能会有很大差异是正常的。因此，最好的办法是对数据集的“故意遮盖的”部分进行测试，然后看看会发生什么。

插值缺失值2d python

相关阅读

相关文章

相关问答

相关工具

相关文档