当前位置: 首页 > 面试题库 >

快速内插网格数据

长孙泉
2023-03-14
问题内容

我有一个大的3d np.ndarray数据,它表示以规则网格方式在某个卷上采样的物理变量(如array [0,0,0]中的值表示物理坐标(0,0,0 ))。

我想通过在粗糙网格中插值数据来获得更好的网格间距。目前,我正在使用scipy
griddata线性插值法,但速度相当慢(20x20x20数组约为90秒)。就我的目的而言,它有些过分设计,可以对体积数据进行随机采样。有没有什么可以利用我定期排列的数据以及我想插值的特定点集有限这一事实呢?


问题答案:

当然!有两个选项可以做不同的事情,但都可以利用原始数据的规则网格性质。

首先是scipy.ndimage.zoom。如果您只想基于对原始数据进行插值来生成更密集的规则网格,则可以采用这种方法。

第二个是scipy.ndimage.map_coordinates。如果您想在数据中插入几个(或多个)任意点,但仍然利用原始数据的规则网格性质(例如,不需要四叉树),则可以采用此方法。

“缩放”数组(scipy.ndimage.zoom

作为一个简单的示例(这将使用三次插值。order=1用于双线性,order=0最接近等):

import numpy as np
import scipy.ndimage as ndimage

data = np.arange(9).reshape(3,3)

print 'Original:\n', data
print 'Zoomed by 2x:\n', ndimage.zoom(data, 2)

这样产生:

Original:
[[0 1 2]
 [3 4 5]
 [6 7 8]]
Zoomed by 2x:
[[0 0 1 1 2 2]
 [1 1 1 2 2 3]
 [2 2 3 3 4 4]
 [4 4 5 5 6 6]
 [5 6 6 7 7 7]
 [6 6 7 7 8 8]]

这也适用于3D(和nD)阵列。但是请注意,例如,如果放大2倍,则会沿 所有 轴缩放。

data = np.arange(27).reshape(3,3,3)
print 'Original:\n', data
print 'Zoomed by 2x gives an array of shape:', ndimage.zoom(data, 2).shape

这样产生:

Original:
[[[ 0  1  2]
  [ 3  4  5]
  [ 6  7  8]]

 [[ 9 10 11]
  [12 13 14]
  [15 16 17]]

 [[18 19 20]
  [21 22 23]
  [24 25 26]]]
Zoomed by 2x gives an array of shape: (6, 6, 6)

如果您要缩放3波段RGB图像,可以通过指定一个元组序列作为缩放因子来实现:

print 'Zoomed by 2x along the last two axes:'
print ndimage.zoom(data, (1, 2, 2))

这样产生:

Zoomed by 2x along the last two axes:
[[[ 0  0  1  1  2  2]
  [ 1  1  1  2  2  3]
  [ 2  2  3  3  4  4]
  [ 4  4  5  5  6  6]
  [ 5  6  6  7  7  7]
  [ 6  6  7  7  8  8]]

 [[ 9  9 10 10 11 11]
  [10 10 10 11 11 12]
  [11 11 12 12 13 13]
  [13 13 14 14 15 15]
  [14 15 15 16 16 16]
  [15 15 16 16 17 17]]

 [[18 18 19 19 20 20]
  [19 19 19 20 20 21]
  [20 20 21 21 22 22]
  [22 22 23 23 24 24]
  [23 24 24 25 25 25]
  [24 24 25 25 26 26]]]

使用任意插值规则网格数据

map_coordinates

首先要了解的map_coordinates是它在 像素
坐标下运行(例如,就像您要为数组建立索引一样,但是值可以是浮点数)。根据您的描述,这正是您想要的,但是如果经常使人感到困惑。例如,如果您具有x,y,z“真实世界”坐标,则需要将它们转换为基于索引的“像素”坐标。

不管怎么说,我们想在原始数组的位置1.2、0.3、1.4处插值。

如果考虑较早的RGB图像情况,则第一个坐标对应于“带”,第二个坐标对应于“行”,最后一个坐标对应于“列”。什么顺序对应什么完全取决于您决定如何构造数据的方式,但是我将使用这些顺序作为“
z,y,x”坐标,因为它使与打印数组的比较更容易可视化。

import numpy as np
import scipy.ndimage as ndimage

data = np.arange(27).reshape(3,3,3)

print 'Original:\n', data
print 'Sampled at 1.2, 0.3, 1.4:'
print ndimage.map_coordinates(data, [[1.2], [0.3], [1.4]])

这样产生:

Original:
[[[ 0  1  2]
  [ 3  4  5]
  [ 6  7  8]]

 [[ 9 10 11]
  [12 13 14]
  [15 16 17]]

 [[18 19 20]
  [21 22 23]
  [24 25 26]]]
Sampled at 1.2, 0.3, 1.4:
[14]

再一次,这是默认的三次插值。使用orderkwarg控制插值的类型。

在这里值得注意的是,所有scipy.ndimage的操作都保留了原始数组的dtype。如果要浮点结果,则需要将原始数组强制转换为浮点数:

In [74]: ndimage.map_coordinates(data.astype(float), [[1.2], [0.3], [1.4]])
Out[74]: array([ 13.5965])

您可能会注意到的另一件事是,插值坐标格式对于单点而言非常麻烦(例如,它期望使用3xN数组而不是Nx3数组)。但是,当您具有坐标序列时,可以说是更好的选择。例如,考虑沿穿过数据“多维数据集”的线进行采样的情况:

xi = np.linspace(0, 2, 10)
yi = 0.8 * xi
zi = 1.2 * xi
print ndimage.map_coordinates(data, [zi, yi, xi])

这样产生:

[ 0  1  4  8 12 17 21 24  0  0]

这也是提及如何处理边界条件的好地方。默认情况下,数组外部的任何内容都设置为0。因此,序列中的最后两个值是0。(即zi最后两个元素> 2)。

如果我们希望将数组外的点设为-999(我们不能使用,nan因为这是一个整数数组。如果想要nan,则需要转换为浮点数。):

In [75]: ndimage.map_coordinates(data, [zi, yi, xi], cval=-999)
Out[75]: array([   0,    1,    4,    8,   12,   17,   21,   24, -999, -999])

如果我们希望它为数组外的点返回最接近的值,我们可以这样做:

In [76]: ndimage.map_coordinates(data, [zi, yi, xi], mode='nearest')
Out[76]: array([ 0,  1,  4,  8, 12, 17, 21, 24, 25, 25])

除了和之外,还可以使用"reflect""wrap"作为边界模式。这些都是不言自明的,但是如果您感到困惑,请尝试一下。"nearest"``"constant"

例如,让我们沿着数组中第一个波段的第一行插入一条直线,该直线延伸了数组距离的两倍:

xi = np.linspace(0, 5, 10)
yi, zi = np.zeros_like(xi), np.zeros_like(xi)

默认给出:

In [77]: ndimage.map_coordinates(data, [zi, yi, xi])
Out[77]: array([0, 0, 1, 2, 0, 0, 0, 0, 0, 0])

比较一下:

In [78]: ndimage.map_coordinates(data, [zi, yi, xi], mode='reflect')
Out[78]: array([0, 0, 1, 2, 2, 1, 2, 1, 0, 0])

In [78]: ndimage.map_coordinates(data, [zi, yi, xi], mode='wrap')
Out[78]: array([0, 0, 1, 2, 0, 1, 1, 2, 0, 1])

希望这可以澄清一些事情!



 类似资料:
  • pre { white-space: pre-wrap; } jQuery EasyUI 插件 扩展自 $.fn.panel.defaults。通过 $.fn.datagrid.defaults 重写默认的 defaults。 数据网格(datagrid)以表格格式显示数据,并为选择、排序、分组和编辑数据提供了丰富的支持。数据网格(datagrid)的设计目的是为了减少开发时间,且不要求开发人员具

  • 互联网上连接的每台设备都有一个IP地址,该IP地址唯一地标识该设备。 IP地址可以分为外网和内网两种类型。 可以从Internet上的任何位置访问外网IP地址, 而只能在内网(LAN)中访问专用IP地址。 现在,如果您想将本地Web服务器中的某些内容开放给内网之外的朋友,他们是在局域网外,并且不能通过外网访问内网的web服务器,那么,如何将本地web服务暴露给内网之外的朋友呢? 在这种情况是可以使

  • 问题内容: 我在要插入到新网格的同一不规则网格上定义了多个值。即,我有,我想计算。 目前,我正在使用它,并且效果很好。但是,因为我必须分别执行每个插值并且有很多点,所以它非常慢,并且在计算中有很多重复(例如,找到最接近的点,设置网格等…)。 有没有一种方法可以加快计算速度并减少重复的计算?即沿着定义两个网格的线,然后更改插值的值? 问题答案: 每次您拨打以下电话时,都会发生几件事情: 首先,调用来

  • pre { white-space: pre-wrap; } jQuery EasyUI 插件 扩展自 $.fn.datagrid.defaults。通过 $.fn.propertygrid.defaults 重写默认的 defaults。 属性网格(propertygrid)为用户提供李露兰和编辑属性的接口。属性网格是内联编辑的数据网格。它相当容易使用。用户可以很容易就创建一个可编辑属性的分层列

  • pre { white-space: pre-wrap; } jQuery EasyUI 插件 扩展自 $.fn.datagrid.defaults。通过 $.fn.treegrid.defaults 重写默认的 defaults。 树形网格(treegrid)用于以网格形式显示分层数据。它是基于数据网格(datagrid)的,并结合了树视图(treeview)和可编辑网格。树形网格(treegr

  • 问题内容: 该问题已清除,重要信息移至下面的答案。 我对内存管理有一些疑问。 我正在构建照片编辑应用程序。因此,保持较低的内存使用量很重要。另外,我不打算发布代码,因为在做一件特定的事情时,我不会发生大的内存泄漏。我将所有发生的一切都丢失了几KB / MB。遍历数万行代码以查找千字节并不有趣;) 我的应用使用了核心数据,许多cifilter内容,位置和基础知识。 我的第一个视图只是一个表视图,它占