n维数组中唯一值的索引

汪思博

2023-03-14

问题内容：

我有一个2D Numpy数组，包含从0到n的值。我想要一个长度为n的列表，以使该列表的第i个元素是值i + 1（不包括0）的所有索引的数组。

例如，对于输入

array([[1, 0, 1],
   [2, 2, 0]])

我期望得到

[array([[0, 0], [0, 2]]), array([[1,0], [1,1]])]

我发现了一个相关的问题：
在numpy数组中获取重复元素的所有索引的列表，
这可能会有所帮助，但我希望找到一个更直接的解决方案，该方法不需要展平和排序数组，并且尽可能高效。

问题答案：

这是一种矢量化方法，适用于任意数量维的数组。此解决方案的思想是在中扩展return_index方法的功能np.unique，并返回一个数组数组，每个数组都在numpy数组中包含N个维的唯一值索引。

对于更紧凑的解决方案，我在以下各个步骤中定义了以下功能以及一些解释：

def ndix_unique(x):
    """
    Returns an N-dimensional array of indices
    of the unique values in x
    ----------
    x: np.array
       Array with arbitrary dimensions
    Returns
    -------
    - 1D-array of sorted unique values
    - Array of arrays. Each array contains the indices where a
      given value in x is found
    """
    x_flat = x.ravel()
    ix_flat = np.argsort(x_flat)
    u, ix_u = np.unique(x_flat[ix_flat], return_index=True)
    ix_ndim = np.unravel_index(ix_flat, x.shape)
    ix_ndim = np.c_[ix_ndim] if x.ndim > 1 else ix_flat
    return u, np.split(ix_ndim, ix_u[1:])

从问题中检查数组-

a = np.array([[1, 0, 1],[2, 2, 0]])

vals, ixs = ndix_unique(a)

print(vals)
array([0, 1, 2])

print(ixs)
[array([[0, 1],
        [1, 2]]), 
 array([[0, 0],
        [0, 2]]), 
 array([[1, 0],
        [1, 1]])]

让我们尝试其他情况：

a = np.array([[1,1,4],[2,2,1],[3,3,1]])

vals, ixs = ndix_unique(a)

print(vals)
array([1, 2, 3, 4])

print(ixs)
array([array([[0, 0],
              [0, 1],
              [1, 2],
              [2, 2]]),
       array([[1, 0],
              [1, 1]]), 
       array([[2, 0],
              [2, 1]]),
       array([[0, 2]])], dtype=object)

对于一维数组：

a = np.array([1,5,4,3,3])

vals, ixs = ndix_unique(a)

print(vals)
array([1, 3, 4, 5])

print(ixs)
array([array([0]), array([3, 4]), array([2]), array([1])], dtype=object)

最后是带有 3D ndarray的另一个示例：

a = np.array([[[1,1,2]],[[2,3,4]]])

vals, ixs = ndix_unique(a)

print(vals)
array([1, 2, 3, 4])

print(ixs)
array([array([[0, 0, 0],
              [0, 0, 1]]),
       array([[0, 0, 2],
              [1, 0, 0]]), 
       array([[1, 0, 1]]),
       array([[1, 0, 2]])], dtype=object)

n维数组中唯一值的索引

相关阅读

相关文章

相关问答

相关工具

相关文档