当前位置：首页 > 面试题库 >

从NumPy数组中选择特定的行和列

呼延河

2023-03-14

问题内容：

我一直在发疯，试图找出我在这里做错了什么愚蠢的事情。

我正在使用NumPy，并且我想从中选择特定的行索引和特定的列索引。这是我的问题的要点：

import numpy as np

a = np.arange(20).reshape((5,4))
# array([[ 0,  1,  2,  3],
#        [ 4,  5,  6,  7],
#        [ 8,  9, 10, 11],
#        [12, 13, 14, 15],
#        [16, 17, 18, 19]])

# If I select certain rows, it works
print a[[0, 1, 3], :]
# array([[ 0,  1,  2,  3],
#        [ 4,  5,  6,  7],
#        [12, 13, 14, 15]])

# If I select certain rows and a single column, it works
print a[[0, 1, 3], 2]
# array([ 2,  6, 14])

# But if I select certain rows AND certain columns, it fails
print a[[0,1,3], [0,2]]
# Traceback (most recent call last):
#   File "<stdin>", line 1, in <module>
# ValueError: shape mismatch: objects cannot be broadcast to a single shape

为什么会这样呢？我当然应该能够选择第一行，第二行和第四行以及第一列和第三列？我期望的结果是：

a[[0,1,3], [0,2]] => [[0,  2],
                      [4,  6],
                      [12, 14]]

问题答案：

花式索引要求您提供每个维度的所有索引。您为第一个提供3个索引，为第二个仅提供2个索引，因此会出现错误。您想做这样的事情：

>>> a[[[0, 0], [1, 1], [3, 3]], [[0,2], [0,2], [0, 2]]]
array([[ 0,  2],
       [ 4,  6],
       [12, 14]])

当然写这很痛苦，所以您可以让广播帮助您：

>>> a[[[0], [1], [3]], [0, 2]]
array([[ 0,  2],
       [ 4,  6],
       [12, 14]])

如果您使用数组而不是列表建立索引，则此操作要简单得多：

>>> row_idx = np.array([0, 1, 3])
>>> col_idx = np.array([0, 2])
>>> a[row_idx[:, None], col_idx]
array([[ 0,  2],
       [ 4,  6],
       [12, 14]])

类似资料：

从SQL数据库中选择特定的行和列

问题内容：是否可以检索中特定行的特定列？假设我要使用以下查询文本从名为的表中选择名称为：a，b的行：如何修改此查询文本以仅选择第2、12、22、32、42列，而不是选择其所有1000列？问题答案：将通配符替换为要检索的列名。但是请阅读有关SQL标准的文档。您在表中需要1.000列的可能性很小。
从numpy数组中随机选择

问题内容：我有两个相关的numpy数组和。我需要从中选择随机行，并将其存储在数组中，并将其对应的值附加到随机选择的点的索引上。我有另一个数组，它存储我不想采样的索引列表。我怎样才能做到这一点？样本数据：如果这些是随机选择的（其中）：所需的输出将是：我怎样才能做到这一点？问题答案：您可以使用以下方法创建随机索引：然后，您只需要使用结果索引数组：
从MySQL中分组和联接表的特定行中选择数据

我有两张桌子，客户和订单是内部连接的。客户可以有多个与其关联的订单。在我的选择中，我然后按客户分组。id.我需要选择每个客户的最新订单，还需要选择在该订单中花费的金额。目前，我可以选择最近的订单日期，但不知道如何选择与订单日期同一行中的金额。这是我当前的查询：查询选择最近日期，但不选择与最近订单日期关联的金额。表格声明：
从mysql表中选择特定的行

问题内容：理想情况下，我需要一个等于但这是非法的。我不能使用自动递增的字段。 row_number（）是需要选择的行。我该怎么办？编辑：嗯，我使用iSql * plus进行练习，出于某些原因，使用limit和auto_increment是非法的。我最终创建了一个序列和一个触发器，并且每次输入一个条目时，ID都增加了1。问题答案：您可以使用代替。如文档所述，第一个参数指定要返回的第
从多维numpy数组行中选择随机窗口

问题内容：我有一个很大的数组，其中每一行都是一个时间序列，因此需要保持秩序。我想为每行选择一个给定大小的随机窗口。在我看来，理想的解决方案是：但不幸的是，这不起作用我现在要进行的操作非常慢：当然，我可以对列表进行理解（并获得最小的速度提升），但是我想知道是否有某种超级聪明的numpy向量化方法可以做到这一点。问题答案：这是一种杠杆作用- 在具有行的更大数组上进行运行时测试-
如何从熊猫DataFrame数组列中选择具有特定值的行

我有一个带有数组列的数据帧：我读了这个CSV，并将“类”列的值转换成数组：现在我想选择“类”值中具有“performer_0”的行。像这样：但是这个代码不起作用：回溯（最后一次调用）：文件“d:\pyenv\pandas\lib\site packages\pandas\core\indexes\base.py”，第2657行，在get_loc return self.\u engine.

相关阅读

提取numpy数组中的特定列 Regular Expressions 根据特定位置的单词从列表中选择特定行从NumPy 2D数组中删除重复的列和行 Pandas：根据特定列的值计数选择行 awk 选择表格数据中的特定列

相关文章

NumPy创建区间数组 MySQL数据类型的选择 MariaDB选择数据库 PostgreSQL 选择数据库 MySQL选择数据库

相关问答

在每行的特定值内计算numpy数组中的实例数从laravel中的内部联接表中选择特定列如何移除numpy数组中的特定元素在Protractor中选择特定选项选择JPA Spring Boot中的特定列

相关工具

城市选择器中国省市地区选择器中国省市选择器（含经纬度）定制多选的PickerView NumPy

相关文档

CIO 面临大数据架构的选择困境 NumPy 中文教程 NumPy 教程 NumPy 用户指南 Numpy 入门教程