当前位置：首页 > 面试题库 >

根据熊猫中的列名删除多个列

班安平

2023-03-14

问题内容：

我有一些数据，导入时会得到以下不需要的列，我正在寻找一种删除所有这些数据的简便方法

   'Unnamed: 24', 'Unnamed: 25', 'Unnamed: 26', 'Unnamed: 27',
   'Unnamed: 28', 'Unnamed: 29', 'Unnamed: 30', 'Unnamed: 31',
   'Unnamed: 32', 'Unnamed: 33', 'Unnamed: 34', 'Unnamed: 35',
   'Unnamed: 36', 'Unnamed: 37', 'Unnamed: 38', 'Unnamed: 39',
   'Unnamed: 40', 'Unnamed: 41', 'Unnamed: 42', 'Unnamed: 43',
   'Unnamed: 44', 'Unnamed: 45', 'Unnamed: 46', 'Unnamed: 47',
   'Unnamed: 48', 'Unnamed: 49', 'Unnamed: 50', 'Unnamed: 51',
   'Unnamed: 52', 'Unnamed: 53', 'Unnamed: 54', 'Unnamed: 55',
   'Unnamed: 56', 'Unnamed: 57', 'Unnamed: 58', 'Unnamed: 59',
   'Unnamed: 60'

它们被0索引索引，所以我尝试了类似

    df.drop(df.columns[[22, 23, 24, 25, 
    26, 27, 28, 29, 30, 31, 32 ,55]], axis=1, inplace=True)

但这不是很有效。我尝试编写一些for循环，但这使我感到震惊，因为熊猫的行为不佳。因此，我在这里问这个问题。

我已经看到了一些类似的示例（投递多列pandas），但这无法回答我的问题。

问题答案：

我不知道您所说的低效率是什么意思，但是如果您指的是打字，那么选择感兴趣的cols并分配回df会更容易：

df = df[cols_of_interest]

cols_of_interest您关心的列的列表在哪里。

或者，您可以切片列并将其传递给drop：

df.drop(df.ix[:,'Unnamed: 24':'Unnamed: 60'].head(0).columns, axis=1)

调用head只会选择0行，因为我们只对列名而不是数据感兴趣

更新

另一种方法：使用from中的布尔掩码str.contains并将其反转以掩码列会更简单：

In [2]:
df = pd.DataFrame(columns=['a','Unnamed: 1', 'Unnamed: 1','foo'])
df

Out[2]:
Empty DataFrame
Columns: [a, Unnamed: 1, Unnamed: 1, foo]
Index: []

In [4]:
~df.columns.str.contains('Unnamed:')

Out[4]:
array([ True, False, False,  True], dtype=bool)

In [5]:
df[df.columns[~df.columns.str.contains('Unnamed:')]]

Out[5]:
Empty DataFrame
Columns: [a, foo]
Index: []

类似资料：

熊猫：根据阈值条件删除列

我必须解决这个问题：目标：删除大多数行缺少输入的列：1。数据帧df：数据帧2。阈值：确定将删除哪些列。如果阈值为.9，则缺少90%值的列将被丢弃：1。带删除列的数据帧df（如果未删除任何列，则返回相同的数据帧） Excel文档截图我编码了这个：我必须有“自我、博士和阈值”，不能添加更多。代码必须通过下面的测试用例：当我运行VT.drop_nan_col（df，0.9）. head（）时，我不
根据熊猫中的条件删除行

问题内容：我有以下数据框基本上我可以如下过滤行我可以如下所示删除/删除一行但是我想根据条件删除一定数量的行，我该怎么做？问题答案：最好的是但需要反转条件-使所有值相等且更高，如下所示：与功能相同：另一种可能的解决方案是通过以下方法反转掩码：
如何根据条件删除熊猫数据框中的列？

问题内容：我有一个熊猫DataFrame，里面有很多值。如何删除这样的列？我试图这样做：有更优雅的方法吗？问题答案：这是保留每列中小于或等于指定数量的nan的列的另一种选择：在我的测试中，这似乎比李建勋在我测试的案例中建议的放置列方法要快一些：
重命名熊猫中的多个列

我有一个单一的CSV文件，在其中我想重命名一些列相同的名称。我的初始代码如下所示我用这段代码从dataframe中提取了选定的列此切片每隔三列获取一次。现在我想用相同的名称重命名每三列一次，但这样重命名我的列会出错有没有办法在pandas中重命名多个同名列？除了手动操作，还有其他建议吗？
熊猫：从多级列索引中删除一个级别？

如果我有一个多级列索引：我如何才能降低该指数的“a”级，因此我最终得到：
组合熊猫中的多个数据列

我有下面的数据框- 我需要一个全新的数据帧，，有3列：1.0、2.0（结合2.0和4.0）和3.0（结合3.0和5.0）。结果将是- 您可以预期合并列中不会有重叠的值；如果一行中的一列具有有效值，那么其他列将具有NaN值。我试过了- 而且它并没有按预期的那样工作。有没有简单有效的方法来做到这一点？

相关阅读

根据另一个列熊猫数据框提取列值熊猫的DataFrame-重命名多个相同名称的列多列熊猫get_dummies 使用熊猫删除一列中的非数字行根据在熊猫中包含特定字符串的列名称选择列

相关文章

CouchDB删除数据库 MariaDB删除数据库 PostgreSQL 删除数据库 MongoDB删除数据库 MySQL删除数据表

相关问答

基于列值删除熊猫中的数据帧行如何用熊猫删除数据集中的列？[副本]如何从熊猫数据框中删除行列表？根据熊猫中的多个条件分组[重复]如何根据不同列中的多个值筛选熊猫表？[副本]

相关工具

熊猫Flash播放器仿天猫App可打开列表多级树形目录列表根据开发者帐号查看App 物体根据重力感应运动

相关文档

KDB+ 高性能列式数据库中文教程变现猫接入文档 v1.4 Blockly 系列教程 JavaScript 系列教程实战 Groovy 系列