当前位置：首页 > 面试题库 >

多列熊猫get_dummies

曹疏珂

2023-03-14

问题内容：

我有一个包含多个列的数据集，我希望对其进行一次热编码。但是，我不想为每个编码都有编码，因为所说的列与所说的项目有关。我想要的是一组使用所有列的虚拟变量。请参阅我的代码以获得更好的解释。

假设我的数据框如下所示：

In [103]: dum = pd.DataFrame({'ch1': ['A', 'C', 'A'], 'ch2': ['B', 'G', 'F'], 'ch3': ['C', 'D', 'E']})

In [104]: dum
Out[104]:
 ch1 ch2 ch3
0   A   B   C
1   C   G   D
2   A   F   E

如果我执行

pd.get_dummies(dum)

输出将是

   ch1_A  ch1_C  ch2_B  ch2_F  ch2_G  ch3_C  ch3_D  ch3_E
 0      1      0      1      0      0      1      0      0
 1      0      1      0      0      1      0      1      0
 2      1      0      0      1      0      0      0      1

但是，我想获得的是这样的东西：

 A B C D E F G
 1 1 1 0 0 0 0
 0 0 1 1 0 0 1
 1 0 0 0 1 1 0

代替具有表示编码，例如多列的ch1_A和ch1_C，我只希望有一组（A，B，等等）与值1时任何在列中的值的ch1，ch2，ch3显示出来。

需要说明的是，在我的原始数据集中，单行不会多次包含相同的值（A，B，C …）；它只会出现在其中一列上。

问题答案：

使用stack和str.get_dummies

dum.stack().str.get_dummies().sum(level=0)
Out[938]: 
   A  B  C  D  E  F  G
0  1  1  1  0  0  0  0
1  0  0  1  1  0  0  1
2  1  0  0  0  1  1  0

类似资料：

熊猫：多层列名称

问题内容：支持多级列名：此功能非常有用，因为它允许“水平”地将同一数据框的多个版本附加到区分实例的列名称的第一级（在我的示例中）。想象一下我已经有一个这样的数据框：有没有一种好方法可以向列名添加另一个级别，类似于行索引：问题答案：无需创建元组列表采用：结果数据框： 2014年1月25日起提出要求
大熊猫：to_numeric用于多列

问题内容：我正在使用以下df：我想在所有年份中强制使用数字：有没有简单的方法可以做到这一点，还是我必须全部输入？问题答案：更新：您以后不需要转换值，可以在读取CSV时即时进行：如果您需要将多列转换为数字dtypes，请使用以下技术：样本来源DF：将选定的列转换为数字dtypes： PS，如果要选择所有（）列，请使用以下简单技巧：
从熊猫返回多列apply（）

问题内容：我有一个熊猫DataFrame ，。它包含一列“大小”，以字节为单位表示大小。我已经使用以下代码计算了KB，MB和GB：我已经运行了超过120,000行，并且根据％timeit，每列花费的时间约为2.97秒* 3 =〜9秒。无论如何，我可以使它更快吗？例如，我是否可以代替一次套用并运行3次而不是一次返回一列，而是可以一次通过返回所有三列以将其插入回原始数据帧吗？我发现的其他问题都
选择跨多列与python熊猫？

问题内容：我有一个从csv文件构建的pandas中的数据框。数据框有几列，并由其中一列进行索引（这是唯一的，因为每一行都有用于该索引的该列的唯一值。）如何基于应用于多个列的“复杂”过滤器选择数据框的行？我可以轻松地从列中大于10的数据框中选择切片，例如：但是，如果我想要的东西就像一个过滤器：选择的切片，其中任何列都大于10？或者，如果for的值大于10但值小于5？这些如何在熊猫中实现
熊猫列值到列？

问题内容：我已经看到了将一个列/系列分解为Pandas数据框的多个列的主题的几种变体，但是我一直在尝试做点事情，而实际上并没有成功地使用现有方法。给定这样的一个DataFrame：我想将系列中的项目转换为以值作为值的列，如下所示：我觉得这应该是相对简单的事情，但是由于卷积水平的提高，我已经为此花了几个小时不停地努力，但没有成功。问题答案：有几种方法：使用：使用：使用后跟：
在熊猫中设置多列索引

问题内容：我这样制作数据框。我想通过使用一些熊猫方法将索引转换为此（例如set_index，stack 、、）我怎样才能做到这一点？问题答案：我认为你需要与重塑，然后交换在水平由列由去年的排序列：用另一种解决方案和：

相关阅读

熊猫列值到列？在熊猫中设置多列索引熊猫-替换列值根据熊猫中的列名删除多个列熊猫：多栏成一栏

相关文章

猫眼java开发小熊电器—Hr面猫眼前端一面猫眼前端二面天猫一面凉经

相关问答

熊猫列值到列？[重复]要列出的熊猫列名熊猫-两列柱状图？Python熊猫2列关系熊猫应用于多列输出的轧制

相关工具

熊猫Flash播放器仿天猫App可打开列表猫国建设者红猫软路由多级树形目录列表

相关文档

变现猫接入文档 v1.4 Blockly 系列教程 JavaScript 系列教程实战 Groovy 系列 ES6 系列连载