当前位置: 首页 > 面试题库 >

在多个DataFrame列上运行get_dummies?

南门野
2023-03-14
问题内容

如何习惯地get_dummies在多个DataFrame列上运行类似的函数,该函数期望一个列并返回多个列?


问题答案:

使用 pandas 0.19 ,您可以在一行中完成此操作:

pd.get_dummies(data=df, columns=['A', 'B'])

Columns 指定在哪里进行一次热编码。

>>> df
   A  B  C
0  a  c  1
1  b  c  2
2  a  b  3

>>> pd.get_dummies(data=df, columns=['A', 'B'])
   C  A_a  A_b  B_b  B_c
0  1  1.0  0.0  0.0  1.0
1  2  0.0  1.0  0.0  1.0
2  3  1.0  0.0  1.0  0.0


 类似资料:
  • 如何将一个数据帧中的多列(比如3列)组合成一个列(在一个新的数据帧中),其中每一行都成为一个Spark DenseVector?类似于这个线程,但在Java中,有一些下面提到的调整。 我试着用这样的UDF: 然后注册UDF: 其中<code>数据类型<code>为: 当我在一个有3列的数据帧上调用这个UDF并打印出新数据帧的模式时,我得到如下结果: 这里的问题是,我需要一个向量在外部,而不是在结构

  • 问题内容: 我必须阅读一些文件,其中一些文件采用Excel格式,有些文件采用CSV格式。一些文件具有数百列。 有没有一种方法可以选择多个列范围而不指定所有列名或位置?例如,选择第1 -10、15、17和50-100列: 从Excel文件和CSV文件创建数据框时以及创建数据框框程序后,我都需要知道如何执行此操作。 问题答案: 采用 所以你可以做

  • 我需要根据其中一个列的条件交换多个列的值,并使用API而不是sparkQL 我有一个包含列 [A,B,C,X,Y,Z] 的数据帧,并且它具有具有以下模式的行: (1,2,3,空,空,空),< br> (3,3,3,空,空,空),< br >(空,空,空,5,3,2),< br> (3,1,1,空,空),< br >(空,空,空,3,4,1) 当任何行具有列A中的值为空的条件时,我想实现列组(a,

  • 问题内容: 我想在Centos 7上运行Redis的多个实例。有人可以指出我的正确链接或在此处发布步骤。 我在Google上搜索了该信息,但没有找到任何相关信息。 问题答案: 您可以在单台计算机上使用不同的端口运行Redis的多个实例。如果这与您有关,则可以按照以下步骤操作。 通过安装第一个Redis实例,默认情况下它会监听。 对于第二实例,创建一个新的工作目录 默认的Redis实例用作其工作目录

  • 在Crystal Reports中,我使用以下查询(针对Oracle数据库)为报表中的单个字段生成数据: 这可以很好地工作,并基于提供的{HB_As_At_Date}(the{?}语法是Crystal将参数值嵌入SQL(SQL)的方法。不过,上述查询的内容不是我的问题——我想做的是在几个不同的日期重复运行它,并将输出输入Crystal以供在报告中使用。 假设我希望在9月的每个星期一运行这个查询,我

  • 当读取从json到熊猫的数据时,一个多标准的酒店评级列被读取如下所示。我有2列在我的数据帧评级和评论ID。因为我从一个较大的Json读取数据框,所以评级列对每个审阅者都有一个条目,其形式如下: 我的目的是将评级列分为7个不同的列,每个列都有各自的标准值:' 任何有格式建议的人都会很有帮助。。 可用数据帧所需数据帧