当前位置: 首页 > 知识库问答 >
问题:

如何自动转换成熊猫假人

贺君浩
2023-03-14

数据如下

no,store_id,revenue,profit,state,country
'0','101','779183','281257','WD','India'
'1','101','144829','838451','WD','India'
'2','101','766465','757565','AL','Japan'
'3','102','766465','757565','AL','Japan'

代码在下面

import pandas as pd  
data = pd.read_csv("1.csv") 
dummies = pd.get_dummies(data)
dummies.head(10)

data.info()是所有列的对象

如何自动转换到new object column到dummies,例如这里的teamobject需要转换到get_dummies。 如果有人添加了明天的names列,也需要转换为dummies

  • data.info()是所有列的对象
  • 如何将自动分配的int转换为数字列,将object转换为非数字列
  • 明天有人可能会添加新列,可能是数字列或非数字列
  • 之后如何应用get_dummies

共有1个答案

戴浩初
2023-03-14

使用pd.read_csv读取CSV文件时,将quotechar参数设置为'(默认值为)

from io import StringIO
text = """no,store_id,revenue,profit,state,country
'0','101','779183','281257','WD','India'
'1','101','144829','838451','WD','India'
'2','101','766465','757565','AL','Japan'
'3','102','766465','757565','AL','Japan'"""

df = pd.read_csv(StringIO(text),quotechar='\'') # or quotechar = "'"
print(df.dtypes)
no           int64
store_id     int64
revenue      int64
profit       int64
state       object
country     object
dtype: object
 类似资料:
  • 问题内容: 我已经读过一个对Pandas的SQL查询,并且值以dtype’object’的形式出现,尽管它们是字符串,日期和整数。我能够将日期“ object”转换为Pandas datetime dtype,但是在尝试转换字符串和整数时遇到错误。 这是一个例子: 将转换为日期时间可以: 但是尝试将转换为整数时出现错误: 注意:我尝试时遇到类似的错误 当尝试转换为字符串时,似乎什么也没有发生。 问

  • 我有一个字段在熊猫DataFrame被导入为字符串格式。它应该是日期时间变量。如何将其转换为日期时间列,然后根据日期进行筛选。 示例: 数据帧名称:原始数据

  • 我有一个列表的字典(等长),我想把它转换成一个数据帧,这样字典中的每个键代表数据帧中的一列(或一系列),并且对应于每个键的值列表被转换成数据帧中的单个记录专栏。 假设词典的内容是: 我希望dataframe的内容是: 我尝试通过首先将字典转换为数据帧,然后对数据帧进行转置来解决这个问题。 这给出了以下输出: 我不知道如何进一步进行。

  • 我正在将SQL查询的结果写入Excel工作表,并尝试将行转换为列,但似乎无法让Pandas移动;Excel似乎存在某种难题。我看过: 如何在数据帧中切换列和行 在groupby之后,如何将dataframe中的行值转换为Python中的列标签? 在Python中将列转换为行 Python:将行转换为列标题 似乎都不起作用。 Excel表格: 请求:

  • 问题内容: 我必须解析一个XML文件,该文件为我提供Excel样式的日期时间。例如:。 熊猫是否提供将该数字转换为常规对象的方法? 问题答案: 好的,我认为最简单的方法是从浮点数构造a并将其添加到以下标量日期时间中: 好的,似乎Excel的日期有点奇怪,谢谢@ayhan:

  • 问题内容: 我有一个带有ID号的大型数据框: 这些现在都是字符串。 我想转换为不使用循环-为此我使用。 问题是我的某些行包含无法转换为的脏数据,例如 如何(不使用循环)删除这些类型的事件,以便我可以放心使用? 问题答案: 您需要向功能添加参数: 如果是列: 但非数字会转换为,因此所有值都是。 对于需要转换到一些值,例如,然后转换为: 样品: 编辑:如果使用0.25+大熊猫,则可以使用:

  • 我有以下布尔值表: 我想创建一个具有相同索引的新数据帧,但每行都有前一列的前三个 True 列名。 如果一行少于三个真值,则新数据帧将具有空值。

  • 问题内容: 您是否知道如何以NumPy数组或python列表的形式获取DataFrame的索引或列? 问题答案: 要获取NumPy数组,应使用以下属性: 这样可以访问数据的存储方式,因此无需进行转换。 注意:此属性也可用于其他许多熊猫的对象。 要将索引作为列表获取,请致电: 同样,对于列。