我写了一个小代码来测试如何更改Python中DataFrame列的数据类型(版本3.8.5,并在Jupyter笔记本中运行代码)。但是它没有改变数据类型。知道我做错了什么吗?
import pandas as pd
data = {'Name':['Tom', 'nick', 'krish', 'jack'],
'Age':['20+', '21.5', '19+', '18.6']}
df = pd.DataFrame(data)
df["Age_Corrected"] = df["Age"].str.replace("+","")
df
df["Age_Corrected"].astype("float")
df.info()
但我不会把年龄修正为浮动。它仍在显示对象。下面给出了我从df.info()得到的结果。
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 4 entries, 0 to 3
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 Name 4 non-null object
1 Age 4 non-null object
2 Age_Corrected 4 non-null object
dtypes: object(3)
memory usage: 112.0+ bytes
它不会更改,因为不影响列。试试这个
df["Age_Corrected"] = df["Age_Corrected"].astype("float")
你必须这样做
df["Age_Corrected"]=df["Age_Corrected"]. astype("浮动")
本文向大家介绍更改Pandas Dataframe中一列或多列的数据类型,包括了更改Pandas Dataframe中一列或多列的数据类型的使用技巧和注意事项,需要的朋友参考一下 在本教程中,我们将学习一种或多种列数据类型到另一种数据类型的转换。我们将使用DataFrame.astype()方法。 我们必须传递来自Python,Pandas或Numpy的任何数据类型以更改列元素的数据类型。我们还可
问题内容: 在pgsql中,有一种方法可以建立一个包含多个值的表,然后选择其中一个值(例如other_id),找出其最大值,并使表中的每个新条目都从该值开始递增。 我想这太容易了,没有机会工作。 非常感谢您的见解! 问题答案: 快速浏览一下文档会告诉您 数据类型smallserial, serial 和bigserial 不是真实类型, 而只是创建唯一标识符列的符号方便 如果你想使现有的(整数)列
如何在PySpark中更改嵌套列的datatype?对于rxample,如何将value的数据类型从string更改为int? 参考:如何在pyspark中将Dataframe列从String类型更改为Double类型
下面是我做的方式: 我只是想知道,这是正确的方法吗,因为在运行逻辑回归时,我得到了一些错误,所以我想知道,这是麻烦的原因吗。
问题内容: 我们需要将某些列的数据类型从int更改为bigint。不幸的是,其中一些表很大,大约有7-10百万行(但不宽)。 Alter表alter列将永远保留在这些表上。有没有更快的方法来实现这一目标? 问题答案: 巧合的是,大约3个小时前,我不得不做一些非常相似的事情。该表是3500万行,它相当宽,并且花了很多时间才能做到这一点: 这就是我最终得到的结果: 这次,这些陈述几乎是即时的。(在速度
我有一个包含复杂条目的数组列表的结构,我想将它们转换为浮点数。虚部可以丢弃,这很好。 我想知道,为什么这不起作用,而另一方面,在创建列表“数组”之前将类型更改为float会起作用。 这是一个非常基本的问题,但如果有人能分享他或她的想法,我将非常高兴。 感谢提前:)