我使用以下代码通过指定每个列的类型来读取csv:
clean_pdf_type=pd.read_csv('table_updated.csv',usecols=col_names,dtype =col_types)
但它有一个错误:
ValueError: Integer column has NA values in column 298
不知道如何跳过NA?
clean_pdf_type=pd.read_csv('table_updated.csv',usecols=col_names)
clean_pdf_type = (clean_pdf_type.fillna(0)).astype(col_types)
正如注释中所说,不要指定类型,删除NA,然后强制转换为特定类型
请参见NumPy或Pandas:在具有NaN值时保持数组类型为整数
在int
dtype系列中不能有NaN
值。这是无法避免的,因为NaN
值被视为float
:
import numpy as np
type(np.nan) # float
您最好将这些列中的内容改为float
。如果随后能够用填充值(如0
或-1
)替换NaN
值,则可以相应地进行处理并转换为int
:
int_cols = ['col1', 'col2', 'col3']
df[int_cols] = df[int_cols].fillna(-1)
df[int_cols] = df[int_cols].apply(pd.to_numeric, downcast='integer')
混合使用int
和float
值将导致一系列数据类型对象
。不建议这样做。
本文向大家介绍R使用NA值读取和写入数据,包括了R使用NA值读取和写入数据的使用技巧和注意事项,需要的朋友参考一下 示例 使用read.*函数读取表格数据集时,R自动查找看起来像的缺失值"NA"。但是,缺失值并不总是由表示NA。有时,点(.),连字符(-)或字符值(例如:)empty表示值是NA。该函数的na.strings参数read.*可用于告诉R需要将哪些符号/字符视为NA值: 还可能表明需
读取文件已支持 windows 系统,版本号大于等于 1.3.4.1; 扩展版本大于等于 1.2.7; PECL 安装时将会提示是否开启读取功能,请键入 yes; 编译 编译时需添加 --enable-reader ./configure --enable-reader 类型数组说明 文档第三列是时间,你需要这样设置类型: [ 2 => \Vtiful\Kernel\Excel::TYP
当我尝试导入带有火花的本地CSV时,默认情况下每个列都作为字符串读取。但是,我的列只包括整数和时间戳类型。更具体地说,CSV如下所示: 我已经找到了这个问题中应该有效的代码,但当我执行它时,所有条目都返回为NULL。 我使用以下内容来创建自定义架构: 然后使用以下命令读取CSV: 返回: 我是否错过了关键的一步?我怀疑Date列是问题的根源。注意:我在GoogleCollab中运行这个。
问题内容: 如何实现使用通用数据类型将我的包裹写入我的包裹? 这是我的代码。 问题答案: 您的课程应该实现Parcelable。上面的代码就是一个例子。 您的问题是您正在尝试将通用数据类型读取/写入包裹。 但是无法在包裹中读取/写入通用数据类型。了解更多如何使用Parcelable 这里 和包裹在这里
问题内容: 我不确定自己到底在做什么错,请问有人可以纠正吗?我需要使用C#确定从SQL Server数据库中检索到的列的类型。 说,我有这个: 问题答案: 您可以执行以下操作:
我在JPA上工作。我的要求是从表中获取列名和数据类型。我有查询来做这件事,但这些是原生查询的。如果我使用这些原生查询,它将支持任何数据库,如Oracle,MySql,....... 现在我正在使用MySql和JPA工作得很好。 下面的查询用于获取表列名 我使用JPA中的createNativeQuery()执行了上面的查询。它将支持所有的数据库。如果没有,我怎么能做到这一点。非常感谢。