使用数据类型读取\u csv，但列[duplicate]中有na值

仉嘉泽

2023-03-14

我使用以下代码通过指定每个列的类型来读取csv：

clean_pdf_type=pd.read_csv('table_updated.csv',usecols=col_names,dtype =col_types)

但它有一个错误：

ValueError: Integer column has NA values in column 298

不知道如何跳过NA？

共有2个答案

西门骁

2023-03-14

clean_pdf_type=pd.read_csv('table_updated.csv',usecols=col_names)
clean_pdf_type = (clean_pdf_type.fillna(0)).astype(col_types)

正如注释中所说，不要指定类型，删除NA，然后强制转换为特定类型

拓拔浩阔

2023-03-14

请参见NumPy或Pandas：在具有NaN值时保持数组类型为整数

在intdtype系列中不能有NaN值。这是无法避免的，因为NaN值被视为float：

import numpy as np
type(np.nan)  # float

您最好将这些列中的内容改为float。如果随后能够用填充值（如0或-1）替换NaN值，则可以相应地进行处理并转换为int：

int_cols = ['col1', 'col2', 'col3']
df[int_cols] = df[int_cols].fillna(-1)
df[int_cols] = df[int_cols].apply(pd.to_numeric, downcast='integer')

混合使用int和float值将导致一系列数据类型对象。不建议这样做。

类似资料：

R使用NA值读取和写入数据

本文向大家介绍R使用NA值读取和写入数据，包括了R使用NA值读取和写入数据的使用技巧和注意事项，需要的朋友参考一下示例使用read.*函数读取表格数据集时，R自动查找看起来像的缺失值"NA"。但是，缺失值并不总是由表示NA。有时，点（.），连字符（-）或字符值（例如：）empty表示值是NA。该函数的na.strings参数read.*可用于告诉R需要将哪些符号/字符视为NA值：还可能表明需
数据类型读取

读取文件已支持 windows 系统，版本号大于等于 1.3.4.1；扩展版本大于等于 1.2.7； PECL 安装时将会提示是否开启读取功能，请键入 yes；编译编译时需添加 --enable-reader ./configure --enable-reader 类型数组说明文档第三列是时间，你需要这样设置类型： [ 2 => \Vtiful\Kernel\Excel::TYP
使用正确的数据类型在Pyspark中读取CSV

当我尝试导入带有火花的本地CSV时，默认情况下每个列都作为字符串读取。但是，我的列只包括整数和时间戳类型。更具体地说，CSV如下所示：我已经找到了这个问题中应该有效的代码，但当我执行它时，所有条目都返回为NULL。我使用以下内容来创建自定义架构：然后使用以下命令读取CSV：返回：我是否错过了关键的一步？我怀疑Date列是问题的根源。注意：我在GoogleCollab中运行这个。
Android Parcelable-使用通用数据类型将数据读取/写入Parcel

问题内容：如何实现使用通用数据类型将我的包裹写入我的包裹？这是我的代码。问题答案：您的课程应该实现Parcelable。上面的代码就是一个例子。您的问题是您正在尝试将通用数据类型读取/写入包裹。但是无法在包裹中读取/写入通用数据类型。了解更多如何使用Parcelable 这里和包裹在这里
使用C＃获取SQL Server列的数据类型

问题内容：我不确定自己到底在做什么错，请问有人可以纠正吗？我需要使用C＃确定从SQL Server数据库中检索到的列的类型。说，我有这个：问题答案：您可以执行以下操作：
如何使用Eclipse Link/JPA获取表中列名、列数据类型

我在JPA上工作。我的要求是从表中获取列名和数据类型。我有查询来做这件事，但这些是原生查询的。如果我使用这些原生查询，它将支持任何数据库，如Oracle，MySql，....... 现在我正在使用MySql和JPA工作得很好。下面的查询用于获取表列名我使用JPA中的createNativeQuery（）执行了上面的查询。它将支持所有的数据库。如果没有，我怎么能做到这一点。非常感谢。

使用数据类型读取\u csv，但列[duplicate]中有na值

共有2个答案

相关问答

相关文章

相关阅读

相关工具

相关文档