当前位置：首页 > 面试题库 >

根据熊猫中的列索引在csv文件导入期间定义数据类型

扶开诚

2023-03-14

问题内容：

我需要导入一个包含300多个列的csv文件，在这些列中，仅第一列需要指定为类别，而其余列应为float
32或更少。我猜想我可以通过列索引指定列的数据类型。我的问题是：基于列索引指定数据类型的最佳方法是什么？

Col_A   Col_B   Col_C   Col_D
001       1       2      1.2
002       2       3      3.5
003       3       4.5      7
004       4       6.5     10

我试过的代码是：

df = pd.read_csv(path, low_memory=False,  
             dtype={'Col_A': 'category', [2:]: np.float32)}

问题答案：

读取两次，第一次获取所有列，第二次读取时指定dtype。

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randint(0,100,size=(100, 4)), columns=list('ABCD'))
df.to_csv('tmp.csv',index=False)

path = 'tmp.csv'
df =pd.read_csv(path)
type_dict = {}

for key in df.columns:
    if key == 'A':
        type_dict[key]='category'
    else:
        type_dict[key]=np.float32
df = pd.read_csv(path,dtype=type_dict)
print(df.dtypes)

类似资料：

将CSV文件导入为熊猫数据帧

Python是如何将CSV文件读入pandas数据帧的（我可以使用它进行统计操作，可以有不同类型的列，等等）？我的CSV文件有以下内容：在R中，我们将使用以下方法读取此文件：这将返回一个R数据。框架：有没有类似python的方法来获得相同的功能？
熊猫将数据框列写入csv

问题内容：我正在编写一个脚本，以将带有标头的大.xlsx文件减少到一个csv中，然后根据标头名称仅写有所需列的新csv文件。我得到的错误是最后一部分代码，它说我确定我忽略了一些愚蠢的事情，但是我已经阅读了熊猫网站上的to_csv文档，但我仍然感到茫然。我知道我使用了不正确的to_csv参数，但我似乎无法理解我猜的文档。任何帮助表示赞赏，谢谢！问题答案：选择特定列的方法是这样的-
根据数据类型获取熊猫数据框列的列表

问题内容：如果我有一个包含以下列的数据框：我想说：这是一个数据框，请给我列出对象类型或日期时间类型的列的列表吗？我有一个将数字（Float64）转换为两位小数的函数，并且我想使用此数据框列的特定类型的列表，并通过此函数运行它以将它们全部转换为2dp。也许：问题答案：如果您想要某种类型的列的列表，可以使用：
根据数据类型获取熊猫数据帧列列表

如果我有一个包含以下列的数据帧：我想能够说：这里是一个数据框，给我一个列的列表，它是类型Object还是类型DateTime？我有一个将数字（Float64）转换为两位小数的函数，我想使用这个特定类型的dataframe列列表，并通过这个函数将它们全部转换为2dp。也许吧：
将大型数据文件导入熊猫[副本]

我有一个1.5GB.dat文件需要作为pandas数据帧导入，我遇到了内存问题(8GB RAM）。如何将dat文件分解成块来执行分析？
格式化熊猫数据框索引日期

问题内容：我有一个从以下代码获得的数据框，但无法将索引转换为dd / mm / yyyy 这是结果我已经在stackoverflow上搜索了其他几个不同的变体，但是我找不到适合的组合。它仍然打印出as 问题答案：如果需要则是个问题，因为是in的默认显示格式。如果需要通过索引：不幸的是，这不起作用-docs：

相关阅读

如何根据条件删除熊猫数据框中的列？将索引转换为列熊猫数据框在熊猫中保存csv时删除索引列如何在熊猫数据框中重置索引？在熊猫数据框中自定义排序

相关文章

SQL Server数据定义 MySQL哈希索引的数据结构以及索引的优缺点导入Oracle示例数据库 Firebase写入列表数据 MySQL常见数据类型的深入理解以及数据类型的选择优化

相关问答

从Jmeter中的csv文件导入数据替换熊猫多索引数据帧中的值熊猫：根据阈值条件删除列从带有日期索引的多个csv文件创建熊猫DataFrame 如何添加熊猫数据到现有的csv文件？

相关工具

熊猫Flash播放器 SQL Server 数据库发布向导开源数据访问组件DAC 根据开发者帐号查看App 物体根据重力感应运动

相关文档

Porter 数据同步中间件 KDB+ 高性能列式数据库中文教程 Phinx 数据库迁移中文文档大数据入门指南变现猫接入文档 v1.4