当前位置：首页 > 面试题库 >

将CSV加载到Pandas MultiIndex DataFrame

毋澄邈

2023-03-14

问题内容：

我有一个719mb的CSV文件，看起来像：

from, to, dep, freq, arr, code, mode   (header row)
RGBOXFD,RGBPADTON,127,0,27,99999,2
RGBOXFD,RGBPADTON,127,0,33,99999,2
RGBOXFD,RGBRDLEY,127,0,1425,99999,2
RGBOXFD,RGBCHOLSEY,127,0,52,99999,2
RGBOXFD,RGBMDNHEAD,127,0,91,99999,2
RGBDIDCOTP,RGBPADTON,127,0,46,99999,2
RGBDIDCOTP,RGBPADTON,127,0,3,99999,2
RGBDIDCOTP,RGBCHOLSEY,127,0,61,99999,2
RGBDIDCOTP,RGBRDLEY,127,0,1430,99999,2
RGBDIDCOTP,RGBPADTON,127,0,115,99999,2
and so on...

我想加载到熊猫DataFrame中。现在我知道csv方法有负载：

 r = pd.DataFrame.from_csv('test_data2.csv')

但我特别想将其加载为“ MultiIndex” DataFrame，其中from和to是索引：

所以最后以：

                   dep, freq, arr, code, mode
RGBOXFD RGBPADTON  127     0   27  99999    2
        RGBRDLEY   127     0   33  99999    2
        RGBCHOLSEY 127     0 1425  99999    2
        RGBMDNHEAD 127     0 1525  99999    2

等等。我不确定该怎么做？

问题答案：

您可以使用pd.read_csv：

>>> df = pd.read_csv("test_data2.csv", index_col=[0,1], skipinitialspace=True)
>>> df
                       dep  freq   arr   code  mode
from       to                                      
RGBOXFD    RGBPADTON   127     0    27  99999     2
           RGBPADTON   127     0    33  99999     2
           RGBRDLEY    127     0  1425  99999     2
           RGBCHOLSEY  127     0    52  99999     2
           RGBMDNHEAD  127     0    91  99999     2
RGBDIDCOTP RGBPADTON   127     0    46  99999     2
           RGBPADTON   127     0     3  99999     2
           RGBCHOLSEY  127     0    61  99999     2
           RGBRDLEY    127     0  1430  99999     2
           RGBPADTON   127     0   115  99999     2

我曾经skipinitialspace=True摆脱标题行中那些烦人的空格的地方。

类似资料：

将CSV加载到Neo4j时出错

谢谢
在Python中将CSV数据加载到MySQL中

问题内容：不知道我在这里缺少什么，但是这段代码运行时没有任何错误消息，但是表中没有任何内容。我正在将三列的CSV值加载到mysql表中如果有人可以看看，将不胜感激。谢谢。问题答案：我认为您必须将所有内容插入。像这样
写入CSV时将列添加到CSV

问题内容：我正在用csv快速编写以下数据：当我完成解析第一个文件并启动第二个文件时，我想添加更多列，如下所示： parsed STEP ID ELEMENT_ID Fatigue SW Fatigue F1 Fatigue F3 Fatigue SW Fatigue F1 Fatigue F3 Step 10 10000 1.30E-07 1.51E-06 2.15E-06 1.30E-07
Logstash不将csv数据加载到弹性搜索

我无法用logstash将数据加载到localhost上的弹性搜索节点...我想让logstash读取csv文件并将这些数据加载到弹性搜索。但是什么都不起作用，我只能读取我手动添加到弹性搜索中的数据，看起来logstash什么都不做。我的logstash配置是：我的csv文件是： “MyIndex”索引上没有新的内容出现！但我不知道为什么... 将logstash配置文件从不获取文件的“*.c
SSIS将数据从csv文件加载到sql表

我正在通过SSIS将数据从csv文件加载到我的sql表中。是否对从csv文件读取的记录数指定了默认限制？在加载csv文件时，我的数据流组件只处理5000条记录，尽管它包含5341条记录，如下面的图像所示。我如何修复这个问题？
从CSV文件将树结构加载到Neo4J中

相关阅读

通过SQLLDR将多个csv加载到一个表中将数据从CSV加载到mySQL数据库Java + Hibernate + Spring 用numpy将csv加载到二维矩阵中进行绘图 Python将标头添加到CSV文件 Java将新列追加到csv文件

相关文章

ionic 加载动作 PyTorch加载数据 PDFBox加载文件 OrientDB加载记录 ECharts 异步加载数据

相关问答

如何将csv直接加载到Spark数据集中？Kinesis消防软管将csv数据加载到红移将csv加载到Postgres数据库的pandas.read_csv与其他csv库的比较将带有NaN的CSV数据加载到AWS红移中可以将csv数据上载到bigquery

相关工具

jQuery CSV webview 加载css js 文件 Apache Commons CSV Excel-To-CSV-Inbrowser 图片下载和保存

相关文档

ES6 系列连载 Camel 负载平衡中间件 fbreader 和移动 DM 和加解密从 Docker 到 Kubernetes 进阶魔方加密帮助手册文档