当前位置：首页 > 面试题库 >

使用Pandas读取数据（.dat文件）

公西苗宣

2023-03-14

问题内容：

如何使用Pandas读取以下（两列）数据（来自.dat文件）

TIME                      XGSM
2004 006 01 00 01 37 600  1
2004 006 01 00 02 32 800  5
2004 006 01 00 03 28 000  8
2004 006 01 00 04 23 200  11
2004 006 01 00 05 18 400  17

列分隔符（至少）为2个空格。

我试过了

df = pd.read_table("test.dat", sep="\s+", usecols=['TIME', 'XGSM'])
print df

但它打印

问题答案：

您可以将参数usecols与列顺序一起使用：

import pandas as pd
from pandas.compat import StringIO

temp=u"""TIME             XGSM
2004 006 01 00 01 37 600  1
2004 006 01 00 02 32 800  5
2004 006 01 00 03 28 000  8
2004 006 01 00 04 23 200  11
2004 006 01 00 05 18 400  17"""
#after testing replace StringIO(temp) to filename
df = pd.read_csv(StringIO(temp), 
                 sep="\s+", 
                 skiprows=1, 
                 usecols=[0,7], 
                 names=['TIME','XGSM'])

print (df)
   TIME  XGSM
0  2004     1
1  2004     5
2  2004     8
3  2004    11
4  2004    17

编辑：

您可以使用分隔符regex-2个或更多空格，然后添加，engine='python'因为出现警告：

ParserWarning：回退到“ python”引擎，因为“ c”引擎不支持正则表达式分隔符（分隔符> 1个字符且与“ \ s
+”不同的分隔符被解释为正则表达式）；您可以通过指定engine =’python’来避免此警告。

import pandas as pd
from pandas.compat import StringIO

temp=u"""TIME              XGSM
2004 006 01 00 01 37 600   1
2004 006 01 00 02 32 800   5
2004 006 01 00 03 28 000   8
2004 006 01 00 04 23 200   11
2004 006 01 00 05 18 400   17"""
#after testing replace StringIO(temp) to filename
df = pd.read_csv(StringIO(temp), sep=r'\s{2,}', engine='python')

print (df)
                       TIME  XGSM
0  2004 006 01 00 01 37 600     1
1  2004 006 01 00 02 32 800     5
2  2004 006 01 00 03 28 000     8
3  2004 006 01 00 04 23 200    11
4  2004 006 01 00 05 18 400    17

类似资料：

C#创建及读取DAT文件操作

本文向大家介绍C#创建及读取DAT文件操作，包括了C#创建及读取DAT文件操作的使用技巧和注意事项，需要的朋友参考一下 *.DAT 从后缀名上也能理解其中的含义即：data文件，数据文件；这个文件有的可以用记事本工具打开，但是加密后就不一定了。很多程序都创建dat文件来保存设定。创建一个只有自己才能解析得dat文件，并且可以读取和写入，写一个类，它可以创建一个只有使用这个类才能解析得dat文件。
从数据库中提取数据。python中的dat文件

这就是我的生活。dat文件看起来像我想知道如何从中提取数据，就像我想让它像1:：Toy Story（1995）在单独的列中一样。而且我想在没有熊猫的情况下做这件事，numpy有可能吗
Python Pandas读取文件

主要内容：CSV文件读取,json读取文件,SQL数据库读取当使用 Pandas 做数据分析的时，需要读取事先准备好的数据集，这是做数据分析的第一步。Panda 提供了多种读取数据的方法： read_csv() 用于读取文本文件 read_json() 用于读取 json 文件 read_sql_query() 读取 sql 语句的，本节将对上述方法做详细介绍。 CSV文件读取 CSV 又称逗号分隔值文件，是一种简单的文件格式，以特定的结构来排列表格数据
使用Apache POIJava只读xlsm文件读取数据

我试图使用java apache poi从只读xlsm读取数据，但当我使用XSSF工作簿时，它似乎无法访问该文件，而HSSF工作簿仅适用于xls文件。我的代码如下所示：代码从未到达“工作簿中”打印行，我不知道为什么。请帮忙！
使用CSV文件读取测试数据

我如何完成这个任务？
使用pig从csv文件读取数据

我正在尝试读取Mac上pig shell上的csv文件。我所做的只是文件到变量中，然后变量。我是这样做的：我使用的数据是从这里提供的github下载的此文件在我的Mac上的本地安装的hdfs中可用。当我执行时，我得到一个错误： org.apache.pig.impl.logicallayer.FrontendException：错误1066：无法打开别名影片的迭代器在org.apache.p

相关阅读

如何使用JavaScript从* .CSV文件读取数据？Python-如何用pandas读取6gb csv文件使用pandas读取zip文件中包含的多个文件使用PHP读取JSON数据在Pandas Python中读取XLSB文件

相关文章

Go语言使用buffer读取文件使用scanf读取从键盘输入的数据 mysql源码解读——数据到文件之数据 Jsoup 读取文件获取HTML Pandas数据重采样

相关问答

使用Python Pandas读取制表符分隔的文件 Python使用Pandas读取固定宽度文件，无需任何数据类型解释 Python pandas读取表单标签::的数据如何使用Spring数据从elasticsearch读取文档？读取Json数据时使用BufferedReader

相关工具

Dat Dat Data Pandas Sklearn-pandas pandas-profiling

相关文档

Python 和 Pandas 数据分析教程 Python Pandas 中文教程 Pandas 函数手册 Phinx 数据库迁移中文文档 StackExchange.Redis 中文使用文档