当我只想要列的一个子集(例如总共20列中的第4和第7列)时,如何使用Pandas读取.csv文件(没有头)?我似乎无法执行usecols
以前的答案很好,也很正确,但在我看来,一个额外的names
参数会使它变得完美,这应该是推荐的方式,特别是当csv没有headers
时。
df = pd.read_csv(file_path, usecols=[3,6], names=['colA', 'colB'])
或者使用header=none
显式地告诉用户CSV
没有头(无论如何两行都是相同的)
df = pd.read_csv(file_path, usecols=[3,6], names=['colA', 'colB'], header=None)
以便您可以通过以下方式检索数据
# with `names` parameter
df['colA']
df['colB']
而不是
# without `names` parameter
df[0]
df[1]
基于read_csv,当显式传递names
时,header
的行为将与none
类似,而不是0
。因此,当存在names
时,可以跳过header=none
。
要读取没有标头且仅针对某些列的csv,需要为第4和第7列传递参数header=none
和usecols=[3,6]
:
df = pd.read_csv(file_path, header=None, usecols=[3,6])
查看文档
问题内容: 我有一个带有多个标题的Excel工作表,例如: 现在在这里您可以看到前两列没有标题,它们为空白,而其他列具有标题,例如Header1,Header2和Header3。因此,我想阅读此表并将其与其他具有类似结构的表合并。 我想将其合并在第一列“ ColX”上。现在我正在这样做: 但是我不知道它没有正确读取列,我认为不会以我想要的方式返回结果。所以,我希望结果框架应该像这样: 有任何建议请
问题内容: 我尝试将文件读入熊猫。该文件具有以空格分隔的值,但是我尝试使用不同数量的空格: 但这不起作用 问题答案: 添加参数,它比正则表达式更快。
我有两个python发行版(python2.7,python3.6),在这两个我已经安装了和,但不能使用 这些是我尝试导入熊猫时产生的错误 在Python2.7中 文件"/usr/local/lib/python2.7/dist-包/熊猫/init.py",第19行,在"缺少必需的依赖项{0}"中。格式(missing_dependencies)) 缺少必需的依赖项 然后导入Numpy 进口恐怖主
问题内容: 我很好奇如何使用熊猫读取以下结构的嵌套json: 这使数组保持为json。我宁愿将其扩展为列。 感谢您的第一个答案。我应该提一下我的问题:数组中嵌套属性的拼合不是强制性的。仅将[A,B,C]连接df.locations [‘name’]就可以了。 我的文件包含多个JSON对象(每行1个),我想保留number,date,name和location列。但是,我需要加入这些地点。 我在这里
我在这里和这里发现了关于同一问题的几个问题 我得到以下错误: 我尝试卸载和重新安装熊猫版本1.1.3, 1.1.2, 1.1.1和他们都不工作,我只是得到了同样的错误,然后我试图建立熊猫以下方式: 我还是会犯同样的错误
我不能进口熊猫 我试着胡闹,但这个错误没有改变。我已经更新了模块以及pip和python! 这是该命令的完整回溯。 我目前使用python 3.6.6(从官方网站下载) pip版本:18.1在windows 10笔记本电脑上运行!!