当前位置：首页 > 面试题库 >

将JSON文件读取为熊猫数据框？

袁飞鹏

2023-03-14

问题内容：

我正在使用python 3.6并尝试使用以下代码将json文件（350 MB）下载为pandas数据框。但是，出现以下错误：

data_json_str = "[" + ",".join(data) + "]
"TypeError: sequence item 0: expected str instance, bytes found

我该如何解决错误？

import pandas as pd

# read the entire file into a python array
with open('C:/Users/Alberto/nutrients.json', 'rb') as f:
   data = f.readlines()

# remove the trailing "\n" from each line
data = map(lambda x: x.rstrip(), data)

# each element of 'data' is an individual JSON object.
# i want to convert it into an *array* of JSON objects
# which, in and of itself, is one large JSON object
# basically... add square brackets to the beginning
# and end, and have all the individual business JSON objects
# separated by a comma
data_json_str = "[" + ",".join(data) + "]"

# now, load it into pandas
data_df = pd.read_json(data_json_str)

问题答案：

如果以二进制（'rb'）格式打开文件，则会得到字节。怎么样：

with open('C:/Users/Alberto/nutrients.json', 'rU') as f:

类似资料：

将CSV文件导入为熊猫数据帧

Python是如何将CSV文件读入pandas数据帧的（我可以使用它进行统计操作，可以有不同类型的列，等等）？我的CSV文件有以下内容：在R中，我们将使用以下方法读取此文件：这将返回一个R数据。框架：有没有类似python的方法来获得相同的功能？
从pyodbc读取数据到熊猫

问题内容：我正在查询一个SQL数据库，我想使用熊猫来处理数据。但是，我不确定如何移动数据。以下是我的输入和输出。问题答案：答案更简短
如何将熊猫数据帧的第n行提取为熊猫数据帧？

假设熊猫数据帧如下所示：如何将第三行（如row3）提取为pd数据帧？换句话说，row3.shape应该是（1,5），row3.head（）应该是：
熊猫读取json不适用于MultiIndex

问题内容：我试图读取通过via 创建的数据框，但得到了。我认为这可能与索引为MultiIndex的事实有关，但我不确定如何处理。调用了55k行的原始数据框，并通过以下方式创建了该数据框：如果要使用它，这是输出。当我对这小部分数据（5行）进行处理时，我得到一个。这是完整的堆栈：但是，当我在整个数据帧（55k行）上执行此操作时，我得到一个无效的指针错误，并且IPython内核死亡。有任何想
如何将熊猫的数据文件放平？

所以我得到了一个看起来像这样的数据帧：原始数据帧我需要对数据帧进行转换，使其看起来如下所示：有谁知道怎么用熊猫？
熊猫将csv读取为字符串类型

问题内容：我有一个包含字母数字键的数据框，我想另存为csv并在以后读取。由于种种原因，我需要以字符串格式显式读取此键列，所以我使用的键严格地是数字的，甚至更糟，例如：1234E5，Pandas会将其解释为浮点数。这显然使密钥完全无用。问题是，当我为数据框或其中的任何列指定字符串dtype时，我只会得到垃圾回收。我在这里有一些示例代码：数据框如下所示：然后我像这样阅读：结果是：这是我的计

相关阅读

将熊猫数据框转换为序列将JSON数据保存到文本文件并读取将索引转换为列熊猫数据框将大熊猫数据帧分块写入CSV文件熊猫数据框到JSON列表格式

相关文章

Jsoup 读取文件获取HTML Ajax获取JSON数据以数据块的形式读写文件 yml文件读取方式-2 yml文件读取方式-1

相关问答

在CloudML的Tensorflow中读取熊猫泡菜文件将XML标签解析为熊猫数据框熊猫：将dbf表转换为数据帧将熊猫数据帧转换为系列将压缩文件作为数据帧读取

相关工具

熊猫Flash播放器开源数据访问组件DAC 读取txt并实现翻页效果猫国建设者红猫软路由

相关文档

变现猫接入文档 v1.4 Phinx 数据库迁移中文文档 Porter 数据同步中间件小米数据流服务 MDS 文档 Hubble Data 网易哈勃数据开发文档