当前位置：首页 > 面试题库 >

pandas DataFrame：标准化一个JSON列并与其他列合并

董奇思

2023-03-14

问题内容：

我有一个熊猫DataFrame，其中包含一列，其中包含多个JSON数据项作为字典列表。我想规范化JSON列并复制非JSON列：

# creating dataframe
df_actions = pd.DataFrame(columns=['id', 'actions'])
rows = [[12,json.loads('[{"type": "a","value": "17"},{"type": "b","value": "19"}]')],
   [15, json.loads('[{"type": "a","value": "1"},{"type": "b","value": "3"},{"type": "c","value": "5"}]')]]
df_actions.loc[0] = rows[0]
df_actions.loc[1] = rows[1]

>>>df_actions
   id                                            actions
0  12  [{'type': 'a', 'value': '17'}, {'type': 'b', '...
1  15  [{'type': 'a', 'value': '1'}, {'type': 'b', 'v...

我想要

>>>df_actions_parsed
   id      type    value
   12      a        17
   12      b        19
   15      a        1
   15      b        3
   15      c        5

我可以使用以下方式标准化JSON数据：

pd.concat([pd.DataFrame(json_normalize(x)) for x in df_actions['actions']],ignore_index=True)

但我不知道如何将其连接回原始DataFrame的id列。

问题答案：

您可以将concatwith dict comprehension与with
一起使用，pop用于提取列，删除第二层并join恢复原始：

df1 = (pd.concat({i: pd.DataFrame(x) for i, x in df_actions.pop('actions').items()})
         .reset_index(level=1, drop=True)
         .join(df_actions)
         .reset_index(drop=True))

等同于：

df1 = (pd.concat({i: json_normalize(x) for i, x in df_actions.pop('actions').items()})
         .reset_index(level=1, drop=True)
         .join(df_actions)
         .reset_index(drop=True))

print (df1)
  type value  id
0    a    17  12
1    b    19  12
2    a     1  15
3    b     3  15
4    c     5  15

类似资料：

hsqldb与标识列合并

我有以下hsqldb数据库：我需要添加条目，只有当它们在表中不存在时。我希望在一个步骤中完成这项工作（而不是通过选择步骤来确定条目是否在表中，如果不是这样，则通过第二个步骤插入） hsqldb对此具有合并操作。然而，问题是我有一个id-IDENTITY列，hsqldb应该自动负责设置值，我不知道如何告诉合并操作。这可以工作，但我必须给出id（3），我需要由hsqldb自动设置id（就像上面的插
在一列中选择2列并将其合并

问题内容：是否可以在一列中选择2列并合并它们？例子：问题答案：是的，就像您所做的那样：如果查询数据库，您将得到正确的答案。发生的事情是您要求表达。一个非常简单的表达式只是一个列名，一个更复杂的表达式中可以包含公式等。
合并两列并添加到一个新列中

在PostgreSQL中，我想使用SQL语句合并两列并从中创建一个新列。我正在考虑使用concat（…），但有更好的方法吗<最好的方法是什么？
将列表合并为一个

问题内容：我正在写一个小脚本来帮助日本假名记忆。我如何将以下列表合并为一个？我尝试如下。问题答案：单程：
使用列名作为值标签将多个列合并为一个类别列

我有这些数据我想把它变成 < li >我想将列名用作< code>category列的值标签。 < li >每行最多只有一个< code>True值。这就是MWE 我可以做。但是，熊猫自己的工具不是有更优雅的方式吗？
将两列合并为一列

问题内容：我有第1列和第2列，并希望将它们合并到同一表的第3列中。如果第2列为空，则显示第1列的值；如果第1列为空，则它们显示第2列的数据。如果它们都为空，则显示为空。我尝试了两件事： 1）使用CONCAT 。仅当两个列都不为null时，它才合并列。否则，它只是将null声明为null。 2）使用（第1栏+第2栏）。。没有显示所需的输出。我正在用Java编写此代码。谢谢问题答案： us

相关阅读

如何将两个列表合并为一个列表？MySQL将两列合并为一列用其他语言反序列化序列化JSON以查询字符串的标准化方法？将多个列值合并到python pandas的一列中

相关文章

分享一波团子和其他其他进程 PDFBox合并多个PDF文档 Gson序列化示例 Gson对象序列化

相关问答

RxJava将对象与列表合并/合并将Spark中的多个ArrayType列合并为一个ArrayType列在其他变量的多个组合中最小化列的总和为其他两列的每个唯一组合选择具有Max（列值）的行将一列的值与同一索引合并到列表中[重复]

相关工具

首列固定的列表标准TVL格式数据解析 iOS 下拉列表列表刷新 SBJSON HTTP 卡片式插入列表

相关文档

用 JSON 构建 API 的标准指南 PHP 标准规范 Go 语言标准库让开发自动化系列专栏 JavaScript 标准参考手册