经常在Python中对JSON格式的文件进行操作,今天对这些操作做一个总结
首先,需要导入json库import json
Python | JSON |
---|---|
dict | object |
list, tuple | array |
str, unicode | string |
int, long, float | number |
True | true |
False | false |
None | null |
相较于JSON对象,JSON字符串(可以理解为一个普通的字符串但拥有特殊的格式 这种格式可以用来转换回JSON对象)可以更加方便的在函数之间传递。
JSON对象中只能使用双引号""
而python对象字典中可以使用单引号''
json.loads
将JSON字符串转化为 Python 字段的数据类型。
loads:针对内存对象,将string转换为dict (将string转换为dict)
def loads(s, encoding=None, cls=None, object_hook=None, parse_float=None,
parse_int=None, parse_constant=None, object_pairs_hook=None, **kw):
"""Deserialize ``s`` (a ``str`` instance containing a JSON
document) to a Python object."""
json.loads 用于解码 JSON 数据。该函数返回 Python 字段的数据类型。
jsonData='{"\u6d4b\u8bd5": 12345, "\u5185\u5bb9": ["\u6211\u4e5f\u4e0d\u77e5\u9053\u6211\u8981\u5199\u4ec0\u4e48", "123"]}'
print(jsonData)
print(type(jsonData)) # <class 'str'> 理解为json字符串
py_type_info=json.loads(jsonData)
print(py_type_info)
print(type(py_type_info)) # <class 'dict'>
# 输出:
#{"测试": 12345, "内容": ["我也不知道我要写什么", "123"]}
# <class 'str'>
# {'测试': 12345, '内容': ['我也不知道我要写什么', '123']}
# <class 'dict'>
可以从上面输出中看到 JSON 的双引号 与python dict的单引号
json.load
json.load用于读取.json格式的文件,将JSON文件 转化成Python字段的数据类型
load:针对文件句柄,将json格式的字符转换为dict,从文件中读取 (将string转换为dict)
def load(fp, cls=None, object_hook=None, parse_float=None,
parse_int=None, parse_constant=None, object_pairs_hook=None, **kw):
"""Deserialize ``fp`` (a ``.read()``-supporting file-like object containing
a JSON document) to a Python object."""
with open('abc.json','r',encoding='utf-8')as f:
py_type_info = json.load(f)
print(py_type_info)
with open(os.path.join("/home/output/compare", "cmp{}.json".format(i)), "r", encoding='utf-8') as f:
cmpInfo=json.load(f)
参考资料:Pythonh中用json.load() json.loads()加载json数据的方法
提醒:根据JSON规范(http://www.json.org, RFC 4627, RFC 7159),不支持注释。
但如果真的不幸遇到json文件中有 // 类似的注释如何解决?
def load_json(path):
import json
lines = [] # 第一步:定义一个列表, 打开文件
with open(path) as f:
for row in f.readlines(): # 第二步:读取文件内容
if row.strip().startswith("//"): # 第三步:对每一行进行过滤
continue
lines.append(row) # 第四步:将过滤后的行添加到列表中.
return json.loads("\n".join(lines)) #将列表中的每个字符串用某一个符号拼接为一整个字符串,用json.loads()函数加载,这样就大功告成啦!!
json.dumps
json.dumps 用于将 Python 对象 编码成 JSON 字符串。
注意:这个函数产生的是字符串
json.dumps(obj, skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, cls=None, indent=None, separators=None, encoding="utf-8", default=None, sort_keys=False, **kw)
j1={'测试':12345,'内容':['我也不知道我要写什么','123']}
j1_str=json.dumps(j1)
print(j1)
# 输出:{'测试': 12345, '内容': ['我也不知道我要写什么', '123']}
json.dump
将Python对象编码成JSON文件
j1={'测试':12345,'内容':['我也不知道我要写什么','123']}
with open('abc.json','w') as f:
json.dump(j1,f)
abc.json中写入了Python对象j1编码出的json格式信息:
{"\u6d4b\u8bd5": 12345, "\u5185\u5bb9": ["\u6211\u4e5f\u4e0d\u77e5\u9053\u6211\u8981\u5199\u4ec0\u4e48", "123"]}