XML是解析HTML的一个中间产物。我们解析HTML时,可以直接对HTML进行解析,也可以先把HTML处理成XML,再对XML解析
XML的英文是Extensible Markup Language,翻译过来是“可扩展标记语言
HTML更加擅长于内容的表示,也就是说HTML可以表现样式丰富的内容
XML则更加偏向于数据本身,不关心数据是如何展示的。
JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,
JSON其实包括两种数据结构,一种是对象,一种是数组。
对象这种结构类似Python的字典
数组这种结构类似Python的列表
Python的库里面有一个JSON模块
import json
Json.loads()
负责把Json格式字符串解码转换成Python对象。import json
strDict = '{"city": "BeiJing","Country": "China"}'
print(type(strDict))
json.loads(strDict)
print(type(json.loads(strDict)))`
结果:json.loads()函数已经成功地把json格式的字符串strDict 转化为了Python的字典
<class ‘str’>
<class ‘dict’>
json.dumps()
json.dumps()
和json.loads()
函数正好相反,json.dumps()
做的事情是将Python的字典转化为json格式的字符串。
Json.dump()
函数可以将Python的字典类型数据转化为json对象后写入文件
import json
Dict = {"city": "BeiJing","Country": "China"}
print(type(Dict))
json.dump(Dict,open('Dict.json','w'))
json.load()
函数可以读取文件中json形式的字符串元素并且转化成python的字典类型
import json
Dict = json.load(open("Dict.json"))
print(Dict)
print(type(Dict))
结果
{'city': 'BeiJing', 'Country': 'China'}
<class 'dict'>