我已经审查了围绕HTML在Python中进行JSON解析的可能解决方案,但无法确定正确的解决方案。
内容:
原型的一部分:我正在使用request.get()方法从第三方组织接收数据。响应为HTML 4.0(loose.dtd格式)。
问题陈述:使用Json.dumps和file.write操作,我已将此响应保存到本地文件(期望它是JSON)。
但内容并不解析出任何HTML标记(如,等)
我需要将此HTML内容转换为JSON(或字典)。我想将其用作数据源。
观察结果:我遇到了一些Java代码段,他们尝试手动解析。希望有一种实现此目标的最佳方法。
样品响应
\r\n\r\nNumber\r\n
bgcolor=\"#eeeeff\">Volcano Name
\r\nbgcolor=\"#eeeeff\">Country
\r\nRegion\r\nbgcolor=\"#eeeeff\">Latitude
\r\nbgcolor=\"#eeeeff\">Longitude
\r\nElev\r\nbgcolor=\"#eeeeff\">Type
\r\nStatus\r\nbgcolor=\"#eeeeff\">
href=\"\"OnClick=\"hold=window.open('/nndc/DescribeField.jsp?dataset=102557&s=77&field_name=HAZ.VOL_LOC_TSQP.TIME_ERUPT','commentsWindow','menubar=no,scrollbars=yes,resizable=yes,width=620,height=425,left=5,top=50');
hold.focus(); return false;\">Last
Known
Eruption
valign=\"top\">0803-001
\r\nAbu\r\nJapan\r\nHonshu-Japan\r\n34.5\r\n131.6\r\n571\r\nShield volcano\r\nHolocene\r\nUnknown\r\n1505-096\r\nAcamarachi\r\nChile\r\nChile-N\r\n-23.3\r\n解决方案
暂无回答
站长简介:前每日优鲜python全栈开发工程师,自媒体达人,逗比程序猿,钱少话少特宅,关注我,做朋友, 我们一起谈人生和理想吧!我的公众号:想吃麻辣香锅
关注公众号回复充值+你的账号,免费为您充值1000积分