当前位置: 首页 > 工具软件 > Chardet > 使用案例 >

chardet猜测网页的编码方式

颜志学
2023-12-01

chardet猜测网页的编码方式

使用python自带的urllib

import urllib
import chardet
#向百度的网站发出响应
page = urllib.request.urlopen('https://www.baidu.com')
#读取网页源代码
html_page = page.read()
print(chardet.detect(html_page))#{'encoding': 'ascii', 'confidence': 1.0, 'language': ''}

使用第三方库requests

import requests
import chardet
page = requests.get('https://www.baidu.com')
html_page = page.content
print(chardet.detect(html_page))#{'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
 类似资料: