当前位置：首页 > 面试题库 >

Python 3 UnicodeDecodeError：“ charmap”编解码器无法解码字节0x9d

向锦

2023-03-14

问题内容：

我想制作搜索引擎，并按照某些网络中的教程进行操作。我想测试解析html

from bs4 import BeautifulSoup

def parse_html(filename):
    """Extract the Author, Title and Text from a HTML file
    which was produced by pdftotext with the option -htmlmeta."""
    with open(filename) as infile:
        html = BeautifulSoup(infile, "html.parser", from_encoding='utf-8')
        d = {'text': html.pre.text}
        if html.title is not None:
            d['title'] = html.title.text
        for meta in html.findAll('meta'):
            try:
                if meta['name'] in ('Author', 'Title'):
                    d[meta['name'].lower()] = meta['content']
            except KeyError:
                continue
        return d

parse_html("C:\\pdf\\pydf\\data\\muellner2011.html")

它得到错误

UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 867: character maps to <undefined>enter code here

我在网上看到了一些使用encode（）的解决方案。但是我不知道如何在代码中插入encode（）函数。谁能帮我？

问题答案：

在Python 3中，文件会以文本（解码为Unicode）的形式为您打开。您无需告诉BeautifulSoup要解码的编解码器。

如果数据解码失败，那是因为您没有告诉open()调用文件读取文件时使用哪种编解码器；这是因为使用encoding参数添加正确的编解码器：

with open(filename, encoding='utf8') as infile:
    html = BeautifulSoup(infile, "html.parser")

否则，将使用系统默认的编解码器打开文件，该默认编解码器取决于操作系统。

类似资料：

Python-UnicodeEncodeError：“ charmap”编解码器无法编码字符

问题内容：我正在尝试抓取一个网站，但这给我一个错误。我正在使用以下代码：我收到以下错误：我该怎么做才能解决此问题？问题答案：我通过添加将其修复。那意味着变成。
UnicodeEncodeError:“charmap”编解码器无法对字符进行编码

我正试图抓取一个网站，但它给了我一个错误。我正在使用以下代码：我得到了以下错误：我能做些什么来解决这个问题？
Python-UnicodeEncodeError:“charmap”编解码器无法编码-字符映射到

问题内容：我正在编写一个Python（Python 3.3）程序，以使用POST方法将一些数据发送到网页。通常在调试过程中，我会获取页面结果并使用print()功能将其显示在屏幕上。代码是这样的：该方法返回一个bytes编码页面的元素（格式正确的UTF-8文档），直到我停止使用Windows的IDLE GUI并改为使用Windows控制台时，这似乎还可以。返回的页面具有字符（破折号），打印功
Pipreqs：UnicodeDecodeError：'charmap'编解码器无法解码位置1206中的字节0x98：字符映射到

当我使用时，我有这个问题。我使用anaconda和俄罗斯Windows。
UnicodeDecodeError:“charmap”编解码器无法解码位置7458中的字节0x83：字符映射到

我正在尝试使用CSV模块打开文件，但我收到了此错误。 return codecs.charmap_decode（input，self.errors，decoding_table）[0]UnicodeDecodeError:'charmap'编解码器无法解码7458位置的字节0x83：字符映射到我检查了文件，文件编码是UTF-8...下面是我的代码。错误在第63行
UnicodeDecodeError：“ utf8”编解码器无法解码字节0x9c

问题内容：我有一个套接字服务器，应该从客户端接收UTF-8有效字符。问题是某些客户端（主要是黑客）正在通过它发送所有错误的数据。我可以轻松地区分真正的客户端，但是我会将所有发送的数据记录到文件中，以便以后进行分析。有时我会得到这样的导致错误的字符。我需要能够使带有或不带有这些字符的字符串UTF-8。更新：对于我的特殊情况，套接字服务是MTA，因此我只希望接收ASCII命令，例如：我

相关阅读

Python-UnicodeDecodeError：“ utf8”编解码器无法解码字节0x9c utf8编解码器无法在python中解码字节0x96 UnicodeEncodeError：'charmap'编解码器无法对字符'\ u2010'进行编码：字符映射到 Python-如何解决：“ UnicodeDecodeError：'ascii'编解码器无法解码字节”UnicodeEncodeError：“ ascii”编解码器无法编码字符

相关文章

哔哩哔哩视频编解码算法工程师笔试快手视频编解码算法工程师一面面经 Java字符编码介绍 20240922字节跳动算法笔试题解字节测开面经&内推码

相关问答

如何修复："UnicodeDecodeError：'ascii'编解码器无法解码字节"UTF-8编解码器无法解码位置1中的字节0xdb：UnicodeDecodeError：'ascii'编解码器无法解码位置1中的字节0xef UnicodeDecodeError:“utf8”编解码器无法解码位置0中的字节0xa5:无效的开始字节 UnicodeDecodeError：'utf-8'编解码器无法解码位置15的字节0x96：无效的开始字节

相关工具

ECMAScript6 编码规范乱码过滤器 PHP代码生成器 HDCP加密/解密算法校验码计算器 for Mac OS X

相关文档

Laravel 源码详解 Tornado 源码解析 Ruby 源码解读 Java 编码规范 30 秒就能理解的 JavaScript 代码片段