因此,我实际上是从网上尝试编写一个gzip文件,但是为了简化起见,我编写了一些非常基本的测试。
import gzip
LINES = [b'I am a test line' for _ in range(100_000)]
f = gzip.open('./test.text.gz', 'wb')
for line in LINES:
f.write(line)
f.close()
它运行的很好,我在Jupyter中可以看到它已经在目录列表中创建了test.txt.gz文件。因此,我单击它时期望有一大堆指示二进制文件的垃圾字符,就像在记事本中看到的那样。
但是,相反,我得到这个…
Error! test.text.gz is not UTF-8 encoded.
Saving disabled.
See console for more details
这让我想到了,天哪,编码错误,我的编码有问题,保存了,我可以保存字节吗?我是否使用正确的例程?然后花5个小时尝试所有代码和模块的组合。
答案很简单,以上都不是。这是一条非常令人误解的错误消息,尤其是当您编写的代码旨在保存带有怪异扩展名的二进制文件时。
这实际上意味着…
I HAVE NO IDEA HOW TO DISPLAY THIS DATA ! - Yours Jupyter
因此,转到“文件资源管理器”,Finder导航到刚刚保存的文件并打开它。瞧!一切都按计划进行,没有错误。
希望这可以节省其他人的大量调试时间,请Jupyter更改您的错误消息。
所以,我试图编写一个gzip文件,实际上是从网络上编写的,但为了简化,我编写了一些非常基本的测试。 它运行得很好,我可以在Jupyter中看到它创建了测试。txt。目录列表中的gz文件。所以我点击它,希望看到一大堆垃圾字符表示一个二进制文件,就像你们在记事本中看到的一样<然而,我却得到了这个。。。 这让我想,哦,我的上帝,编码错误,我的编码有问题,我的保存,我能保存字节吗?我用的是正确的套路吗??
我的rails应用程序遇到了问题,我最近从一个不同的开发人员那里接管了这个应用程序。虽然我知道错误意味着什么,我知道我需要强制所有的UTF-8,但没有运气。我已经尝试清理应用程序目录,并将所有文件更新为UTF-8(以前在不同的应用程序上工作过)。 我还阅读了关于ruby的UTF-8问题的不同帖子(例如这里和这里)。 当我运行或任何其他bundle操作时,我会得到以下信息: 还有以下绑定程序的其他错
null 在一个案例中,我还意识到,如果我从Git diff复制原始值,并用它替换Eclipse中错误的值,那么我在消息属性文件中就有了正确的umlauts。
我有一个编码问题。 我有数百万个文本文件需要为语言数据科学项目进行解析。每个文本文件都编码为UTF-8,但我刚刚发现其中一些源文件的编码不正确。 例如我有一个中文文本文件,编码为UTF-8,但文件中的文本如下所示: 当我使用Python检测此中文文本文件的编码时: Chardet告诉我文件编码为UTF-8: UnicodeDammit还告诉我该文件编码为UTF-8: 同时,我知道这不是UTF-8,
我有字节数组,它放在InputStreamReader中,用它做一些操作。 JVM有默认的cp1252编码,但是我转换成字节数组的文件有utf-8编码。此外,这个文件有德语umlauts。当我把字节数组放在InputStreamReader中时,java会将元音解码为错误的符号。例如,ürepression为。我试着把“utf-8”和charset.forname(“utf-8”).newdeco
问题内容: 我想从请求中获取参数(带有重音符的字符),但是它不起作用。我尝试使用,但也没有用。 我知道返回正确的字符,但不起作用! 有人有主意吗? 问题答案: Paul的建议似乎是最好的做法,但如果要解决此问题,则根本不需要URLEncoder或URLDecoder: 更新: 由于获得了很多选票,我想强调BalusC的观点,即这绝对不是解决方案。充其量是一种解决方法。人们不应该这样做。 我不知道是