问题：

使用iconv从UTF-16BE转换为不带BOM的UTF-8

濮阳和泰

2023-03-14

我正在尝试使用iconv将UTF-16BE编码文件（字节顺序标记：0xFE 0xFF）转换为UTF-8，如下所示：

iconv -f UTF-16BE -t UTF-8 myfile.txt

然而，结果输出具有UTF-8字节顺序标记（0xEF 0xBB 0xBF），这不是我需要的。有没有办法告诉iconv（或者有等效的编码）不要在UTF-8结果中放入BOM？

共有1个答案

宓诚

2023-03-14

实验表明，指示UTF-16而不是UTF-16BE符合您的要求：

iconv -f UTF-16 -t UTF-8 myfile.txt

类似资料：

在Python中将没有BOM的UTF-8转换为带有BOM的UTF-8

问题内容：这里有两个问题。我有一组通常是带有BOM的UTF-8文件。我想将它们（理想情况下）转换为没有BOM的UTF-8。似乎可以解决这个问题。但是我真的看不到任何有关用法的好例子。这将是处理此问题的最佳方法吗？同样，如果我们能够处理清楚知道的不同输入编码（看到的ASCII和UTF-16），那将是理想的。看来这一切都是可行的。是否有一种解决方案可以采用任何已知的Python编码并以UTF-8格
将UTF-16转换为UTF-8并删除BOM？

问题内容：我们有一个数据输入人员，他在Windows上使用UTF-16编码，并且希望拥有utf-8并删除BOM。utf-8转换有效，但BOM仍然存在。我将如何删除？这是我目前拥有的：如果我使用hexdump -CI，请参阅：在结果文件中。如何删除物料清单？谢谢问题答案：只需使用和：将为您摆脱BOM表（并推断出字节序）。
java中的UTF-16BE和UTF-16问题

我有一个文件，当用geanny显示时*显示UTF-16BE。如果我尝试将这个Java文件转换为不同的编码（假设它是UTF-16BE)，那么一个问号（？）每次在新建文件的开头出现。相反，如果我假设它是在UTF-16中（这不是真的），转换后的文件就可以转换了，在开头没有任何问号。有谁能澄清为什么会有这种行为吗？
从双UTF-8到UTF-8（或从UTF-8到ANSI）的“原始”转换

我正在处理一个使用UTF-8编码了两次的遗留文件。例如，编码点（）本应编码为，但改为编码为（是的UTF-8编码，是的UTF-8编码）。假设数据在CP-1252中编码，则执行第二次编码。为了回到UTF-8编码，我使用了以下（似乎错误）命令我的问题是iconv似乎无法转换回一些字符。更准确地说，iconv无法转换UTF-8表示形式包含映射到CP-1252中控制字符的字符。一个例子是代码点ρ（）：
JasperReport CSV UTF-8没有BOM而不是UTF-8

我尝试用JasperReport导出CSV文件，问题是当我想打印像“€”这样的货币时。当我搜索解决方案时，我意识到这是关于文件编码的！我写这个代码！ JasperReport导出的文件编码在“没有BOM的UTF-8”上。所以当我用Excel打开文件时，“€”看起来像“，”。但是当我用记事本打开文件时，“€”看起来像“€”。在记事本上，我将文件编码转换为UTF-8（我认为是BOM），我保存文件。
从UTF-8转换为ASCII的Python脚本

问题内容：我正在尝试在python中编写脚本以将utf-8文件转换为ASCII文件：当我运行此脚本时，出现以下错误： UnicodeDecodeError：’ascii’编解码器无法解码位置13的字节0xef：序数不在范围内（128）我认为可以使用encode方法中的ignore参数忽略错误。但是似乎没有。我愿意接受其他转换方式。问题答案： data=”UTF-8 DATA” udata

使用iconv从UTF-16BE转换为不带BOM的UTF-8

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档