当前位置: 首页 > 知识库问答 >
问题:

从文本文件中编码表情符号(Python)的最佳和干净的方法

徐俊人
2023-03-14

参考这个问题:表情符号在上传到大查询时崩溃

我正在寻找最好和干净的方法来将emoji从这个\ud83d\ude04类型编码为这个(Unicode)-\U0001f604.因为目前,我除了创建python方法(该方法将通过文本文件并替换emojis编码)之外,没有任何想法。

这是可以转换的字符串:

在python 3中将表情符号转换为Unicode,反之亦然

作为一种假设,可能需要逐行传递文本并进行转换??

潜在想法:

with open(ff_name, 'rb') as source_file:
  with open(target_file_name, 'w+b') as dest_file:
    contents = source_file.read()
    dest_file.write(contents.decode('utf-16').encode('utf-8'))

暂时还没有答案

 类似资料:
  • 问题内容: 关于这个问题,我有一个类似的问题),但不是相同的问题。 在途中,我将有一些文本文件,其结构如下: 我需要python读取文件,然后创建一个名为var_a的变量,其值为’home’,依此类推。 例: 我的意思是,甚至可以保留var类型吗? 请注意,我对文本文件结构拥有完全的自由,如果我建议的格式不是最好的,我可以使用自己喜欢的格式。 编辑 :ConfigParser可以是一个解决方案,但

  • 问题内容: 在Java中为XML输出编码字符串的推荐方法是什么。字符串可能包含“&”,“ <”等字符。 问题答案: 很简单:使用XML库。这样,实际上将是正确的,而不需要XML规范的详细知识。

  • 我有一个文本文件(没有标点符号),文件大小约为100MB-1GB,以下是一些示例行: 以及替换标记列表,如下所示: 在文本文件上替换后我想要的输出如下所示: 该解决方案正在工作,但对于大量替换标记和大型文本文件,速度非常慢。有更好的解决方案吗?

  • 问题内容: 我正在使用node-webkit,并试图让用户选择一个文件夹,然后返回该文件夹的目录结构并递归获取其子级。 我已经用这个代码(在Angular Controller中)相当简单地工作了。 取一个中等大小的文件夹,其中包含22个子文件夹,深度约为4层,这需要几分钟的时间来获取整个目录结构。 我在这里显然做错了什么吗?看到我正在使用内置的Node fs方法,我简直不敢花这么长时间。还是有一

  • 问题内容: 从Python 2.6的迭代器中获取最后一项的最佳方法是什么?例如说 从中获取最短代码/最干净的方法是什么? 我可以这样做,但是效率似乎不高: 问题答案: