当前位置: 首页 > 编程笔记 >

Python 处理带有 \u 的字符串操作

夹谷琨
2023-03-14
本文向大家介绍Python 处理带有 \u 的字符串操作,包括了Python 处理带有 \u 的字符串操作的使用技巧和注意事项,需要的朋友参考一下

最近遇到一个头疼的问题,用socket接收到一个字符串

格式如下:

{“trade_status”: {“desc”: “\u30106\u3011 - \u8d22\u52a1\u7ed3\u7b97\u5df2\u5b8c\u6210 “}}/end/

其中含有一段含有\u的编码字串,怎么将其转化为汉字。

decode().encode(‘utf-8') 不行,decode、encode半天搞不定,后来偶然发现,在decode时可以选则unicode-escape

代码如下:

# -*- coding: utf-8 -*-
import socket
if __name__ == '__main__':
 sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
 sock.connect(('192.168.6.63', 10001))
 sock.send('[{"action": "trade_status"}]')
 rec = sock.recv(1024)
 print rec
 print rec.decode('unicode-escape').encode('utf-8')
 print rec.decode('raw_unicode-escape').encode('utf-8')
 sock.close()

输出结果:

{"trade_status": {"desc": "\u30101\u3011 - \u4ea4\u6613\u4e2d "}}/**end**/
{"trade_status": {"desc": "【1】 - 交易中 "}}/**end**/
{"trade_status": {"desc": "【1】 - 交易中 "}}/**end**/

补充:Python3解析【\u】和【\\u】字符

【\u】字符示例

a = '\u5317\u4eac\u5e02'
print(a)

北京市

b = '\\u5317\\u4eac\\u5e02'
print(b)

\u5317\u4eac\u5e02

json.loads解析

import json
a = '\\u5317\\u4eac\\u5e02'
b = '"%s"' % a
c = json.loads(b)
print(a, b, c, sep='\n')

\u5317\u4eac\u5e02

“\u5317\u4eac\u5e02”

北京市

读取文件中\u字符

demjson

from demjson import decode # pip install demjson

以上为个人经验,希望能给大家一个参考,也希望大家多多支持小牛知识库。如有错误或未考虑完全的地方,望不吝赐教。

 类似资料:
  • Pandas 提供了一系列的字符串函数,因此能够很方便地对字符串进行处理。在本节,我们使用 Series 对象对常用的字符串函数进行讲解。 常用的字符串处理函数如下表所示: 函数名称 函数功能和描述 lower() 将的字符串转换为小写。 upper() 将的字符串转换为大写。 len() 得出字符串的长度。 strip() 去除字符串两边的空格(包含换行符)。 split() 用指定的分割符分割

  • 问题内容: 因此,最近我一直在制作python脚本,用于从大型文本文件(> 1 GB)中提取数据。问题基本上可以归结为从文件中选择文本行,然后从某个数组中搜索字符串以查找字符串(此数组中可以包含多达1000个字符串)。这里的问题是我必须找到该字符串的特定出现,并且该字符串在该文件中可能出现无数次。同样,需要一些解码和编码,这另外会降低脚本速度。代码看起来像这样: 我的问题是:有没有办法对此进行优化

  • 问题内容: 我收到以下错误消息: 不确定是什么,在我进行网页抓取时会显示。我该如何纠正这种情况?该字符串的方法不能进行这项工作。 问题答案: Unicode字符是字节顺序标记或BOM,用于区分大尾数UTF-16编码之间的区别。如果您使用正确的编解码器解码网页,Python会为您删除它。例子: 请注意,这是UTF-8编码的BOM。对于UTF-8,它不是必需的,而仅用作签名(通常在Windows上)。

  • StringBuffer 是一个字符串拼接工具,和java中的StringBuilder类似。对于那些需要大量的字符串连接的时候,用 StringBuffer 更高效一些。它实现了以下API: class StringBuffer { public function __construct($str); public function isEmpty(); publi

  • 字符串在我们平常的Web开发中经常用到,包括用户的输入,数据库读取的数据等,我们经常需要对字符串进行分割、连接、转换等操作,本小节将通过Go标准库中的strings和strconv两个包中的函数来讲解如何进行有效快速的操作。 字符串操作 下面这些函数来自于strings包,这里介绍一些我平常经常用到的函数,更详细的请参考官方的文档。 func Contains(s, substr string)