当前位置 博文首页 > Python 处理带有 \u 的字符串操作

    Python 处理带有 \u 的字符串操作

    作者:huilan_same 时间:2021-05-23 18:27

    最近遇到一个头疼的问题,用socket接收到一个字符串

    格式如下:

    {“trade_status”: {“desc”: “\u30106\u3011 - \u8d22\u52a1\u7ed3\u7b97\u5df2\u5b8c\u6210 “}}/end/

    其中含有一段含有\u的编码字串,怎么将其转化为汉字。

    decode().encode(‘utf-8') 不行,decode、encode半天搞不定,后来偶然发现,在decode时可以选则unicode-escape

    代码如下:

    # -*- coding: utf-8 -*-
    import socket
    if __name__ == '__main__':
     sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
     sock.connect(('192.168.6.63', 10001))
     sock.send('[{"action": "trade_status"}]')
     rec = sock.recv(1024)
     print rec
     print rec.decode('unicode-escape').encode('utf-8')
     print rec.decode('raw_unicode-escape').encode('utf-8')
     sock.close()
    

    输出结果:

    {"trade_status": {"desc": "\u30101\u3011 - \u4ea4\u6613\u4e2d "}}/**end**/
    {"trade_status": {"desc": "【1】 - 交易中 "}}/**end**/
    {"trade_status": {"desc": "【1】 - 交易中 "}}/**end**/

    补充:Python3解析【\u】和【\\u】字符

    【\u】字符示例

    a = '\u5317\u4eac\u5e02'
    print(a)

    北京市

    b = '\\u5317\\u4eac\\u5e02'
    print(b)

    \u5317\u4eac\u5e02

    json.loads解析

    import json
    a = '\\u5317\\u4eac\\u5e02'
    b = '"%s"' % a
    c = json.loads(b)
    print(a, b, c, sep='\n')

    \u5317\u4eac\u5e02

    “\u5317\u4eac\u5e02”

    北京市

    读取文件中\u字符

    demjson

    from demjson import decode # pip install demjson

    以上为个人经验,希望能给大家一个参考,也希望大家多多支持站长博客。如有错误或未考虑完全的地方,望不吝赐教。

    js
    下一篇:没有了