美文网首页
Python bytes 反斜杠转义问题解决方法

Python bytes 反斜杠转义问题解决方法

作者: Wonz | 来源:发表于2020-12-23 22:45 被阅读0次

    一、问题

    因为前文提到工作中需要使用 Go 调 Python 脚本执行加解密,但是 Go 那边执行命令行输出的是 str 类型。因此需要转回 bytes 进行解密,但是发现转回 bytes 和原来的不一样。下面以一个小例子做演示。

    old_bytes = b"=\x1di\xab\xc1~)]9H\xdf\x0c\x7f`f&'\xfbooX}kX\x0e~D\x9d\x88\x83\x0f\xb8\xe7\xf6\x0f+\x97\xfc8+\xe5\xd4\xb9uC\xc0\xcdh\xa2S=|\xb5\xf9\xc59\xc0R#\xfaGR\xddMa\x8e\x9cS\xf9\xcdq\xbd\xb8_\x94\xa2\x8e\x13I\xbc\x0e\xcf\x82\xeeG\x85\xafBj\xe9\x0e\xd7\xd9\x0fj\x15\x06IY\xaf\xde\xee"  # 这是bytes类型
    old_str = str(old_bytes)  # 这是str类型
    new_bytes = bytes(old_str, encoding="utf-8")  # 这是bytes类型
    
    print(new_bytes)
    print(new_bytes == old_bytes)
    

    输出:

    b'b"=\\x1di\\xab\\xc1~)]9H\\xdf\\x0c\\x7f`f&\'\\xfbooX}kX\\x0e~D\\x9d\\x88\\x83\\x0f\\xb8\\xe7\\xf6\\x0f+\\x97\\xfc8+\\xe5\\xd4\\xb9uC\\xc0\\xcdh\\xa2S=|\\xb5\\xf9\\xc59\\xc0R#\\xfaGR\\xddMa\\x8e\\x9cS\\xf9\\xcdq\\xbd\\xb8_\\x94\\xa2\\x8e\\x13I\\xbc\\x0e\\xcf\\x82\\xeeG\\x85\\xafBj\\xe9\\x0e\\xd7\\xd9\\x0fj\\x15\\x06IY\\xaf\\xde\\xee"'
    False
    

    可以看到,bytes 经过 str 强制类型转换之后再转回 bytes,会发现和原来的不一样。结果多了 b',以及 \ 变成了 \\

    二、解决方法

    使用切片截掉开头的 b',使用 codecs.escape_decode 来进行反斜杠转换。

    old_bytes = b"=\x1di\xab\xc1~)]9H\xdf\x0c\x7f`f&'\xfbooX}kX\x0e~D\x9d\x88\x83\x0f\xb8\xe7\xf6\x0f+\x97\xfc8+\xe5\xd4\xb9uC\xc0\xcdh\xa2S=|\xb5\xf9\xc59\xc0R#\xfaGR\xddMa\x8e\x9cS\xf9\xcdq\xbd\xb8_\x94\xa2\x8e\x13I\xbc\x0e\xcf\x82\xeeG\x85\xafBj\xe9\x0e\xd7\xd9\x0fj\x15\x06IY\xaf\xde\xee"  # 这是bytes类型
    old_str = str(old_bytes)  # 这是str类型
    new_bytes = bytes(old_str[2:-1], encoding="utf-8")  # 这是bytes类型
    
    import codecs
    original = codecs.escape_decode(new_bytes, "hex-escape")
    print(old_bytes, original)
    print(original[0] == old_bytes)
    

    输出:

    b"=\x1di\xab\xc1~)]9H\xdf\x0c\x7f`f&'\xfbooX}kX\x0e~D\x9d\x88\x83\x0f\xb8\xe7\xf6\x0f+\x97\xfc8+\xe5\xd4\xb9uC\xc0\xcdh\xa2S=|\xb5\xf9\xc59\xc0R#\xfaGR\xddMa\x8e\x9cS\xf9\xcdq\xbd\xb8_\x94\xa2\x8e\x13I\xbc\x0e\xcf\x82\xeeG\x85\xafBj\xe9\x0e\xd7\xd9\x0fj\x15\x06IY\xaf\xde\xee" (b"=\x1di\xab\xc1~)]9H\xdf\x0c\x7f`f&'\xfbooX}kX\x0e~D\x9d\x88\x83\x0f\xb8\xe7\xf6\x0f+\x97\xfc8+\xe5\xd4\xb9uC\xc0\xcdh\xa2S=|\xb5\xf9\xc59\xc0R#\xfaGR\xddMa\x8e\x9cS\xf9\xcdq\xbd\xb8_\x94\xa2\x8e\x13I\xbc\x0e\xcf\x82\xeeG\x85\xafBj\xe9\x0e\xd7\xd9\x0fj\x15\x06IY\xaf\xde\xee", 273)
    True
    

    发现成功转换回原来的 bytes 内容。

    三、参考

    关于python bytes反斜杠转义的问题? - Blownhither的回答 - 知乎

    相关文章

      网友评论

          本文标题:Python bytes 反斜杠转义问题解决方法

          本文链接:https://www.haomeiwen.com/subject/aaqpnktx.html