0110编程-Python的中文编码

作者: zhyuzh3d | 来源:发表于2019-01-10 23:38 被阅读13次

点击这里进入人工智能嘚吧嘚目录,观看全部文章


收集的一些常用中文乱码转换:

print("ord('我'):",ord('我'))
print("chr(25105):",chr(25105))
print('\n')
print("'我的简书'.encode('unicode_escape'):",'我的简书'.encode('unicode_escape'))
print("'\\u6211\\u7684\\u7b80\\u4e66'.encode().decode('unicode_escape'):",'\\u6211\\u7684\\u7b80\\u4e66'.encode().decode('unicode_escape'))
print("'\\u6211\\u7684\\u7b80\\u4e66'.encode('ascii').decode('unicode_escape'):",'\\u6211\\u7684\\u7b80\\u4e66'.encode('ascii').decode('unicode_escape'))

print('\n')
print("'我的简书'.encode('gbk').decode('ISO-8859-1'):",'我的简书'.encode('gbk').decode('ISO-8859-1'))
print("'ÎҵļòÊé'.encode('ISO-8859-1'):",'ÎҵļòÊé'.encode('ISO-8859-1'))
print(r"'\xce\xd2\xb5\xc4\xbc\xf2\xca\xe9'.encode('ISO-8859-1').decode('gbk'):",'\xce\xd2\xb5\xc4\xbc\xf2\xca\xe9'.encode('ISO-8859-1').decode('gbk'))
print("'ÎҵļòÊé'.encode('ISO-8859-1').decode('gbk'):",'ÎҵļòÊé'.encode('ISO-8859-1').decode('gbk'))
print('\n')
print("'我的简书'.encode('utf-8').decode('utf-16'):",'我的简书'.encode('utf-8').decode('utf-16'))
print("'裦\ue791蒚껧\ue480ꚹ'.encode('utf-16').decode('utf8','ignore'):",'裦\ue791蒚껧\ue480ꚹ'.encode('utf-16').decode('utf8','ignore'))

输出结果:

ord('我'): 25105
chr(25105): 我


'我的简书'.encode('unicode_escape'): b'\\u6211\\u7684\\u7b80\\u4e66'
'\u6211\u7684\u7b80\u4e66'.encode().decode('unicode_escape'): 我的简书
'\u6211\u7684\u7b80\u4e66'.encode('ascii').decode('unicode_escape'): 我的简书


'我的简书'.encode('gbk').decode('ISO-8859-1'): ÎҵļòÊé
'ÎҵļòÊé'.encode('ISO-8859-1'): b'\xce\xd2\xb5\xc4\xbc\xf2\xca\xe9'
'\xce\xd2\xb5\xc4\xbc\xf2\xca\xe9'.encode('ISO-8859-1').decode('gbk'): 我的简书
'ÎҵļòÊé'.encode('ISO-8859-1').decode('gbk'): 我的简书


'我的简书'.encode('utf-8').decode('utf-16'): 裦蒚껧ꚹ
'裦蒚껧ꚹ'.encode('utf-16').decode('utf8','ignore'): 我的简书

如果去掉ignore,'裦\ue791蒚껧\ue480ꚹ'.encode('utf-16').decode('utf8')将抛出异常UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte

ord和chr互为相反,字符和ascii码互换
斜杠加四位的乱码可以.encode().decode('unicode_escape')恢复
斜杠加两位的乱码可以用.encode('ISO-8859-1').decode('gbk')恢复
类似拼音的乱码可以用.encode('ISO-8859-1').decode('gbk')恢复
类似古文的乱码可以用.encode('utf-16').decode('utf8','ignore')


点击这里进入人工智能DBD嘚吧嘚目录,观看全部文章


每个人的智能新时代

如果您发现文章错误,请不吝留言指正;
如果您觉得有用,请点喜欢;
如果您觉得很有用,欢迎转载~


END

相关文章

  • 0110编程-Python的中文编码

    点击这里进入人工智能嘚吧嘚目录,观看全部文章 收集的一些常用中文乱码转换: 输出结果: 如果去掉ignore,'裦...

  • Python教程导航

    Python 教程 Python 简介 Python 环境搭建 Python 中文编码 Python 基础语法 ...

  • 人工智能学习线路图

    Python教程 Python 教程Python 简介Python 环境搭建Python 中文编码Python 基...

  • Python2和python3的区别

    1.python2的中文编码问题 python2是用ASCII码作为默认编码,因此在项目代码中如果出现中文是会报错...

  • Python教程列表

    Python 基础教程 Python 基础教程Python 简介Python 环境搭建Python 中文编码Pyt...

  • 第2章 - 基础入门.md

    第2章 基础入门 2.1 Python 中文编码 Python2 Python2 文件如果未指定编码,在执行过程会...

  • Python2编码问题

    Python2 源码编码 python2源码默认使用ascii进行编码,当源码中出现中文字符等非ascii编码的字...

  • python 字符串前加u

    python中文编码问题,字符串前面加u

  • Python中文编码

    代码中包含中文头部指定编码 注意:Python3.X 源码文件默认使用utf-8编码,所以可以正常解析中文,无需指...

  • python 中文编码

    Python 2.x文件中如果未指定编码,在执行过程中会出现报错: 会出现如下错误 因为python中默认的是AS...

网友评论

    本文标题:0110编程-Python的中文编码

    本文链接:https://www.haomeiwen.com/subject/tpnzrqtx.html