-
s是某编码格式的字符串
-
s.encode('xxx') 将Unicode格式的字符串s,编码为xxx格式 (这里的s一定要是Unicode的类型的)
-
s.decode('xxx') 将xxx格式的字符串s,按xxx进行解码为Unicode格式
- Unicode内部是什么样子的呢
>>> u'嘻嘻'
u'\u563b\u563b'
- UTF8呢
>>> s = u'嘻嘻'.encode('utf8')
>>> s
'\xe5\x98\xbb\xe5\x98\xbb'
- 关于拼接转移字符串和编码
举个例子,想要把gb2312编码的字符串'\x'和'01'拼接起来并输出,有什么办法吗?
直接'\x'+'01'这样会出错。
方法是取消转义,然后用用指定的方法来解码:
(string-escape和unicode-escape都可以)
>>>(r'\x' + '01').decode('string-escape')
网友评论