美文网首页
gbk,utf-8,unicode编码转换

gbk,utf-8,unicode编码转换

作者: 阿发贝塔伽马 | 来源:发表于2017-08-01 19:41 被阅读0次

1、将字符串'024f'转化为unicode字符,先将字符转化为16进制整数

code = int('024f',base=16)
print '%x'%code,'%04x'%code

输出结果:24f 024f,一般选择后者处理凑足偶数字节
转化unicode编码

unichr(code)

运行得到unicode编码

u'\u024f'
uc = unichr(code)
print uc, type(uc)

输出字符,类型,特别注意unicode类型,处理起来有点不同,两个字节算一个字符

ɏ,unicode

转gb18030编码

uc.encode('gb18030')
'\x810\xab6'
gbk = uc.encode('gb18030')
print  type(gbk)

类型是str

<type 'str'>
gbk = uc.encode('gb18030')
gbkcode = str()
for el in gbk:
    gbkcode += '%02x'%ord(el)
print gbkcode
  8130ab36
  uc.encode('utf-8')

输出

    '\xc9\x8f'

解码

utf8 = uc.encode('utf-8')
utf8.decode('utf-8')

输出

u'\u024f'
gbk.decode('gb18030')

输出

u'\u024f'
def writeTxt(fdir, info):
    print '%s\\f0.txt'%fdir
    f=open('%s\\f0.txt'%fdir,'a')
    f.write(info)
    f.write('\n')
    f.close()
def getcosins(wordcode, gbkflag=0):
    if gbkflag == 2:
        wordcodelen = 2
    else:
        wordcodelen = len(wordcode)
    cosins = '20ff%02x00%02x'%(gbkflag, wordcodelen)
    if gbkflag == 2:
        cosins += '%04x'%ord(wordcode)
    else:
        for i in range(len(wordcode)):
            cosins += '%02x'%ord(wordcode[i])
    writeTxt('F:\zpcs', cosins)
    return cosins
def writegbkucode(uccode):
    code = int(uccode,base=16)
    print code
    uc = unichr(code)
    print uc
    getcosins(uc, 2)
    ucgbk = uc.encode('gb18030')
    getcosins(ucgbk)
writegbkucode('024f')

相关文章

  • python 编码转换

    python 编码转换 主要介绍了Python的编码机制,unicode, utf-8, utf-16, GBK,...

  • python基础-13-史上最通俗易懂的编码讲解

    常用编码 ascii unicode utf-8 gbk 编码 ascii unicode utf-...

  • unicode

    gbk---解码--->unicode---编码--->utf-8 其它编码格式到unicode属于解码,反之属于编码

  • 编码

    编码 编码格式(ASCII编码,GB2312编码(简体中文),GBK,ANSI编码,unicode,utf-8编码...

  • gbk,utf-8,unicode编码转换

    1、将字符串'024f'转化为unicode字符,先将字符转化为16进制整数 输出结果:24f 024f,一般选择...

  • 关于python编码

    编码转换 平常在写python代码时经常遇到输出乱码,unicode、gbk、utf-8等等什么时候该用哪个确实很...

  • 解决Windows下打开Rstudio 中文注释乱码的情况

    首先知道两个概念:GBK编码方式和UTF-8编码方式 UTF-8(8-bit Unicode Transforma...

  • 文件、异常

    编码问题 '''GBK 汉字编码 cp936 汉字2字节 windows默认Unicode(utf-8) 国际通...

  • 知识点

    @Unicode 我们知道unicode是一种编码标准,具体的实现标准可能是utf-8,utf-16,gbk ……...

  • 编码简介

    编码格式简介(ANSI、GBK、GB2312、UTF-8、GB18030和 UNICODE) 转载于https:/...

网友评论

      本文标题:gbk,utf-8,unicode编码转换

      本文链接:https://www.haomeiwen.com/subject/ejrjlxtx.html