Python3全角转半角的方法

作者: Ray0458 | 来源:发表于2017-08-04 16:33 被阅读0次

    相信大家都对全角半角的概念已经有所了解了。中文文字永远是全角,只有英文字母、数字键、符号键才有全角半角的概念,一个字母或数字占一个汉字的位置叫全角,占半个汉字的位置叫半角。标点符号在中英文状态下、全半角的状态下是不同的。

    转换说明

    全角半角转换说明

    • 有规律的:

    全角字符unicode编码从65281~65374 (十六进制 0xFF01 ~ 0xFF5E)
    半角字符unicode编码从33~126 (十六进制 0x21~ 0x7E)

    • 特殊的:

    空格比较特殊,全角为 12288(0x3000),半角为 32(0x20)

    除空格外,全角/半角按unicode编码排序在顺序上是对应的(半角 + 0x7e= 全角),所以可以直接通过用+-法来处理非空格数据,对空格单独处理。

    全角转半角的代码如下:

      def strQ2B(ustring):
        ss = []
        for s in ustring:
            rstring = ""
            for uchar in s:
                inside_code = ord(uchar)
                if inside_code == 12288:  # 全角空格直接转换
                    inside_code = 32
                elif (inside_code >= 65281 and inside_code <= 65374):  # 全角字符(除空格)根据关系转化
                    inside_code -= 65248
                rstring += chr(inside_code)
            ss.append(rstring)
        return ss
    

    执行结果:

    >>>python3 strQ2B('A')
    A
    >>>python3 strQ2B('Angelababy')
    ['A', 'n', 'g', 'e', 'l', 'a', 'b', 'a', 'b', 'y']
    

    相关文章

      网友评论

        本文标题:Python3全角转半角的方法

        本文链接:https://www.haomeiwen.com/subject/iunvlxtx.html