美文网首页
java全角半角标点符号转换

java全角半角标点符号转换

作者: 冬天里的懒喵 | 来源:发表于2021-07-27 17:00 被阅读0次

早上发现某个群居然爆出一个bug,上游系统存储的客户简称是商务人员自己填的,这个字段支持用户录入各种字符。但是下游对接的其他系统,在将这个字段应用到系统中的时候,不能支持全角的标点符号,如果这个字段有全角标点符号,则系统会出错。

看到这个问题,我首先觉得下游对接的系统也是奇葩,居然还不支持全角的字符串。但是一想到我们没办法强迫下游系统来改变他们的接口,而站在本系统的角度来考虑,未来下游系统还很多,毕竟客户的基本信息数据会应用到越来越多的系统中去。最好的方式就是我们将采集到的客户信息中的全角字符,都自动转为半角字符。将客户信息的接口加以约束,这样能一劳永逸。

说到全角和半角的标点符号问题,这里就需要介绍一下什么是全角,什么是半角。

全角:指一个字符占用两个标准字符位置。
汉字字符和规定了全角的英文字符及国标GB2312-80中的图形符号和特殊字符都是全角字符。一般的系统命令是非全角字符的,只有在文本处理时才会使用全角字符。

半角:指一字符占用一个标准的字符位置。
通常的英文字母、数字键、符号键都是半角的,半角的显示内码都是一个字节。在系统内部,以上三种字符是作为基本代码处理的,所以用户输入命令和参数时一般都使用半角。

全角与半角的使用场景
通常情况下,我们认为全角是占两个字节,而半角只占一个字节,但是需要注意的是,这都是相对标点符号而言。因为汉字不管全角还是半角,都是两个字节。而我们的所有程序代码中,都只支持半角字符,全角字符默认会当作文本。

全角字符和半角字符的范围:
经过观察,我们可以得到如下结论:

  • 1.半角字符是从33开始到126结束
  • 2.与半角字符对应的全角字符是从65281开始到65374结束
  • 3.其中半角的空格是32.对应的全角空格是12288
  • 4.半角和全角的关系很明显,除空格外的字符偏移量是65248(65281-33 = 65248)

这样我们可以做一个工具类来进行全角和半角字符的转换,针对本文开篇的问题,就可以很方便的解决:

package com.dhb.springbootdata;

public class AsciiUtil {

    public static final char SBC_SPACE = 12288; // 全角空格 12288

    public static final char DBC_SPACE = 32; //半角空格 32

    // ASCII character 33-126 <-> unicode 65281-65374
    public static final char ASCII_START = 33;

    public static final char ASCII_END = 126;

    public static final char UNICODE_START = 65281;

    public static final char UNICODE_END = 65374;

    public static final char DBC_SBC_STEP = 65248; // 全角半角转换间隔

    public static char sbc2dbc(char src) {
        if (src == SBC_SPACE) {
            return DBC_SPACE;
        }

        if (src >= UNICODE_START && src <= UNICODE_END) {
            return (char) (src - DBC_SBC_STEP);
        }

        return src;
    }

    /**
     * Convert from SBC case to DBC case
     *
     * @param src
     * @return DBC case
     */
    public static String sbc2dbcCase(String src) {
        if (src == null) {
            return null;
        }
        char[] c = src.toCharArray();
        for (int i = 0; i < c.length; i++) {
            c[i] = sbc2dbc(c[i]);
        }
        return new String(c);
    }

    public static char dbc2sbc(char src) {
        if (src == DBC_SPACE) {
            return SBC_SPACE;
        }
        if (src <= ASCII_END) {
            return (char) (src + DBC_SBC_STEP);
        }
        return src;
    }

    /**
     * Convert from DBC case to SBC case.
     *
     * @param src
     * @return SBC case string
     */
    public static String dbc2sbcCase(String src) {
        if (src == null) {
            return null;
        }

        char[] c = src.toCharArray();
        for (int i = 0; i < c.length; i++) {
            c[i] = dbc2sbc(c[i]);
        }

        return new String(c);
    }

    public static void main(String[] args) {
        System.out.println(AsciiUtil.sbc2dbcCase("你好(张三)111?!"));
        System.out.println(AsciiUtil.dbc2sbcCase("你好(张三)111?!"));
        
        Character.MIN_VALUE
    }
}
    

上述代码执行结果:

你好(张三)111?!
你好(张三)111?!

相关文章

  • java全角半角标点符号转换

    早上发现某个群居然爆出一个bug,上游系统存储的客户简称是商务人员自己填的,这个字段支持用户录入各种字符。但是下游...

  • 全角半角转换

    今天遇到全角半角的问题。(仅供自己学习记录)

  • go 全角转换半角

    google了半天,并没有很清晰的答案,这里记录下;golang里面完成这件事情是用rune和strings里面的...

  • 文本函数ASC和WIDECHAR

    ASC函数 1、用途: 将全角字符转换为半角字符 。 2、语法: ASC(text) 参数: Text 要进行半角...

  • SQL Server 全角半角转换

    哪些字符是有全角和半角之分的? 首先,中文是只有全角,没有半角之分,所以转换的时候可以忽略掉中文字符。 英文字符与...

  • 将Word文档中的标点符号统一为全角或者半角

    将Word文档中的标点符号统一为全角或者半角,比手工操作高效百倍

  • Oracle替换全角为半角

    函数:to_single_byte(c)转换成半角to_multi_byte(c)转换成全角实例:SELECT '...

  • js 日语全半角转换

    1、js 日语全半角转换 客户的需求是,输入半角字符或日语假名,筛选出来的结果显示包含该字符的半角形式和全角形式的...

  • 2019-01-07

    Day18【学员昵称】:沐沐【学习内容】:10.4 大小写、全角半角转换【学习心得】:学习函数用处大,随心所欲全角...

  • 全角\半角

    在传统的字体排印学中,将文字字身长宽比为1比1的正方形金属铅字称作“全身”,而宽度只有一半的称为“半身”日本人将其...

网友评论

      本文标题:java全角半角标点符号转换

      本文链接:https://www.haomeiwen.com/subject/nqpomltx.html