美文网首页
GB2312、GBK、GB18030 以及 UTF8 共同点是都

GB2312、GBK、GB18030 以及 UTF8 共同点是都

作者: 屎倒淋头还嚼便 | 来源:发表于2023-11-21 21:08 被阅读0次
image.png

出自:https://zhuanlan.zhihu.com/p/453675608

image.png
image.png

出自:https://zhuanlan.zhihu.com/p/453675608

image.png
出自:https://blog.csdn.net/m0_47584501/article/details/128881636

总结:gbk、utf8都兼容ascii码,gbk、u8兼容ascii码的部分都是一个字节长度,编码值、传输编码值都相同。gbk、u8除了ascii码之外的字符最少也是两个字节长度。

中行的某个系统使用的8583报文,认为每个域的长度指的是字节长度,并且代码中按照字节长度截取字节数组从未产生过乱码(但不是每个域、每个字段都这样截取操作过),所以大概都是用的ascii码。另外有汉字的域,长度都等于:预估的汉字最大个数✖2.

如果这个任务,四包编辑各个域时有的域以gbk编码有的域以utf-8编码,有的域的各个字段都以不同的字符集编码。那就不能在四包打包时整包转码(gbk转u8,或u8转gbk),因为前面编码不一致,不能整包转,只能根据不同编码的域、字段转。

相关文章

  • vim 中文乱码

    set fileencodings=utf-8,gb2312,gb18030,gbk,ucs-bom,cp936,...

  • 编码简介

    编码格式简介(ANSI、GBK、GB2312、UTF-8、GB18030和 UNICODE) 转载于https:/...

  • .bashrc配置

    set fileencodings=utf-8,ucs-bom,gb18030,gbk,gb2312,cp936s...

  • 关于编码

    编码的三种大类 ANSI(GBK) ANSI即为GBK编码以前是GB2312,GBK和UTF8为最常用的编码格式,...

  • Excel--基础数据处理

    常见函数文本清洗类编码方式:ASCII/GB2312/GBK/GB18030/unicode等函数名参数含义Fin...

  • httpd常用配置:设定默认字符集

    设定默认字符集 AddDefaultCharset UTF-8 中文字符集:GBK,GB2312,GB18030

  • 数据库创建语句

    老美 ASCII:2**8 256中国 gbk gb2312 gb18030 Big5unicode 统一编码ut...

  • GBK

    Guo国 Biao标 Kuo扩展 。发布前后顺序为GB2312、GBK、GB18030 1.GB2312-80 G...

  • 乱码问题

    ANSI、GBK、GB2312、UTF-8、GB18030和 UNICODE 起源和发展关于各种编码方式的起源和发...

  • 2022-04-03 ANSI是什么编码?

    不同的国家和地区制定了不同的标准,由此产生了 GB2312、GBK、GB18030、Big5、Shift_JIS ...

网友评论

      本文标题:GB2312、GBK、GB18030 以及 UTF8 共同点是都

      本文链接:https://www.haomeiwen.com/subject/tvhiwdtx.html