编码区分很重要,对于编程语言已经实现了功能的,如果前端出现乱码很有可能是编码不符的问题,下面小菌给大家简介UTF-8、Unicode、ISO8859系列编码的区别和历史演化。
UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,又称万国码。由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到6个字节编码Unicode字符。用在网页上可以统一页面显示中文简体繁体及其它语言(如英文,日文,韩文)。俗称国际通用编码,但是不要以为通过就可以随意使用咯,要注意各服务器、数据库以及前后端使用的一致哦!
Unicode(统一码、万国码、单一码)是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,1994年正式公布。
ISO8859 不是一个标准,而是一系列的标准,这套字符集与编码系统的共同特色是,以同样的码位对应不同字符集。
GB2312/GBK 这是汉字的国标码,全称《汉字内码扩展规范》(GBK即“国标”、“扩展”汉语拼音的第一个字母,英文名称:Chinese Internal Code Specification),专门用来表示汉字,是双字节编码,而英文字母和iso8859-1一致(兼容iso8859-1编码)。其中gbk编码能够用来同时表示繁体字和简体字,而gb2312只能表示简体字,gbk是兼容gb2312编码的。
关于UTF-8、Unicode、ISO8859系列的编码区分问题https://www.qwzyj.com/thread-152-1-1.html(出处: 全网资源菌)
网友评论