这些编码方式你不可不知

作者: 给你一颗小瓜子 | 来源:发表于2016-12-23 08:01 被阅读287次

编程过程中经常会遇到各种编码方式,乱码的问题是最让程序员头疼的问题。我们经常会遇到哪些编码方式呢?这些编码方式你到底懂多少?

头疼的各类编码方式

1. Unicode

Unicode

Unicode(统一码、万国码、单一码)是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。

2. UTF-8

UTF-8

UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,又称万国码。由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到4个字节编码Unicode字符。用在网页上可以统一页面显示中文简体繁体及其它语言(如英文,日文,韩文)。

3. GB2312

GB2312

GB2312编码适用于汉字处理、汉字通信等系统之间的信息交换,通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB 2312。

基本集共收入汉字6763个和非汉字图形字符682个。整个字符集分成94个区,每区有94个位。每个区位上只有一个字符,因此可用所在的区和位来对汉字进行编码,称为区位码。

4. ANSI

ANSI

ANSI是一种字符代码,为使计算机支持更多语言,通常使用 0x00~0x7f 范围的1 个字节来表示 1 个英文字符。超出此范围的使用0x80~0xFFFF来编码,即扩展的ASCII编码。

为使计算机支持更多语言,通常使用 0x80~0xFFFF 范围的 2 个字节来表示 1 个字符。比如:汉字 '中' 在ANSI编码中文操作系统中,使用 [0xD6,0xD0] 这两个字节存储。

5. ASCII

ASCII

ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。它是现今最通用的单字节编码系统,并等同于国际标准ISO/IEC 646。

ASCII 码使用指定的7 位或8 位二进制数组合来表示128 或256 种可能的字符。标准ASCII 码也叫基础ASCII码,使用7 位二进制数(剩下的1位二进制为0)来表示所有的大写和小写字母,数字0 到9、标点符号, 以及在美式英语中使用的特殊控制字符。

6. GBK

GBK

GBK全称《汉字内码扩展规范》(GBK即“国标”、“扩展”汉语拼音的第一个字母,英文名称:Chinese Internal Code Specification)

GBK编码,是在GB2312-80标准基础上的内码扩展规范,使用了双字节编码方案,其编码范围从8140至FEFE(剔除xx7F),共23940个码位,共收录了21003个汉字。

相关文章

  • 这些编码方式你不可不知

    编程过程中经常会遇到各种编码方式,乱码的问题是最让程序员头疼的问题。我们经常会遇到哪些编码方式呢?这些编码方式你到...

  • iOS 常见加密方式 - Base64

    Base64常用于字符的编码,将原始数据加密为不可读的字符,因其编码方式是完全公开的,所以称作“编码”更为贴切。 ...

  • 谈谈Android base64的使用

    Base64是网络上最常见的用于传输8Bit字节代码的编码方式之一,编码后的字符串具有不可读性,即所编码的数据不会...

  • 【编码】认识编码方式

    认识几种编码方式: ASCII全称美国标准信息交换代码(American Standard Code for In...

  • 讲一下常见编码方式?

    什么是编码: 常见的编码方式:

  • 计算机整数的编码

    整数的两种编码方式是神马? 答:无符号编码和补码编码 编码整数的两种不同方式无符号数编码和补码编码各有什么特点? ...

  • iOS-视屏编码

    编码方式 在iOS中编码方式有两种硬编码: 在iOS8.0之后,使用原生框架VideoToolBox&AudioT...

  • 第二次作业

    上周末,我们已经完成了100位数字编码的学习,那么这些编码你有完全掌握吗?如果还没有就请你继续调整属于你的编码,...

  • 加密三:base64

    简介 网络上最常见的用于传输8Bit(字节代码)的编码方式之一 特点 Base64编码具有不可读性 把3个字符变成...

  • JavaWeb——中文编码问题

    一、常见的编码方式 (1)ASCII码这是最简单的一种编码方式。这种编码方式总共可以表示128个字符,其中包括控制...

网友评论

    本文标题:这些编码方式你不可不知

    本文链接:https://www.haomeiwen.com/subject/yslqvttx.html