计算机储存数据的方式:
计算机通过在内存中储存0和1来储存数据。
内存中存在许多储存元件,通过选择其中一行储存元件,并横向对其充电。
充电元件则表示为1,否则表示为0。
但由于储存元件为晶体管,存在自行耗电现象,因此要通过不断地刷新和充电来维持其状态。
负数会以补码的形式储存
小数会以浮点数的形式储存
几种常见的字符集:
ASCII:美国信息交换标准代码
GB2312:中国国家标准简体中文字符集
GBK字符集——扩展了生僻字、繁体字、日语和朝鲜语等(微软开发的)
Unicode字符集——目前最常用的字符集,仍在不断扩充,已扩充至4个字节大小
UTF-8
UTF-8是一种编码方式,不是字符集
具体:
原二进制编码:00000000 00000000 00000000 01111111(2) 即0000007F(16)以下
UTF-8表示:0xxxxxxx
原二进制编码:00000000 00000000 00000111 11111111(2) 即000007FF(16)以下
UTF-8表示:110xxxxx 10xxxxxx
原二进制编码:00000000 00000000 11111111 11111111(2) 即0000FFFF(16)以下
UTF-8表示:1110xxxx 10xxxxxx 10xxxxxx
原二进制编码:00000000 00011111 11111111 11111111(2) 即001FFFFF(16)以下
UTF-8表示:11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
JavaScript使用了Unicode字符集,但是没有使用UTF-8编码
网友评论