美文网首页
【字符集】

【字符集】

作者: Pino_HD | 来源:发表于2017-10-19 08:56 被阅读0次

0x01 字符与字节

肉眼看到的一个文字或符号单元就是一个单元(包括乱码),一个字符可能对应1~n字节,1字节为8位,每一位要么是1,要么是0

0x02 字符集

一个字符对应1~n字节是由字符集与编码决定的,比如,ASCII字符集就是一个字符对应1字节,不过1字节只用了7位,最高位用于其他目的,所以ASCII字符集共有2的7次方(128)个字符。

0x03 字符集编码

一般字符集对应一种编码方式(比如GBK字符集对应了GBK编码),不过Unicode字符集的编码方式有UTF-8、UTF-7、UTF-16、URF-32。
编码的目的是最终将这些字符正确的转换为计算机可理解的二进制,对应的解码就是将二进制最终解码为人类可读的字符。

0x04 宽字节编码

GB2312、GBK、GB18030、BIG5等就是常说的宽字节,就是只有两字节。宽字节的问题主要是吃ASCII字符(一字节),比如,当字符集为GBK的时候,GBK编码第一字节(高字节)的范围0x810xFE,第二字节(低字节)的范围0x400xFE,这样的十六进制表示。而\符号的十六进制表示为0x5c,正好在GBK的低字节,如果之前有一个高字节,那么正好会被组成一个合法字符

GB2312是被GBK兼容的,它的高位是0xA10xF7,低位是0xA10xFE,但是在浏览器中处理行为同GBK,可能是浏览器兼容了,把GB2312统一按GBK处理。

相关文章

  • 2019-04-16字符集 通配符

    修改字符集 永久修改字符集 重启xshell 原因 与远程工具不同字符集 排错 查看xshll字符集查看系统字符集...

  • 字符集与校对规则

    MySQL字符集及校对规则的理解 阅读目录:MySQL的字符集和校对规则 MySQL的字符集 MySQL与字符集 ...

  • MYSQL 8 基本操作之03 (字符集)

    查询服务器字符集 查询服务器字符集校对规则 查询数据库字符集 查询数据库字符集校对规则 查询表的字符集及校对规则

  • 字符集和字符编码

    常常会把字符集和字符编码混起来。下面是一些常用的字符集:ASCII字符集GB2312字符集GBK字符集GB1803...

  • MySQL字符类型学习笔记

    @[toc] 一、字符集和字符编码 1.1、字符集 字符集:字符集就是字符的集合,例如GB2312是中国国家标准的...

  • tr

    转换字符集或者删除字符集 通常与输出命令搭配管道使用 将文本的输入内容中的小写字符集转换成大写字符集 删除指定的字符集

  • MySQL学习 6 字符集

    Mysql 的字符集设置非常灵活,可以设置: - 服务器默认字符集 - 数据库默认字符集 - 表默认字符集 - 列...

  • 字符集

    定义 mysql 的字符集包括 字符集 CHARACTER 和 校对规则COLLATION 两个概念 字符集 : ...

  • Unicode字符集与MYSQL数据库中的字符集

    全文内容概述 字符集是什么?有哪些常见的字符集?字符集的发展和历史知识 Unicode字符集的由来和特点 MYSQ...

  • Mysql 中文乱码问题

    从以下几方面排查: 数据库字符集 表字符集 连接字符集: useUnicode=true&characterEnc...

网友评论

      本文标题:【字符集】

      本文链接:https://www.haomeiwen.com/subject/whxyuxtx.html