美文网首页
常用Unicode编码

常用Unicode编码

作者: 广州秀才 | 来源:发表于2018-11-16 13:57 被阅读0次

unicode编码范围:
汉字:[0x4e00,0x9fa5](或十进制[19968,40869])
数字:[0x30,0x39](或十进制[48, 57])
小写字母:[0x61,0x7a](或十进制[97, 122])
大写字母:[0x41,0x5a](或十进制[65, 90])

汉字编码范围:\u4E00-\u9FA5
双字节字符编码范围:\u0391-\uFFE5

双字节字符编码范围

  1. GBK (GB2312/GB18030)
    /x00-/xff GBK双字节编码范围
    /x20-/x7f ASCII
    /xa1-/xff 中文 gb2312
    /x80-/xff 中文 gbk

  2. UTF-8 (Unicode)
    /u4e00-/u9fa5 (中文)
    /x3130-/x318F (韩文
    /xAC00-/xD7A3 (韩文)
    /u0800-/u4e00 (日文)

汉字unicode编码表

一般使用2w基本汉字就够了

| 字符集 | 字数 | Unicode 编码 |
| 基本汉字 | 20902字 | 4E00-9FA5 |
| 基本汉字补充 | 38字 | 9FA6-9FCB |
| 扩展A | 6582字 | 3400-4DB5 |
| 扩展B | 42711字 | 20000-2A6D6 |
| 扩展C | 4149字 | 2A700-2B734 |
| 扩展D | 222字 | 2B740-2B81D |
| 康熙部首 | 214字 | 2F00-2FD5 |
| 部首扩展 | 115字 | 2E80-2EF3 |
| 兼容汉字 | 477字 | F900-FAD9 |
| 兼容扩展 | 542字 | 2F800-2FA1D |
| PUA(GBK)部件 | 81字 | E815-E86F |
| 部件扩展 | 452字 | E400-E5E8 |
| PUA增补 | 207字 | E600-E6CF |
| 汉字笔画 | 36字 | 31C0-31E3 |
| 汉字结构 | 12字 | 2FF0-2FFB |
| 汉语注音 | 22字 | 3105-3120 |
| 注音扩展 | 22字 | 31A0-31BA |
| 〇 | 1字 | 3007 |

相关文章

  • python基础-13-史上最通俗易懂的编码讲解

    常用编码 ascii unicode utf-8 gbk 编码 ascii unicode utf-...

  • 常用Unicode编码

    unicode编码范围:汉字:[0x4e00,0x9fa5](或十进制[19968,40869])数字:[0x30...

  • 知识拓展

    字节码:ASCII编码、ANSI编码、UNICODE编码 最初的定义:字符是人们常用的一些记号,比如”1”, “汉...

  • 我是字符串(1-5)

    1. 字符编码unicode utf-8 ascii的关系? 定义:百度定义 关系: Unicode标准最常用的是...

  • 一个xss payload编码

    原始paylaod unicode编码函数名alert url编码unicode编码部分 最后在html编码全部 ...

  • 字符串

    字符串的常用操作方法: ASCII 编码, utf-8编码,unicode 编码 输出 b'\xe6\x88\x9...

  • 编码encode and decode

    常用编码与为何要encode和decode 目录 (小拓展): (一)ASCII 码 (二)Unicode 码 (...

  • 5.Python之文件的基础

    文件 编码 常用编码 Unicode与UTF-8编码字节范围对应关系 文件数据 多行文本 文件的基本处理 打开模式...

  • unicode

    gbk---解码--->unicode---编码--->utf-8 其它编码格式到unicode属于解码,反之属于编码

  • python文件

    编码,常用的有ASCII,unicode,utf-8等 文本文件 是基于字符编码的文件,常见的有ASCII,和Un...

网友评论

      本文标题:常用Unicode编码

      本文链接:https://www.haomeiwen.com/subject/zzhmfqtx.html