美文网首页
字符串和字符编码

字符串和字符编码

作者: 无名氏_1 | 来源:发表于2015-12-26 21:29 被阅读41次

    基础知识回顾 :
    1byte = 8 bit
    Int32 = 32byte
    ASCII编码 占1个byte 最多表示255(2的8次幂-1)个数
    GB2312编码 汉字编码 占2个byte 最多表示65535(2的16次幂-1)个数
    Unicode编码 将所有不同语言的编码标准统一到一个格式中 避免乱码的问题
    Unicode编码通常2个byte表示一个字符(特殊的使用四个)
    Utf-8编码 根据字符具体内容不同分配1-6个byte 比如英文字母1个byte 汉字则是3个byte 使用这种编码的好处是 节省空间 传输时更高效率

    在计算机内存中 统一使用Unicode编码
    场景1: 使用记事本记录文件
    将记事本文件的Utf-8编码 转换为Unicode编码 读取到内存中
    内存产生新的字符再以Utf-8的编码标准 写入记事本

    场景2:服务器数据通过网页展示
    将字符以Utf-8编码格式发送到客户端浏览器 客户端显示

    python3
    Python3中de字符串是使用Unicode编码的
    <code>ord('')//将某个字符的Unicode编码打印出来</code>
    <code>chr()//将某个编码对应的字符打印出来</code>

    swift 中使用unicode编码打印出字符
    如<code>print("\u{E9}\u{20DD}")</code>
    unicode编码表

    相关文章

      网友评论

          本文标题:字符串和字符编码

          本文链接:https://www.haomeiwen.com/subject/qerbhttx.html