1-7. 字符集

作者: 一Left一 | 来源:发表于2017-11-08 15:39 被阅读0次

    1、meta标签

    • 为什么会有乱码现象?
      因为我们在编写网页的时候没有指定字符集
    • 如何解决乱码现象?
      在head标签中添加<meta charset="GBK" />, 指定字符集

    2、字符集

    • UTF-8:包含世界上已知的所有字符
    • GBK(gbk2312),中国定义的字符集,内容小

    3、什么是字符集

    • 字符集就是字符的集合, 也就是很多字符堆在一起. 其实字符集很像我们古代的"活字印刷术", 在活字印刷术中就是将很多刻有汉字的小章放到一个盒子中, 然后需要印刷文字的时候再去盒子中取这个小章出来用, 正是因为如此, 所以导致了乱码问题。
    • 假设北方人和南方人都拥有装满小章的盒子, 但是南方人和北方人在盒子中存储小章的顺序不太一样, 那么这个时候如果北方人和南方人都需要去取"李"字, 在南方人记忆中李字在第6个盒子的第6行的第6列中(666), 在北方人的记忆中李字在第8个盒子的第8行的第8列中(888). 那么此时如果让一个南方人去北方人的盒子中取"李"字的小章, 必然找不到,, 所以就导致了乱码问题。
    • 这个地方北方人的存储小章的盒子和南方人存储小章的盒子就对应网页中指定的字符集, 在网页中我们常见的字符集有两个GBK/UTF-8, GBK就对应北方人存储的盒子, UTF-8就对应南方人存储的盒子
    • 所以在网页中指定字符集的意义就在于告诉浏览器我用的是哪个盒子, 你应该如何去查找才能找到对应的正确的内容。

    4、GBK(GB2312)和UTF-8区别

    • GBK(GB2312)里面存储的字符比较少, 仅仅存储了汉字和一些常用外文,体积比较小
    • UTF-8里面存储的世界上所有的文字,提交比较大

    5、那么在企业开发中我们应该使用GBK(GB2312)还是UTF-8呢?

    • 如果你的网站仅仅包含中文, 那么推荐使用GB2312, 因为它的体积更小, 访问速度更快
    • 如果你的网站除了中文以外, 还包含了一些其它国家的语言 , 那么推荐使用UTF-8
    • 懒人推荐: 不管三七二十一, 一律写UTF-8即可

    6、注意点:

    • 在HTML文件中指定的字符集必须和保存这个文件的字符集一致, 否则还是会出现乱码
    • 所以仅仅指定字符集不一定能解决乱码问题, 还需要保存文件的时候, 文件的保存格式必须和指定的字符集一致才能保证没有乱码问题

    http://www.w3school.com.cn/tags/html_ref_charactersets.asp
    http://www.w3school.com.cn/tags/html_ref_ascii.asp

    相关文章

      网友评论

        本文标题:1-7. 字符集

        本文链接:https://www.haomeiwen.com/subject/wimemxtx.html