美文网首页
UTF-8和GBK编码异同

UTF-8和GBK编码异同

作者: sunsunsunny | 来源:发表于2020-09-29 10:46 被阅读0次

    UTF-8:Unicode TransformationFormat-8bit,用以解决国际上字符的一种编码,对中文使用8位(一个字节)、英文使用24位(三个字节)编码,对于英文字符较多的论坛则用UTF-8 节省空间。

    UTF-8包含全世界所有国家需要用到的字符,通用性强。

    UTF-8编码的文字可以在各国支持UTF-8字符集的浏览器上显示。如果是UTF-8编码,则在外国人的英文IE上也能显示中文,他们无需下载IE的中文语言支持包。

    GBK是国家标准GB2312基础上扩容后兼容GB2312的标准。

    GBK的文字编码用双字节表示,即不论中、英文字符均使用双字节表示,为了区分中文,将其最高位都设定成1。

    GBK包含全部中文字符,是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBK大。

    如果外国人访问你的GBK网页,需要下载中文语言包支持。

    GBK、GB2312等与UTF8之间都必须通过Unicode编码才能相互转换:

    GBK、GB2312--Unicode--UTF8

    UTF8--Unicode--GBK、GB2312

    相关文章

      网友评论

          本文标题:UTF-8和GBK编码异同

          本文链接:https://www.haomeiwen.com/subject/jtzsuktx.html