在内存中,字符串的本质是二进制码。只有需要与用户交互时,程序才会将二进制码通过特定的编码方式转换成用户可以识别的字符串。GBK与UTF-8就是两种常用的编码方式。其中,utf-8编码一个字母用一个字节表示,一个汉字用三个字节表示,gbk编码一个字母用一个字节表示,一个汉字用两个字节表示。
一段文字被读入内存,计算机会按照特定的编码方式比如utf-8将其转化为二进制码,当需要打印到屏幕上时,计算机再按照utf-8将二进制码还原成原来的那一段文字。
参考:
https://mp.weixin.qq.com/s?src=11×tamp=1596723919&ver=2506&signature=iXbrluIvRqqKMWnq-O5vfrrO8ZFf-fPFyBt8XWDNKUHtSnkbiq-JYv7s4sRbGbxIwVi8x5N0F1OfXBm4srsSyEoIZkQeUwTDCuxnQVRUhhcSnK7l7VXd5eC9QkVdc7&new=1
网友评论