Unicode规范中的BOM的概念:
BOM——Byte Order Mark,就是字节序标记。
BOM的作用:
UTF-8不需要BOM来表明字节顺序,但可以用BOM来表明编码方式。
字符"ZERO WIDTH NO-BREAK SPACE"的UTF-8编码是"EF BB BF"。
所以如果接收者收到以"EF BB BF"开头的字节流,就知道这是UTF-8编码了。
Windows就是使用BOM来标记文本文件的编码方式的。UTF-8编码的文件中,BOM占三个字节。
如图:
文本内容有BOM
如图:
文本内容无BOM
网友评论