在Go语言中string 底层是用byte数组存储的,并且是不可以改变的
例如 s:="Go编程" fmt.Println(len(s))
输出结果应该是8因为中文字符是用3个字节存的。
len(string(rune('编')))
的结果是3
s := "你"
fmt.Println(len([]byte(s))) //长度为3
fmt.Println(len([]rune(s))) //长度为1
fmt.Println(len(s)) //长度3
所以用string存储unicode的话,如果有中文,按下标是访问不到的,因为你只能得到一个byte。 要想访问中文的话,还是要用rune切片,
s="你" fmt.Println(len([]byte(s)))//输出长度为3
byte 不支持中文的操作
rune在golang 中是int32 的别名,被用来区分字符值和整数值。通过上述例子可以将rune理解为一个可以表示unicode 编码的值int 的值,称为码点(code point)。只不过go语言把这个码点抽象为rune。
网友评论