package main
import "fmt"
func main() {
var str = "hello 你好"
fmt.Println("len(str):", len(str))
}
猜测结果应该是:8:5个字符1个空格2个汉字。那么正确答案是多少呢?
咦...结果居然是12,这是为什么呢!?
golang中string底层是通过byte数组实现的。中文字符在unicode下占2个字节,在utf-8编码下占3个字节,而golang默认编码正好是utf-8。
那么?如果我们预期想得到一个字符串的长度,而不是字符串底层占得字节长度,该怎么办呢???
rune使用
golang中也有一个byte数据类型与rune相似,它们都是用来表示字符类型的变量类型。它们的不同在于:
byte 等同于int8,常用来处理ascii字符
rune等同于in32,常用来处理utf8字符
rune还能用来修改字符串
s1:="白萝卜"
s2:=[]rune(s2)
s3[0] = '红'
fmt.Println(s3)
rune 等同于int32,常用来处理unicode或utf-8字符
网友评论