在 Go 中字符串是 byte 数组。可以通过将内容放在双引号 "" 之间的方式来创建一个字符串。字符串是不可变值类型,内部⽤指针指向 UTF-8 字节数组。
• 默认值是空字符串 ""。
• ⽤索引号访问某字节,如 s[i]。
• 不能⽤序号获取字节元素指针, &s[i] ⾮法。
• 不可变类型,⽆法修改字节数组。
• 字节数组尾部不包含 NULL。
runtime.h
struct String
{
byte* str;
intgo len;
};
(1)使⽤索引号访问字符 。
s := "abc"
fmt.Println(s[0]) //97
fmt.Printf("%c\n", s[0]) //a
//'x\61'Unicode码, 0x63 ascil码
fmt.Println(s[0] == '\x61', s[0] == '\u0061', s[0] == '\U00000061') //true true true
fmt.Println(s[1] == 'b', s[2] == 0x63) //true true
通常Unicode表示一个字符时,通常会用"U+"然后紧接着一组十六进制的数字来表示这个字符,例如 字符a 通常用 U+0061 来表示。
直接按照字符的字形的话,可以用单引号 (') 括起来表示,也可按照码值来表示,可以用 \xNN ,\uNNNN , \UNNNNNNNN 的 格式,每个 N 代表一位数。例如 字符a 可以用 \x61 或 \u0061 或 \U00000061
(2)使⽤ "`" 定义不做转义处理的原始字符串,⽀持跨⾏。
s := `a
b\r\n\x00
c`
fmt.Println(s)
输出
(3)使用len()可以反回字节数
s := "abc"
fmt.Println(len(s)) //3
(4)连接跨⾏字符串时, "+" 必须在上⼀⾏末尾,否则导致编译错误。
s := "Hello, " +
"World!"
(5)rune
rune 是 Go 中的内置类型,它是 int32 的别名。在 Go 中,rune表示一个 Unicode 码点。无论一个码点会被编码为多少个字节,它都可以表示为一个 rune。
汉字在字节中占2-4个码点。直接使用下标访问并不能得到正确的值,可以先将其转换为rune类型再使用下标访问
s := "黄哲"
fmt.Println(s[0]) //233
fmt.Printf("%c\n", s[0]) //é
r := []rune(s)
fmt.Println(r[0]) //40644
fmt.Printf("%c\n", r[0]) //黄
(6)字符串是不可变的,在 Go 中字符串是不可变的。字符串一旦被创建就无法改变。
要修改字符串,可先将其转换成 []rune 或 []byte,完成后再转换为 string。⽆论哪种转换,都会重新分配内存,并复制字节数组。
func changeString(s string) string {
// ru := []rune(s)
// ru[0] = 'w'
by := []byte(s)
by[1] = 'G'
return string(by)
}
(7)⽤ for 循环遍历字符串时,也有 byte 和 rune 两种⽅式。
s := "黄哲abc"
for i := 0; i < len(s); i++ { // byte
fmt.Printf("%c,", s[i])
}
fmt.Println()
for _, r := range s { // rune
fmt.Printf("%c,", r)
}
输出:
(8)字符串操作相关的API大多封装在 strings 包里
我只说几个常用的
1、返回字符串s中有几个不重复的sep子串。
func Count(s, sep string) int
s := "黄哲abc"
fmt.Println(strings.Count(s, "a")) //1
2、子串sep在字符串s中第一次出现的位置,不存在则返回-1。
func Index(s, sep string) int
s := "黄哲abc"
fmt.Println(strings.Index(s, "ab")) //7
3、字符c在s中第一次出现的位置,不存在则返回-1。
func IndexByte(s string, c byte) int
s := "a黄哲abc"
fmt.Println(strings.IndexByte(s, 'a')) //1
4、判断字符串s是否包含字符串chars中的任一字符。
func ContainsAny(s, chars string) bool
s := "a黄哲abc"
fmt.Println(strings.ContainsAny(s, "abcd")) //true
其他的去上面的API里查吧,不一一列举了
(9)字符串转int类型,方法封装在strconv包里
https://studygolang.com/pkgdoc
1、func ParseInt(s string, base int, bitSize int) (i int64, err error)
返回字符串表示的整数值,接受正负号。
base指定进制(2到36),如果base为0,则会从字符串前置判断,"0x"是16进制,"0"是8进制,否则是10进制;
bitSize指定结果必须能无溢出赋值的整数类型,0、8、16、32、64分别代表 int、int8、int16、int32、int64;
返回的err是*NumErr类的,如果语法有误,err.Error = ErrSyntax;如果结果超出类型范围err.Error= ErrRange。
s := "-1234556676876876"
num, _ := strconv.ParseInt(s, 10, 64)
fmt.Println(num) //-1234556676876876
func Atoi(s string) (i int, err error)
Atoi是ParseInt(s, 10, 0)的简写。
2、func ParseUint(s string, base int, bitSize int) (n uint64, err error)
ParseUint类似ParseInt但不接受正负号,用于无符号整型。有符号会返回0。
s1 := "-1234556676876876"
s2 := "123312"
num1, err := strconv.ParseUint(s1, 10, 64)
num2, _ := strconv.ParseUint(s2, 10, 64)
fmt.Println(num1, err) //0 strconv.ParseUint: parsing "-1234556676876876": invalid syntax
fmt.Println(num2) //123312
3、func ParseFloat(s string, bitSize int) (f float64, err error)
解析一个表示浮点数的字符串并返回其值。
如果s合乎语法规则,函数会返回最为接近s表示值的一个浮点数。
bitSize指定了期望的接收类型,32是float32,64是float64;
返回值err是*NumErr类型的,语法有误的,err.Error=ErrSyntax;结果超出表示范围的,返回值f为±Inf,err.Error= ErrRange。
s3:="12312.32131"
f1,_:=strconv.ParseFloat(s3,32)
f2,_:=strconv.ParseFloat(s3,64)
fmt.Println(f1) //12312.3212890625
fmt.Println(f2) //12312.32131
网友评论