美文网首页
go 语言中的 rune

go 语言中的 rune

作者: 本能帅 | 来源:发表于2020-03-27 09:36 被阅读0次

    rune是Go语言中一种特殊的数据类型,它是int32的别名,几乎在所有方面等同于int32,用于区分字符值和整数值,官方解释如下:

    // rune is an alias for int32 and is equivalent to int32 in all ways. It is
    // used, by convention, to distinguish character values from integer values.
    
    //int32的别名,几乎在所有方面等同于int32
    //它用来区分字符值和整数值
    type rune = int32
    

    下面我们通过一个例子来看一下:

    package main
    
    import "fmt"
    
    func main() {
        var str = "hello 你好啊"
        fmt.Println("len(str):", len(str))
    }
    

    我们猜测一下结果,hello5 个字符+1 个空格+3 个汉子,算起来应该是 9 个,长度为 9 才对,但是我们执行一下,

    image.png

    结果打印是 15,这是为什么呢?

    golang中string底层是通过byte数组实现的。中文字符在unicode下占2个字节,在utf-8编码下占3个字节,而golang默认编码正好是utf-8。

    所以计算出的长度就等于 5+1+3*3=15
    如果我们需要计算出字符串的长度,而不是底层字节的个数,那么可以使用下面的方法:

    package main
    
    import (
        "fmt"
        "unicode/utf8"
    )
    
    func main() {
        var str = "hello 你好啊"
        //golang中string底层是通过byte数组实现的,座椅直接求len 实际是在按字节长度计算  所以一个汉字占3个字节算了3个长度
        fmt.Println("len(str):", len(str)) // 15
        //以下两种都可以得到str的字符串长度
        
        //1、golang中的unicode/utf8包提供了用utf-8获取长度的方法
        fmt.Println("RuneCountInString:", utf8.RuneCountInString(str))
    
        //2、通过rune类型处理unicode字符
        fmt.Println("rune:", len([]rune(str)))
    }
    

    运行结果如下:


    image.png

    在 rune 定义上方还有一个,byte = uint8

    // byte is an alias for uint8 and is equivalent to uint8 in all ways. It is
    // used, by convention, to distinguish byte values from 8-bit unsigned
    // integer values.
    type byte = uint8
    
    • byte 等同于int8,常用来处理ascii字符
    • rune 等同于int32,常用来处理unicode或utf-8字符

    相关文章

      网友评论

          本文标题:go 语言中的 rune

          本文链接:https://www.haomeiwen.com/subject/vzbkuhtx.html