美文网首页Rust语言学习
RUST 学习日记 第15课 ——字符串的常用方法(一)

RUST 学习日记 第15课 ——字符串的常用方法(一)

作者: L我是小学生 | 来源:发表于2021-08-01 09:46 被阅读0次

    RUST 学习日记 第15课 ——字符串的常用方法(一)


    0x00 回顾与开篇

    前面用了两篇文章介绍了Rust的字符串,也了解了它们之间的联系和区别。这节课开始介绍Rust字符串的修改,添加,删除等常用的方法,进一步的来了解Rust字符串。

    0x01 追加(Push)

    在字符串尾部可以使用push()方法追加单个字符char,也可以使用push_str()方法追加字符串字面量。这两个方法都是在原有的字符串上追加,并不会返回新的字符串。由于字符串追加操作要修改原来的字符串,则该字符串必须是可变的。即字符串变量必须由mut关键字修饰

    示例代码如下:

        let mut string = String::from("hello ");
    
        string.push('r');
        println!("追加字符 push() -> {}", string);
    
        string.push_str("ust!");
        println!("追加字符串 push_str() -> {}", string);
    

    代码运行结果:

    追加字符 push() -> hello r
    追加字符串 push_str() -> hello rust!
    

    0x02 插入(Insert)

    可以使用insert()方法插入单个字符char,也可以使用insert_str()方法插入字符串字面量。与push()方法不同,这俩方法需要传入两个参数,第一个参数是字符(串)插入位置的索引,第二个参数是要插入的字符(串)。索引从0开始计数,如果越界则会发生错误。由于字符串插入操作要修改原来的字符串,则该字符串必须是可变的。即字符串变量必须由mut关键字修饰

    示例代码如下:

        let mut insert_string = String::from("hello rust!");
    
        insert_string.insert(5, ',');
        println!("插入字符 insert() -> {}", insert_string);
    
        insert_string.insert_str(6, " I like");
        println!("插入字符串 insert_str() -> {}", insert_string);
    

    代码运行结果:

    插入字符 insert() -> hello, rust!
    插入字符串 insert_str() -> hello, I like rust!
    

    0x03 连接(Catenate)

    1、使用+或者+=连接字符串

    使用+或者+=连接字符串,要求右边的参数必须为字符串的切片引用(Slice)类型。其实当调用+的操作符时,相当于调用了string标准库中的add方法。

    源码如下:

    [inline]

    fn add(mut self, other: &str) -> String {
    self.push_str(other);
    self
    }

    这里add方法的第二个参数是一个引用的类型。因此我们在使用+,必须传递切片引用类型。不能直接传递String类型。++=都是返回一个新的字符串。所以变量声明可以不需要mut关键字修饰。

    示例代码如下:

        let string_append = String::from("hello ");
        let string_rust = String::from("rust");
        // &string_rust会自动解引用为&str
        let result = string_append + &string_rust;
        let mut result = result + "!";
        result += "!!!";
    
        println!("连接字符串 + -> {}", result);
    

    代码运行结果:

    连接字符串 + -> hello rust!!!!
    

    看到这里,是不是有人有问题要问。

    Q:看源码明明是操作了原有的字符串啊,只是在原有的字符串中调用了push_str追加了新的内容,为啥还要返回一个新的字符串呢?岂不是多此一举吗?

    A:那我们就直接输出下string_append这个字符串看下不就可以了吗。如果你打印string_append,你会很绝望,因为编译器会发生下面的错误。

    println!("输出 string_append -> {}", string_append);
    | ^^^^^^^^^^^^^ value borrowed here after move

    直译的意思是:这个值在移动后又被使用了。简单解释下,string_append这个变量通过调用了add方法后,所有权被转移到add方法里面,add方法调用后就被释放了,同时string_append也被释放了。再使用string_append就会发生错误。仅了解即可,这里涉及到所有权转移(Move)的相关知识。仅仅了解即可,我在这里埋个坑,后面将所有权会详细解释。

    2、使用format!连接字符串

    format!这种方式适用于String&strformat!的用法与print!的用法类似,在前面“第9课——输入与输出”已经详细介绍过了。

    示例代码如下:

        let s1 = "hello";
        let s2 = String::from("rust");
        let s = format!("{} {}!", s1, s2);
        println!("{}", s);
    

    代码运行结果:

    hello rust!
    

    0x04 替换(Replace)

    如果想要把字符串中的某个字符串替换成其它的字符串,那可以使用replace()方法。与替换有关的方法有三个。

    1、replace

    该方法可适用于String和&str类型。replace方法接收两个参数,第一个参数是要被替换的字符串,第二个参数是新的字符串。该方法会替换所有匹配到的字符串。该方法是返回一个新的字符串,而不是操作原来的字符串。

    示例代码如下:

    // replacen
        let string_replace = "I like rust. Learning rust is my favorite!";
        let new_string_replace = string_replace.replace("rust", "RUST");
        dbg!(new_string_replace);
    

    代码运行结果:

    new_string_replace = "I like RUST. Learning RUST is my favorite!"
    
    2、replacen

    该方法可适用于String和&str类型。replacen方法接收三个参数,前两个参数与replace方法一样,第三个参数则表示替换的个数。该方法是返回一个新的字符串,而不是操作原来的字符串。

    示例代码如下:

    // replacen
        let string_replacen = "I like rust. Learning rust is my favorite!";
        let new_string_replacen = string_replacen.replacen("rust", "RUST", 1);
        dbg!(new_string_replacen);
    

    代码运行结果:

    new_string_replacen = "I like RUST. Learning rust is my favorite!"
    
    3、replace_range

    该方法仅适用于String类型。replace_range接收两个参数,第一个参数是要替换字符串的范围(Range),第二个参数是新的字符串。该方法是直接操作原来的字符串,不会返回新的字符串。该方法需要使用mut关键字修饰。

        let mut string_replace_range = String::from("I like rust!");
        string_replace_range.replace_range(7..8, "R");
        dbg!(string_replace_range);
    

    代码运行结果:

    string_replace_range = "I like Rust!"
    

    0x05 删除(Delete)

    与字符串删除相关的方法有4个,他们分别是popremovetruncateclear这四个方法仅适用于String类型。

    1、pop——删除并返回字符串的最后一个字符。

    该方法是直接操作原来的字符串。但是存在返回值,其返回值是一个Option<char>类型,如果字符串为空,则返回None。有关Option类型后续章节将会介绍。

    示例代码如下:

        let mut string_pop = String::from("rust pop 中文!");
        let p1 = string_pop.pop();
        let p2 = string_pop.pop();
        dbg!(p1);
        dbg!(p2);
        dbg!(string_pop);
    

    代码运行结果:

    p1 = Some(
        '!',
    )
    p2 = Some(
        '文',
    )
    string_pop = "rust pop 中"
    
    2、remove——删除并返回字符串中指定位置的字符

    该方法是直接操作原来的字符串。但是存在返回值,其返回值是删除位置的字符串只接收一个参数,表示该字符起始索引位置。remove方法是按照字节来处理字符串的,如果参数所给的位置不是合法的字符边界,则会发生错误。

    • 什么是不合法的字符边界?

      在Rust中,一个英文字符或者阿拉伯数字是占一个字节的,而一个汉字是占3个字符串。可以使用std::mem::size_of_val()方法查看在内存占用几个字节。还有一些Emoji表情还占了4个字节。

      也许你会问为什么会这样呢?这个与UTF-8编码有关系,这里就不解释了,如果后面有时间,我可以拿出一篇文章来讲解下Unicode的背景。如果想知道答案也可以通过网络搜索下。

      示例代码如下:

        let word = "中";
          let ch = "1";
          println!("word 占 {} 个字节", std::mem::size_of_val(word));
          println!("ch 占 {} 个字节", std::mem::size_of_val(ch));
      

      代码运行结果:

      word 占 3 个字节
      ch 占 1 个字节
      

    经过上面的例子,也许你理解了什么叫做不合法的字符边界。看下面的代码示例,string_remove是一个String类型,按照上面说的规则,计算下的它的字节长度是18字节。如果要删除第一个汉字,那就传参数为0。如果想直接删除第二个汉字,则需要传参数为3。如果你传递参数为1或者2,则会出现不合法的字符边界错误。

    示例代码如下:

    let mut string_remove = String::from("测试remove方法");
        println!("string_remove 占 {} 个字节", std::mem::size_of_val(string_remove.as_str()));
        // 删除第一个汉字
        string_remove.remove(0);
        // 下面代码会发生错误
        // string_remove.remove(1);
        // 直接删除第二个汉字
        // string_remove.remove(3);
        dbg!(string_remove);
    

    代码运行结果:

    string_remove 占 18 个字节
    string_remove = "试rmove方法"
    
    3、truncate——删除字符串中从指定位置开始到结尾的全部字符。

    该方法是直接操作原来的字符串。无返回值。该方法truncate方法是按照字节来处理字符串的,如果参数所给的位置不是合法的字符边界,则会发生错误。

    示例代码如下:

        let mut string_truncate = String::from("测试truncate");
        string_truncate.truncate(3);
        dbg!(string_truncate);
    

    代码运行结果:

    string_truncate = "测"
    
    4、clear——清空字符串

    该方法是直接操作原来的字符串。调用后,删除字符串中的所有字符,相当于truncate方法参数为0的时候。

    示例代码如下:

        let mut string_clear = String::from("string clear");
        string_clear.clear();
        dbg!(string_clear);
    

    代码运行结果:

    string_clear = ""
    

    0x06 小结

    简单介绍了字符串的常用修改方法,总共分为追加,插入,连接,替换,删除5部分。下节继续介绍字符串的常用方法——字符串的访问。

    0x04 本节源码

    015 · StudyRust - 码云 - 开源中国 (gitee.com)

    下节预告——字符串的常用方法(二)。

    相关文章

      网友评论

        本文标题:RUST 学习日记 第15课 ——字符串的常用方法(一)

        本文链接:https://www.haomeiwen.com/subject/dfmlvltx.html