美文网首页Rust语言学习
Rust 通用集合类型

Rust 通用集合类型

作者: kaiv2 | 来源:发表于2020-04-12 16:10 被阅读0次

    通用集合类型

    • vector 允许我们一个挨着一个的存储一系列数量可变的值。
    • 字符串是一个字符的集合
    • **哈希 map **允许我们将值与一个特定的key相关联

    vector 用来存储一些列的值

    新建 vector

    let v: Vec<i32> = Vec::new();
    

    或者使用宏

    let v = vec![1, 2, 3];
    

    更新vector

    let mut v = Vec::new();
    
    v.push(5);
    v.push(6);
    

    丢弃vector时也会丢弃所有其他元素

    {
        let v = vec![1, 2, 3, 4];
        // 处理变量 v
    }// 这里 v 离开作用域并被丢弃
    

    读取 vector 的元素

    let v = vec![1, 2, 3, 4, 5];
    
    let third: &i32 = &v[2];
    println!("{}", third);
    
    match v.get(2) {
        Some(x) => println!("{}", x),
        None => println!("none"),
    }
    

    遍历 vector 中的元素

    let mut v = vec![1, 2, 3];
    
    for i in &v {
        println!("{}", i);
    }
    
    // 为每个元素加50
    for i in &mut v {
        *i += 50;
    }
    

    使用枚举来存储多种类型

    enum SpreadsheetCell {
        Int(i32),
        Float(f64),
        Text(String),
    }
    
    let row = vec![
        SpreadsheetCell::Int(3),
        SpreadsheetCell::Float(2.1),
        SpreadsheetCell::Text(String::from("zhang")),
    ]
    

    更多vector使用方式可参考标准库文档。

    使用字符串存储 UTF-8 编码的文本

    什么是字符串

    rust 的核心语言中只有一种字符类型 str , 字符串 slice,它通常以被借用的形式出现,&str

    新建字符串

    let mut s = String::new();
    
    let data = "initial contents";
    
    let s = data.to_string();
    
    let s = "initial contents".to_string();
    

    更新字符串

    String的大小可以增长其内容也可以改变,就像可以放入更多数据来改变Vec的内容一样。

    使用push_strpush附加字符串

    let mut s = String::from("foo");
    s.push_str("bar");
    s.push('a');
    

    使用+运算符或format!宏拼接字符串

    let s1 = String::from("hello ");
    let s2 = String::from("world!");
    let s3 = s1 + &s2;// 注意 s1 被移动了,不能继续使用
    

    索引字符串

    let s1 = String::from("hello");
    let h = s1[0];// 这里将报错
    

    为什么Rust不支持字符索引,我们来聊一聊Rust是如何在内存中储存字符串的。

    内部表现 String是一个Vec<u8>的封装。让我们看看之前一些正确编码的字符串例子:

    let len = String::from("hello").len();
    

    这里,len的值是5,这意味者字符串 hello 的 Vec的长度是5个字节:这里每一个字母的 UTF-8 编码都占用一个字节。下面这个例子呢?

    let len = String::from("你好").len();
    

    这里的长度是 6,这里是用的是 UTF-8编码 你好所需要的字节数。

    字符串 slice

    let hello = "你好";
    let s = &hello[..3]; // 你
    

    你应该小心这个操作,如果获取&hell0[..1]会发生什么呢?答案是:在运行时会 panic,就跟访问 vector 中的无效索引时一样。

    遍历字符串的方法

    for c in "你好".chars() {
        println!("{}", c);
    }
    

    字符串并不简单

    总而言之,字符串还是很复杂的。不同语言选着了不同的向程序员展示其复杂性的方式。Rust 选择了以准确的方式处理String数据作为所有Rust程序的默认行为,这意味者程序员们必须更多的思考如何预先处理UTF-8 数据。

    哈希 map

    哈希map储存键值对

    最后介绍的常用集合类型是哈希 map (hash map)HashMap<K, V>类型储存了一个键类型K和对应一个值类型V的映射。它通过哈希函数来实现映射,决定如何将键和值放入内存中。

    新建一个哈希 map

    use std::collections::HashMap;
    
    let mut scores = HashMap::new();
    scores.insert(String::from("blue"), 50);
    scores.insert(String::from("yellow"), 20);
    

    必须注意首先 use标准库中集合部分的HashMap。在这三个常用集合中,HashMap是最不常用的,所以没有被 prelude 自动引用。

    哈希 map 和所有权

    use std::collections::HashMap;
    
    let field_name = String::from("Favorite color");
    let field_value = String::from("Blue");
    
    let mut map = HasshMap::new();
    map.insert(field_name, field_value);
    // 这里 field_name 和 field_value 不再有效
    

    insert 调用将 field_namefield_value移动到哈希 map 中后,将不能再使用这两个绑定。如果将值的引用插入哈希map,这些值本身不会将被移动到哈希map。但是这些引用指向的值必须在哈希 map有效时也是有效的。

    访问哈希 map 中的值

    use std::collections::HashMap;
    
    let mut scores = HashMap::new();
    
    scores.insert(String::from("Blue"), 10);
    scores.insert(String::from("Yellow"), 50);
    
    let team_name = String::from("Blue");
    let score = scores.get(&team_name);
    

    这里,score是与蓝队分数相关的值,应为Some(10)。因为get返回Option<V>,所以结果被装进Some;如果某个键在哈希 map 中没有对应的值,get会返回 None

    可以使用与 vector 类是的方式来遍历哈希 map 中的每一个键值对,也就是for循环:

    use std::collections::HashMap;
    
    let mut scores = HashMap::new();
    socres.insert(String::from("Blue"), 10);
    socres.insert(String::from("Yellow"), 50);
    
    for (key, value) in &scores {
        println!("{}: {}", key, value);
    }
    

    跟新哈希map

    尽管键值对的数量是可增长的,不过任何时候,每个键只能关联一个值。当我们想要改变哈希 map 中的数据时,必须决定如何处理一个键已经有值了的情况。

    覆盖一个值

    use std::collections::HashMap;
    
    let mut scores = HashMap::new();
    
    scores.insert(String;:from("Blue"), 10);
    scores.insert(String::from("Blue"), 25);
    pritnln!("{:?}", scores);
    

    这里会打印出{"Blue": 25}。原始的值`10被覆盖了。

    只在键没有对应的值时插入

    use std::collections::HashMap;
    
    let mut scores = HashMap::new();
    scores.insert(String::from("Blue"), 10);
    scores.entry(String::from("Yellow")).or_insert(50);
    scores.entry(String::from("Blue")).or_insert(50);
    
    pritnln!("{:?}", scores);
    

    这里将打印{"Yellow": 50, "Blue": 10}。第一个entry调用会插入50因为Yellow并没有值。第二个entry调用不会改变哈希 map 因为Blue已经有了值 10

    根据旧值更新一个值

    use std::collections::HashMap;
    
    let text = "hello world hi hello world";
    
    let mut map = HashMap::new();
    
    for word in text.split_witespace() {
        let count = map.entrt(word).or_insert(0);
        *count += 1;
    }
    

    这里会打印出{"hello": 2, "world": 2, "hi": 1}, or_insert方事实上回返回这个键的值的一个可变引用(&mut v)。这里我们将这个可变引用储存在count变量中,所以为了赋值必须用星号(*)解引用count

    哈希函数

    HashMap默认使用一种密码学安全的(cryptographically strong)哈希函数,它可以抵抗拒绝服务攻击。

    总结

    vector, 字符串和哈希 map 会在你的程序需要储存、访问和修改数据时帮助你。

    相关文章

      网友评论

        本文标题:Rust 通用集合类型

        本文链接:https://www.haomeiwen.com/subject/cyqbmhtx.html