前缀树

作者: 一凡呀 | 来源:发表于2017-11-27 17:48 被阅读0次

    概念:

    简述:又名单词查找树,tries树,一种多路树形结构,常用来操作字符串(但不限于字符串),和hash效率有一拼(二者效率高低是相对的,后面比较)。
    性质:不同字符串的相同前缀只保存一份。
    操作:查找,插入,删除等。

    举个例子:
    假设有这么几个单词

    abcd
    abc
    abd
    bcq
    edj

    前缀树画出如下


    前缀树.png

    如上图可以看出,abcd等字符是在边上的,a的那条边和指向的节点我们可以看成一个整体,存储的信息是在节点上

    定义的数据结构:

    
        //节点
        public static class TrieNode{
            //以此节点结尾
            int end;
            //走过的路径的次数,可以理解为一个节点和指向 它的路径的值
            int path;
            //节点
            private TrieNode[] arr;
    
            public TrieNode(){
                end = 0;
                path = 0;
                arr= new TrieNode[26];
            }
        }
    

    操作:

    插入:

    先创建一个根节点,根节点代表起点,起点可以有26条不同的路,代表26个字母,你可以想想一个根节点走出26个字符的路径。然后用 index = chs[i] - 'a' 来计算属于哪条路,在这里解释一下,-'a' 减去的是'a'的阿斯克码,比如传进来的是b 就相当于用b的阿斯克码减去a的阿斯克码,求出的就是由当前结点出去的那条路径,其中end代表以当前结点结尾,path代表经过当前结点的个数,如上所说,当前结点和指向它的路径可以看成一个整体,比如一个节点,指向它的由a,b,c,它的path就是3,知道了变量的意思,插入就简单了,就判断现在要加入的节点之前有没有,没有就加入,加完之后,把尾节点的end++即可

    代码:

    public static class Trie {
            private TrieNode root;
    
            public Trie() {
                root = new TrieNode();
            }
    
            public void insert(String word) {
                if (word == null) {
                    return;
                }
                char[] chs = word.toCharArray();
                TrieNode node = root;
                int index = 0;
                for (int i = 0; i < chs.length; i++) {
                    index = chs[i] - 'a';
                    if (node.arr[index] == null) {
                        node.arr[index] = new TrieNode();
                    }
                    node = node.arr[index];
                    node.path++;
                }
                node.end++;
            }
    }
    

    查询:

    查询的整体操作和插入类似,查询就随着字符串向下查询,如果查的当前节点没有,就返回false,直到查完,看尾节点的end是否大于零,大于零说明有该字符,如果为0就说明没有,比如有字符串abcd,你要查有没有abc,虽然一直能查到c,但是c的end不是1,所以没有

    代码:

    
        public static class Trie {
            private TrieNode root;
    
            public Trie() {
                root = new TrieNode();
            }
                  
            public boolean search(String word) {
                if (word == null) {
                    return false;
                }
                char[] chs = word.toCharArray();
                TrieNode node = root;
                int index = 0;
                for (int i = 0; i < chs.length; i++) {
                    index = chs[i] - 'a';
                    if (node.arr[index] == null) {
                        return false;
                    }
                    node = node.arr[index];
                }
                return node.end != 0;
            }
    }
    

    删除:

    删除就判断当前节点的--path是否为0,为0就说明要删除的就是这个路径,而且只有要删除的那一个字符串在这条大路径上,删除就行,另一种情况,abcd,abc,要删除abc,就相当于大路径还在,只不过把每个节点的--path,然后c的end--就行了

    代码:

    public static class Trie {
            private TrieNode root;
    
            public Trie() {
                root = new TrieNode();
            }
    
                    public void delete(String word) {
                if (search(word)) {
                    char[] chs = word.toCharArray();
                    TrieNode node = root;
                    int index = 0;
                    for (int i = 0; i < chs.length; i++) {
                        index = chs[i] - 'a';
                        if (node.arr[index].path-- == 1) {
                            node.arr[index] = null;
                            return;
                        }
                        node = node.arr[index];
                    }
                    node.end--;
                }
            }
    

    查找是否包含此前缀:

    如果当前结点的下一个节点不为空,就一直找下去,为空就返回0,查到最后就,返回当前结点的path值,代表有几个字符串有此前缀

    代码:

    public static class Trie {
            private TrieNode root;
    
            public Trie() {
                root = new TrieNode();
            }
    
            public int prefixNumber(String pre) {
                if (pre == null) {
                    return 0;
                }
                char[] chs = pre.toCharArray();
                TrieNode node = root;
                int index = 0;
                for (int i = 0; i < chs.length; i++) {
                    index = chs[i] - 'a';
                    if (node.arr[index] == null) {
                        return 0;
                    }
                    node = node.[index];
                }
                return node.path;
            }
        }
    

    相关文章

      网友评论

        本文标题:前缀树

        本文链接:https://www.haomeiwen.com/subject/qcvdbxtx.html