KMP算法

作者: wzhixin | 来源:发表于2018-03-09 20:23 被阅读2次

KMP算法是一种用于解决字符串匹配的算法,比如说我们要在一个长字符串当中查找一个段字符串是否存在,就需要使用这种算法。
这里先介绍KMP算法当中next数组的构造方法

public int[] createNextArray(String str1) {
        int[] subArray = new int[str1.length()];
        char[] p = str1.toCharArray();
        subArray[0] = -1;//
        int j = 0;//当前遍历的字符数组的位置
        int len = -1;//设置为-1是为了直接构造为next数组,len表示的是当前已经匹配到的最长的前缀和后缀的长度
        while (j < p.length -  1) {
            if (len == -1 || p[len] == p[j]) {
                len++;
                j++;
                subArray[j] = len;

            } else {
                len = subArray[len];
            }
        }
        return subArray;

    }

前缀:

image

下面介绍《部分匹配表》是如何产生的。

首先,要了解两个概念:"前缀"和"后缀"。 "前缀"指除了最后一个字符以外,一个字符串的全部头部组合;"后缀"指除了第一个字符以外,一个字符串的全部尾部组合。


image

"部分匹配值"就是"前缀"和"后缀"的最长的共有元素的长度。以"ABCDABD"为例,

- "A"的前缀和后缀都为空集,共有元素的长度为0;

- "AB"的前缀为[A],后缀为[B],共有元素的长度为0;

- "ABC"的前缀为[A, AB],后缀为[BC, C],共有元素的长度0;

- "ABCD"的前缀为[A, AB, ABC],后缀为[BCD, CD, D],共有元素长度为 0;

- "ABCDA"的前缀为[A, AB, ABC, ABCD],后缀为[BCDA, CDA, DA, A],共有元素为"A",长度为1;

- "ABCDAB"的前缀为[A, AB, ABC, ABCD, ABCDA],后缀为[BCDAB, CDAB, DAB, AB, B],共有元素为"AB",长度为2;

- "ABCDABD"的前缀为[A, AB, ABC, ABCD, ABCDA, ABCDAB],后缀为 [BCDABD, CDABD, DABD, ABD, BD, D],共有元素的长度为0。

什么是next数组

next数组就是
例如对字符串ABABCABA构造next数组,我们可以看出来一个一个字符串长度增加一位,判断改变后的字符串的最长前后缀匹配值需要根据未增加之前字符串的最长前后缀匹配值来确定。例如对于"ABABCA"的最长前后缀值是1,那么“ABABCA-B”增加的B我们只需要判断B和这个字符的最长前缀的下一位是否相同。


image.png

构造最长前缀数组

public int[] prefixArray(String str1) {
        int[] prefixArray = new int[str1.length()];
        char[] p = str1.toCharArray();
        int j = 1;
        int len = 0;
        while (j < str1.length()){
            if (p[len] == p[j]){
                len++;
                prefixArray[j] = len;
                j++;
            } else {
                if (len > 0){
//                    如果len大于0说明还可继续看前面一个元素是否和p[j]相同
                    len = prefixArray[len - 1];
                } else {
//                    如果len==0了说明前面没有元素和p[j]相同了直接
                    prefixArray[j] = len;
                    j++;
                }

            }
        }
        return prefixArray;
    }

相关文章

  • KMP 专题整理

    KMP 学习记录 kuangbin专题十六——KMP KMP 学习总结 朴素 KMP 算法 拓展 KMP 算法(E...

  • 对KMP算法的一些理解

    最近学到KMP算法,下面讲讲对KMP算法的一些个人理解,希望对大家有帮助! 对于KMP算法的理解: 整个KMP算法...

  • KMP算法文章合集

    字符串的查找:朴素查找算法和KMP算法 暴力匹配算法与KMP算法(串的匹配) 字符串查找算法BF和KMP 字符串匹...

  • 串的模式匹配算法

    KMP算法 算法匹配

  • 问答|KMP算法学习笔记

    问题 目录KMP是什么,做什么用的KMP算法的高效体现在哪如何KMP算法的next数组KMP的代码KMP的时间复杂...

  • KMP算法——寻找子串位置

    KMP算法——寻找子串位置 1、KMP算法简介: KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J....

  • 字符串匹配 - KMP算法

    前面我们介绍非常高效的 BM 算法,今天我们介绍另一个非常出名且高效的 KMP 算法。 KMP 算法思想 KMP ...

  • KMP算法及优化

    转载请注明出处: KMP算法及优化 今天看到同学在复习数据结构书上的KMP算法,忽然发觉自己又把KMP算法忘掉了,...

  • KMP算法(字符串匹配问题)

    一、是什么? 注意,是KMP算法,不是MMP哈,我没有骂人。KMP算法是用来做字符串匹配的,除了KMP算法分,还有...

  • KMP算法

    KMP算法

网友评论

      本文标题:KMP算法

      本文链接:https://www.haomeiwen.com/subject/smxcaxtx.html