美文网首页工作生活
数据结构之kmp算法

数据结构之kmp算法

作者: smallmartial | 来源:发表于2019-07-01 15:56 被阅读0次

    Knuth-Morris-Pratt 字符串查找算法,简称为 “KMP算法”,常用于在一个文本串S内查找一个模式串P 的出现位置,这个算法由Donald Knuth、Vaughan Pratt、James H. Morris三人于1977年联合发表,故取这3人的姓氏命名此算法。
    下面先直接给出KMP的算法流程:

    • 假设现在文本串S匹配到 i 位置,模式串P匹配到 j 位置
    • 如果j = -1,或者当前字符匹配成功(即S[i] == P[j]),都令i++,j++,继续匹配下一个字符;
    • 如果j != -1,且当前字符匹配失败(即S[i] != P[j]),则令 i 不变,j = next[j]。此举意味着失配时,模式串P相对于文本串S向右移动了j - next [j] 位。
    • 换言之,当匹配失败时,模式串向右移动的位数为:失配字符所在位置 - 失配字符对应的next 值(next 数组的求解会在下文的3.3.3节中详细阐述),即移动的实际位数为:j - next[j],且此值大于等于1。
      文章详解参考:https://www.cnblogs.com/ZuoAndFutureGirl/p/9028287.html

    代码:

    package cn.algorithm.kmp;
    
    import java.util.Arrays;
    
    /**
     * @Author smallmartial
     * @Date 2019/7/1
     * @Email smallmarital@qq.com
     */
    public class KMPAlgorithm {
    
        public static void main(String[] args) {
            String str1 = "BBC ABCDAB ABCDABCDABDE";
            String str2 = "ABCDABD";
           // String str2 = "BBC";
    
            int[] next = kmpNext("ABCDABD");
            System.out.println(Arrays.toString(next));
    
            int index = kmpSearch(str1,str2,next);
            System.out.println("index = "+ index);
        }
    
        //写出kmp搜索算法
    
        /**
         *
         * @param str1 源字符串
         * @param str2 子串
         * @param next 部分匹配表 是字串对应的部分匹配表
         * @return 如果返回-1 则没有匹配到
         */
        public static int kmpSearch(String str1, String str2,int[] next){
            //遍历str1
            for (int i = 0,j=0; i <str1.length() ; i++) {
    
                //str1.charAt(i) != str2.charAt(j)
                //kmp核心算法
                while (j > 0 && str1.charAt(i) != str2.charAt(j)){
                    j = next[j -1];
                }
    
                if (str1.charAt(i) == str2.charAt(j)) {
                    j++;
                }
                if (j == str2.length()){
                    return i - j + 1;
                }
            }
            return -1;
        }
    
        //获取一个字符串的部分匹配值
        public static int[] kmpNext(String dest){
            //创建一个next数组保存部分匹配值
            int[] next = new int[dest.length()];
    
            next[0] = 0;//如果字符串长度为1 部分匹配值就是0
    
            for (int i = 1 ,j = 0; i < dest.length(); i++) {
                //当dest.charAt(i) != dest.charAt(j) 满足时,我们需要从next[j-1]获取新的j
                //直到我们发现有dest.charAt(i) == dest.charAt(j)成立才退出
                while (j>0 && dest.charAt(i) != dest.charAt(j)){
                    j =next[j-1];
                }
    
                //当dest.charAt(i) == dest.charAt(j) 满足时,部分匹配值就是+1
                if (dest.charAt(i) == dest.charAt(j)){
                    j++;
                }
                next[i]=j;
            }
            return next;
        }
    
    }
    
    

    相关文章

      网友评论

        本文标题:数据结构之kmp算法

        本文链接:https://www.haomeiwen.com/subject/jbagcctx.html