美文网首页
求子串位置算法 -- KMP算法

求子串位置算法 -- KMP算法

作者: 半亩房顶 | 来源:发表于2018-07-24 19:24 被阅读70次

所看这一节标题是 串的模式匹配算法
数据结构C语言版,第四章第三节

目的:求子串位置

首先,最容易想到的就是暴力算法,不废话,直接上代码

int Index(SString S, SString T, int pos){
    i = pos; j=1;
    while(i <= S[0] && j <= T[0]){
        if(S[i] == T[j]) {i++; j++;}
        else{i = i-j+2; j=1}//回退指针中-2需要注意
    }
    if(j > T[0]) return i-T[0];
    else return 0;
}

这个算法可以很好的完成他的功能,这个没有问题。时间复杂度最好为 O(n+m),最坏时候则为O(n*m),问题就在这里了,时间复杂度不可能一直都是最好情况,最坏时候的复杂度我们不满意,那好,优化开始。

这个时候KMP算法就出来了。
暴力算法对复杂度影响最大的,是主串的回退,而KMP其优化思路就是,其实我们可以每次出现匹配失败的时候,主串不回退,适当的回退子串,然后继续进行匹配的。
这个功能成立的条件就是我们对于子串足够的了解。假设我们已经非常熟悉子串,这时可以知道,子串是有一定的重复的,当匹配失败的时候,我们可以让子串回退到一个位置,这个位置不一定是起点,但是主串已经满足了子串这一点之前的字符的成功匹配,这个时候,我们就可以不回退主串,基于我们对于子串的了解,继续进行匹配。说多容易晕,看代码。

代码中我们引入一个next数组,它记录了子串匹配失败时回退的位置,如何得到next数组,后续会说

int Index_KMP(SString S, SString T, int pos){
    i = pos; j = 1;
    while(i <= S[0] && j <= T[0]){
        if(j==0 || S[i] == T[j]){i++; j++;}
        else{ j = next[j]; }
    }
    if(j > T[0]) return i-T[0];
    else return 0;
}

此算法时间复杂度就稳了,O(m+n),不错,挺满意的。当然大家会说,你还需要生成next数组啊,这也是计算啊,那好,我们来看看这个生成next数组的算法

void get_next(SString T, int next[]){
    i=1;next[1] = 0;j=0;
    while(i < T[0]){
        if(j==0 || T[i]==T[j]){i++;j++;next[i]=j;}
        else j = next[j];
    }
}

时间复杂度O(m),感觉可以接受的工作量,呆胶布~

然而,KMP没这么简单的,它还能优化,由此,我们需要先看一个特殊情况:
子串‘aaaab’和主串'aaabaaaab'相遇时候,会发生什么?对next数组足够了解的小伙伴一眼就看出来了,你这不得一步步退回到起点么,干嘛不直接回退到起点?
好,那我们就让它能直接回退到起点来优化它。
新的next算法

void get_nextval(SString T, int nextval[]){
    i=1; j=0; nextval[1]=0;
    while(i < T[0]){
        if(j==0 || T[i]==T[j]){
            ++i;++j;
            if(T[i] != T[j]) nextval[i] =j;
            else nextval[i] = nextval[j];
        }
        else j = nextval[j];
    }
}

emmm,没啥好说的了,手打好累,,,,

相关文章

  • 求子串位置算法 -- KMP算法

    所看这一节标题是 串的模式匹配算法数据结构C语言版,第四章第三节 目的:求子串位置 首先,最容易想到的就是暴力算法...

  • KMP算法——寻找子串位置

    KMP算法——寻找子串位置 1、KMP算法简介: KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J....

  • KMP算法文章合集

    字符串的查找:朴素查找算法和KMP算法 暴力匹配算法与KMP算法(串的匹配) 字符串查找算法BF和KMP 字符串匹...

  • 字符串匹配KMP算法

    假设我们的字符串母串是,子串是,我们想找到子串在母串中出现的位置并统计总的出现次数,可以使用KMP算法。KMP算法...

  • 09--KMP

    [toc] KMP算法原理 KMP思想 假设字符串abcdefgab和模式串abcdex,进行匹配,当匹配到x位置...

  • 算法(2)KMP算法

    1.0 问题描述 实现KMP算法查找字符串。 2.0 问题分析 “KMP算法”是对字符串查找“简单算法”的优化。 ...

  • 字符串匹配与KMP算法

    1.朴素字符串匹配算法 2.KMP算法 求前缀函数 实现KMP算法 3.测试代码

  • KMP算法(字符串匹配问题)

    一、是什么? 注意,是KMP算法,不是MMP哈,我没有骂人。KMP算法是用来做字符串匹配的,除了KMP算法分,还有...

  • leetcode字符串匹配算法之KMP算法

    本篇介绍一种高效的字符串匹配算法——KMP算法。 KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J....

  • KMP算法理解

    文章大纲:1.KMP算法概念2.KMP算法中最核心的next[] 数组是如何生成的3.使用KMP算法 匹配字符串 ...

网友评论

      本文标题:求子串位置算法 -- KMP算法

      本文链接:https://www.haomeiwen.com/subject/dxpemftx.html