kmp算法

作者: 流年划破容颜_cc55 | 来源:发表于2018-08-15 15:55 被阅读24次

    题面

    题目描述

    如题,给出两个字符串s1和s2,其中s2为s1的子串,求出s2在s1中所有出现的位置。

    为了减少篇幅的情况,接下来还要输出子串的前缀数组next。如果你不知道这是什么意思也不要问,去百度搜[kmp算法]学习一下就知道了。
    输入输出格式

    输入格式:

    第一行为一个字符串,即为s1(仅包含大写字母)

    第二行为一个字符串,即为s2(仅包含大写字母)

    输出格式:

    若干行,每行包含一个整数,表示s2在s1中出现的位置

    接下来1行,包括length(s2)个整数,表示前缀数组next[i]的值。

    输入样例:

    ABABABC
    ABA

    输出样例:

    1
    3
    0 0 1

    说明

    时空限制:1000ms,128M
    数据规模:
    设s1长度为N,s2长度为M
    对于30%的数据:N<=15,M<=5
    对于70%的数据:N<=10000,M<=100
    对于100%的数据:N<=1000000,M<=1000

    题解

    我就是拿着它学习一下KMP算法
    其实原来我学过KMP算法
    但是一直没有弄懂next(跳转)数组是如何求出来的。
    最近花了一个下午自己研究了一下KMP算法
    现在终于觉得KMP很简单了~

    现在直接说next数组把
    至于有什么作用,next数组是干什么的,请自行百度,有很多dalao总结的非常到位,看一看就会明白。

    好,来说next数组

    image.png

    并不用在意这一坨黑的是什么东西,我们就假设他是我们要求next数组的字符串。

    next数组求的东西就是从起始位置到当前位置最长的相等的前缀和后缀的长度。
    (举个例子China的前缀有:C、Ch、Chi、Chin、China ; 后缀有a、na、ina、hina、China)

    image.png

    我们继续,如上图红色的是当前位置(设为j)前,所匹配上的最长前缀和后缀,蓝色的是当前要匹配的位置。

    image.png

    那么,我们就拿当前位置和原来匹配到的最长前缀的后一位相比较
    如果两个位置相同,
    显然,
    可以和前面的红色连在一起,
    此时就有next[j]=next[j-1]+1

    如果两个位置不相同,
    根据next数组的性质,
    显然的,你的当前的相等的前缀和后缀只能够继续向前找,
    也就是说,你当前的next数组一定会减小。

    image.png

    既然前面的红色部分存在一小块灰色,那么,后面的红色部分也必然存在灰色部分。

    image.png

    所以,判断当前位置和前面那一块灰色的前缀的后一位是否相等。
    如果这两位相同的话,不就可以和前面的灰色部分连在一起了吗

    image.png

    此时,又回到一开始的那一步。
    因此,求解某个位置的next值是一个循环过程。
    不断检查 上一位的 最长前缀的 后一位(i位置)(这句子有点拗口)
    如果相等next[j]=next[i]+1
    否则令 i=next[i-1]+1,继续循环匹配

    如果没有看懂就自己多看几遍,自己找几个字符串算一算

     void GetNext(string s)//获得字符串s的next数组
    {
        int l=s.length(),t;
        Next[0]=-1;//如果在0位置失配则是向下移动一位
        for(int i=1;i<l;++i)//依次求解后面的next数组
        {
            t=Next[i-1];
            while(s[t+1]!=s[i]&&t>=0)//循环求解next值 
                t=Next[t];
            if(s[t+1]==s[i])//如果是匹配上而退出循环 
                Next[i]=t+1;
            else            //否则则是匹配不上 
                Next[i]=-1; //指向头 
        }
    }
    

    题目完整代码

    #include<iostream>
    #include<cstdio>
    #include<cstdlib>
    #include<cstring>
    #include<cmath>
    #include<vector>
    #include<algorithm>
    using namespace std;
    const int MAX=1001;
    int Next[MAX];
    vector<int> Ans;
    inline void GetNext(string s)//获得字符串s的next数组
    {
        int l=s.length(),t;
        Next[0]=-1;//如果在0位置失配则是向下移动一位
        for(int i=1;i<l;++i)//依次求解后面的next数组
        {
            t=Next[i-1];
            while(s[t+1]!=s[i]&&t>=0)//循环求解next值 
                t=Next[t];
            if(s[t+1]==s[i])//如果是匹配上而退出循环 
                Next[i]=t+1;
            else            //否则则是匹配不上 
                Next[i]=-1; //指向头 
        }
    }
    inline void KMP(string s1,string s2)
    {
        GetNext(s2);
        int l1=s1.length();
        int l2=s2.length();
        int i=0,j=0;
        while(j<l1)
        {
            if(s2[i]==s1[j])//当前位匹配成功,继续匹配下一位
            {
                ++i;++j;
                if(i==l2)//完全匹配
                {
                    Ans.push_back(j-l2+1);//储存答案
                    i=Next[i-1]+1;//继续匹配                
                }
            }
            else
            {
                if(i==0)//在首位不匹配
                    j++;//直接向后挪一位
                else
                    i=Next[i-1]+1;//跳转
            }
        }
    }
    int main()
    {
        string s1,s2;
        int l;
        cin>>s1>>s2;
        l=s2.length();
        KMP(s1,s2);
        for(int i=0;i<Ans.size();++i)
            cout<<Ans[i]<<endl;
        for(int i=0;i<l;++i)
            cout<<Next[i]+1<<' ';
        cout<<endl;
        return 0;
    }
    

    相关文章

      网友评论

          本文标题:kmp算法

          本文链接:https://www.haomeiwen.com/subject/umswbftx.html