美文网首页
后缀数组_不可重叠最长重复子串

后缀数组_不可重叠最长重复子串

作者: Gitfan | 来源:发表于2017-03-11 15:05 被阅读0次

    http://poj.org/problem?id=1743

    先二分答案,把题目变成判定性问题:判断是否存在两个长度为 k 的子串是相同的,且不重叠。解决这个问题的关键还是利用height 数组。把排序后的后缀分成若干组,其中每组的后缀之间的 height 值都不小于 k。有希望成为最长公共前缀不小于 k 的两个后缀一定在同一组。然后对于每组后缀,只须判断每个后缀的 sa 值的最大值和最小值之差是否不小于k。如果有一组满足,则说明存在,否则不存在。整个做法的时间复杂度为O(nlogn)。

    #include<cstdio>
    #include<cstring>
    #include<algorithm>
    #define maxn 100005
    using namespace std;
    int s[maxn];
    int sa[maxn],t[maxn],t2[maxn],c[maxn],Rank[maxn],height[maxn],n;
    void build_sa(int m){
        int i,*x=t,*y=t2,*T,p ;
        n++;
        for(i=0;i<m;++i)c[i]=0;
        for(i=0;i<n;++i)++c[x[i]=s[i]];
        for(i=1;i<m;++i)c[i]+=c[i-1];
        for(i=n-1;i>=0;--i)sa[--c[x[i]]]=i;
        for(int k=1;k<=n;k<<=1)
        {
              p=0;
           for(i=n-1;i>=n-k;--i)y[p++]=i;
           for(i=0;i<n;++i)if(sa[i]>=k)y[p++]=sa[i]-k;
           for(i=0;i<m;++i)c[i]=0;
           for(i=0;i<n;++i)++c[x[y[i]]];
           for(i=1;i<m;++i)c[i]+=c[i-1];
           for(i=n-1;i>=0;--i)sa[--c[x[y[i]]]]=y[i];
           swap(x,y);
           x[sa[0]]=0;p=1;
           for(i=1;i<n;++i)
             x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k]?p-1:p++;
           if(p>=n)break;
           m=p;
        }
        n--;
       // for(int i=1;i<=n;++i)printf("%d ",sa[i]+1);
        //printf("\n");
    
    }
    void cal_height(){
        int i,j,k=0;
        for(i=1;i<=n;i++)Rank[sa[i]]=i;
        for(int i=0;i<n;++i)
        {
           j=sa[Rank[i]-1];//h[i-1]
           if(k)k--;
           while(s[i+k]==s[j+k])k++;
           height[Rank[i]]=k;//h[i]
        }
        //for(int i=2;i<=n;++i)printf("%d ",height[i]);
    }
    bool check(int k)
    {
        int i,mmin=sa[1],mmax=sa[1];
        for(i=2;i<=n;i++)
        {
            if(height[i]<k)
            {
                mmin=sa[i];
                mmax=sa[i];
            }
            else
            {
                mmin=min(mmin,sa[i]);
                mmax=max(mmax,sa[i]);
                if(mmax-mmin>k) return true;
            }
        }
        return false;
    }
    int main(){
        int a,b;
        while(~scanf("%d",&n),n)
        {
            scanf("%d",&a);
            for(int i=0;i<n-1;i++)
            {
                scanf("%d",&b);
                s[i]=b-a+88;
                a=b;
            }
            s[n-1]=0;
            build_sa(180);
            cal_height();
            int l=1,r=n,mid;
            while(r-l>1)
            {
                mid=(l+r)/2;
                if(check(mid)) l=mid;
                else r=mid;
            }
            if(l>=4)printf("%d\n",l+1);
            else printf("0\n");
    
        }
    }
    

    相关文章

      网友评论

          本文标题:后缀数组_不可重叠最长重复子串

          本文链接:https://www.haomeiwen.com/subject/znnagttx.html