美文网首页
后缀数组_不相同的子串的个数

后缀数组_不相同的子串的个数

作者: Gitfan | 来源:发表于2017-03-11 15:57 被阅读0次

    给定一个字符串,求不相同的子串的个数。
    算法分析:
    每个子串一定是某个后缀的前缀,那么原问题等价于求所有后缀之间的不相
    同 的 前 缀 的 个 数 。 如 果 所 有 的 后 缀 按 照 suffix(sa[1]), suffix(sa[2]),
    suffix(sa[3]), ...... ,suffix(sa[n])的顺序计算,不难发现,对于每一次新加
    进来的 后缀 suffix(sa[k]), 它将产生 n-sa[k]+1 个新 的前缀。 但是其中有
    height[k]个是和前面的字符串的前缀是相同的。所以 suffix(sa[k])将“贡献”
    出 n-sa[k]+1- height[k]个不同的子串。累加后便是原问题的答案。这个做法
    的时间复杂度为 O(n)。

    http://www.spoj.com/problems/SUBST1/

    #include<cstdio>
    #include<cstring>
    #include<algorithm>
    #define maxn 100005
    using namespace std;
    char s[maxn];
    int sa[maxn],t[maxn],t2[maxn],c[maxn],Rank[maxn],height[maxn],n;
    void build_sa(int m){
        int i,*x=t,*y=t2,*T,p ;
        n++;
        for(i=0;i<m;++i)c[i]=0;
        for(i=0;i<n;++i)++c[x[i]=s[i]];
        for(i=1;i<m;++i)c[i]+=c[i-1];
        for(i=n-1;i>=0;--i)sa[--c[x[i]]]=i;
        for(int k=1;k<=n;k<<=1)
        {
              p=0;
           for(i=n-1;i>=n-k;--i)y[p++]=i;
           for(i=0;i<n;++i)if(sa[i]>=k)y[p++]=sa[i]-k;
           for(i=0;i<m;++i)c[i]=0;
           for(i=0;i<n;++i)++c[x[y[i]]];
           for(i=1;i<m;++i)c[i]+=c[i-1];
           for(i=n-1;i>=0;--i)sa[--c[x[y[i]]]]=y[i];
           swap(x,y);
           x[sa[0]]=0;p=1;
           for(i=1;i<n;++i)
             x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k]?p-1:p++;
           if(p>=n)break;
           m=p;
        }
        n--;
       // for(int i=1;i<=n;++i)printf("%d ",sa[i]+1);
        //printf("\n");
    
    }
    void cal_height(){
        int i,j,k=0;
        for(i=1;i<=n;i++)Rank[sa[i]]=i;
        for(int i=0;i<n;++i)
        {
           j=sa[Rank[i]-1];//h[i-1]
           if(k)k--;
           while(s[i+k]==s[j+k])k++;
           height[Rank[i]]=k;//h[i]
        }
        //for(int i=2;i<=n;++i)printf("%d ",height[i]);
    }
    int solve()
    {
        int sum=n-sa[1],i;
        for(i=2;i<=n;i++)
        {
            sum+=n-sa[i]-height[i];
        }
        return sum;
    
    }
    int main(){
        int t;
        scanf("%d",&t);
        while(t--)
        {
            scanf("%s",s);
            n=strlen(s);
            build_sa(255);
            cal_height();
            printf("%d\n",solve());
        }
    }
    

    相关文章

      网友评论

          本文标题:后缀数组_不相同的子串的个数

          本文链接:https://www.haomeiwen.com/subject/vxzagttx.html