美文网首页
后缀数组_不相同的子串的个数

后缀数组_不相同的子串的个数

作者: Gitfan | 来源:发表于2017-03-11 15:57 被阅读0次

给定一个字符串,求不相同的子串的个数。
算法分析:
每个子串一定是某个后缀的前缀,那么原问题等价于求所有后缀之间的不相
同 的 前 缀 的 个 数 。 如 果 所 有 的 后 缀 按 照 suffix(sa[1]), suffix(sa[2]),
suffix(sa[3]), ...... ,suffix(sa[n])的顺序计算,不难发现,对于每一次新加
进来的 后缀 suffix(sa[k]), 它将产生 n-sa[k]+1 个新 的前缀。 但是其中有
height[k]个是和前面的字符串的前缀是相同的。所以 suffix(sa[k])将“贡献”
出 n-sa[k]+1- height[k]个不同的子串。累加后便是原问题的答案。这个做法
的时间复杂度为 O(n)。

http://www.spoj.com/problems/SUBST1/

#include<cstdio>
#include<cstring>
#include<algorithm>
#define maxn 100005
using namespace std;
char s[maxn];
int sa[maxn],t[maxn],t2[maxn],c[maxn],Rank[maxn],height[maxn],n;
void build_sa(int m){
    int i,*x=t,*y=t2,*T,p ;
    n++;
    for(i=0;i<m;++i)c[i]=0;
    for(i=0;i<n;++i)++c[x[i]=s[i]];
    for(i=1;i<m;++i)c[i]+=c[i-1];
    for(i=n-1;i>=0;--i)sa[--c[x[i]]]=i;
    for(int k=1;k<=n;k<<=1)
    {
          p=0;
       for(i=n-1;i>=n-k;--i)y[p++]=i;
       for(i=0;i<n;++i)if(sa[i]>=k)y[p++]=sa[i]-k;
       for(i=0;i<m;++i)c[i]=0;
       for(i=0;i<n;++i)++c[x[y[i]]];
       for(i=1;i<m;++i)c[i]+=c[i-1];
       for(i=n-1;i>=0;--i)sa[--c[x[y[i]]]]=y[i];
       swap(x,y);
       x[sa[0]]=0;p=1;
       for(i=1;i<n;++i)
         x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k]?p-1:p++;
       if(p>=n)break;
       m=p;
    }
    n--;
   // for(int i=1;i<=n;++i)printf("%d ",sa[i]+1);
    //printf("\n");

}
void cal_height(){
    int i,j,k=0;
    for(i=1;i<=n;i++)Rank[sa[i]]=i;
    for(int i=0;i<n;++i)
    {
       j=sa[Rank[i]-1];//h[i-1]
       if(k)k--;
       while(s[i+k]==s[j+k])k++;
       height[Rank[i]]=k;//h[i]
    }
    //for(int i=2;i<=n;++i)printf("%d ",height[i]);
}
int solve()
{
    int sum=n-sa[1],i;
    for(i=2;i<=n;i++)
    {
        sum+=n-sa[i]-height[i];
    }
    return sum;

}
int main(){
    int t;
    scanf("%d",&t);
    while(t--)
    {
        scanf("%s",s);
        n=strlen(s);
        build_sa(255);
        cal_height();
        printf("%d\n",solve());
    }
}

相关文章

  • 后缀数组_不相同的子串的个数

    给定一个字符串,求不相同的子串的个数。算法分析:每个子串一定是某个后缀的前缀,那么原问题等价于求所有后缀之间的不相...

  • 字符串算法

    求一个字符串的前缀与另一个字符串的后缀的最大相同子串 一个关于字符串前后缀的神奇数组:next 数组 Leetco...

  • 后缀树(suffix tree & array)

    定义:后缀数组(suffix array)是将字符串的所有后缀进行排序放入数组中。后缀树(suffix tree)...

  • 字符串

    字符串DP 字符串匹配 后缀数组 后缀数组的注意点:1 两个串拼接在一起。2 height数组的性质。POJ 15...

  • 【教3妹学算法】竞赛题-按身高排序

    题目: 给你一个字符串数组 names ,和一个由 互不相同 的正整数组成的数组 heights 。两个数组的长度...

  • c语言解决最长重复子串问题

    1.解题思路 最大后缀方法思路: 用字符串指针数组保存用户输入的字符串的所有后缀字符串; 将后缀字符串集合进行排序...

  • 718. 最长公共子串

    题目:给定两个整数数组A和B,返回两个数组中最长的公共子串的长度。思路:注意和最长公共子序列的思想区分,子串要求连...

  • CF 655E E. Beautiful Subarrays (

    题意 给你一个大小为n(1 <= n <= 10 ^ 6)的 int 数组,找出连续子串的个数,满足连续子串的亦或...

  • 两个数组对比,取出相同的元素

    两个数组,一个为普通数组,一个是对象数组,取出两个数组里不相同的元素 算法:

  • CUMTOJ数据结构实验内容1-2 problemI

    1375 problem 后缀子串排序 C++ 题目描述 对于一个字符串,将其后缀子串进行排序,例如grain其子...

网友评论

      本文标题:后缀数组_不相同的子串的个数

      本文链接:https://www.haomeiwen.com/subject/vxzagttx.html