题目意思大概就是
输入n 和nc 还有一个字符串
字符串的长度不超过16 Millions
As an example, consider N=3, NC=4 and the text "daababac". The different substrings of size 3 that can be found in this text are: "daa"; "aab"; "aba"; "bab"; "bac". Therefore, the answer should be 5.
这里的n=3的意思很明显就是为了把这个字符串按3的长度分割开,然后统计有多少个不同的
nc就是告诉你整个字符串里只有nc个不同的字母,其他的都是重复的字母
Sample Input
3 4
daababac
Sample Output
5
这题看起来就可以用hash,我当时一次想的时候就是在想这个地址冲突的问题,想怎么能够有效的避免这个地址的冲突
就有想用map在规避这个地址冲突的问题,后面我看到这个nc一直不能理解这个变量的含义
这个题nc就是我们求key的核心了,
我们开始讲这个题的思想拉
第一步 这个nc怎么用 ,这里nc是代表不同的字母那么,是不是可以用nc来做编号?
例如
daababac
第一个是d
那d是第一个出现的我们就给d这个字母设置一个0的编号
a是第二个是 1
b是第三个是 2
c是第四个是 3
那我们怎么用呢?
daa是不是第一个分割好的字符串
那d=0,a=1
key = 0
key = key * nc + asc[d] 这里的asc[d]就是0拉 为什么呢,d = ASCLL=100 所以我们这里直接访问到 asc [100]这个数组里存的就是我们的d的编号所以是0
那么第一次
key=0 x 4+0; key=0
第二次
key=0 x 4+asc[a]; asc[a]=1 key =1
第三次
key=1 x 4+asc[a]; key = 5
所以我们就得到一个没有冲突的key 表示的就是hash表里5这个位置
为什么说没有冲突呢?
例如 ada
第一次
key = 0 x 4 +asc[a] ; key=1;
第二次
key = 1 x 4 +asc[b]; key=4;
第三次
key = 4 x 4 + asc[a]; key=17
例如aad
第一次
key = 0 x 4 + asc[a] ; key = 1
第二次
key = 1 x 4 + asc[a] ; key = 5
第三次
key = 5 x 4 + asc[b]; key = 20
所以说这样是可以避免冲突的
什么时候会冲突
那就是再次出现重复的字符串
所以这个操作可以让我们避免重复记录
第一次得到key访问这个hash[key] 值为 0 我们就记录 不同的字符串+1 并把这个hash[kay]变成 1 下次重复的字符串就不会在加在我们的统计里
这里有个小问题我之前提交是TLE 发现是因为我的循环里用了strlen()导致我超时了
大家以后需要用到长度的时候最好把长度先求出好放在一个变量里下次使用的时候就可以直接使用了不需要每次都去求
AC代码
include <stdio.h>
include <string.h>
char str[16000003];
int hash[16000003];
int asc[256]; //这里的256是因为键盘上读取到的最多255
int main()
{
int n,m;
while(scanf("%d %d",&n,&m)!=EOF)
{
memset(hash,0,sizeof(hash));
memset(asc,0,sizeof(asc));
scanf("%s",str);
int len=0;
int stlen=strlen(str);
for(int i=0;i<stlen && len<m;i++) //m是字符串中不同字母的数量,len==m说明剩下的都是相同的了
if(asc[str[i]]==0) //这里是为了给各个字母赋值一个编号
asc[str[i]]=len++; //第一个出现的就是0
int tot=0;
stlen=stlen-n+1; //这里为什么要减n呢 我们是不是要求每n长度的字符串 ,这是为了保证每个字符串的长度都是n
for(int i=0;i<stlen;i++)
{
int sum=0;
for(int j=0;j<n;j++)
sum=sum*m+asc[str[j+i]];
if(hash[sum]==0)
{
hash[sum]=1;
tot++;
}
}
printf("%d\n",tot);
}
return 0;
}
网友评论