POJ1200 Crazy Search哈希

http://poj.org/problem?id=1200

题目大意就是将一个字符串分成长度为N的字串。且不同的字符不会超过NC个。问总共有多少个不同的子串。最初看了半天一直没看明白与哈希有什么关系(相信也有人和这个菜鸟我一样吧),无奈之下只好去搜结题报告,突然才明白原来那个NC作用大大。

最后采用的办法就是以nc作为进制,把一个子串化为这个进制下的数,再用哈希判断。由于题目说长度不会超过16,000,000  所以哈希长度就设为16000000就行。另外为每一个字符对应一个整数,来方便转化。

如题目中的

daababac与整数对应之后就是

12232324

然后子串

daa->122->011(因为是化为4进制,所以需要减1)->5(因为是4进制);

aab->223->112->22;

aba->232->121->25;

... ...

时间复杂度为O(length)

具体看代码

 1 #include<stdio.h>
 2 #include<string.h>
 3 #define mem(a) memset(a,0,sizeof(a))
 4 
 5 unsigned int hash[16000000+5];
 6 unsigned int c[128];
 7 char str[1000000];
 8 
 9 int main()
10 {
11     int len,base;
12     while(~scanf("%d%d",&len,&base))
13     {
14         mem(str);
15         mem(c);
16         mem(hash);
17         scanf("%s",str);
18         int num =0;
19         int i,j=0,length=strlen(str),tp=1;
20         for(i=0;i<length;i++)
21         {
22             if(c[str[i]]==0)c[str[i]]=++j;
23             if(j==base)break;
24         }
25         for(i=0;i<len;i++)
26         {
27             num=num*base+c[str[i]]-1;
28             tp*=base;
29         }
30         tp/=base;
31         hash[num]=1;
32         int count=1;
33         for(i=1;i<=length-len;i++)
34         {
35             num = ( num-(c[str[i-1]]-1)*tp )* base+ c[str[i+len-1]] - 1;
36             if(!hash[num])
37             {
38                 hash[num]=1;
39                 count++;
40             }
41         }
42         printf("%d\n",count);
43     }
44     return 0;
45 }

 

posted @ 2013-05-15 21:11  再见~雨泉  阅读(2197)  评论(0编辑  收藏  举报