1401 兔子与兔子(字符串哈希)

描述

很久很久以前,森林里住着一群兔子。有一天,兔子们想要研究自己的 DNA 序列。我们首先选取一个好长好长的 DNA 序列(小兔子是外星生物,DNA 序列可能包含 26 个小写英文字母),然后我们每次选择两个区间,询问如果用两个区间里的 DNA 序列分别生产出来两只兔子,这两个兔子是否一模一样。注意两个兔子一模一样只可能是他们的 DNA 序列一模一样。

输入格式

第一行一个 DNA 字符串 S。
接下来一个数字 m,表示 m 次询问。
接下来 m 行,每行四个数字 l1, r1, l2, r2,分别表示此次询问的两个区间,注意字符串的位置从1开始编号。
其中 1 ≤ length(S), m ≤ 1000000

输出格式

对于每次询问,输出一行表示结果。如果两只兔子完全相同输出 Yes,否则输出 No(注意大小写)

样例输入

aabbaabb
3
1 3 5 7
1 3 6 8
1 2 1 2

样例输出

Yes
No
Yes


思路:字符串哈希裸题,我一般习惯写双hash,总感觉单hash可能不太靠谱。
介绍一下字符串哈希,就是将字符串看作p进制数,给每种字符分配大于0的数值,取一个固定值M,求p进制数的余数(p远大于分配数值),作为该字符串的hash值
p = 131 或者 p = 13331,或者其他大于分配数值的数(不能含有模数的因子,所以模数最好选择质数,不含有因子),这样冲突概率极低,再加上双hash,
一般hash值一样,我们就认为其字符串一样
存储hash值用unsign long long,这样就相当于自动就2^64 取模,避免取模操作,当然也可以自己选择取模的模数进行取模。

h(s+c) = (h(s)*p+val【c】)%mod (乘p相当于p进制数左移)
h(t) = (h(s+t) - h(s)*p^length(t))%mod

#include<bits/stdc++.h>
using namespace std;
const int maxn = 1000005;
char word[maxn];
int m;
int mod = INT_MAX;
unsigned long long f1[maxn],f2[maxn],p1[maxn],p2[maxn];
int main()
{
    scanf("%s",word+1);
    int len = strlen(word+1);
    p1[0] = p2[0] = 1;
    for(int i=1;i<=len;i++)
    {
        f1[i] = f1[i-1]*131+(word[i]-'a'+1);
        f2[i] = f2[i-1]*13331+(word[i]-'a'+1);
        p1[i] = p1[i-1]*131;
        p2[i] = p2[i-1]*13331;
    }
    scanf("%d",&m);
    for(int i=1;i<=m;i++)
    {
        int l1,r1,l2,r2;
        scanf("%d%d%d%d",&l1,&r1,&l2,&r2);
        if(f1[r1]-f1[l1-1]*p1[r1-l1+1] == f1[r2]-f1[l2-1]*p1[r2-l2+1] &&
           f2[r1]-f2[l1-1]*p2[r1-l1+1] == f2[r2]-f2[l2-1]*p2[r2-l2+1])
            puts("Yes");
        else puts("No");
    }
}
View Code

 

posted @ 2019-04-02 13:29  进击的黑仔  阅读(238)  评论(0编辑  收藏  举报