1401 兔子与兔子（字符串哈希）

描述

很久很久以前，森林里住着一群兔子。有一天，兔子们想要研究自己的 DNA 序列。我们首先选取一个好长好长的 DNA 序列（小兔子是外星生物，DNA 序列可能包含 26 个小写英文字母），然后我们每次选择两个区间，询问如果用两个区间里的 DNA 序列分别生产出来两只兔子，这两个兔子是否一模一样。注意两个兔子一模一样只可能是他们的 DNA 序列一模一样。

输入格式

第一行一个 DNA 字符串 S。
接下来一个数字 m，表示 m 次询问。
接下来 m 行，每行四个数字 l1, r1, l2, r2，分别表示此次询问的两个区间，注意字符串的位置从1开始编号。
其中 1 ≤ length(S), m ≤ 1000000

输出格式

对于每次询问，输出一行表示结果。如果两只兔子完全相同输出 Yes，否则输出 No（注意大小写）

样例输入

aabbaabb
3
1 3 5 7
1 3 6 8
1 2 1 2

样例输出

Yes
No
Yes


思路：字符串哈希裸题，我一般习惯写双hash，总感觉单hash可能不太靠谱。
介绍一下字符串哈希，就是将字符串看作p进制数，给每种字符分配大于0的数值，取一个固定值M，求p进制数的余数（p远大于分配数值），作为该字符串的hash值
p = 131 或者 p = 13331，或者其他大于分配数值的数（不能含有模数的因子，所以模数最好选择质数，不含有因子），这样冲突概率极低，再加上双hash，
一般hash值一样，我们就认为其字符串一样
存储hash值用unsign long long，这样就相当于自动就2^64 取模，避免取模操作，当然也可以自己选择取模的模数进行取模。

h（s+c） = （h（s）*p+val【c】）%mod （乘p相当于p进制数左移）
h(t) = (h(s+t) - h(s)*p^length(t))%mod

#include<bits/stdc++.h>
using namespace std;
const int maxn = 1000005;
char word[maxn];
int m;
int mod = INT_MAX;
unsigned long long f1[maxn],f2[maxn],p1[maxn],p2[maxn];
int main()
{
    scanf("%s",word+1);
    int len = strlen(word+1);
    p1[0] = p2[0] = 1;
    for(int i=1;i<=len;i++)
    {
        f1[i] = f1[i-1]*131+(word[i]-'a'+1);
        f2[i] = f2[i-1]*13331+(word[i]-'a'+1);
        p1[i] = p1[i-1]*131;
        p2[i] = p2[i-1]*13331;
    }
    scanf("%d",&m);
    for(int i=1;i<=m;i++)
    {
        int l1,r1,l2,r2;
        scanf("%d%d%d%d",&l1,&r1,&l2,&r2);
        if(f1[r1]-f1[l1-1]*p1[r1-l1+1] == f1[r2]-f1[l2-1]*p1[r2-l2+1] &&
           f2[r1]-f2[l1-1]*p2[r1-l1+1] == f2[r2]-f2[l2-1]*p2[r2-l2+1])
            puts("Yes");
        else puts("No");
    }
}

View Code

posted @ 2019-04-02 13:29 进击的黑仔阅读(257) 评论(0) 收藏举报

刷新页面返回顶部

进击的黑仔

1401 兔子与兔子（字符串哈希）

描述

输入格式

输出格式

样例输入

样例输出

公告