【bzoj4259/bzoj4503】残缺的字符串/两个串 FFT
bzoj4259
题目描述
很久很久以前,在你刚刚学习字符串匹配的时候,有两个仅包含小写字母的字符串A和B,其中A串长度为m,B串长度为n。可当你现在再次碰到这两个串时,这两个串已经老化了,每个串都有不同程度的残缺。
你想对这两个串重新进行匹配,其中A为模板串,那么现在问题来了,请回答,对于B的每一个位置i,从这个位置开始连续m个字符形成的子串是否可能与A串完全匹配?
输入
第一行包含两个正整数m,n(1<=m<=n<=300000),分别表示A串和B串的长度。
第二行为一个长度为m的字符串A。
第三行为一个长度为n的字符串B。
两个串均仅由小写字母和*号组成,其中*号表示相应位置已经残缺。
输出
第一行包含一个整数k,表示B串中可以完全匹配A串的位置个数。
若k>0,则第二行输出k个正整数,从小到大依次输出每个可以匹配的开头位置(下标从1开始)。
样例输入
3 7
a*b
aebr*ob
样例输出
2
1 5
bzoj4503
题目描述
几乎同上,只是B串中不含万能字符,更简单些。
题解
FFT
设两个字符c1、c2的差异度为(c1-c2)^2,那么两个普通字符串能匹配,当且仅当∑(str1[i]-str2[i])^2=0
考虑包含万能字符的情况,由于可以匹配任何字符,则应当把差异度看作0。
即:万能字符为0,其它字符为1~26,差异度为c1*c2*(c1-c2)^2。
展开得c1^3*c2 - 2*c1^2*c2^2 + c1*c2^3。
令题中所给的两个字符串计算差异度,可以分成以上3部分来求,并且每部分都可以化成只包含str1和只包含str2的两个式子的乘积。
并且发现两个位置的差是定值,可以翻转后转化为卷积来求。
于是上FFT出解。
对于4503,可以少考虑一种一个字符为万能字符的情况,所以可以少FFT计算,具体见代码。
bzoj4259:
#include <cstdio>
#include <cmath>
#include <algorithm>
#define N 1 << 20
#define pi acos(-1)
#define tra(ch) (ch == '*' ? 0 : ch - 'a' + 1)
using namespace std;
struct data
{
double x , y;
data() {x = y = 0;}
data(double x0 , double y0) {x = x0 , y = y0;}
data operator+(const data a)const {return data(x + a.x , y + a.y);}
data operator-(const data a)const {return data(x - a.x , y - a.y);}
data operator*(const data a)const {return data(x * a.x - y * a.y , x * a.y + y * a.x);}
}a1[N] , b1[N] , a2[N] , b2[N] , a3[N] , b3[N];
char sa[N] , sb[N];
int ans[N] , tot;
void fft(data *a , int n , int flag)
{
int i , j , k;
for(i = k = 0 ; i < n ; i ++ )
{
if(i > k) swap(a[i] , a[k]);
for(j = (n >> 1) ; (k ^= j) < j ; j >>= 1);
}
for(k = 2 ; k <= n ; k <<= 1)
{
data wn(cos(2 * pi * flag / k) , sin(2 * pi * flag / k));
for(i = 0 ; i < n ; i += k)
{
data t , w(1 , 0);
for(j = i ; j < i + (k >> 1) ; j ++ , w = w * wn)
t = w * a[j + (k >> 1)] , a[j + (k >> 1)] = a[j] - t , a[j] = a[j] + t;
}
}
}
void work(data *a , data *b , int len)
{
int i;
fft(a , len , 1) , fft(b , len , 1);
for(i = 0 ; i < len ; i ++ ) a[i] = a[i] * b[i];
fft(a , len , -1);
for(i = 0 ; i < len ; i ++ ) a[i].x = a[i].x / len;
}
int main()
{
int m , n , i , len;
double tmp;
scanf("%d%d%s%s" , &m , &n , sa , sb);
for(i = 0 ; i < m ; i ++ ) tmp = tra(sa[i]) , a1[m - i - 1].x = tmp , a2[m - i - 1].x = tmp * tmp , a3[m - i - 1].x = tmp * tmp * tmp;
for(i = 0 ; i < n ; i ++ ) tmp = tra(sb[i]) , b1[i].x = tmp * tmp * tmp , b2[i].x = tmp * tmp , b3[i].x = tmp;
for(len = 1 ; len < n + m ; len <<= 1);
work(a1 , b1 , len) , work(a2 , b2 , len) , work(a3 , b3 , len);
for(i = 0 ; i <= n - m ; i ++ )
if(!(int)(a1[i + m - 1].x - 2 * a2[i + m - 1].x + a3[i + m - 1].x + 0.1))
ans[++tot] = i;
printf("%d\n" , tot);
for(i = 1 ; i <= tot ; i ++ ) printf("%d " , ans[i] + 1);
return 0;
}
bzoj4503:
#include <cstdio>
#include <cstring>
#include <cmath>
#include <algorithm>
#define N 1 << 20
#define tra(ch) (ch == '?' ? 0 : ch - 'a' + 1)
#define pi acos(-1)
using namespace std;
struct data
{
double x , y;
data() {x = y = 0;}
data(double x0 , double y0) {x = x0 , y = y0;}
data operator+(const data a)const {return data(x + a.x , y + a.y);}
data operator-(const data a)const {return data(x - a.x , y - a.y);}
data operator*(const data a)const {return data(x * a.x - y * a.y , x * a.y + y * a.x);}
}a1[N] , b1[N] , a2[N] , b2[N];
char sa[N] , sb[N];
int ans[N] , tot;
void fft(data *a , int n , int flag)
{
int i , j , k;
for(i = k = 0 ; i < n ; i ++ )
{
if(i > k) swap(a[i] , a[k]);
for(j = (n >> 1) ; (k ^= j) < j ; j >>= 1);
}
for(k = 2 ; k <= n ; k <<= 1)
{
data wn(cos(2 * pi * flag / k) , sin(2 * pi * flag / k));
for(i = 0 ; i < n ; i += k)
{
data t , w(1 , 0);
for(j = i ; j < i + (k >> 1) ; j ++ , w = w * wn)
t = w * a[j + (k >> 1)] , a[j + (k >> 1)] = a[j] - t , a[j] = a[j] + t;
}
}
}
void work(data *a , data *b , int len)
{
int i;
fft(a , len , 1) , fft(b , len , 1);
for(i = 0 ; i < len ; i ++ ) a[i] = a[i] * b[i];
fft(a , len , -1);
for(i = 0 ; i < len ; i ++ ) a[i].x /= len;
}
int main()
{
int la , lb , i , len;
double tmp , a3 = 0;
scanf("%s%s" , sa , sb) , la = strlen(sa) , lb = strlen(sb);
for(i = 0 ; i < la ; i ++ ) tmp = tra(sa[i]) , a1[i].x = tmp * tmp , a2[i].x = tmp;
for(i = 0 ; i < lb ; i ++ ) tmp = tra(sb[i]) , b1[lb - i - 1].x = tmp , b2[lb - i - 1].x = tmp * tmp , a3 += tmp * tmp * tmp;
for(len = 1 ; len < 2 * la || len < 2 * lb ; len <<= 1);
work(a1 , b1 , len) , work(a2 , b2 , len);
for(i = 0 ; i < la - lb + 1 ; i ++ )
if(!(int)(a1[i + lb - 1].x - 2 * a2[i + lb - 1].x + a3 + 0.1))
ans[++tot] = i;
printf("%d\n" , tot);
for(i = 1 ; i <= tot ; i ++ ) printf("%d\n" , ans[i]);
return 0;
}
浙公网安备 33010602011771号