POJ2778 DNA Sequence

POJ2778 DNA Sequence

题意

\(m\) 个字符串(只包含 A , T , C , G ), 问有多少长度为 \(n\) 的字符串不含有这 \(m\) 个字串.

其中 \(0 \le m \le 10\), \(1 \le n \le 2 \times 10^9\), 字符串长度不超过 \(10\)

题解

​ 这是一个字符串匹配问题,我们首先想到 AC 自动机,建完 AC 自动机后怎么操作呢,因为字符串是不确定的,我们想到了动态规划。

​ 一个字符串,我们在它后面加上一个字符,如果它还是不含这 \(m\) 个字串,那就说明这个字符是可以加上去的,那么我们就成功的把 \(n\) 长度的状态转移到了 \(n+1\) 长度的状态。

​ 这个题的算法就出来了,我们在 AC 自动机上进行计数 dp,对于每一个节点,我们考虑在它后面添加字符,如果添加完后转移到的节点及其所有的 fail 指针没有指向字符串结尾的节点,说明这是一个有效转移。

\(f[i][j]\)代表长度为 \(i\) 的字符串在 \(j\) 节点时的方案数,起始状态 \(f[0][0]=1\)

Q\(n\) 是 20 亿怎么办?

A : 发现每一次转移的方程都是一样的,我们改用矩阵进行转移,用矩阵快速幂就可以做到复杂度为

\[\sum_{i = 1}^m \text{length of string} \times \log n \]

这种题居然写了 100 行


#include<iostream>
#include<cstdio>
#include<algorithm>
#include<cstring>
#include<queue>
using namespace std;
int read()
{
	int k=0,f=1;char c=getchar();
	for(;!isdigit(c);c=getchar()) if(c=='-') f=-1;
	for(;isdigit(c);c=getchar()) k=k*10+c-'0';return k*f;
}
const int N=405;
const int mod=100000;
int n,m,L;
int tot,ch[N][4],val[N],fail[N];
char s[N];
queue<int> q;
struct matrix
{
	long long a[105][105];
	matrix() {memset(a,0,sizeof(a));}
	matrix operator *(const matrix &b) 
	{
		matrix c;
		for(int i=0;i<=tot;i++)
			for(int j=0;j<=tot;j++)
				for(int k=0;k<=tot;k++)
					c.a[i][j]=(c.a[i][j]+a[i][k]*b.a[k][j])%mod;	
		return c;
	}
};
int Pow(int x,int k) {int ans=1;for(;k;k>>=1,x=1ll*x*x%mod) if(k&1) ans=1ll*ans*x%mod;return ans;}
int get(char x)
{
	if(x=='A') return 0;
	else if(x=='T') return 1;
	else if(x=='C') return 2;
	return 3;
}
void ins(char *s)
{
	int now=0;
	for(int i=0;s[i];i++)
	{
		int x=get(s[i]);
		if(!ch[now][x]) tot++,ch[now][x]=tot;
		now=ch[now][x];
	}
	val[now]=1;
}
void build()
{
	for(int i=0;i<4;i++)
		if(ch[0][i]) q.push(ch[0][i]);
	while(!q.empty())
	{
		int u=q.front();q.pop();
		for(int i=0;i<4;i++)
			if(!ch[u][i]) ch[u][i]=ch[fail[u]][i];
			else fail[ch[u][i]]=ch[fail[u]][i],q.push(ch[u][i]);
	}
}
matrix ksm(matrix a,int p)
{
	matrix c;
	c.a[0][0]=1;
	for(;p;p>>=1,a=a*a)
		if(p&1)
			c=c*a;
	return c;
}
int main()
{
 	m=read();n=read();
	if(!m) {printf("%d\n",Pow(4,n));return 0;}
	for(int i=1;i<=m;i++)
		scanf("%s",s),ins(s);
	build();
	matrix a,b;
	for(int i=0;i<=tot;i++)
	{
		for(int j=0;j<4;j++)
		{
			int fl=1;
			for(int k=i;;k=fail[k])
			{
				if(val[ch[k][j]]) 
				{
					fl=0;
					break;
				}
				if(!k) break; 
			}
			a.a[i][ch[i][j]]+=fl;
		}
	}
	b=ksm(a,n);
	int ans=0;
	for(int i=0;i<=tot;i++)
		for(int j=0;j<=tot;j++)
			ans=(ans+b.a[i][j])%mod;
	printf("%d\n",ans);
	return 0;
}
posted @ 2020-01-12 19:01  waing  阅读(96)  评论(0编辑  收藏  举报