bzoj1030 [JSOI2007]文本生成器

题意

JSOI交给队员ZYX一个任务,编制一个称之为“文本生成器”的电脑软件:该软件的使用者是一些低幼人群,他们现在使用的是GW文本生成器v6版。该软件可以随机生成一些文章―――总是生成一篇长度固定且完全随机的文章—— 也就是说,生成的文章中每个字节都是完全随机的。如果一篇文章中至少包含使用者们了解的一个单词,那么我们说这篇文章是可读的(我们称文章a包含单词b,当且仅当单词b是文章a的子串)。但是,即使按照这样的标准,使用者现在使用的GW文本生成器v6版所生成的文章也是几乎完全不可读的。ZYX需要指出GW文本生成器 v6生成的所有文本中可读文本的数量,以便能够成功获得v7更新版。你能帮助他吗?

题解

补集转化,\(ans = 26 ^ m\) - 不含任何单词的文本数。
$ dp[i][j] $ 表示考虑到了第i位,在ac自动机的第j个节点上。显然可以由$ dp[i][j] $ 转移到$ dp[i + 1][k (k是j的可走的儿子)] $ 上。
这位能不能填k,判断方法是从j开始向$ fail[j] $跳,看是不是有一个j有一个k儿子,并且k儿子上还有结束标记,只要有一个就证明如果i+1位填k就会让整个字符串出现AC自动机上的字符串,所以不能填k(要理解这一段需要理解ac自动机的fail的本质,而不是单纯背板)。
显然最后答案为 \(\sum dp[m][k]\)

#include<set>
#include<queue>
#include<cstdio>
#include<vector>
#include<cstring>
#include<iostream>
#include<algorithm>
using namespace std;

inline int read() {
	int x = 0, flag = 1; char ch = getchar();
	while (ch > '9' || ch < '0') { if (ch == '-') flag = -1; ch = getchar(); }
	while (ch <= '9' && ch >= '0') { x = x * 10 + ch - '0'; ch = getchar(); }
	return x * flag;
}

#define rep(ii, aa, bb) for (int ii = aa; ii <=  bb; ii++)
#define ll long long
#define N 7001
#define ha 10007

int ch[N][26], no[N], fail[N], tot;
int dp[101][N];
char s[105];

void inzert() {
	int i, u = 0, len = strlen(s);
	rep(i, 0, len - 1) {
		if (!ch[u][s[i] - 64]) ch[u][s[i] - 64] = ++tot;
		u = ch[u][s[i] - 64];
	}
	no[u] = 1;
}

queue<int> q;
void build() {
	rep(i, 1, 26) if (ch[0][i]) q.push(ch[0][i]);
	while (q.size()) {
		int u = q.front(); q.pop();
		no[u] |= no[fail[u]];
		rep(i, 1, 26) {
			int v = ch[u][i];
			if (v) {
				fail[v] = ch[fail[u]][i];
				q.push(v);
			}
			else ch[u][i] = ch[fail[u]][i];
		}
	}
}
int main() {
	int n, m;
	scanf("%d%d", &n, &m);
	while (n--) {
		scanf("%s", s);
		inzert();
	}

	build();
	dp[0][0] = 1;
	rep(i, 1, m) rep(j, 0, tot)
		if (!no[j] && dp[i - 1][j])
			rep(k, 1, 26)
				dp[i][ch[j][k]] = (dp[i][ch[j][k]] + dp[i - 1][j]) % ha;
	int ans = 0, sna = 1;
	rep(i, 0, tot) if (!no[i]) ans += dp[m][i];
	rep(i, 1, m) sna = (sna * 26) % ha;
	printf("%d", ((sna - ans) % ha + ha) % ha);
	return 0;
}
posted @ 2018-02-05 09:12  aziint  阅读(88)  评论(0编辑  收藏
Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.