BZOJ3172 & 洛谷3966 [Tjoi2013]单词 【fail树】

3172: [Tjoi2013]单词

Time Limit: 10 Sec  Memory Limit: 512 MB
Submit: 4293  Solved: 2083
[Submit][Status][Discuss]

Description

某人读论文,一篇论文是由许多单词组成。但他发现一个单词会在论文中出现很多次,现在想知道每个单词分别在论文中出现多少次。

Input

第一个一个整数N,表示有多少个单词,接下来N行每行一个单词。每个单词由小写字母组成,N<=200,单词长度不超过10^6

Output

输出N个整数,第i行的数字表示第i个单词在文章中出现了多少次。

Sample Input

3
a
aa
aaa

Sample Output

6
3
1

第一次遇到这道题的时候,才疏学浅的我用裸的AC自动机竟然A了。。就没有多想什么

后来遇到了阿狸的打字机,听说这题的正解是fail树,于是回来练练手


首先数据很水AC自动机可以直接过


再来正解就是fail树,就是拿fail构造的树

在整个fail图中存在多少u节点所对应的字符串,在fail树中以u为根的子树就有多大


注意:

建立fail指针时,应先将fail[0]置为一个不会用到的值,否则就会遇到根0指向的单词的fail指向自己的情况,普通AC自动机的构建也应加上这个操作


#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#define LL long long int
#define REP(i,n) for (int i = 1; i <= (n); i++)
#define fo(i,x,y) for (int i = (x); i <= (y); i++)
#define Redge(u) for (int k = head[u]; k != -1; k = edge[k].next)
using namespace std;
const int maxn = 1000005,maxm = 205,INF = 1000000000;
//begin 18:51 End 19:04
char P[maxn];
int ch[maxn][26],fail[maxn],sum[maxn],siz = 0,n,q[maxn],head,tail,E[maxm];
void insert(int p){
	int u = 0,len = strlen(P),id;
	for (int i = 0; i <len; i++){
		id = P[i] - 'a';
		++sum[u = ch[u][id] ? ch[u][id] : ch[u][id] = ++siz];
	}
	E[p] = u;
}
void getf(){
	head = 0; tail = 1; fail[0] = -1; int u,v;
	while (head < tail){
		u = q[++head];
		for (int i = 0 ; i < 26; i++){
			v = ch[u][i];
			if (!v) ch[u][i] = ch[fail[u]][i];
			else q[++tail] = v,fail[v] = ch[fail[u]][i];
		}
	}
}
int main()
{
	cin>>n;
	REP(i,n) scanf("%s",P),insert(i);
	getf();
	for (int i = tail; i; i--) sum[fail[q[i]]] += sum[q[i]];
	REP(i,n) printf("%d\n",sum[E[i]]);
	return 0;
}


posted @ 2017-12-01 19:15  Mychael  阅读(122)  评论(0编辑  收藏  举报