CodeForces 547E Mike and Friends AC自动机 主席树

题意:

给出\(n\)个字符串\(s_i\)\(q\)个询问:

  • \(l,r,k\)\(\sum\limits_{i=l}^{r}count(i, k)\),其中\(count(i,j)\)表示\(s_j\)作为子串在\(s_i\)中出现的次数

分析:

先不考虑查询中\(l,r\)的限制,考虑该字符串\(s_k\)在一个字符串集合中出现的次数。
先将这个字符串集合插入到一棵Trie数中,并且每经过一个节点就将其对应的\(val\)值加\(1\)
这样\(s_k\)对应节点的\(val\)值就是以\(s_k\)前缀的字符串的个数。
然而这还不够,接着构造出一棵fail树,也就是AC自动机中的fail指针构成的树。
这棵fail树中,父节点是子节点的后缀
因为fail树中\(s_k\)是其子节点的后缀,所以再加上子树节点的\(val\)值。
这样就把问题转化为了求子树节点的权值之和:

利用DFS序将子树转为区间,然后用线段树维护区间和

然后考虑上题中的\(l,r\),可以将线段树可持久化或者离线查询加树状数组维护,而且离线应该是很快的。

#include <cstdio>
#include <cstring>
#include <algorithm>
#include <vector>
#include <map>
#include <set>
#include <queue>
using namespace std;
typedef long long LL;
typedef pair<int, int> PII;
#define PB push_back
#define PII pair<int, int>
#define REP(i, a, b) for(int i = a; i < b; i++)
#define PER(i, a, b) for(int i = b - 1; i >= a; i--)
#define ALL(x) x.begin(), x.end()

const int maxn = 200000 + 10;
const int nlogn = maxn * 40;

//persistant segment tree
int lch[nlogn], rch[nlogn], sum[nlogn];
int tot, root[maxn], p[maxn];

void update(int& rt, int pre, int L, int R, int p, int v = 1) {
	rt = ++tot;
	if(L == R) { sum[rt] = sum[pre] + v; return; }
	int M = (L + R) / 2;
	if(p <= M) { rch[rt] = rch[pre]; update(lch[rt], lch[pre], L, M, p, v); }
	else { lch[rt] = lch[pre]; update(rch[rt], rch[pre], M+1, R, p, v); }
	sum[rt] = sum[lch[rt]] + sum[rch[rt]];
}

int qL, qR;
int query(int rt, int pre, int L, int R) {
	int ans = 0;
	if(qL <= L && R <= qR) return sum[rt] - sum[pre];
	int M = (L + R) / 2;
	if(qL <= M) ans += query(lch[rt], lch[pre], L, M);
	if(qR > M) ans += query(rch[rt], rch[pre], M+1, R);
	return ans;
}

//fail tree
vector<int> G[maxn];
int l[maxn], r[maxn], dfs_clock;

void dfs(int u) {
	l[u] = ++dfs_clock;
	for(int v : G[u]) dfs(v);
	r[u] = dfs_clock;
}

//Trie
int sz;
int ch[maxn][26], f[maxn], pos[maxn], fa[maxn];

void insert(int id, char* s) {
	int u = 0;
	for(int i = 0; s[i]; i++) {
		int c = s[i] - 'a';
		if(!ch[u][c]) {
			ch[u][c] = ++sz;
			memset(ch[sz], 0, sizeof(ch[0]));
		}
		fa[ch[u][c]] = u;
		u = ch[u][c];
	}
	pos[id] = u;
}

void getFail() {
	queue<int> Q;
	REP(c, 0, 26) if(ch[0][c]) {
		Q.push(ch[0][c]);
		G[0].PB(ch[0][c]);
	}
	while(!Q.empty()) {
		int r = Q.front(); Q.pop();
		REP(c, 0, 26) {
			int u = ch[r][c];
			if(!u) ch[r][c] = ch[f[r]][c];
			else {
				f[u] = ch[f[r]][c];
				G[f[u]].PB(u);
				Q.push(u);
			}
		}
	}
}

int n, q;
char s[maxn];

int main() {
	scanf("%d%d", &n, &q);
	REP(i, 0, n) {
		scanf("%s", s);
		insert(i + 1, s);
	}
	getFail();
	dfs(0);
	int cur = 0, s;
	REP(i, 1, n + 1) {
		for(int j = pos[i]; j; j = fa[j]) {
			cur++;
			update(root[cur], root[cur-1], 1, dfs_clock, l[j]);
		}
		p[i] = root[cur];
	}

	while(q--) {
		int x, y, k; scanf("%d%d%d", &x, &y, &k);
		qL = l[pos[k]], qR = r[pos[k]];
		printf("%d\n", query(p[y], p[x-1], 1, dfs_clock));
	}

	return 0;
}
posted @ 2017-12-06 19:14  AOQNRMGYXLMV  阅读(...)  评论(...编辑  收藏