【SPOJ 220】 PHRASES - Relevant Phrases of Annihilation

【链接】h在这里写链接


【题意】


    给你n(n<=10)个字符串。
    每个字符串长度最大为1e4;
    问你能不能找到一个子串.
    使得这个子串,在每个字符串里面都不想交出现了至少两次;
    输出子串的最长值。


【题解】


    后缀数组题;
    
        把n个字符串,通过一个连接符连接在一起。
        然后求其后缀数组.

    二分子串的长度
    子串的长度越长显然就越不可能。
        然后在连续的Height里找大于等于二分长度mid的组
        看看是不是每个组都有弄到两次以上.
        以及每个组的最大值Sa和最小值Sa之差是不是大于等于枚举的长度
        (实际上只要知道Sa最大最小之差大于等于枚举的长度就可以了。。次数不用判。因为
            如果次数为1,差肯定是0)
        是的话,直接返回true;
    返回false;


【错的次数】


0

【反思】


'z'+10超过了最大的ascill码。。
所以会RE
所以特殊的字符选1..10就好。。。

【代码】

#include<bits/stdc++.h>
using namespace std;

const int N = 1e5 + 500;
const int MAX_CHAR = 255;//每个数字的最大值。
char s[N + 10];//如果是数字,就写成int s[N+10]就好,从0开始存
int Sa[N + 10], T1[N + 10], T2[N + 10], C[N + 10];
int Height[N + 10], Rank[N + 10];

void build_Sa(int n, int m) {
	int i, *x = T1, *y = T2;
	for (i = 0; i<m; i++) C[i] = 0;
	for (i = 0; i<n; i++) C[x[i] = s[i]]++;
	for (i = 1; i<m; i++) C[i] += C[i - 1];
	for (i = n - 1; i >= 0; i--) Sa[--C[x[i]]] = i;
	for (int k = 1; k <= n; k <<= 1)
	{
		int p = 0;
		for (i = n - k; i<n; i++) y[p++] = i;
		for (i = 0; i<n; i++) if (Sa[i] >= k) y[p++] = Sa[i] - k;
		for (i = 0; i<m; i++) C[i] = 0;
		for (i = 0; i<n; i++) C[x[y[i]]]++;
		for (i = 1; i<m; i++) C[i] += C[i - 1];
		for (i = n - 1; i >= 0; i--) Sa[--C[x[y[i]]]] = y[i];
		swap(x, y);
		p = 1; x[Sa[0]] = 0;
		for (i = 1; i<n; i++)
			x[Sa[i]] = y[Sa[i - 1]] == y[Sa[i]] && y[Sa[i - 1] + k] == y[Sa[i] + k] ? p - 1 : p++;
		if (p >= n) break;
		m = p;
	}
}

void getHeight(int n)
{
	int i, j, k = 0;
	for (i = 1; i <= n; i++) Rank[Sa[i]] = i;
	for (i = 0; i<n; i++) {
		if (k) k--;
		j = Sa[Rank[i] - 1];
		while (s[i + k] == s[j + k]) k++;
		Height[Rank[i]] = k;
	}
}

const int MAXN = 10;
const int INF = 0x3f3f3f3f;
int T,n,len;
int a[MAXN + 10][3],idx[N+10];

bool ok(int l)
{
	for (int i = 1; i <= n; i++)
		a[i][1] = INF, a[i][2] = -INF;
	for (int i = 2; i <= len; i++)
		if (Height[i]>=l)
		{
			int pre = idx[Sa[i - 1]], now = idx[Sa[i]];
			a[pre][1] = min(a[pre][1], Sa[i - 1]); a[pre][2] = max(a[pre][2], Sa[i - 1]);
			a[now][1] = min(a[now][1], Sa[i]); a[now][2] = max(a[now][2], Sa[i]);
		}
		else
		{
			bool ok1 = true;
			for (int i = 1; i <= n; i++) if (a[i][1] + l - 1 >= a[i][2]) ok1 = false;
			if (ok1) return true;
			for (int i = 1; i <= n; i++) a[i][1] = INF, a[i][2] = -INF;
		}
	return false;
}

const int PN = 1e4;
char ts[PN + 10];

int main() {
	//freopen("F:\\rush.txt", "r", stdin);
	scanf("%d", &T);
	while (T--)
	{
		len = 0;
		scanf("%d", &n);
		for (int i = 1; i <= n; i++)
		{
			scanf("%s", ts);
			int ls = strlen(ts);
			for (int j = 0; j < ls; j++) {
				idx[len] = i;
				s[len++] = ts[j];
			}
			//s[len++] = 'z' + i;n=10的时候会超过ascill码的范围。。。 120几就超过了。。'z'是122.。
			s[len++] = i;
		}
		s[len] = 0;
		build_Sa(len + 1, MAX_CHAR);
		getHeight(len);
		int l = 1, r = 1e4, temp = 0;
		while (l <= r)
		{
			int mid = (l + r) >> 1;
			if (ok(mid))
			{
				temp = mid;
				l = mid + 1;
			}
			else
				r = mid - 1;
		}
		printf("%d\n", temp);
	}
	return 0;


posted @ 2017-10-04 18:44  AWCXV  阅读(162)  评论(0编辑  收藏  举报