bzoj 3238 [Ahoi2013]差异 后缀数组 + 单调栈

题目链接

Description

一个长度为\(n\)的字符串\(S\),令\(T_i\)表示它从第\(i\)个字符开始的后缀。求$$\sum_{1\leq i\leq j\leq n}len(T_i)+len(T_j)-2*lcp(T_i,T_j)$$其中,\(len(a)\)表示字符串\(a\)的长度,\(lcp(a,b)\)表示字符串\(a\)和字符串\(b\)的最长公共前缀。

\(2\leq n\leq 500000\)

思路

\(O(n^2)\)枚举显然是不可行的,应从 贡献 的角度取思考问题。

首先,每个后缀都被计算 \(n-1\) 次,如果不减去\(lcp\)的话,则答案为$$(1+2+...+n)(n-1)=\frac{(n+1)n*(n-1)}{2}$$

再来考虑\(lcp\),因为任意两个后缀的\(lcp\)的长度即为\(height\)数组的区间最小值,所以要减去的即为 所有区间的最小值之和

即考虑每个点向左向右可以延伸多远,所有区间最小值之和即为

\[\sum_{i=1}^{n}(r[i]-i+1)*(i-l[i]+1)*h[i] \]

// 注意,区间个数要用乘法原则。

\(l\)\(r\)数组的计算用 单调栈 即可,如poj 2796 Feel Good.

Code

#include <bits/stdc++.h>
#define maxn 500010
using namespace std;
typedef long long LL;
int wa[maxn], wb[maxn], wv[maxn], wt[maxn], h[maxn], rk[maxn], sa[maxn], n, r[maxn], l[maxn], st[maxn];
char s[maxn];
bool cmp(int* r, int a, int b, int l) { return r[a] == r[b] && r[a+l] == r[b+l]; }
void init(int* r, int* sa, int n, int m) {
    int* x=wa, *y=wb, *t, i, j, p;
    for (i = 0; i < m; ++i) wt[i] = 0;
    for (i = 0; i < n; ++i) ++wt[x[i] = r[i]];
    for (i = 1; i < m; ++i) wt[i] += wt[i - 1];
    for (i = n-1; i >= 0; --i) sa[--wt[x[i]]] = i;
    for (j = 1, p = 1; p < n; j <<= 1, m = p) {
        for (p = 0, i = n-j; i < n; ++i) y[p++] = i;
        for (i = 0; i < n; ++i) if (sa[i] >= j) y[p++] = sa[i] - j;
        for (i = 0; i < n; ++i) wv[i] = x[y[i]];
        for (i = 0; i < m; ++i) wt[i] = 0;
        for (i = 0; i < n; ++i) ++wt[wv[i]];
        for (i = 1; i < m; ++i) wt[i] += wt[i - 1];
        for (i = n-1; i >= 0; --i) sa[--wt[wv[i]]] = y[i];
        t = x, x = y, y = t, x[sa[0]] = 0;
        for (p = 1, i = 1; i < n; ++i) x[sa[i]] = cmp(y, sa[i], sa[i-1], j) ? p - 1 : p++;
    }
    for (i = 0; i < n; ++i) rk[sa[i]] = i;
    int k = 0;
    for (i = 0; i < n - 1; h[rk[i++]] = k) {
        for (k = k ? --k : 0, j = sa[rk[i] - 1]; r[i+k] == r[j+k]; ++k);
    }
}
int main() {
    scanf("%s", s);
    int tot=0, m=0, len=strlen(s);
    for (int i = 0; i < len; ++i) m = max(r[tot++] = s[i], m); r[tot++] = 0;
    init(r, sa, tot, ++m);
    int top=0;
    LL ans = 1LL * (len+1) * len / 2 * (len-1);
    h[tot] = -1;
    for (int i = 2; i <= tot; ++i) {
        int ll = i;
        while (top && h[i]<h[st[top-1]]) {
            --top;
            ans -= 1LL * h[st[top]] * (i-st[top]) * (st[top]-(ll=l[st[top]])+1) * 2;
        }
        st[top++] = i; l[i] = ll;
    }
    printf("%lld\n", ans);
    return 0;
}

posted @ 2018-02-12 12:09  救命怀  阅读(130)  评论(0编辑  收藏  举报