如何用 Lyndon 薄纱 SA

没卡常,目前用时是次优解的一半左右。

推销 Lyndon 理论学习笔记(没写完)

P5108 仰望半月的夜空

给一个字符串 \(s\),对 \(i\in[1,|s|]\) 问长度为 \(i\) 的最小子串的第一次出现。

先给复杂度:问最后一次出现可以 \(O(|s|)\),问第一次出现可以结合哈希二分做到 \(O(|s|\log|s|)\)

字典序问题,可以在 Lyndon 分解上考虑,设分解得到 \(s=w_1+\dots+w_k\)

考虑长度为 \(i\) 的最小子串在哪里起头。首先根据 Lyndon 串的定义,在某个 \(w_p\) 中间起头肯定不优,

而且分解出的 Lyndon 串字典序是单调不增的,所以应该在尽量靠后的 \(w_p\) 起头,

所以可以得出结论:应该在 \(|w_p+w_{p+1}+\dots+w_k|\ge i\) 的最后一个 \(w_p\) 处起头,

但这个子串不一定只在这里出现,考虑它还在哪里出现过。

分解出的 Lyndon 串字典序是单调不增的,所以这个子串只在 \(w_p\) 及其前的若干个 Lyndon 串中出现。

二分这个子串最早在哪里出现即可。

#include <cstdio>
#include <cstring>
char _[300050];
int n, o, S, l[300050], a[300050];
unsigned long long p[300050], h[300050];
int Q(int l, int r) { return h[r] - h[l - 1] * p[r - l + 1]; }
int main()
{
    scanf("%d%d", &S, &n);
    if (S == 26)
    {
        scanf("%s", _ + 1);
        for (int i = 1; i <= n; ++i)
            a[i] = _[i];
    }
    else
    {
        for (int i = 1; i <= n; ++i)
            scanf("%d", a + i);
    }
    for (int i = p[0] = 1; i <= n; ++i)
        p[i] = p[i - 1] * 10000019, h[i] = h[i - 1] * 10000019 + a[i];
    int i = 1, j, k;
    while (i <= n)
    {
        j = i + 1, k = i;
        while (j <= n)
        {
            if (a[j] == a[k])
                ++j, ++k;
            else if (a[j] > a[k])
                ++j, k = i;
            else
                break;
        }
        while (i <= k)
            l[++o] = i, i += j - k;
    }
    for (int i = 1, j = o; i <= n; ++i)
    {
        if (n - l[j] + 1 < i)
            --j;
        int L = 1, R = j;
        while (L <= R)
        {
            int M = L + R >> 1;
            if (Q(l[M], l[M] + i - 1) == Q(l[j], l[j] + i - 1))
                R = M - 1;
            else
                L = M + 1;
        }
        printf("%d ", l[L]);
    }
    return 0;
}
posted @ 2025-01-09 11:36  Jijidawang  阅读(96)  评论(2)    收藏  举报