【BZOJ 4310】跳蚤
【链接】h在这里写链接
【题意】
给你一个字符串;
让你把它分割成最多k个部分。
然后求出每个部分的字符串里面子串的字典序最大的那一个子串。
然后在这k个子串里面,再选一个字典序最最大的那个。
作为魔法串。
要求这个魔法串的字典序尽可能地小.
让你把它分割成最多k个部分。
然后求出每个部分的字符串里面子串的字典序最大的那一个子串。
然后在这k个子串里面,再选一个字典序最最大的那个。
作为魔法串。
要求这个魔法串的字典序尽可能地小.
【题解】
后缀数组题。
首先,求出这个串的后缀数组。
然后看到最大最小这些字样,就应该想到是一道二分的题目了;
二分啥呢??
字典序!
先求出这个字符串的所有不同的子串个数。
个数就为∑(len-sa[i]-height[i]);
把这个值作为二分的右端点.
字典序为mid的子串.
->可以枚举排名,然后获取出本质排名为mid的子串是哪一个
又题意等价于,最后的子串,大于等于各个部分的字符串里的所有子串的字典序的最大值.
所以我们可以贪心地选取区间,从最后一个字符开始,逆序往前找,用i枚举,看看这个区间i..区间右端点
这个子串是不是大于二分的子串,如果是的话,那么就要新加一个区间。这样才能避免子串比所有区间的
字符串的最大字典序子串来得大。
(比较可以预处理出来lcp比较,要用到ST表
->但也有不可能的情况,即这个字符比二分的子串的首字母来得大,那就直接返回false;
否则的话,最后选取的区间的个数如果小于等于k的话,返回true;
否则返回false;
可以保证,最后二分出来的子串,不会出现在选取的区间的交界处(即横跨两个区间);
因为如果那样的话(子串横跨),就说明这个选取出来的子串它是比所有区间的子串的最大字典序来得大的.
那么总可以让他的字典序小一点.使得它是某个区间里面的子串。
即让>变成==
记录下选取的子串的左端点和右端点就好。
(关于本质不同的子串:排名为i的后缀,本来应该有len-Sa[i]个子串,但是因为会和排名第i-1的后缀重
复Height[i]个,所以要减去Heigh[i]个,则不同的子串数目就是上面那个式子了)
首先,求出这个串的后缀数组。
然后看到最大最小这些字样,就应该想到是一道二分的题目了;
二分啥呢??
字典序!
先求出这个字符串的所有不同的子串个数。
个数就为∑(len-sa[i]-height[i]);
把这个值作为二分的右端点.
字典序为mid的子串.
->可以枚举排名,然后获取出本质排名为mid的子串是哪一个
又题意等价于,最后的子串,大于等于各个部分的字符串里的所有子串的字典序的最大值.
所以我们可以贪心地选取区间,从最后一个字符开始,逆序往前找,用i枚举,看看这个区间i..区间右端点
这个子串是不是大于二分的子串,如果是的话,那么就要新加一个区间。这样才能避免子串比所有区间的
字符串的最大字典序子串来得大。
(比较可以预处理出来lcp比较,要用到ST表
->但也有不可能的情况,即这个字符比二分的子串的首字母来得大,那就直接返回false;
否则的话,最后选取的区间的个数如果小于等于k的话,返回true;
否则返回false;
可以保证,最后二分出来的子串,不会出现在选取的区间的交界处(即横跨两个区间);
因为如果那样的话(子串横跨),就说明这个选取出来的子串它是比所有区间的子串的最大字典序来得大的.
那么总可以让他的字典序小一点.使得它是某个区间里面的子串。
即让>变成==
记录下选取的子串的左端点和右端点就好。
(关于本质不同的子串:排名为i的后缀,本来应该有len-Sa[i]个子串,但是因为会和排名第i-1的后缀重
复Height[i]个,所以要减去Heigh[i]个,则不同的子串数目就是上面那个式子了)
【错的次数】
0
【反思】
在这了写反思
【代码】
#include<bits/stdc++.h>
using namespace std;
#define ll long long
const int N = 1e5;
const int MAX_CHAR = 255;//每个数字的最大值。
const int MAXL = 18;//log2数组的最大长度
const int INF = 0x3f3f3f3f;//数值绝对值的最大值
char s[N + 10];//如果是数字,就写成int s[N+10]就好,从0开始存
int Sa[N + 10], T1[N + 10], T2[N + 10], C[N + 10];
int Height[N + 10], Rank[N + 10];
int n,k,t_l,t_r,ans_l,ans_r;
void build_Sa(int n, int m) {
int i, *x = T1, *y = T2;
for (i = 0; i<m; i++) C[i] = 0;
for (i = 0; i<n; i++) C[x[i] = s[i]]++;
for (i = 1; i<m; i++) C[i] += C[i - 1];
for (i = n - 1; i >= 0; i--) Sa[--C[x[i]]] = i;
for (int k = 1; k <= n; k <<= 1)
{
int p = 0;
for (i = n - k; i<n; i++) y[p++] = i;
for (i = 0; i<n; i++) if (Sa[i] >= k) y[p++] = Sa[i] - k;
for (i = 0; i<m; i++) C[i] = 0;
for (i = 0; i<n; i++) C[x[y[i]]]++;
for (i = 1; i<m; i++) C[i] += C[i - 1];
for (i = n - 1; i >= 0; i--) Sa[--C[x[y[i]]]] = y[i];
swap(x, y);
p = 1; x[Sa[0]] = 0;
for (i = 1; i<n; i++)
x[Sa[i]] = y[Sa[i - 1]] == y[Sa[i]] && y[Sa[i - 1] + k] == y[Sa[i] + k] ? p - 1 : p++;
if (p >= n) break;
m = p;
}
}
struct abc{
int pre2[MAXL+5],need[N+10];
int fmax[N+10][MAXL+5],fmin[N+10][MAXL+5];
void init()
{
pre2[0] = 1;
for (int i = 1;i <= MAXL;i++)
{
pre2[i] = pre2[i-1]<<1;
}
need[1] = 0; need[2] = 1;
int temp = 2;
for (int i = 3; i <= n; i++)//need[i]表示长度为i是2的多少次方,可以理解为[log2i]
if (pre2[temp] == i)
need[i] = need[i - 1] + 1, temp++;
else
need[i] = need[i - 1];
}
void getst(int *a,int n)
{
memset(fmax,-INF,sizeof fmax);
memset(fmin,INF,sizeof fmin);
for (int i = 1;i <= n;i++)//下标从0开始就改成对应的就好
fmax[i][0] = fmin[i][0] = a[i];
for (int l = 1;pre2[l]<=n;l++)
for (int i = 1;i <= n;i++)
if (i+pre2[l]-1<=n)
fmax[i][l] = max(fmax[i][l-1],fmax[i+pre2[l-1]][l-1]);
for (int l = 1;pre2[l]<=n;l++)
for (int i = 1;i <= n;i++)
if (i+pre2[l]-1<=n)
fmin[i][l] = min(fmin[i][l-1],fmin[i+pre2[l-1]][l-1]);
}
int getmin(int l,int r)
{
int len = need[r-l+1];
return min(fmin[l][len],fmin[r-pre2[len]+1][len]);
}
int getmax(int l,int r)
{
int len = need[r-l+1];
return max(fmax[l][len],fmax[r-pre2[len]+1][len]);
}
}ST;
void getHeight(int n)
{
int i, j, k = 0;
for (i = 1; i <= n; i++) Rank[Sa[i]] = i;
for (i = 0; i<n; i++) {
if (k) k--;
j = Sa[Rank[i] - 1];
while (s[i + k] == s[j + k]) k++;
Height[Rank[i]] = k;
}
}
void kth(ll pos)
{
for (int i = 1;i <= n;i++)
if (pos > n - Sa[i] - Height[i])
{
pos -= n - Sa[i] - Height[i];
}
else
{
t_l = Sa[i];
t_r = Sa[i] + Height[i] + (int)pos - 1;
break;
}
}
int calc(int x1, int y1)
{
if (x1 == y1) return INF;
return ST.getmin(min(Rank[x1], Rank[y1])+1,max(Rank[x1],Rank[y1]));//排名的较小值到最大值之间
//的Height的最小值
}
bool cmp(int x1, int y1, int x2,int y2)
{
int l1 = y1 - x1 + 1, l2 = y2 - x2 + 1, lcp = calc(x1, x2);
if (lcp >= l1)
return l1 <= l2;
else
if (lcp >= l2) return 0;//l2 <= lcp < l1
else
return s[x1+lcp] <= s[x2+lcp];
}
bool ok()
{
int last = n - 1,p = 1;
for (int i = n - 1; i >= 0; i--)
if (s[i] > s[t_l]) return 0;
else
if (cmp(i,last,t_l,t_r) == 0)
{
p++;
last = i;
}
if (p > k) return false;
return true;
}
int main() {
//freopen("F:\\rush.txt", "r", stdin);
scanf("%d", &k);
scanf("%s", s);
n = strlen(s);
s[n] = 0;
build_Sa(n + 1, MAX_CHAR);//注意调用n+1
getHeight(n);
ST.init();
ST.getst(Height, n);
ll r = 0;
for (int i = 1; i <= n; i++) r += (n - Sa[i] - Height[i]);
ll l = 1;
while (l <= r)
{
ll mid = (l + r) >> 1;
kth(mid);
if (ok())
{
ans_l = t_l,ans_r = t_r;
r = mid - 1;
}
else
{
l = mid + 1;
}
}
for (int i = ans_l; i <= ans_r; i++)
putchar(s[i]);
puts("");
return 0;
}
浙公网安备 33010602011771号