BZOJ2754: [SCOI2012]喵星球上的点名
Description
a180285幸运地被选做了地球到喵星球的留学生。
他发现喵星人在上课前的点名现象非常有趣。
假设课堂上有N个喵星人,每个喵星人的名字由姓和名构成。
喵星球上的老师会选择M个串来点名,每次读出一个串的时候,如果这个串是一个喵星人的姓或名的子串,那么这个喵星人就必须答到。
然而,由于喵星人的字码过于古怪,以至于不能用ASCII码来表示。
为了方便描述,a180285决定用数串来表示喵星人的名字。
现在你能帮助a180285统计每次点名的时候有多少喵星人答到,以及M次点名结束后每个喵星人答到多少次吗?
Input
现在定义喵星球上的字符串给定方法:
先给出一个正整数L,表示字符串的长度,接下来L个整数表示字符串的每个字符。
输入的第一行是两个整数N和M。
接下来有N行,每行包含第i 个喵星人的姓和名两个串。姓和名都是标准的喵星球上的字符串。
接下来有M行,每行包含一个喵星球上的字符串,表示老师点名的串。
Output
对于每个老师点名的串输出有多少个喵星人应该答到。
然后在最后一行输出每个喵星人被点到多少次。
Sample Input
2 3
6 8 25 0 24 14 8 6 18 0 10 20 24 0
7 14 17 8 7 0 17 0 5 8 25 0 24 0
4 8 25 0 24
4 7 0 17 0
4 17 0 8 25
6 8 25 0 24 14 8 6 18 0 10 20 24 0
7 14 17 8 7 0 17 0 5 8 25 0 24 0
4 8 25 0 24
4 7 0 17 0
4 17 0 8 25
Sample Output
2
1
0
1 2
【提示】
事实上样例给出的数据如果翻译成地球上的语言可以这样来看
2 3
izayoi sakuya
orihara izaya
izay
hara
raiz
1
0
1 2
【提示】
事实上样例给出的数据如果翻译成地球上的语言可以这样来看
2 3
izayoi sakuya
orihara izaya
izay
hara
raiz
HINT
【数据范围】
对于30%的数据,保证:
1<=N,M<=1000,喵星人的名字总长不超过4000,点名串的总长不超过2000。
对于100%的数据,保证:
1<=N<=20000,1<=M<=50000,喵星人的名字总长和点名串的总长分别不超过100000,保证喵星人的字符串中作为字符存在的数不超过10000。
题解Here!
先来一发$AC$自动机的暴力,复杂度?$O(\text{能过})$。。。
我当然是开心的写了$AC$自动机 + 暴力转移。。。
每次沿着$fail$指针跳,然后计算, 注意判断是否计算过。
$BUT$!要用$map$存$Trie$树的儿子节点!不然?你说呢。。。
其实我也不想用$STL$,但是出题人太毒了我也没有辨法。。。
附代码:
#include<iostream>
#include<algorithm>
#include<cstdio>
#include<cstring>
#include<queue>
#include<map>
#include<vector>
#define MAXN 100010
using namespace std;
int n,m;
int ans_one[MAXN],ans_two[MAXN];
vector<int> last_name[MAXN],first_name[MAXN];
inline int read(){
int date=0,w=1;char c=0;
while(c<'0'||c>'9'){if(c=='-')w=-1;c=getchar();}
while(c>='0'&&c<='9'){date=date*10+c-'0';c=getchar();}
return date*w;
}
namespace AC{
int size=0;
bool vis[MAXN],mark[MAXN];
vector<int> V,M;
struct AC_Automaton{
int fail;
vector<int> val;
map<int,int> son;
AC_Automaton(){fail=0;}
}a[MAXN];
void insert(int v){
int u=0,l=read();
for(int i=1;i<=l;i++){
int name=read();
if(!a[u].son[name])a[u].son[name]=++size;
u=a[u].son[name];
}
a[u].val.push_back(v);
}
void buildtree(){
int u,v;
queue<int> q;
for(map<int,int>::iterator i=a[0].son.begin();i!=a[0].son.end();i++){
a[i->second].fail=0;
q.push(i->second);
}
while(!q.empty()){
u=q.front();
q.pop();
for(map<int,int>::iterator i=a[u].son.begin();i!=a[u].son.end();i++){
int k=a[u].fail,now=i->first;
while(k&&!a[k].son[now])k=a[k].fail;
a[i->second].fail=a[k].son[now];
q.push(i->second);
}
}
}
void calculate(int x,int u){
for(int i=u;i;i=a[i].fail){
if(!vis[i]){
vis[i]=true;
V.push_back(i);
for(int j=0;j<a[i].val.size();j++)
if(!mark[a[i].val[j]]){
mark[a[i].val[j]]=true;
M.push_back(a[i].val[j]);
ans_one[a[i].val[j]]++;
ans_two[x]++;
}
}
else return;
}
}
void solve(int x){
int u=0;
for(int i=0;i<last_name[x].size();i++){
int c=last_name[x][i];
while(u&&!a[u].son[c])u=a[u].fail;
u=a[u].son[c];
calculate(x,u);
}
u=0;
for(int i=0;i<first_name[x].size();i++){
int c=first_name[x][i];
while(u&&!a[u].son[c])u=a[u].fail;
u=a[u].son[c];
calculate(x,u);
}
for(int i=0;i<V.size();i++)vis[V[i]]=false;
for(int i=0;i<M.size();i++)mark[M[i]]=false;
V.clear();M.clear();
}
}
void work(){
for(int i=1;i<=n;i++)AC::solve(i);
for(int i=1;i<=m;i++)printf("%d\n",ans_one[i]);
for(int i=1;i<=n;i++)printf("%d ",ans_two[i]);
printf("\n");
}
void init(){
int x,y;
n=read();m=read();
for(int i=1;i<=n;i++){
x=read();
for(int j=1;j<=x;j++){
y=read();
last_name[i].push_back(y);
}
x=read();
for(int j=1;j<=x;j++){
y=read();
first_name[i].push_back(y);
}
}
for(int i=1;i<=m;i++)AC::insert(i);
AC::buildtree();
}
int main(){
init();
work();
return 0;
}
然后是正解。
正解:
离线+后缀数组+树状数组。
把所有串串起来建后缀数组,对于每个询问串首向左向右二分找合法区间。
问题就转化成求每个区间包含多少种颜色,和每种颜色被多少区间包含。
都可以用树状数组做。
第一问,有个类似的题:BZOJ1878: [SDOI2009]HH的项链
直接跑树状数组。
第二问跟第一问类似,都是对序列遍历一遍,在区间的左右端点$L,R$,以及当前点和与当前点同色的上一个点$front[i],i$的操作.
第二问是访问到$L$处给树状数组$bit[L]++$,到$R$时$bit[L]--$,到i时查询$sum(i)-sum(front[i])$, 和第一问相反。
复杂度是严格$O(nlog_2n)$的。
但是这个方法常数有点大,我也不知道我哪里写挫了。。。
附代码:
#include<iostream>
#include<algorithm>
#include<cstdio>
#include<cstring>
#include<cmath>
#define MAXN 501010
#define MAX 999999999
using namespace std;
int n,m,q;
int val[MAXN],id[MAXN],colour[MAXN],num[MAXN],bit_one[MAXN],bit_two[MAXN];
int front[MAXN],pos[MAXN],lside[MAXN],lg[MAXN],ans_one[MAXN],ans_two[MAXN];
int size,sa[MAXN],rk[MAXN],tax[MAXN],tp[MAXN],height[MAXN],f[MAXN][20];
struct Question{
int l,r,id;
}que[MAXN];
inline int read(){
int date=0,w=1;char c=0;
while(c<'0'||c>'9')c=getchar();
while(c>='0'&&c<='9'){date=date*10+c-'0';c=getchar();}
return date*w;
}
bool cmp(const Question &p,const Question &q){
return p.r<q.r;
}
void radixsort(){
for(int i=0;i<=size;i++)tax[i]=0;
for(int i=1;i<=n;i++)tax[rk[i]]++;
for(int i=1;i<=size;i++)tax[i]+=tax[i-1];
for(int i=n;i>=1;i--)sa[tax[rk[tp[i]]]--]=tp[i];
}
void suffixsort(int x){
size=x+1;
for(int i=1;i<=n;i++){
rk[i]=val[i];
tp[i]=i;
}
radixsort();
for(int w=1,p=0;p<n;size=p,w<<=1){
p=0;
for(int i=1;i<=w;i++)tp[++p]=n-w+i;
for(int i=1;i<=n;i++)if(sa[i]>w)tp[++p]=sa[i]-w;
radixsort();
swap(tp,rk);
rk[sa[1]]=p=1;
for(int i=2;i<=n;i++)
rk[sa[i]]=(tp[sa[i-1]]==tp[sa[i]]&&tp[sa[i-1]+w]==tp[sa[i]+w])?p:++p;
}
}
void getheight(){
for(int i=1,j,k=0;i<=n;i++){
if(k)k--;
j=sa[rk[i]-1];
while(val[i+k]==val[j+k])k++;
height[rk[i]]=k;
}
}
void step(){
for(int i=1;i<=n;i++)f[i][0]=height[i];
for(int i=1;(1<<i)<=n;i++)
for(int j=1;j+(1<<i)-1<=n;j++)
f[j][i]=min(f[j][i-1],f[j+(1<<(i-1))][i-1]);
for(int i=1;(1<<i)<=n;++i)lg[1<<i]=i;
for(int i=1;i<=n;++i)if(!lg[i])lg[i]=lg[i-1];
}
int query(int l,int r){
if(l==r)return MAX;
if(l>r)swap(l,r);
int k=lg[r-(l++)];
return min(f[l][k],f[r-(1<<k)+1][k]);
}
inline int lowbit(int x){return x&(-x);}
inline void update_one(int x,int v){if(!x)return;for(;x<=n;x+=lowbit(x))bit_one[x]+=v;}
inline void update_two(int x,int v){if(!x)return;for(;x<=n;x+=lowbit(x))bit_two[x]+=v;}
inline int sum_one(int x){int s=0;for(;x;x-=lowbit(x))s+=bit_one[x];return s;}
inline int sum_two(int x){int s=0;for(;x;x-=lowbit(x))s+=bit_two[x];return s;}
void work(){
for(int i=1,j=1,k=1;i<=n;i++){
for(;j<=q&&lside[j]==i;j++)update_two(i,1);
if(colour[sa[i]]>0){
ans_two[colour[sa[i]]]+=sum_two(i)-sum_two(front[i]);
update_one(i,1);update_one(front[i],-1);
}
for(;k<=q&&que[k].r==i;k++){
ans_one[que[k].id]=sum_one(que[k].r)-sum_one(que[k].l-1);
update_two(que[k].l,-1);
}
}
for(int i=1;i<=q;i++)printf("%d\n",ans_one[i]);
for(int i=1;i<=m;i++)printf("%d ",ans_two[i]);
printf("\n");
}
void init(){
int x,w=10001;
n=0;
m=read();q=read();
for(int i=1;i<=m;i++)
for(int j=1;j<=2;j++){
x=read();
while(x--){
colour[++n]=i;
val[n]=read();
}
val[++n]=w;
}
for(int i=1;i<=q;i++){
x=num[n+1]=read();
id[n+1]=i;
while(x--){
colour[++n]=-i;
val[n]=read();
}
val[++n]=w;
}
suffixsort(w);
getheight();
step();
for(int i=1;i<=n;i++){
if(colour[sa[i]]>0){
front[i]=pos[colour[sa[i]]];
pos[colour[sa[i]]]=i;
}
if(id[i]){
que[id[i]].id=id[i];
int l=1,r=rk[i];
while(l<r){
int mid=l+r>>1;
if(query(mid,rk[i])>=num[i])r=mid;
else l=mid+1;
}
que[id[i]].l=lside[id[i]]=l;
l=rk[i];r=n;
while(l<r){
int mid=l+r+1>>1;
if(query(rk[i],mid)>=num[i])l=mid;
else r=mid-1;
}
que[id[i]].r=r;
}
}
sort(que+1,que+q+1,cmp);
sort(lside+1,lside+q+1);
}
int main(){
init();
work();
return 0;
}
还有一种更快的正解:后缀自动机
$SAM$是吊打$SA$,$AC$自动机的一种数据结构。
(坑,未填。。。)

浙公网安备 33010602011771号