Codeforces 356E - Xenia and String Problem(哈希)

Codeforces 题面传送门 & 洛谷题面传送门

首先显然一个 gray 串的长度只可能是 \(2^k-1\),其中 \(k\in\mathbb{Z}\)

考虑将一个字符改成另外一个字符会对答案产生什么样的影响。显然原来包含这个字符的 gray 串的贡献都应被减掉,新出现的 gray 串的贡献又应被加上。我们分别计算两部分的贡献。

对于第一部分,由于 gray 串最多只可能有 \(n\log n\),因此我们逐一枚举它们并差分一下它们贡献。那么如何检验一个长度为 \(2^k-1\) 的字符串是否符合要求呢?考虑倍增。设 \(is_{i,j}\) 表示以 \(s_j\) 开头的长度为 \(2^i-1\) 的字符串是否符合要求,那么 \(is_{i,j}\)\(1\) 当且仅当 \(is_{i-1,j},is_{i-1,j+2^{i-1}}\) 均为 \(1\),并且 \(s[j...j+2^{i-1}-2]=s[j+2^{i-1}...j+2^i-2]\),且 \(s_{j+2^{i-1}-1}\)\(s[j...j+2^i-2]\) 中只出现过一次。这个很好判断。

对于第二部分,我们考虑一个长度为 \(2^{k}-1\) 字符串在修改哪些字符的情况下会变成 gray 串。分三种情况:改左边、改中间、改右边。第一种和第三种本质上是相同的,因此这里只考虑第一种和第二种。如果修改中间字符,那么要求左右两边的子串相同并且都是 gray 串,并且修改过的字符在子串中只出现一次。如果修改左边字符串中的字符,那么修改方式显然是唯一的——就是左右两部分唯一不同的字符串,可以通过二分+hash 求出 LCP 和 LCS 后知道要修改哪个字符,然后再检验下改过之后的字符串是否符合要求即可。

总之是一道不算太难的哈希练手题。

const int MAXN=1e5;
const int LOG_N=17;
int n;char s[MAXN+5];
ll d[MAXN+5],add[MAXN+5][28];
struct hsh{
	int BS,MOD;
	int hs[MAXN+5],pw[MAXN+5];
	void init(){
		for(int i=(pw[0]=1);i<=n;i++) pw[i]=1ll*pw[i-1]*BS%MOD;
		for(int i=1;i<=n;i++) hs[i]=(1ll*hs[i-1]*BS+s[i])%MOD;
	}
	int gethash(int l,int r){return (hs[r]-1ll*pw[r-l+1]*hs[l-1]%MOD+MOD)%MOD;}
} h1,h2;
bool check(int l1,int r1,int l2,int r2){
	return h1.gethash(l1,r1)==h1.gethash(l2,r2)&&
		   h2.gethash(l1,r1)==h2.gethash(l2,r2);
}
int occ[MAXN+5][28];
bool is[LOG_N+2][MAXN+5];
int getocc(int c,int l,int r){return occ[r][c]-occ[l-1][c];}
int getlcp(int x,int y){
	int l=1,r=n-max(x,y)+1,p=0;
	while(l<=r){
		int mid=l+r>>1;
		if(check(x,x+mid-1,y,y+mid-1)) p=mid,l=mid+1;
		else r=mid-1;
	} return p;
}
int getlcs(int x,int y){
	int l=1,r=min(x,y),p=0;
	while(l<=r){
		int mid=l+r>>1;
		if(check(x-mid+1,x,y-mid+1,y)) p=mid,l=mid+1;
		else r=mid-1;
	} return p;
}
int main(){
	scanf("%s",s+1);n=strlen(s+1);
	h1.BS=191;h1.MOD=998244853;h2.BS=193;h2.MOD=1004535809;
	h1.init();h2.init();
	for(int i=1;i<=n;i++){
		for(int j=0;j<26;j++) occ[i][j]=occ[i-1][j];
		occ[i][s[i]-'a']++;
	}
	for(int i=1;i<=n;i++) is[1][i]=1;ll sum=n;
	for(int i=2;i<=LOG_N;i++) for(int j=1;j+(1<<i)-2<=n;j++){
		is[i][j]=is[i-1][j]&is[i-1][j+(1<<i-1)];
		if(is[i][j]){
			is[i][j]&=check(j,j+(1<<i-1)-2,j+(1<<i-1),j+(1<<i)-2);
			is[i][j]&=(getocc(s[j+(1<<i-1)-1]-'a',j,j+(1<<i)-2)==1);
			if(is[i][j]){
				int len=(1<<i)-1;sum+=1ll*len*len;
				d[j]+=1ll*len*len;d[j+(1<<i)-1]-=1ll*len*len;
			}
		}
//		printf("%d %d %d\n",i,j,is[i][j]);
	}
	for(int i=1;i<=n;i++) d[i]+=d[i-1];
	ll dlt=0;
	for(int i=2;i<=LOG_N;i++) for(int j=1;j+(1<<i)-2<=n;j++){
		if(!is[i-1][j]&&!is[i-1][j+(1<<i-1)]) continue;
		int len=(1<<i)-1;ll bnf=1ll*len*len;
		if(is[i-1][j]&&is[i-1][j+(1<<i-1)]){
			if(check(j,j+(1<<i-1)-2,j+(1<<i-1),j+(1<<i)-2)){
				for(int c=0;c<26;c++) if(!getocc(c,j,j+(1<<i)-2)){
					add[j+(1<<i-1)-1][c]+=bnf;
				}
			}
		} if(is[i-1][j+(1<<i-1)]){
			int lcp=getlcp(j,j+(1<<i-1)),lcs=getlcs(j+(1<<i-1)-2,j+(1<<i)-2);
			if(lcp+lcs==(1<<i-1)-2){
				int ori=s[j+lcp]-'a',nd=s[j+(1<<i-1)+lcp]-'a';
				if(getocc(s[j+(1<<i-1)-1]-'a',j,j+(1<<i)-2)-(ori==s[j+(1<<i-1)-1]-'a')+(nd==s[j+(1<<i-1)-1]-'a')!=1);
				else add[j+lcp][nd]+=bnf;
			}
		} if(is[i-1][j]){
			int lcp=getlcp(j,j+(1<<i-1)),lcs=getlcs(j+(1<<i-1)-2,j+(1<<i)-2);
			if(lcp+lcs==(1<<i-1)-2){
				int ori=s[j+(1<<i-1)+lcp]-'a',nd=s[j+lcp]-'a';
				if(getocc(s[j+(1<<i-1)-1]-'a',j,j+(1<<i)-2)-(ori==s[j+(1<<i-1)-1]-'a')+(nd==s[j+(1<<i-1)-1]-'a')!=1);
				else add[j+(1<<i-1)+lcp][nd]+=bnf;
			}
		}
	}
//	printf("%lld\n",sum);
//	for(int i=1;i<=n;i++) printf("%lld%c",d[i]," \n"[i==n]);
	for(int i=1;i<=n;i++) for(int j=0;j<26;j++)
		if(s[i]-'a'!=j) chkmax(dlt,-d[i]+add[i][j]);
	printf("%lld\n",sum+dlt);
	return 0;
}
posted @ 2021-10-20 12:39  tzc_wk  阅读(61)  评论(0)    收藏  举报