[CF1526D] Kill Anton(逆序对,搜索)
题面
A N T O N \rm ANTON ANTON 的基因由 A , N , T , O \rm A,N,T,O A,N,T,O 四种碱基排列组成。 A N T O N \rm ANTON ANTON 的身体很智能,一旦发现基因序列被改变了,就会通过尽量少的次数交换相邻两个碱基,来还原回开始的基因序列。
现在给出 A N T O N \rm ANTON ANTON 的基因序列,长为 N N N ,求一个打乱后的该序列,满足还原时需要交换操作最少次数最多,输出任意一个符合条件的序列。
1 ≤ N ≤ 1 0 5 1\leq N \leq10^5 1≤N≤105.
题解
我们先考虑最少操作次数怎么求。根据做题经验,有一个贪心思路:把相同类型的碱基不交叉地一一配对,然后把每个初始位置的目标位置拿出来组成一个序列(因此这应该是个1~N的排列),最小操作次数即该排列的逆序对数。
那么,我们不妨把打乱后的序列也这样一一对应回去,每个位置上记录初始位置的编号。容易发现,对于同一种碱基的所有位置,初始位置的编号一定是单增的。在满足这个条件的情况下,我们可以想想怎么最大化逆序对数。
这里有一个结论:一定存在一种逆序对最多的方案,满足同种碱基都相邻。
- 证明:我们用调整法,假设序列中有这么一段两边都有个 A(省略号中间没有 A):
A......A
,前面一个的初始位置为 i i i ,后面一个的初始位置为 j j j,此时 i < j i<j i<j。令省略号中间比 i i i 小的数量为 a a a ,比 j j j 大的数量为 b b b 。如果 a ≥ b a\geq b a≥b,把右边的 A 移到省略号左边,逆序对的变化量为 a − b ≥ 0 a-b\geq0 a−b≥0 。如果 a < b a<b a<b ,把左边的 A 移到省略号右边,逆序对的变化量为 b − a > 0 b-a>0 b−a>0。两种使 A 相邻的方法总有一个不会让逆序对数减小,得证。
那么,由于只有四种碱基,全排列有 M ! = 4 ! = 24 M!=4!=24 M!=4!=24 种,最终的序列也只有这么多种,其中一定存在一个答案序列,我们暴力枚举找它。复杂度 O ( M ! n log n ) O(M!n\log n) O(M!nlogn)。
还有一种 O ( n ) O(n) O(n) 的做法。交换次数不一定要求逆序对,还可以求初始与目标的距离。由于我们知道同种碱基要相邻,可以通过预处理前缀和等方式,快速判断每种碱基段在某个位置对答案贡献为多少,这样一来,枚举全排列时就不用每次 O ( n ) O(n) O(n) 求答案,而是常数时间。总时间复杂度就主要只有输入和预处理了。
CODE
O ( 24 n log n ) O(24n\log n) O(24nlogn)
#include<set>
#include<queue>
#include<cmath>
#include<vector>
#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
using namespace std;
#define MAXN 400005
#define ENDL putchar('\n')
#define LL long long
#define DB double
#define lowbit(x) ((-x) & (x))
#define INF 0x3f3f3f3f
LL read() {
LL f = 1,x = 0;char s = getchar();
while(s < '0' || s > '9') {if(s=='-')f = -f;s = getchar();}
while(s >= '0' && s <= '9') {x=x*10+(s-'0');s = getchar();}
return f * x;
}
int n,m,i,j,s,o,k;
char s0[10] = "ANTO";
char ss[MAXN];
int c[MAXN];
void addc(int x,int y){while(x<=n)c[x]+=y,x+=lowbit(x);}
int sum(int x){int s=0;while(x>0)s+=c[x],x-=lowbit(x);return s;}
void INIT() {for(int i = 1;i <= n;i ++) c[i] = 0;}
LL as = 0,CN;
char D[MAXN],e[MAXN];
void ADD(int x) {
D[CN --] = ss[x];
as += sum(x-1); addc(x,1);
return ;
}
int main() {
int T = read();
while(T --) {
scanf("%s",ss + 1);
n = strlen(ss + 1);
for(int i = 1;i <= n;i ++) e[i] = ss[i];
LL ans = -1;
for(int a=0;a<4;a++) {
for(int b=0;b<4;b++) if(b!=a) {
for(int c=0;c<4;c++) if(c!=a&&c!=b) {
for(int d=0;d<4;d++) if(d!=a&&d!=b&&d!=c) {
INIT();
CN = n;as = 0;
for(int i = n;i > 0;i --) if(ss[i] == s0[d]) ADD(i);
for(int i = n;i > 0;i --) if(ss[i] == s0[c]) ADD(i);
for(int i = n;i > 0;i --) if(ss[i] == s0[b]) ADD(i);
for(int i = n;i > 0;i --) if(ss[i] == s0[a]) ADD(i);
if(as > ans) {
for(int i = 1;i <= n;i ++) e[i] = D[i];
ans = as;
}
}
}
}
}
for(int i = 1;i <= n;i ++) putchar(e[i]);ENDL;
}
return 0;
}