加载中...

P1908 逆序对

逆序对

题目描述

猫猫 TOM 和小老鼠 JERRY 最近又较量上了,但是毕竟都是成年人,他们已经不喜欢再玩那种你追我赶的游戏,现在他们喜欢玩统计。

最近,TOM 老猫查阅到一个人类称之为“逆序对”的东西,这东西是这样定义的:对于给定的一段正整数序列,逆序对就是序列中 a_i>a_j 且 i<j 的有序对。知道这概念后,他们就比赛谁先算出给定的一段正整数序列中逆序对的数目。注意序列中可能有重复数字。

Update:数据已加强。

输入格式

第一行,一个数 n,表示序列中有 n个数。

第二行 n 个数,表示给定的序列。序列中每个数字不超过 10^9。

输出格式

输出序列中逆序对的数目。

样例 #1

样例输入 #1

6
5 4 2 6 3 1

样例输出 #1

11

提示

对于 25% 的数据,n <= 2500

对于 50% 的数据,n <= 4 * 10^4。

对于所有数据,n <= 5 * 10^5

请使用较快的输入输出

应该不会 O(n^2) 过 50 万吧 by chen_zhe

分析

① 归并排序解法

首先你需要知道什么是归并排序。然后,我们可以这样想:

如果我们想要将一个序列排成从小到大有序的,那么每次划分后合并时左右子区间都是从小到大排好序的,我们只需要统计右边区间每一个数分别会与左边区间产生多少逆序对即可。

不懂的话看栗子:

//在某个时候,左区间:  5 6 7  下标为i
//           右区间:  1 2 9  下标为j
//          
//这个时候我们进行合并:
//step 1:由于 5>1,所以产生了逆序对,这里,我们发现,左区间所有还没有被合并的数都比 1 大,所以1与左区间所有元素共产生了 3 个逆序对(即tot_numleft-i+1对),统计答案并合并 1 
//step 2:由于 5>2,由上产生了3对逆序对,统计答案并合并 2
//step 3:由于 5<9, 没有逆序对产生,右区间下标 j++
//step 4:由于 6<9, 没有逆序对产生,右区间下标 j++
//step 5:由于 7<9, 没有逆序对产生,右区间下标 j++
//step 6:由于右区间已经结束,正常执行合并左区间剩余,结束

//PS: tot_numleft=3,即左区间总元素个数

看懂了吧(莫名自信)

由于归并排序没有什么坑,正常执行并统计即可,注意 答案会爆 int !我们需要使用longlong存,如果使用 printf输出,那么可别忘了用%lld!

复杂度与普通的归并排序相同,为O(Nlog_2N)

效率:**1682ms/4.43MB ** (数据更新之后)

提交答案

Code:

#include<cstdio>
#include<iostream>
using namespace std;
int n,a[500010],c[500010];
long long ans;

void msort(int b,int e)//归并排序
{
    if(b==e)  
		return;
    int mid=(b+e)/2,i=b,j=mid+1,k=b;
    msort(b,mid),msort(mid+1,e);
    //将两组数据按顺序填入c[k++]
    while(i<=mid&&j<=e)
    	if(a[i]<=a[j])
    		c[k++]=a[i++];
    	else
    		c[k++]=a[j++],ans+=mid-i+1;//统计答案
    //讲剩余的数据填入c[k++]
    while(i<=mid)
    	c[k++]=a[i++];
    while(j<=e)
    	c[k++]=a[j++];
    //将数据拷贝回原数组
    for(int l=b;l<=e;l++)
    	a[l]=c[l];
} 

int main()
{
    scanf("%d",&n); 
    for(int i=1;i<=n;i++)
    	scanf("%d",&a[i]);
    msort(1,n);
    printf("%lld",ans);
    return 0;
}

②树状数组解法

树状数组解法在这道题没有归并快,原因等会说

Q1: 我们需要知道,怎么统计第 i 个数会与第1~ i-1个数构成多少个逆序对呢?

Ans1: 考虑根据值来建树状数组 , 初始树状数组为全 0。现在按照序列从左到右将数据的值对应的位置的数加一,代表又有一个数出现。因此,在循环到第 i 项时,前 i-1 项已经加入到树状数组内了 , 树状数组内比 a_i大的都会与a_i构成逆序对,因为它们一定出现的更早,所以产生的逆序对数量为i-query(a_i)
注:query(a_i) 代表在树状数组内询问 1 ~ a_i项的前缀和

Q2: 根据 a_i来建树状数组空间不够啊?

Ans2: 确实不够。但是我们需要的只是数据之间的相对大小,只需要满足大于或小于本身,与大多少无关,具体来说,举个栗子:

//  1 2 10000
//  1 2 3
//上面两个序列在本题是等效的,因为无论第三项是3还是10000,它都大于第一项和第二项

这启发我们对数据离散化,先将数据排序,再用 1 ~ n 分别对应 n 个数表示它们的相对大小,对新的序列建树状数组空间就够了(n≤5×10^5)

Q3: 相等的元素是否会导致求解错误?每一个数(不管是否相等)对应的新数都不同诶?

Ans3: 不处理的话会出错的,问题的关键在于是否有与 a_i相等的元素在 a_i前被加入且其相对大小标记更大。出现这种情况就会误将两个相等的数判为逆序对。怎么解决呢,只要所有与 a_i相等的元素中,先出现的标记也更小就好了(我们只统计相对更大的)。具体只需要在排序时将 a_i作为第一关键字,下标(第几个出现)作为第二关键字从小到大排序即可。

如果用的不是这个方法的树状数组,那么你 WA 也多半是你忘记处理 Q3 中提到的问题了,如果 RE ,多半是空间开小了。

同时,再一次,注意 答案会爆 int!我们需要使用longlong存,如果使用 printf输出,那么可别忘了用%lld!

由于我们不仅要排序,还要建树状数组统计,所以,虽然两者复杂度相同,但是树状数组在这里会慢一些。

两种方法都是有必要掌握的,数据值域小的时候树状数组会更快,两者均有优点。

复杂度瓶颈在排序,为O(Nlog_2N)

效率:2359ms/8.38MB:2359ms/8.38MB (数据更新之后)

提交答案

Code:

#include<iostream>
#include<cstdio>
#include<algorithm>
using namespace std;
int tree[500010],ranks[500010],n;
long long ans; 
struct point
{
    int num,val;
}a[500010];
inline bool cmp(point q,point w)
{
    if(q.val==w.val)
        return q.num<w.num;
    return q.val<w.val;
}
inline void insert(int p,int d)//insert(it,x)前面是位置,后面是要插入的元素;
{
    for(;p<=n;p+=p&-p)
        tree[p]+=d; 
}
inline int query(int p)//query(a_i) 代表在树状数组内询问 1 ~ a_i项的前缀和
{
    int sum=0;
    for(;p;p-=p&-p)
        sum+=tree[p];
    return sum;
}
int main()
{
    scanf("%d",&n);
    for(int i=1;i<=n;i++)
        scanf("%d",&a[i].val),a[i].num=i;
    sort(a+1,a+1+n,cmp);
    for(int i=1;i<=n;i++)
        ranks[a[i].num]=i;
    for(int i=1;i<=n;i++)
    {
        insert(ranks[i],1);
        ans+=i-query(ranks[i]);
    }
    printf("%lld",ans);
    return 0;
} 
posted @ 2023-02-08 11:57  bujidao1128  阅读(175)  评论(0)    收藏  举报