HDU 2993 - MAX Average Problem - [斜率DP]

题目链接：http://acm.hdu.edu.cn/showproblem.php?pid=2993

Consider a simple sequence which only contains positive integers as a1, a2 ... an, and a number k. Define ave(i,j) as the average value of the sub sequence ai ... aj, i<=j. Let’s calculate max(ave(i,j)), 1<=i<=j-k+1<=n.

Input

There multiple test cases in the input, each test case contains two lines.
The first line has two integers, N and k (k<=N<=10^5).
The second line has N integers, a1, a2 ... an. All numbers are ranged in [1, 2000].

Output

For every test case, output one single line contains a real number, which is mentioned in the description, accurate to 0.01.

Sample Input

10 6
6 4 2 10 3 8 5 9 4 1

Sample Output

6.50

题意：

定义ave(i,j) = ( a[i] + a[i+1] + … + a[j-1] + a[j] ) / ( j - i + 1 )，现给定一个整数k且规定j - i + 1 ≥ k，求max(ave(i,j)).

题意：

我们设sum[0~N]是a[1~N]的前n项和，且sum[0]=0，那么就有：

不妨把ave(i,j)看做是点i-1到点j的斜率；

我们设dp[j]代表max(ave(i,j))，j-i+1≥k；

换句话说，在规定最少要连续取到k个值的前提下，a[1~j]中必有一个连续子序列，它以a[j]为结尾，且是所有a[1~j]的连续子序列中平均值最大的，把这个平均值记为dp[j]。

那么题目的最终答案就是max( dp[k] , dp[k+1] , … , dp[N] )。

问题相应可以转化为：

现有0~N这N+1个平面坐标系内的点，每个点P[i]的坐标为(i,sum[i])，0≤i≤N，要求任意横向距离差不小于k的两个点间，最大的斜率为多少。

现在对求斜率有方向化，规定对i<j，只检查从点P[j]到点P[i]的连线的斜率，不检查从P[i]到P[j]的连线。

那么，对于一个点P[j]，定义其检查集合为：

G[j] = {P[i] , 0 ≤ i ≤ j - k }

显然，j取值应当从k到n；当j<k时，G[j]为空集。

那么，dp[j]定义相应可变为：G[j]中任选一个点P[i]，它与P[j]的连线斜率最大，这个斜率记为dp[j]。

那么，在朴素的思想中，我们若要求一个dp[t]，必然要枚举检查G[t]中所有的点；

但是我们通过观察，可以发现如下性质：

若G[t]中存在三个点P[i],P[j],P[k]，i<j<k，并且P[j]在直线P[i]P[k]的上方，那么必然可以淘汰P[j]。

证明：

设g(P1,P2)代表直线P1P2的斜率，则：

若g(P[j],P[t]) ≥ g(P[i],P[t])，那么P[t]必然落在区域②中；

若g(P[j],P[t]) ≥ g(P[k],P[t])，那么P[t]必然落在区域③中；

但是显然区域②和③显然没有符合条件（t>k）的相交区域，故不可能同时满足g(P[j],P[t]) ≥ g(P[i],P[t])和g(P[j],P[t]) ≥ g(P[k],P[t])；

也就是说要么g(P[j],P[t]) < g(P[i],P[t])，要么g(P[j],P[t]) < g(P[k],P[t])，显然j总归不如i或者k中至少一个优，即证明了j必然淘汰。

这样一来，由于我们去掉了所有上凸的点，就维护了一个下凸的折线图形：

显然当P[t]切到这个折线时，斜率最大，即为dp[t]。

那么相应的我们可以建立一个存储点的队列，维护下凸图形，有以下的算法过程：

　　首先枚举 j = k ~ N，按以下两步尝试计算dp[j]：

　　　　①首先令点i = j - k，尝试将点i入队：

　　　　　　　若队列尾部存在点a和b，且g(a,b) ≥ g(b,i)，则删去元素b；

　　　　　　　（原因：若G[t]中存在三个点P[i],P[j],P[k]，i<j<k，并且P[j]在直线P[i]P[k]的上方，那么必然可以淘汰P[j]。）

　　　　　　　不断重复上述操作，直到队列内元素少于2，或者g(a,b) < g(b,i)；然后将点i入队。

　　　　②现在，所有点P[0]到点P[j - k]都曾经进入过队列了，那么此时可以通过队列的性质计算dp[j]：

　　　　　　　若队列头部存在点a和b，且g(a,b) ≤ ave(b,j)，则将元素a删去；

　　　　　　　反复上述操作，直到队列元素少于2，或者ave(a,b) > ave(b,j)；然后再选取队头元素得到dp[j]=g(q[head],j)。

　　　　　　　这样做的原因上面讲过，不再赘述。

　　　　　　　（删去的这些队列头部的元素，不难发现，在求dp[j]时它们不能成为最优解，在往后的dp[j+1],dp[j+2]……中依然不可能成为最优解，所以可以直接删去。）

AC代码：

#include<bits/stdc++.h>
using namespace std;
const int maxn=1e5+10;

int n,k,sum[maxn];
int q[maxn],head,tail;

//输入外挂
int tot;
const int BUF=25000000;
char Buf[BUF],*buf=Buf;
inline void read(int &a)
{
    for(a=0;*buf<48;buf++);
    while(*buf>47) a=a*10+*buf++-48;
}

double inline g(int i,int j){return (double(sum[j]-sum[i]))/(double(j-i));}

int main()
{
    tot=fread(Buf,1,BUF,stdin);

    while(1)
    {
        if(buf-Buf+1>=tot) break;

        read(n),read(k);
        sum[0]=0;
        for(int i=1;i<=n;i++)
        {
            read(sum[i]);
            sum[i]+=sum[i-1];
        }

        head=tail=0;
        double ans=0;
        for(int j=k;j<=n;j++)
        {
            int i=j-k;

            while( head+1<tail && g(q[tail-2],q[tail-1])>=g(q[tail-1],i) ) tail--;
            q[tail++]=i;

            while( head+1<tail && g(q[head],q[head+1])<=g(q[head+1],j) ) head++;
            ans=max(ans,g(q[head],j));
        }
        printf("%.2f\n",ans);
      }
}

注意点：

①要使用输入加速外挂，而且不能是一般的getchar版的，要是fread版的加速挂。

②结合前一道题目http://www.cnblogs.com/dilthey/p/8745843.html来看，斜率DP一定要讲究理论基础，理论严密基础扎实，写出来的代码才不会WA。

posted @ 2018-04-12 23:35 Dilthey 阅读(458) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

HDU 2993 - MAX Average Problem - [斜率DP]

公告