HDU6438 Buy and Resell 解题报告(一个有趣的贪心问题的严格证明)

写在前面

此题是一个很容易想到的贪心题目,但是正确性的证明是非常复杂的。然而,目前网上所有题解并未给出本题贪心算法的任何正确性证明,全部仅停留在描述出一个贪心算法。本着对算法与计算机科学的热爱(逃),我花了2周时间深入研究了这个问题,并请教了Apass.Jack 大牛,终于在他的帮助下证明了该贪心的正确性。接下来将给出详细地证明过程。

PS:Apass.Jack提供了整个证明框架(尽管后来被我发现了一处错误并重新修正了证明),在此表示感谢!

题目描述

给定$n$($n \le 10^5)$个城市的物品价格,每个城市只能最多购买或卖出一个物品,可以既不买也不卖。当然,若当前手上没有物品则不能卖出。问从城市1走到城市$n$,途中进行买卖后最多赚多少钱,在此前提下最少进行多少次交易。初始手上没有任何物品,但有无限的钱。

Sample Input

3
4
1 2 10 9
5
9 5 9 10 5
2
2 1

Sample Output

16 4
5 2
0 0

算法描述

我们先不考虑最小化交易次数,只考虑利润最大化。本题有一个比较好想的贪心算法:

从左往右遍历城市,并维护每个城市当前的状态(买了物品、卖了物品或什么都不做)。对于城市$i$,我们找1到$i-1$中价格最低的$j$且$j$城市未买入(可以卖出),如果$j$城市价格比$i$城市低,则在$j$城市买入并在$i$城市卖出。同时更新$j$城市的买卖状态:若之前状态是卖出,则更新为什么都不做;否则更新为买入。

这样遍历完1到$n$即可得出答案。实现时,显然可用优先队列维护。这样时间复杂度$O(n\log n)$。

算法正确性证明

基本术语

为表述方便,引入以下记号:

(1)用$p_i$表示城市$i$的价格;

(2)一个策略定义为每个城市的买卖状态集合,用$s_i$表示。其中,$s_i=0$表示什么都不做;$s_i=1$表示买入;$s_i=-1$表示卖出。

(3)定义$s$的前缀和为$h_s(i)=\sum_{i=1}^n {s_i}$,并补充$h_s(0)=0$;显然一个方案是合法的,当且仅当对任意$1 \le i \le n$,$h_s(i) \ge 0$。

(4)定义$(i,j)$表示一个升序二元组$(i < j)$;

(5)称$(i,j)$被策略$s$分开,或称在策略$s$中$(i,j)$不可能属于同一次买卖,如果存在$i \le k < j$,使得$h_s(k)=0$。

证明思路

此题直接证明是非常困难的,因为它会动态修改之前的策略。我们考虑引入一个中间步骤,即得出最优解满足的充要性质,然后证明贪心的解也满足这个性质,那么贪心就自然是正确的了。

接下来将证明以下几个主要定理,分别建立最优解的性质以及贪心解的性质。

另外为了简化证明,以下部分均假设所有$p_i$互不相同。显然如果$p_i$互不相同时算法正确,那么$p_i$可以相同时算法也必然正确(通过取极限)。

定理1

如果一个策略$s$是最优策略,则$h_s(n)=0$,且对于任意$(i,j)$一定满足:

(1)若$s_i=s_j=0$或$s_i<s_j$,必有$p_i>p_j$。

(2)若$s_i=s_j=0$或$s_i>s_j$,且$p_i>p_j$,$(i,j)$必然被分开。

证明:$h_s(n)=0$显然。

(1)若不然,我们将$s_i$加1,将$s_j$减1,显然对任意$i$有$h_s(i) \ge 0$,因此是合法方案,但利润更大了,矛盾。

(2)若不然,则对任意$i \le k<j$有$h_s(k)\ge1$。我们令$s_i$减1,$s_j$加1,显然对任意$i$,$h_s(i)\ge 0$仍成立,因此是合法方案,但利润更大了,矛盾。

定理2

满足定理1的策略必然由贪心算法给出。

证明:用数学归纳法,$n=1$显然成立。

考虑$n$时满足定理1的一个策略,由于$h_s(n)=0$故必有$s_n=0$或$s_n=-1$。

(1)若$s_n=0$,那么该策略在前$n-1$个城市中满足定理1策略,已由贪心算法给出。当贪心算法到第$n$个城市时,它一定什么都不做,若不然,必存在$p_j<p_n$且$s_j \le 0$。那么二元组$(j,n)$和定理1(1)矛盾。

(2)若$s_n=-1$。设$k$是$0 \le k<n$中满足$h_s(k)=0$的最大的$k$,$j$为$k<j\le n$中$s_j \ge 0$且价格最高的城市。

考虑把$s_j$减1而其它不变,这样我们得到一个新策略,将其记为$w$,那么新的策略$h_w(n-1)=0$且$h_w$恒非负,此时$w_1$到$w_{n-1}$便是前$n-1$个城市的一个合法方案。下证它满足定理1的条件。

注意一个性质:如果$(i,j)$在$s$中被分开,在$w$中一定被分开,因为$w$只有$j$处比$s$小1,其它值都相同。利用该性质,对于策略$w$,任何不包含$j$的二元组必然满足定理1的条件;我们只需考虑包含$j$的二元组是否满足定理1条件即可。

对于定理1(1):

a):若$(i,j)$满足$w_i=w_j=0$或$w_i<w_j$,必有$s_i<s_j$,由于$s$满足定理1(1)故$p_i>p_j$;

b):若$(j,i)$满足$w_j=w_i=0$或$w_j<w_i$,那么$s_i=w_i \ge 0$,由于$j$是$k$之后$s$非负的价格最高者,故$p_j>p_i$。

对于定理1(2):

a):若$(i,j)$满足$w_i>w_j$或$w_i=w_j=0$,且$p_i>p_j$,那么$s_i=w_i \ge 0$,由于$j$是$k$之后$s$非负的价格最高者,故必有$i \le k$,故$(i,j)$被$s$分开;

b):若$(j,i)$满足$w_j>w_i$或$w_i=w_j=0$,且$p_j>p_i$,那么$s_j>s_i$,由定理1(2)$(j,i)$在$s$策略中被分开,这与$k$是最大的$h_s(k)=0$的城市矛盾,不会有这种情况。

综上,$w$是满足定理1的策略,由归纳知必然是贪心算法前$n-1$个城市的执行结果。最后考虑算法在第$n$个城市的操作。

首先必有$p_j<p_n$,若不然由$s_j \ge 0 >-1=s_n$但$(j,n)$并未在$s$中被分开可导出和定理1(2)的矛盾。而$w_j \le 0$,故算法必然会在$n$城市卖出(因为可以在$j$买入且能增大利润),下面只需考虑是不是一定买入$j$城市。设算法买入的城市为$t$,且$p_j>p_t$,那么$s_t \le 0$而$s_j \ge 0$,那么$t$不能在$j$之前(否则与定理1(1)矛盾)。同样$t$也不能在$j$之后(否则由定理1(2)$(j,t)$被$s$分开,与$k$是最大的$h_s(k)=0$的城市矛盾),因此买入的城市$t=j$。因此满足定理1的策略确实完全由贪心算法给出。证毕。

定理3

满足定理1的策略是唯一的,从而贪心算法正确。

证明:由于定理1的策略必由贪心算法给出,而贪心算法给出的策略只有一个,故满足定理1的策略是唯一的。又由定理1,最优策略满足定理1,故算法是正确的。

最小化交易次数

根据上面定理,当价格互不相同时最优策略是唯一的,但价格可以相同时则不一定,此时才存在最小化交易次数的问题。此时考虑修改算法,当优先队列中最低价格不止一个时,优先取原本卖出物品的城市,这样该城市的状态会被修改成什么都不做。这个正确性很显然。对于价格相同的物品,它们对于后续城市是完全等价的,因此尽可能的将它们变成不买也不卖必然达到最小交易次数。

综上,这道题目就完全解决了。

参考代码

 1 #include<cstdio>
 2 #include<queue>
 3 using namespace std;
 4 int p[100001];
 5 struct Node{
 6     int i;
 7     bool sell;
 8     bool operator < (const Node t)const{
 9         return p[i] != p[t.i] ? p[i] > p[t.i] : !sell && t.sell;
10     }
11 };
12 int main()
13 {
14     int test, n;
15     scanf("%d", &test);
16     while (test--){
17         priority_queue<Node> q;
18         scanf("%d", &n);
19         for (int i = 0; i < n; i++)
20             scanf("%d", &p[i]);
21         long long ans = 0;
22         int cnt = 0;
23         q.push({ 0, 0 });
24         for (int i = 1; i < n; i++){
25             int j = q.top().i;
26             if (p[j] < p[i]){
27                 bool sell = q.top().sell;
28                 q.pop();
29                 ans += p[i] - p[j];
30                 if (sell)q.push(Node{ j, 0 });
31                 else cnt += 2;
32                 q.push(Node{ i, 1 });
33             }
34             else q.push(Node{ i, 0 });
35         }
36         printf("%lld %d\n", ans, cnt);
37     }
38 }

 

posted @ 2018-10-02 12:08  zbh2047  阅读(419)  评论(0编辑  收藏  举报