简单贪心

贪心算法是指,在对问题求解时,总是做出在当前看来是最好的选择。也就是说,不从整体最优上加以考虑,算法得到的是在某种意义上的局部最优解。
贪心算法不是对所有问题都能得到整体最优解,关键是贪心策略的选择。

主体思路:排序+循环,局部最优解转化为最优解

多考虑中位数,平均值。

区间问题

例.AcWing905 区间选点

给定 $N$ 个闭区间 $[a_i,b_i]$,请你在数轴上选择尽量少的点,使得每个区间内至少包含一个选出的点。

输出选择的点的最小数量。

位于区间端点上的点也算作区间内。

输入格式

第一行包含整数 $N$,表示区间数。

接下来 $N$ 行,每行包含两个整数 $a_i,b_i$,表示一个区间的两个端点。

输出格式

输出一个整数,表示所需的点的最小数量。

数据范围

$1 \le N \le 10^5$,
$-10^9 \le a_i \le b_i \le 10^9$

输入样例

3
-1 1
2 4
3 5

输出样例

2

题解

目标:选尽量少的点,这些点所在的所有区间是题目所给的所有区间。

分析:

1、将每个区间按右端点从小到大排序

2、从前往后依次枚举每个区间

如果当前区域已经包含点,直接过,否则选择当前区域右端点

证明:

1、由于算法得到的所有点都来自于一定没有关联的独立的区间,所需点数量一定大于等于上述算法得到的数量

2、由于算法得到的点满足覆盖所有区间,所需点的数量一定小于等于上述算法得到的数量

#include <iostream>
#include <algorithm>

using namespace std;

const int N = 100010;

int n;
struct Range
{
    int l,r;
}range[N];

bool cmp(Range a,Range b)
{
    return a.r<b.r;
}

int main()
{
    scanf("%d",&n);
    for(int i=0;i<n;i++)
    {
        int l,r;
        scanf("%d%d",&l,&r);
        range[i]={l,r};
    }
    
    sort(range,range+n,cmp);
    
    int res=0,ed=-2e9;
    for(int i=0;i<n;i++)
    {
        if(range[i].l>ed)
        {
            res++;
            ed=range[i].r;
        }
    }
    
    printf("%d\n",res);
    
    return 0;
}

例.AcWing908 最大不相交区间数量

目标:选尽可能多的区间,区间不能有重叠。

分析:与上道例题一致

1、将每个区间按右端点从小到大排序

2、从前往后依次枚举每个区间

如果当前区域已经包含点,直接过,否则选择当前区域右端点

证明:

1、算法选出来的区间一定没有交集,所以一定满足题目的选区间的要求,所以答案一定大于等于算法结果

2、如果答案大于算法结果,那么一定至少存在一个区间与已选的所有区间不重叠,但一定会重叠,所以只能等于。

代码与上题完全一致

例.AcWing906 区间分组

给定 $N$ 个闭区间 $[a_i,b_i]$,请你将这些区间分成若干组,使得每组内部的区间两两之间(包括端点)没有交集,并使得组数尽可能小。

输出最小组数。

输入格式

第一行包含整数 $N$,表示区间数。

接下来 $N$ 行,每行包含两个整数 $a_i,b_i$,表示一个区间的两个端点。

输出格式

输出一个整数,表示最小组数。

数据范围

$1 \le N \le 10^5$,
$-10^9 \le a_i \le b_i \le 10^9$

输入样例

3
-1 1
2 4
3 5

输出样例

2

题解

目标:让区间分组,每组内部,区间没有重叠部分,目标是让组数尽可能少

分析:

1、将所有区间按照左端点从小到大排序

2、从前往后处理每个区间

​ 判断是否能放入现在的某个组中(改区间左端点是否小于某组的最大右端点)

​ 1)如果不存在满足条件的组,则新开组,放进去

​ 2)如果存在这样的组,就放入,并更新最大右端值

#include <iostream>
#include <algorithm>
#include <queue>//不用小根堆会超时

using namespace std;

const int N = 100010;

int n;
struct Range
{
    int l,r;
    bool operator< (const Range &W)const
    {
        return l < W.l;
    }
}range[N];


int main()
{
    scanf("%d",&n);
    for(int i=0;i<n;i++)
    {
        int l,r;
        scanf("%d%d",&l,&r);
        range[i]={l,r};
    }
    
    sort(range,range+n);
    
    priority_queue<int,vector<int>,greater<int>> heap;
    for(int i=0;i<n;i++)
    {
        auto r=range[i];
        if(heap.empty()||heap.top()>=r.l) heap.push(r.r);//最小的右端点都大于现在的左端点,所以要新开一个组放了,于是就push(r,r)
        else
        {
            heap.pop();//最小的右端点不与新左端点冲突,可以接在最小的右端点右边,新右端点替代原右端点
            //也许可以证明,不是只能更新最小的右端点,任何满足条件的右端点都可以更新,只是这里用小根堆找右端点最小值(top())速度快,更新该值也快(pop()、push())
            heap.push(r.r);
        }
    }
    
    printf("%d\n",heap.size());
    
    return 0;
}

例.AcWing907 区间覆盖

给定 $N$ 个闭区间 $[a_i,b_i]$ 以及一个线段区间 $[s,t]$,请你选择尽量少的区间,将指定线段区间完全覆盖。

输出最少区间数,如果无法完全覆盖则输出 $-1$。

输入格式

第一行包含两个整数 $s$ 和 $t$,表示给定线段区间的两个端点。

第二行包含整数 $N$,表示给定区间数。

接下来 $N$ 行,每行包含两个整数 $a_i,b_i$,表示一个区间的两个端点。

输出格式

输出一个整数,表示所需最少区间数。

如果无解,则输出 $-1$。

数据范围

$1 \le N \le 10^5$,
$-10^9 \le a_i \le b_i \le 10^9$,
$-10^9 \le s \le t \le 10^9$

输入样例

1 5
3
-1 3
2 4
3 5

输出样例

2

题解

目标:从若干个区间中选最少数量的区间以完全覆盖目标区间

分析:

1、将所有区间按左端点从小到大排序

2、从前往后依次枚举每个区间,在所有能覆盖start(目标区间左端)的区间中,选择右端点最大的区间,选完后将start更新为刚刚的右端点最大值

#include <iostream>
#include <algorithm>

using namespace std;

const int N = 100010;

int n;
struct Range
{
    int l,r;
    bool operator< (const Range &W)const
    {
        return l<W.l;
    }
}range[N];

int main()
{
    int st,ed;
    scanf("%d%d",&st,&ed);
    scanf("%d",&n);
    for(int i=0;i<n;i++)
    {
        int l,r;
        scanf("%d%d",&l,&r);
        range[i]={l,r};
    }
    
    sort(range,range+n);
    
    int res=0;
    bool success = false;
    for(int i=0;i<n;i++)
    {
        int j=i,r=-2e9;
        while(j<n&&range[j].l<=st)
        {
            r=max(r,range[j].r);
            j++;//在所有满足左端点条件中遍历最大右端点,用j推进,最后遍历完用j更新i并且用最大r更新st
        }
        
        if(r<st)
        {
            res=-1;
            break;//最大值都小于st即无解
        }
        
        res++;
        if(r>=ed)
        {
            success=true;//有可能循环结束不是因为这里break而是走完了i,那么res不为-1但是仍然无答案,需要加一个bool表明
            break;
        }
        
        i=j-1;
        st=r;
    }
    
    if(!success) res=-1;
    printf("%d",res);
    
    return 0;
}

Huffman树

例.AcWing148 合并果子

在一个果园里,达达已经将所有的果子打了下来,而且按果子的不同种类分成了不同的堆。

达达决定把所有的果子合成一堆。

每一次合并,达达可以把两堆果子合并到一起,消耗的体力等于两堆果子的重量之和。

可以看出,所有的果子经过 $n-1$ 次合并之后,就只剩下一堆了。

达达在合并果子时总共消耗的体力等于每次合并所耗体力之和。

因为还要花大力气把这些果子搬回家,所以达达在合并果子时要尽可能地节省体力。

假定每个果子重量都为 $1$,并且已知果子的种类数和每种果子的数目,你的任务是设计出合并的次序方案,使达达耗费的体力最少,并输出这个最小的体力耗费值。

例如有 $3$ 种果子,数目依次为 $1,2,9$。

可以先将 $1、2$ 堆合并,新堆数目为 $3$,耗费体力为 $3$。

接着,将新堆与原先的第三堆合并,又得到新的堆,数目为 $12$,耗费体力为 $12$。

所以达达总共耗费体力$=3+12=15$。

可以证明 $15$ 为最小的体力耗费值。

输入格式

输入包括两行,第一行是一个整数 $n$,表示果子的种类数。

第二行包含 $n$ 个整数,用空格分隔,第 $i$ 个整数 $a_i$ 是第 $i$ 种果子的数目。

输出格式

输出包括一行,这一行只包含一个整数,也就是最小的体力耗费值。

输入数据保证这个值小于 $2^{31}$。

数据范围

$1 \le n \le 10000$,
$1 \le a_i \le 20000$

输入样例

3 
1 2 9 

输出样例

15

题解

目标:n堆果子,经过n-1次合并最终得到1堆果子,问最小消耗(一次消耗就是两堆果子的数量之和)。不同于区间DP,这个合并不要求是相邻的两堆。

Huffman树,把刚刚合并的过程画成一个树,一定是一个完全二叉树,那每一个没有子节点的节点就是我们题目中的起始果子,而最后的总消耗就是每个节点乘上节点到父节点的距离之和。

做法:每次从所有堆中挑最小的两堆合并,即最优解。

证明:

最小的两个点,深度一定最深,且可以互为兄弟,如何不是深度最深,那么一定可以跟深度最深的点交换,并且显然交换后的消耗更小,所以第一步就是合并最小的两个点,可以得到最优解,由于第一步无论如何都是固定的,所以第一步之后新的树其实完全可以按照刚刚的思路继续递推前进。

#include <iostream>
#include <algorithm>
#include <queue>

using namespace std;

int main()
{
    int n;
    scanf("%d",&n);
    
    priority_queue<int,vector<int>,greater<int> > heap;
    while(n--)
    {
        int x;
        scanf("%d",&x);
        heap.push(x);
    }
    
    int res=0;
    while(heap.size()>1)
    {
        int a=heap.top(); heap.pop();
        int b=heap.top(); heap.pop();
        res+=a+b;
        heap.push(a+b);
    }
    
    printf("%d\n",res);
    return 0;
}

排序不等式

例.AcWing913 排队打水

题目

有 $n$ 个人排队到 $1$ 个水龙头处打水,第 $i$ 个人装满水桶所需的时间是 $t_i$,请问如何安排他们的打水顺序才能使所有人的等待时间之和最小?

输入格式

第一行包含整数 $n$。

第二行包含 $n$ 个整数,其中第 $i$ 个整数表示第 $i$ 个人装满水桶所花费的时间 $t_i$。

输出格式

输出一个整数,表示最小的等待时间之和。

数据范围

$1 \le n \le 10^5$,
$1 \le t_i \le 10^4$

输入样例

7
3 6 1 4 2 5 7

输出样例

56

题解

分析:最慢的人最后打水,递推思考,谁快谁先

假设说所需时间依次是 2 6 1 ,那么总时间是2x2+6x1,也就是说时间的权重依次减小,所以权重大的放小数字,权重小的放大数字,才能使结果最小。

#include <iostream>
#include <algorithm>

using namespace std;

typedef long long LL;

const int N = 100010;

int n;
int t[N];

int main()
{
    scanf("%d",&n);
    for(int i=0;i<n;i++) scanf("%d",&t[i]);
    
    sort(t,t+n);
    
    LL res=0;
    for(int i=0;i<n;i++) res += t[i]*(n-i-1);
    
    printf("%lld\n",res);//注意输出long long是%lld,用%d会WA
    
    return 0;
}

绝对值不等式

例.AcWing104 货仓选址

在一条数轴上有 $N$ 家商店,它们的坐标分别为 $A_1 \sim A_N$。

现在需要在数轴上建立一家货仓,每天清晨,从货仓到每家商店都要运送一车商品。

为了提高效率,求把货仓建在何处,可以使得货仓到每家商店的距离之和最小。

输入格式

第一行输入整数 $N$。

第二行 $N$ 个整数 $A_1 \sim A_N$。

输出格式

输出一个整数,表示距离之和的最小值。

数据范围

$1 \le N \le 100000$,
$0 \le A_i \le 40000$

输入样例

4
6 2 9 1

输出样例

12

题解

分析:

设坐标,由数学可知,对于|a-x|+|b-x|,要使其最小,x要在a与b之间,可以分类讨论x小于min(a,b),在a与b之间,大于max(a,b)来证明。

故和的最小值应该是将货仓放在中位数(中位数有两个时只要在两个数之间或者端点就行)

#include <iostream>
#include <algorithm>

using namespace std;

const int N = 100010;

int n;
int a[N];

int main()
{
    scanf("%d",&n);
    for(int i=0;i<n;i++) scanf("%d",&a[i]);
    
    sort(a,a+n);
    
    int  res=0;
    for(int i=0;i<n;i++) res+=abs(a[i]-a[n/2]);
    
    printf("%d\n",res);
    
    return 0;
}

推公式

例.AcWing125 耍杂技的牛

农民约翰的 $N$ 头奶牛(编号为 $1..N$)计划逃跑并加入马戏团,为此它们决定练习表演杂技。

奶牛们不是非常有创意,只提出了一个杂技表演:

叠罗汉,表演时,奶牛们站在彼此的身上,形成一个高高的垂直堆叠。

奶牛们正在试图找到自己在这个堆叠中应该所处的位置顺序。

这 $N$ 头奶牛中的每一头都有着自己的重量 $W_i$ 以及自己的强壮程度 $S_i$。

一头牛支撑不住的可能性取决于它头上所有牛的总重量(不包括它自己)减去它的身体强壮程度的值,现在称该数值为风险值,风险值越大,这只牛撑不住的可能性越高。

您的任务是确定奶牛的排序,使得所有奶牛的风险值中的最大值尽可能的小。

输入格式

第一行输入整数 $N$,表示奶牛数量。

接下来 $N$ 行,每行输入两个整数,表示牛的重量和强壮程度,第 $i$ 行表示第 $i$ 头牛的重量 $W_i$ 以及它的强壮程度 $S_i$。

输出格式

输出一个整数,表示最大风险值的最小可能值。

数据范围

$1 \le N \le 50000$,
$1 \le W_i \le 10,000$,
$1 \le S_i \le 1,000,000,000$

输入样例

3
10 3
2 5
3 3

输出样例

2

题解

分析:

按照wi+si从小到大的顺序排,小的站在上,大的站在下,最大的危险系数一定最小。

证明:

1、贪心得到的答案 >= 最优解,显然

2、贪心得到的答案 <= 最优解,假设最优解不是按照wi+si从小到大的顺序排,一定存在相邻两头牛wi+si>w[i+1]+s[i+1]。

现在讨论对于刚刚所谓”最优解“第i位置上的牛和i+1位置上的牛(注意交换位置后,每头牛的序号不变,也就是说wi换到i+1的位置后仍然是wi,这里的i是绝对位置,不变动)

两牛交换前,

第i位置上的牛危险系数为\(w1+w2+...+w[i-1]-si\),第i+1位置上的牛危险系数为\(w1+w2+...+w[i]-s[i+1]\)

两牛交换后,

第i位置上的牛危险系数为\(w1+w2+...+w[i-1]-s[i+1]\),第i+1位置上的牛危险系数为\(w1+w2+...+w[i+1]-si\)

上述四个式子同时减去\(w1+w2+...+w[i-1]\)然后加上\(si+s[i+1]\)可得

交换前:\(s[i+1]\) \(wi+si\)

交换后:\(si\) \(w[i+1]+s[i+1]\)

由于一定存在wi+si>w[i+1]+s[i+1],wi+si>si,也就是说所谓”最优解“,在做完这么一个交换后,风险最大值(假设是wi+si)反而变小了,那么交换后的情况一定优于这个最优解。(假设是s[i+1]最大值,这就意味着s[i+1]>wi+si,更能说明交换后风险最大值减小了,因为s[i+1]>wi+si>w[i+1]+s[i+1],s[i+1]>wi+si>si)

故贪心得到的答案 <= 最优解

#include <iostream>
#include <algorithm>

using namespace std;

typedef pair<int,int> PII;

const int N = 50010;
PII cow[N];

int n;

int main()
{
    scanf("%d",&n);
    for(int i=0;i<n;i++)
    {
        int w,s;
        scanf("%d%d",&w,&s);
        cow[i]={w+s,w};
    }
    
    sort(cow,cow+n);
    
    int res=-2e9,sum=0;
    for(int i=0;i<n;i++)
    {
        int w=cow[i].second,s=cow[i].first-w;
        res=max(res,sum-s);
        sum+=w;
    }
    
    printf("%d\n",res);
    
    return 0;
}
posted @ 2022-01-02 22:13  泝涉江潭  阅读(83)  评论(0)    收藏  举报