动态规划——状态机模型

动态规划——状态机模型

概述

定义:

它是一个有向图形,由一组节点和一组相应的转移函数组成。状态机通过响应一系列事件而“运行”。每个事件都在属于“当前” 节点的转移函数的控制范围内,其中函数的范围是节点的一个子集。函数返回“下一个”(也许是同一个)节点。这些节点中至少有一个必须是终态。当到达终态, 状态机停止。在这里插入图片描述
状态机可归纳为4个要素,即现态、条件、动作、次态。这样的归纳,主要是出于对状态机的内在因果关系的考虑。“现态”和“条件”是因,“动作”和“次态”是果。详解如下:
①现态:是指当前所处的状态。
②条件:又称为“事件”,当一个条件被满足,将会触发一个动作,或者执行一次状态的迁移。
③动作:条件满足后执行的动作。动作执行完毕后,可以迁移到新的状态,也可以仍旧保持原状态。动作不是必需的,当条件满足后,也可以不执行任何动作,直接迁移到新状态。
④次态:条件满足后要迁往的新状态。“次态”是相对于“现态”而言的,“次态”一旦被激活,就转变成新的“现态”了。

状态机与背包问题的不同

背包问题:当前的状态只与当前的选与不选的结果有关,与之前如何选择的细节无关。状态转移描述的是选择的结果
状态机模型:当前的状态与之前的状态有关,只能由前面的状态推导而来。状态转移描述的是转移的过程。

例题

大盗阿福

阿福是一名经验丰富的大盗。趁着月黑风高,阿福打算今晚洗劫一条街上的店铺。

这条街上一共有 N 家店铺,每家店中都有一些现金。

阿福事先调查得知,只有当他同时洗劫了两家相邻的店铺时,街上的报警系统才会启动,然后警察就会蜂拥而至。

作为一向谨慎作案的大盗,阿福不愿意冒着被警察追捕的风险行窃。

他想知道,在不惊动警察的情况下,他今晚最多可以得到多少现金?

输入格式
输入的第一行是一个整数 T,表示一共有 T 组数据。

接下来的每组数据,第一行是一个整数 N ,表示一共有 N 家店铺。

第二行是 N 个被空格分开的正整数,表示每一家店铺中的现金数量。

每家店铺中的现金数量均不超过1000。

输出格式
对于每组数据,输出一行。

该行包含一个整数,表示阿福在不惊动警察的情况下可以得到的现金数量。

数据范围
1≤T≤50,
1≤N≤105
输入样例:
2
3
1 8 2
4
10 7 6 14
输出样例:
8
24
样例解释
对于第一组样例,阿福选择第2家店铺行窃,获得的现金数量为8。

对于第二组样例,阿福选择第1和4家店铺行窃,获得的现金数量为10+14=24。

思路

在这里插入图片描述

在这里插入图片描述

代码

N = 100010
INF = -int(1e9)
w = [0] * N

T = int(input())
for t in range(T) :
	n = int(input())
	f = [[0, 0] for _ in range(n + 1)]
	w[1 : n + 1] = list(map(int, input().split()))
	f[0][1] = INF
	for i in range(1, n + 1) :
		f[i][0] = max(f[i - 1][0], f[i - 1][1]) # 抢或者不抢->不抢
		f[i][1] = f[i - 1][0] + w[i] # 不抢-> 抢
	print(max(f[n][0], f[n][1]))

股票买卖 IV

给定一个长度为 N 的数组,数组中的第 i 个数字表示一个给定股票在第 i 天的价格。

设计一个算法来计算你所能获取的最大利润,你最多可以完成 k 笔交易。

注意:你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。一次买入卖出合为一笔交易。

输入格式
第一行包含整数 N 和 k,表示数组的长度以及你可以完成的最大交易笔数。

第二行包含 N 个不超过 10000 的正整数,表示完整的数组。

输出格式
输出一个整数,表示最大利润。

数据范围
1≤N≤105,
1≤k≤100
输入样例1:
3 2
2 4 1
输出样例1:
2
输入样例2:
6 2
3 2 6 5 0 3
输出样例2:
7
样例解释
样例1:在第 1 天 (股票价格 = 2) 的时候买入,在第 2 天 (股票价格 = 4) 的时候卖出,这笔交易所能获得利润 = 4-2 = 2 。

样例2:在第 2 天 (股票价格 = 2) 的时候买入,在第 3 天 (股票价格 = 6) 的时候卖出, 这笔交易所能获得利润 = 6-2 = 4 。随后,在第 5 天 (股票价格 = 0) 的时候买入,在第 6 天 (股票价格 = 3) 的时候卖出, 这笔交易所能获得利润 = 3-0 = 3 。共计利润 4+3 = 7.

思路

在这里插入图片描述
在这里插入图片描述

代码

N, K= 100010, 110
INF = -int(1e9) - 7
f = [[INF, INF] for _ in range(K)]
w = [0] * N
n, k = map(int, input().split())
w[1 : n + 1] = list(map(int, input().split()))
f[0][0] = 0
res = 0
for i in range(1, n + 1) :
	for j in range(k, -1, -1) :
		if j :
			f[j][0] = max(f[j][0], f[j - 1][1] + w[i])
		f[j][1] = max(f[j][1], f[j][0] - w[i])
		res = max(f[j][0], res)
print(res)	

股票买卖 V

给定一个长度为 N 的数组,数组中的第 i 个数字表示一个给定股票在第 i 天的价格。

设计一个算法计算出最大利润。在满足以下约束条件下,你可以尽可能地完成更多的交易(多次买卖一支股票):

你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。
卖出股票后,你无法在第二天买入股票 (即冷冻期为 1 天)。
输入格式
第一行包含整数 N,表示数组长度。

第二行包含 N 个不超过 10000 的正整数,表示完整的数组。

输出格式
输出一个整数,表示最大利润。

数据范围
1≤N≤105
输入样例:
5
1 2 3 0 2
输出样例:
3
样例解释
对应的交易状态为: [买入, 卖出, 冷冻期, 买入, 卖出],第一笔交易可得利润 2-1 = 1,第二笔交易可得利润 2-0 = 2,共得利润 1+2 = 3。

思路

在这里插入图片描述

代码

N = 100010
INF = -int(1e9) - 7
f = [[0, 0, 0] for _ in range(N)]
w = [0] * N

n = int(input())
w[1 : n + 1] = list(map(int, input().split()))
f[0][0], f[0][1] = INF, INF
for i in range(1, n + 1) :
	f[i][0] = max(f[i - 1][0], f[i - 1][2] - w[i])
	f[i][1] = f[i - 1][0] + w[i]
	f[i][2] = max(f[i - 1][2], f[i - 1][1])

print(max(f[n][1], f[n][2]))

总结

为了从前一个状态表示当前状态,由此引入状态机保存前一个状态的状态条件。状态机的题一般都是描述前一个状态不好准确表示。主要的关注点时状态机的表示与入口的初始化,根据题意进行状态机的构造。而初始化则需要我们找到入口并判断入口每个状态的意义所在。

posted @ 2022-12-15 11:19  chanxe  阅读(60)  评论(0编辑  收藏  举报