动态规划问题特性

动态规划问题特性

在前面的学习中,我们了解了动态规划是如何通过子问题分解来求解原问题的。实际上子问题分解是一种通用的算法思路,在分治、动态规划、回溯中的侧重点不同。

  • 分治算法递归地将原问题划分为多个相互独立的子问题,直至最小子问题,并在回溯中合并子问题的解,最终得到原问题的解。
  • 动态规划也对问题进行递归分解,但与分治算法的主要区别是,动态规划中的子问题是相互依赖的,在分解过程中会出现许多重叠子问题。
  • 回溯算法在尝试和回退过程中穷举所有可能的解,并通过剪枝避免不必要的搜索分支。原问题的解由一系列决策步骤构成,我们可以将每个决策步骤之前的子序列看作一个子问题。

实际上,动态规划常用来求解最优化问题,它们不仅包含重叠子问题,还具有另外两大特性:最优子结构、无后效性。

最优子结构

我们对爬楼梯问题稍作改动,使之更加适合展示最优子结构概念。

爬楼梯最小代价
给定一个楼梯,你每步可以上1阶或2阶,每一阶楼梯上都贴有一个非负整数,表示你在该台阶所需付出的代价。给定一个非负整数数组\(cost\),其中\(cost[i]\)表示在第\(i\)个台阶所需付出的代价,\(cost[0]\)为地面(起始点)。请计算最少需要付出多少代价才能达到顶部?

如下所示,若第1、2、3阶的代价分别为1、10、1,则从地面爬到第3阶的最小代价为2.

image

\(dp[i]\)为爬到第\(i\)阶累计付出的代价,由于第\(i\)阶只可能从\(i-1\)\(i-2\)阶走来,因此\(dp[i]\)只可能等于\(dp[i-1]+cost[i]\)\(dp[i-2]+cost[i]\)。为了尽可能减少代价,我们应该选择两者中较小的那一个:

\[dp[i] = min(dp[i-1], dp[i-2]) + cost[i] \]

由此可以引出最优子结构的含义:原问题的解是从子问题的最优解构建得来的

本题显然具有最优子结构:我们从两个子问题最优解\(dp[i-1]\)\(dp[i-2]\)中挑选出较优的那一个,并用它构建出原问题\(dp[i]\)的最优解。

根据状态转移方程,以及初始状态\(dp[1]=cost[1]\)\(dp[2]=cost[2]\),我们可以得到动态规划代码:

/* 爬楼梯最小代价:动态规划 */
int minCostClimbingStairsDP(vector<int>& cost) {
    int n = cost.size() - 1;
        if (n == 1 || n == 2)
            return cost[n];
    // 初始化 dp 表,用于存储子问题的解
    vector<int> dp(n + 1);
    // 初始状态:预设最小子问题的解
    dp[1] = cost[1];
    dp[2] = cost[2];
    // 状态转移:从较小子问题逐步求解较大子问题
    for (int i = 3; i <= n; i++) {
        dp[i] = min(dp[i - 1], dp[i - 2]) + cost[i];
    }
    return dp[n];
}

下图展示了动态规划过程
image

同样可以进行空间优化,将一维压缩至零维,使得空间复杂度从\(O(n)\)降至\(O(1)\):

/* 爬楼梯最小代价:空间优化后的动态规划 */
int minCostClimbingStairsDPComp(vector<int>& cost) {
    int n = cost.size() - 1;
    if (n == 1 || n == 2)
        return cost[n];
    int a = cost[1], b = cost[2];
    for (int i = 3; i <= n; i++) {
        int tmp = b;
        b = min(a, tmp) + cost[i];
            a = tmp;
    }
    return b;
}

无后效性

无后效性是动态规划能够解决问题的重要特征之一,其定义为:给定一个确定状态,它的未来发展只与当前状态有关,而与过去经理的所有状态无关

以爬楼梯问题为例,给定状态\(i\),它会发展处\(i+1\)和状态\(i+2\),分别对应跳一步和跳2步。在做出这两种选择时,我们无需考虑状态\(i\)之前的状态,它们对于状态\(i\)的未来没有影响。

然而,如果我们给爬楼梯问题添加一个约束,情况就不一样了。

带约束爬楼梯
给定一个共有\(n\)阶的楼梯,你每步可以上1阶或者2阶,但不能连续两轮跳1阶,请问有多少种方案可以爬到楼顶?

如图所示,爬上第3阶仅剩2种可行方案,其中连续三次跳1阶的方案不满足约束条件,因此被舍弃。
image

在该问题中,如果上一轮是跳1阶上来的,那么下一轮就必须跳2阶。这意味着,下一步选择不能由当前状态(所在楼梯阶数)独立决定,还和前一个状态(上一轮所在阶数)有关

不难发现,此问题已不满足无后效性,状态转移方程\(dp[i]=dp[i-1]+dp[i-2]\)也失效了,因为\(dp[i-1]\)代表本轮跳1阶,但其中包含了许多“上一轮是跳1阶来的”方案,而为了满足约束,我们就不能将\(dp[i-1]\)直接计入\(dp[i]\)中。

为此,我们需要扩展状态定义:状态\([i,j]\)表示出在第\(i\)阶并且上一轮跳了\(j\),其中\(j \in \{1,2\}\)。此状态定义有效区分了上一轮跳了1阶还是2阶,我们可以据此来判断当前状态是从何而来的。

  • 当上一轮跳了1阶时,上上一轮只能选择跳2阶,即\(dp[i,1]\)只能从\(dp[i-1,2]\)转移过来。
  • 当上一轮跳了2阶时,上上一轮可以选择跳1阶或跳2阶,即\(dp[i,2]\)可以从\(dp[i-2,1]\)或者\(dp[i-2,2]\)转移过来。

在该定义下,\(dp[i,j]\)表示状态\([i,j]\)对应的方案数。此时状态转移方程为:

\[dp[i,1]=dp[i-1,2] \]

\[dp[i,2]=dp[i-2,1]+dp[i-2,2] \]

image

最终返回$dp[n,1]+dp[n,2]即可,两者之和代表爬到第n阶的方案总数:

class ClimbingStairs {
public:
	int climbingStairsConstrainDP(int n) {
		if (n < 3) return 1;
		vector<vector<int>> dp(n + 1, vector<int>(2));
		dp[1] = { 1, 0 };
		dp[2] = { 0, 1 };
		for (int i = 3; i <= n; ++i) {
			dp[i][0] = dp[i - 1][1];
			dp[i][1] = dp[i - 2][0] + dp[i - 2][1];
		}
		return dp[n][0] + dp[n][1];
	}
};

在上面的案例中,由于仅需多考虑前面一个状态,因此我们仍然可以通过扩展状态定义,使得问题重新满足无后效性。然而,某些问题具有非常严重的“有后效性”。

爬楼梯与障碍生成
给定一个共有n阶的楼梯,每步可以上1阶或2阶。规定当爬到第\(i\)阶时,系统会自动在第\(2i\)阶上放障碍物,之后所有轮都不允许跳到第\(2i\)阶上。例如,前两轮分别跳到了2、3阶上,则之后就不能跳到第4、6阶上。请问有多少种方案可以爬到楼顶?

在这个问题中,下次跳跃依赖过去所有的状态,因为每一次跳跃都会在更高的阶梯上设置障碍,并影响未来的跳跃。对于这类问题,动态规划往往难以解决。

实际上,许多复杂的组合优化问题(例如旅行商问题)不满足无后效性。对于这类问题,我们通常会选择使用其他方法,例如启发式搜索、遗传算法、强化学习等,从而在有限时间内得到可用的局部最优解。

posted @ 2025-08-15 17:00  风陵南  阅读(14)  评论(0)    收藏  举报