摘要: 二、三大关键维度的效果对比 1. 问题适配性:动态规划适配 “简单线性流程”,MDP 适配 “复杂网状流程” 动态规划的优势在于 “处理线性、低维度的多阶段决策”,MDP 的优势在于 “处理多维、网状的动态决策”,二者在论文场景中的适配效果差异显著: 动态规划在问题二中的适配效果(优)问题二的生产流 阅读全文
posted @ 2025-09-13 22:13 Annaprincess 阅读(14) 评论(0) 推荐(0)
摘要: 动态规划 多阶段生产决策的 “全局最优” 问题 一、动态规划的核心原理与适配性 动态规划(Dynamic Programming, DP)的本质是 “利用问题的‘无后效性’和‘子问题重叠性’,通过存储子问题解避免重复计算,实现高效寻优”。这一特性与电子产品生产流程高度契合: 无后效性:生产某一阶段( 阅读全文
posted @ 2025-09-13 22:07 Annaprincess 阅读(13) 评论(0) 推荐(0)
摘要: 马尔可夫决策 马尔可夫决策:随机动态环境下序贯决策,其核心假设是 “马尔可夫性”—— 即 “未来状态的概率分布仅依赖于当前状态,与当前状态之前的历史无关”。MDP 的最终目标是找到一套最优策略 π(π: S→A,即 “在每个状态下选择哪个动作” 的规则) 马尔可夫决策可以表示成一个四元组,S(状态空 阅读全文
posted @ 2025-09-13 21:54 Annaprincess 阅读(10) 评论(0) 推荐(0)