摘要: 强化学习(Reinforcement Learning, RL)和粒子群算法(Particle Swarm Optimization, PSO)是两类不同范式的智能优化方法。 1)动态序贯问题:环境一直在变,每一步的决策会影响下一步的环境,需要连续调整策略,追求长期整体最优。→ 用强化学习 2)静态 阅读全文
posted @ 2026-01-04 14:54 wangssd 阅读(11) 评论(0) 推荐(0)