随笔档案「2026年1月4日」：粒子群算法PSO/强化学习 ... - wangssd

2026年1月4日

摘要：强化学习（Reinforcement Learning, RL）和粒子群算法（Particle Swarm Optimization, PSO）是两类不同范式的智能优化方法。 1）动态序贯问题：环境一直在变，每一步的决策会影响下一步的环境，需要连续调整策略，追求长期整体最优。→ 用强化学习 2）静态阅读全文

posted @ 2026-01-04 14:54 wangssd 阅读(11) 评论(0) 推荐(0)

wangssd

公告