GlenTt

导航

2025年10月4日 #

强化学习系统性学习笔记(一):从理论基础到策略优化

摘要: 强化学习系统性学习笔记(一):从理论基础到策略优化 一、强化学习的起源与核心问题 1.1 理论溯源:从生物学习到数学框架 强化学习的思想源头可以追溯到生物行为心理学中的"试错学习"原理。在自然界中,生物个体通过反复尝试不同行为并观察环境反馈,逐步学会选择能够带来更好结果的行动策略。这一朴素而普适的学 阅读全文

posted @ 2025-10-04 14:26 GRITJW 阅读(270) 评论(0) 推荐(0)