2025 年 10月 30 日随笔档案 - 小前端攻城狮

2025年10月30日

摘要：一、算法框架设计 Q-learning路径规划的核心流程包含以下模块：环境建模：栅格地图表示障碍物与目标点状态空间定义：每个栅格作为独立状态动作空间设计：上下左右四个移动方向奖励函数构建：目标点正奖励+障碍物惩罚 Q表更新机制：Bellman方程迭代优化二、关键代码实现（迷宫导航案例） 1 阅读全文

posted @ 2025-10-30 15:13 小前端攻城狮阅读(18) 评论(0) 推荐(0)

公告