摘要: 第一步:强化学习到底是什么? (The Big Picture) 想象一下你正在训练一只小狗。这个过程和强化学习非常相似: 智能体 (Agent):你的小狗。在RL中,这就是我们试图训练的模型或算法。 环境 (Environment):你所在的房间或公园。在RL中,这是智能体所处的外部世界。 状态 阅读全文
posted @ 2025-06-23 09:16 jack-chen666 阅读(41) 评论(0) 推荐(0)