2025 年 6月 23 日随笔档案 - jack-chen666

2025年6月23日

摘要：第一步：强化学习到底是什么？ (The Big Picture) 想象一下你正在训练一只小狗。这个过程和强化学习非常相似：智能体 (Agent)：你的小狗。在RL中，这就是我们试图训练的模型或算法。环境 (Environment)：你所在的房间或公园。在RL中，这是智能体所处的外部世界。状态阅读全文

posted @ 2025-06-23 09:16 jack-chen666 阅读(62) 评论(0) 推荐(0)

红豆生南国是很遥远的事情

种豆南山下 github

公告

红豆生南国 是很遥远的事情

种豆南山下 github

公告

红豆生南国是很遥远的事情