2025 年 4月 20 日随笔档案 - mumumu1

2025年4月20日

摘要：

1.基本概念强化学习讨论的问题：一个智能体（agent）如何在一个复杂的环境（environment）中去极大化它所获得的奖励。通过感知环境的状态（state）对动作（action）的反应（reward），来指导更好的动作，从而获得最大的收益（return）。以上过程称为在交互中学习，这样的学习方阅读全文

posted @ 2025-04-20 15:14 mumumu1 阅读(86) 评论(0) 推荐(0)

latex入门

摘要：

常用latex格式，待补充阅读全文

posted @ 2025-04-20 15:10 mumumu1 阅读(112) 评论(0) 推荐(0)

公告