2025 年 3月 6 日随笔档案 - 木木ちゃん

2025年3月6日

摘要： Chapter 2 MAB问题参考：动手学强化学习,建议读者去看看原文 2.1 简介智能体与环境交互学习，试错型学习。多臂lh机（后简称MAB）问题，是一种简化的强化学习问题。不存在状态信息，仅存在动作和奖励，是最简单的交互学习形式。主要有探索和利用问题。 2.2 问题介绍 2.2.1 定阅读全文

posted @ 2025-03-06 11:09 木木ちゃん阅读(123) 评论(1) 推荐(0)

mumujun12345

公告