摘要: Chapter 2 MAB问题 参考:动手学强化学习,建议读者去看看原文 2.1 简介 智能体与环境交互学习,试错型学习。 多臂lh机(后简称MAB)问题,是一种简化的强化学习问题。 不存在状态信息,仅存在动作和奖励,是最简单的交互学习形式。 主要有探索和利用问题。 2.2 问题介绍 2.2.1 定 阅读全文
posted @ 2025-03-06 11:09 木木ちゃん 阅读(123) 评论(1) 推荐(0)