会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
kuon61
博客园
首页
新随笔
联系
订阅
管理
2025年7月16日
强化学习笔记(一)基本概念
摘要: 前言 近两年AIGC模型均在SFT之后,进行强化学习的微调,并逐渐成为主流范式,因此,记录一下学习强化学习的笔记,以供回顾。本笔记参考https://www.bilibili.com/video/BV1sd4y167NS。 基本概念 以grid-world game为例,结合上图,给出强化学习中的一
阅读全文
posted @ 2025-07-16 12:00 久逺61
阅读(23)
评论(0)
推荐(0)
公告