会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
csjywu01
博客园
首页
新随笔
联系
订阅
管理
2024年12月14日
强化学习的设置
摘要: 在这段代码中,DQN 的设置与联邦学习的场景紧密结合,状态、动作、环境和奖励分别具有以下定义和含义: 1. 状态(State) 状态表示系统的当前情况,它提供了决策所需的信息。在该 DQN 设置中,状态由以下部分构成: 客户端损失信息: 损失组件比例(如 nll/total, kl/total, c
阅读全文
posted @ 2024-12-14 16:31 GraphL
阅读(90)
评论(0)
推荐(0)
公告