2024 年 12月 14 日随笔档案 - GraphL

2024年12月14日

摘要：在这段代码中，DQN 的设置与联邦学习的场景紧密结合，状态、动作、环境和奖励分别具有以下定义和含义： 1. 状态（State）状态表示系统的当前情况，它提供了决策所需的信息。在该 DQN 设置中，状态由以下部分构成：客户端损失信息：损失组件比例（如 nll/total, kl/total, c 阅读全文

posted @ 2024-12-14 16:31 GraphL 阅读(109) 评论(0) 推荐(0)

csjywu01

公告