摘要: 在这段代码中,DQN 的设置与联邦学习的场景紧密结合,状态、动作、环境和奖励分别具有以下定义和含义: 1. 状态(State) 状态表示系统的当前情况,它提供了决策所需的信息。在该 DQN 设置中,状态由以下部分构成: 客户端损失信息: 损失组件比例(如 nll/total, kl/total, c 阅读全文
posted @ 2024-12-14 16:31 GraphL 阅读(90) 评论(0) 推荐(0)