2021年12月10日

摘要: 随机梯度下降(SGD)的并行实现由于其出色的可扩展性而受到了极大的研究关注。并行SGD时的一个基本障碍是节点之间通信梯度更新的高带宽成本;因此,提出了几种有损压缩启发式算法,其中节点只传递量化梯度。虽然在实践中有效,但这些启发式方法并不总是收敛。 在本文中,我们提出了量化SGD(QSGD),这是一系 阅读全文
posted @ 2021-12-10 19:25 Le2duo 阅读(924) 评论(0) 推荐(0)

导航