摘要:
随机梯度下降(SGD)的并行实现由于其出色的可扩展性而受到了极大的研究关注。并行SGD时的一个基本障碍是节点之间通信梯度更新的高带宽成本;因此,提出了几种有损压缩启发式算法,其中节点只传递量化梯度。虽然在实践中有效,但这些启发式方法并不总是收敛。 在本文中,我们提出了量化SGD(QSGD),这是一系 阅读全文
posted @ 2021-12-10 19:25
Le2duo
阅读(1008)
评论(0)
推荐(0)

浙公网安备 33010602011771号