摘要:
tag: AI system category: 系统论文 abstruct all-to-all communication: (expert-centric) 让专家位于原地,数据在专家之间进行交换。 作者提出了一种”data-centric“的范式:让数据位于原地,在GPU之间移动专家。(因为 阅读全文
posted @ 2023-09-19 19:35
诗子黎
阅读(410)
评论(0)
推荐(0)
摘要:
tag: AI category: 系统论文 又要读论文啦!! 目的:联合利用多个GPU来训练图神经网络。 方式:用一种特殊的数据布局来利用GPU之间的NVLink连接, 并且GPU(显存)中存放了图形拓扑和popular node features。 措施: 引入集体采样源语:collective 阅读全文
tag: AI category: 系统论文 又要读论文啦!! 目的:联合利用多个GPU来训练图神经网络。 方式:用一种特殊的数据布局来利用GPU之间的NVLink连接, 并且GPU(显存)中存放了图形拓扑和popular node features。 措施: 引入集体采样源语:collective 阅读全文
posted @ 2023-09-19 17:18
诗子黎
阅读(193)
评论(0)
推荐(0)
摘要:
tag: AI category: 系统论文 2 Background and Motivation MoE:Misture-of-Expertsn FFN为MoE模型中的专家,多个FFN和一个Gating组成了基本的MoE模型。 2.2 混合和自动并行化 训练密集型深度学习网络的常见的三种并行方式 阅读全文
tag: AI category: 系统论文 2 Background and Motivation MoE:Misture-of-Expertsn FFN为MoE模型中的专家,多个FFN和一个Gating组成了基本的MoE模型。 2.2 混合和自动并行化 训练密集型深度学习网络的常见的三种并行方式 阅读全文
posted @ 2023-09-19 17:05
诗子黎
阅读(459)
评论(0)
推荐(0)

浙公网安备 33010602011771号