会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
最爱丁珰
博客园
首页
新随笔
联系
订阅
管理
2025年12月13日
分布式训练知识
摘要: 目录基本概念节点集群的层次结构GPU之间的互联层次并行策略选择训练范式数据并行模型并行张量并行流水线并行训练方法单进程多GPU训练分布式训练 基本概念 节点 节点是一个独立的物理服务器,通常包含: 多个CPU(如2颗Intel Xeon,共128个核心) 大容量内存(如1TB DDR4) 多个GPU
阅读全文
posted @ 2025-12-13 22:26 最爱丁珰
阅读(4)
评论(0)
推荐(0)
公告