会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
bhxuwei
博客园
首页
新随笔
联系
订阅
管理
2022年6月29日
基于horovod在k8s上实现分布式训练
摘要: 模型开发过程 分布式训练框架 Horovod k8s、kubeflow、MPI-operator 1 模型开发过程 全流程 详细的训练过程,包括数据集、算法模型、损失函数和优化器四大模块,训练过程就是不断调优确定模型参数的过程。 1.1 训练数据 在机器学习问题中,数据就定义了问题本身。在有监督学习
阅读全文
posted @ 2022-06-29 13:48 bhxuwei
阅读(2546)
评论(0)
推荐(0)
公告