会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
marsggbo
互道晚安,王者峡谷见
博客园
首页
新随笔
联系
订阅
管理
2022年8月6日
RuntimeError: NCCL error in:/torch/csrc/distributed/c10d/ProcessGroupNCCL.cpp:1248, unhandled system error, NCCL version 2.12.10
摘要: 在NGC集群使用https://github.com/pytorch/examples/blob/main/imagenet/main.py跑ImageNet分布式训练,运行命令是 python main.py --dist-url 'tcp://127.0.0.1:8888' --dist-bac
阅读全文
posted @ 2022-08-06 13:51 marsggbo
阅读(8659)
评论(0)
推荐(0)
公告