Loading

上一页 1 ··· 12 13 14 15 16 17 18 19 20 ··· 76 下一页
摘要: 需求 写shell脚本希望读取系统变量并且在为定义时赋默认值。 实现 使用${var:-value}语法,例如: $ echo ${var:-1} 1 $ var=2 $ echo ${var:-1} 2 参考 Shell Parameter Expansion (Bash Reference Ma 阅读全文
posted @ 2022-08-31 10:27 azureology 阅读(88) 评论(0) 推荐(0)
摘要: 痛点 使用ssh连接服务器,闲置一会shell就会卡死,很不方便。 解决 修改$HOME/.ssh/config添加 Host * ServerAliveInterval 60 每分钟发送保持连接请求,对所有host生效。 参考 linux - Keep SSH session alive - St 阅读全文
posted @ 2022-08-30 16:38 azureology 阅读(310) 评论(0) 推荐(0)
摘要: SEO Dockerfile配置正确时区信息 Dockerfile调用apt install取消交互 Dockerfile创建用户并设置密码 Docker使用s6配置自启动服务 Docker配置sshd服务自启动 Docker中使用crontab 有关gosu和su/sudo的区别 前言 为提高im 阅读全文
posted @ 2022-08-30 16:15 azureology 阅读(545) 评论(0) 推荐(0)
摘要: 诉求 重新配置服务器,不希望用户感知到host key发生变化,报错known_hosts冲突问题。 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ @ WARNING: REMOTE HOST IDENTIFICATION H 阅读全文
posted @ 2022-08-30 15:15 azureology 阅读(204) 评论(0) 推荐(0)
摘要: 背景 单机多卡并行模型训练,使用DistributedDataParallel加速,调用超过一个GPU会发生卡死,表现为GPU0占用100%且无法继续。 排查 使用nvtop工具查看,发现GPU0会被分配nproc_per_node对应数量的process,表现与预期N卡N线不符。 调用DDP部分代 阅读全文
posted @ 2022-08-28 17:08 azureology 阅读(18739) 评论(1) 推荐(1)
上一页 1 ··· 12 13 14 15 16 17 18 19 20 ··· 76 下一页