Argocd-repo-server大量僵尸进程导致K3S无法启动

  • 问题现象


查看服务无法正常启动,查看2个node一直notready状态。登录查看发现存在大量git僵尸进程

 

查看父进程确认是argocd-repo服务,此服务是内部的仓库服务,维护git仓库缓存。

 

 

 

  • 解决办法


argocd-reposerver在执行后无法正确终止git进程,或者不等待子进程返回其退出代码。因而导致大量僵尸进程导致K8S变得无响应。

解决此问题的方法是修改argocd-repo-server的yaml,设置shareProcessNamespace: true

添加参数前进入容器查看进程id和命令信息,存在未回收现象,宿主节点仍存在僵尸进程。

 

 

 

添加完成后进程可回收,宿主节点git僵尸进程不再存在,故障恢复。


 

posted @ 2020-11-16 14:12  Squidweber  阅读(85)  评论(0)    收藏  举报