作业系统补充-一些BUG的最终处理

由于投任务的问题,又回头看了很多PBS的东西,看看任务为什么down,为什么Q,为什么C。

 

现在总结一下:

1. maui系统我最终还是没用上(虽然装上了),怎么装的就不讲了,很多博客都有,找了很久的资源,我先给个链接。坑有不少,但是我觉得不用躺进去,有问题可以直接留言。

 

2. Q状态找了一些情况,主要就是节点down了。办法很简单,重启mom,关闭防火墙,等待。具体看我上一篇日志就行。

 

3. 任务不跑了,因为我启动了maui,所以以前可以用的节点也不能用了,甚至出现了连接错误等报错,果断杀掉进程,然后重新启动pbs(还是见上一次的日志)。

 

4. 任务在计算节点没有执行力,表现为先R,然后C。其实是挂掉了。

解决办法简单,做一个NFS共享文件夹。

 yum install nfs-utils rpcbind

 vi /etc/exports # 编辑文件

  /file ip(rw,sync,no_root_squash,no_all_squash)

service rpcbind restart

service nfs restart

showmount -e

 

5. NFS系统配置的时候每个节点和目录需要一行一行的配,不然会有问题。

 然后还要改一下UID

$ cat cmd
#cat /etc/passwd | awk -F ":" '{print "sh cmd "$1" "$3}'
adduser $1
usermod -u $2 $1
groupmod -g $2 $1

没有了,大半夜的,没空写。

后面重做的时候更新到公众号。

 

posted on 2021-04-24 01:03  Yuan-SW-F(abysw)  阅读(69)  评论(0编辑  收藏  举报

导航