linux 管理相关指令
sudo fail2ban-client status sshd fail2ban-client set sshd unbanip xxx.xx.x.x
启用 NCCL 调试模式:
export NCCL_DEBUG=INFO
关闭:
export NCCL_DEBUG=
终止父进程为init PID 1的僵尸进程 | Baeldung中文网
查看内核日志:系统内核日志可能会记录一些 GPU 的错误或状态信息。
-
命令:sudo
dmesg | grep -i nvidia
查看系统日志:某些系统会将 GPU 的状态或错误信息记录在系统日志中。
-
命令:sudo
journalctl -b | grep -i nvidia
sudo journalctl -b --since "2025-05-12 08:00:00" --until "2025-05-12 10:00:00" | grep -i nvidia
grep -i nvidia /var/log/gpu-manager.log
cat /var/log/Xorg.0.log | grep -i nvidia
NVIDIA 驱动程序的日志:cat /var/log/nvidia-installer.log
手动重置GPU:
sudo nvidia-smi --gpu-reset -i 6
-
--gpu-reset: 主要参数,表示要执行GPU重置操作 -
-i 6: 指定要操作的GPU索引号(第6号GPU)
查询用户登录日志:
sudo grep -iE "Failed password|Invalid user" /var/log/auth.log
解禁用户登录:fail2ban-client set sshd unbanip ip地址
查看ssh禁用的IP: sudo fail2ban-client status sshd
查看存在的用户(大于1000的就是用户,其他的是系统内置)
cat /etc/passwd |cut -d: -f 1-3
赋予sudo权限:
[root@192-168-5-133 ~]# vi /etc/sudoers
在root ALL=(ALL) ALL下添加sysadm ALL=(ALL) ALL(注意:格式一定对,如果sysadm是要添加的用户)
## Allow root to run any commands anywhere root ALL=(ALL) ALL sysadm ALL=(ALL) ALL
注意:退出时,先w!,之后q! 。因为该文件不可以随便更改,需要强制写和读。
export https_proxy=localhost:7897
防火墙:
如果你想允许 HTTP(80 端口)和 HTTPS(443 端口)流量,可以运行以下命令:
-
sudo ufw allow 80/tcp -
sudo ufw allow 443/tcp - 开启防火墙:
sudo ufw enable 查看状态:sudo ufw status
无痛安装/重装 Linux服务器 nvidia 驱动安装 - 知乎:
https://zhuanlan.zhihu.com/p/655540898
进程在后台运行:
# 在Ubuntu上安装并使用screen sudo apt update # 更新包列表 sudo apt install screen # 安装screen工具 # 创建一个新的窗口test screen -S test # 进入窗口后 执行文件 python test.py # 退出当前窗口 ctrl+a+d (方法1:保留当前窗口) screen -d (方法2:保留当前窗口) exit (方法3:退出程序,并关闭窗口) # 查看窗口 screen -ls # 重新连接窗口 screen -r id或窗口名称 # 示例: screen -r 344 screen -r test
删除某个会话:
screen -S test -X quit

浙公网安备 33010602011771号