linux 管理相关指令

 

sudo fail2ban-client status sshd

fail2ban-client set sshd unbanip  xxx.xx.x.x

 

启用 NCCL 调试模式:

export NCCL_DEBUG=INFO

关闭:

export NCCL_DEBUG=

 

终止父进程为init PID 1的僵尸进程 | Baeldung中文网

查看内核日志:系统内核日志可能会记录一些 GPU 的错误或状态信息。
  • 命令:sudo dmesg | grep -i nvidia
查看系统日志:某些系统会将 GPU 的状态或错误信息记录在系统日志中。
  • 命令:sudo journalctl -b | grep -i nvidia
sudo journalctl -b --since "2025-05-12 08:00:00" --until "2025-05-12 10:00:00" | grep -i nvidia

grep -i nvidia /var/log/gpu-manager.log

cat /var/log/Xorg.0.log | grep -i nvidia

NVIDIA 驱动程序的日志:cat /var/log/nvidia-installer.log

手动重置GPU:

sudo nvidia-smi --gpu-reset -i 6

  • --gpu-reset: 主要参数,表示要执行GPU重置操作

  • -i 6: 指定要操作的GPU索引号(第6号GPU)

查询用户登录日志:

sudo grep -iE "Failed password|Invalid user" /var/log/auth.log

解禁用户登录:fail2ban-client set sshd unbanip ip地址

 查看ssh禁用的IP: sudo fail2ban-client status sshd

查看存在的用户(大于1000的就是用户,其他的是系统内置)

cat /etc/passwd |cut -d: -f 1-3

 赋予sudo权限:

[root@192-168-5-133 ~]# vi /etc/sudoers

在root ALL=(ALL) ALL下添加sysadm ALL=(ALL) ALL(注意:格式一定对,如果sysadm是要添加的用户)

## Allow root to run any commands anywhere
root    ALL=(ALL)       ALL
sysadm  ALL=(ALL)       ALL

注意:退出时,先w!,之后q! 。因为该文件不可以随便更改,需要强制写和读。

 

export https_proxy=localhost:7897

 防火墙:

如果你想允许 HTTP(80 端口)和 HTTPS(443 端口)流量,可以运行以下命令:

  • sudo ufw allow 80/tcp
  • sudo ufw allow 443/tcp
  • 开启防火墙:sudo ufw enable
  • 查看状态:sudo ufw status

无痛安装/重装 Linux服务器 nvidia 驱动安装 - 知乎

https://zhuanlan.zhihu.com/p/655540898

进程在后台运行:

# 在Ubuntu上安装并使用screen
sudo apt update  # 更新包列表
sudo apt install screen  # 安装screen工具

# 创建一个新的窗口test
screen -S test
 
# 进入窗口后 执行文件
python test.py
 
# 退出当前窗口
ctrl+a+d   (方法1:保留当前窗口)
screen -d  (方法2:保留当前窗口)
exit       (方法3:退出程序,并关闭窗口)
 
# 查看窗口
screen -ls
 
# 重新连接窗口
screen -r id或窗口名称
 
# 示例:
screen -r 344 
screen -r test

删除某个会话:

screen -S test -X quit

 

posted @ 2025-04-14 10:31  pioner  阅读(36)  评论(0)    收藏  举报