文章分类 -  企业故障案例

【故障排除】NIS 客户端用户无法登录:ypcat 密码字段显示 !! 的排查与修复
摘要:【故障排除】NIS 客户端用户无法登录:ypcat 密码字段显示 !! 的排查与修复 1. 问题背景 在我们的 Linux 集群中使用了 NIS(Network Information Service)来集中管理用户账户。最近在 NIS Server 端新创建了几个用户,但在重置密码并推送到客户端后 阅读全文
posted @ 2026-03-16 11:23 LeeHang 阅读(8) 评论(0) 推荐(0)
VNC连接黑屏?可能是xstartup文件权限在作怪!
摘要:VNC连接黑屏?可能是xstartup文件权限在作怪! 一次权限设置的疏忽,导致整个远程桌面无法使用。 在Linux服务器配置VNC远程桌面服务时,很多管理员都遇到过这样的情形:VNC服务正常启动,客户端也能成功连接,但屏幕上只有一片漆黑,没有任何桌面环境。这个问题看似复杂,但很多时候原因却出奇地简 阅读全文
posted @ 2025-10-13 10:41 LeeHang 阅读(990) 评论(0) 推荐(0)
记一次Linux内核崩溃(Kernel Panic)日志分析:Lustre文件系统与锁竞争引发的宕机
摘要:记一次Linux内核崩溃(Kernel Panic)日志分析:Lustre文件系统与锁竞争引发的宕机 事件背景 近期,监控系统(Prometheus)发出告警,提示OpenLava计算平台服务不可用。初步排查发现,计算节点上的Lustre文件系统挂载点消失,系统响应中断,怀疑是Linux内核崩溃导致 阅读全文
posted @ 2025-09-08 10:34 LeeHang 阅读(158) 评论(0) 推荐(0)
LSF 计算节点​​资源已被占满所导致的closed 问题
摘要:在LSF(Load Sharing Facility)集群管理系统中,bhosts命令输出的STATUS字段中的 ​​closed​​ 表示该计算节点​​资源已被占满,无法接受新的作业​​。以下是详细解释: 🔍 closed状态的含义: ​​资源满载​​ 当节点的STATUS为closed时,说明 阅读全文
posted @ 2025-07-28 17:01 LeeHang 阅读(107) 评论(0) 推荐(0)
Cadence作业Pending状态故障分析报告
摘要:以下是一份基于本次问题处理过程的​​Cadence作业Pending状态故障分析报告​​,包含问题定位、解决过程及优化建议: ​​Cadence点击Run后作业Pending问题分析报告​​ ​​问题编号​​:IC-EDA-20240724 ​​影响范围​​:用户xx的Cadence仿真作业 ​​故 阅读全文
posted @ 2025-07-24 16:50 LeeHang 阅读(194) 评论(0) 推荐(0)
zpool raidz2 存储池降级故障处理报告
摘要:ZFS存储池降级故障处理报告 ​​时间​​:2025年07月22日-23日 ​​环境​​: 系统:CentOS 7.9(内核3.10.0-1160.81.1.el7.x86_64) 存储池:pool_ost03(RAIDZ2双冗余组,含12块8TB SAS硬盘) 故障设备:/dev/sdbd(希捷S 阅读全文
posted @ 2025-07-23 10:09 LeeHang 阅读(161) 评论(0) 推荐(0)