文章分类 -  HPC高性能计算

FreeIPA工作原理详解
摘要:FreeIPA(Identity, Policy, Audit)是一个开源的集中式身份管理和安全解决方案,主要用于整合和管理Linux/Unix环境中的用户、策略、权限、审计日志等。其核心作用包括: 统一身份管理:集中管理用户、组、主机、服务等身份信息。 单点登录(SSO):通过Kerberos实现 阅读全文
posted @ 2025-03-31 15:36 LeeHang 阅读(471) 评论(0) 推荐(0)
SVN(Subversion)版本管理工具详解
摘要:### **SVN(Subversion)版本管理工具详解** SVN(Subversion)是一种**集中式版本控制系统**,广泛用于管理代码和文档的版本变更。其核心思想是通过中央仓库(Repository)统一存储文件的历史版本,开发者通过客户端与仓库交互,实现版本控制、协同开发和历史追溯。以下 阅读全文
posted @ 2025-03-31 13:27 LeeHang 阅读(381) 评论(0) 推荐(0)
NIS网络信息服务配置实战
摘要:以下是在CentOS 7.9环境中搭建NIS服务、实现用户统一管理的详细步骤: 一、环境规划 主服务器(Master):IP 192.168.1.10,负责存储用户数据。 客户端节点(Node1/Node2):IP 192.168.1.11、192.168.1.12,绑定到NIS主服务器。 NIS域 阅读全文
posted @ 2025-03-31 11:31 LeeHang 阅读(66) 评论(0) 推荐(0)
NIS(Network Information Service)域名管理工具详解
摘要:NIS(Network Information Service)域名管理工具详解 NIS(Network Information Service,网络信息服务)是一种用于集中管理分布式网络中主机和用户配置信息的系统,广泛应用于UNIX/Linux环境。其核心目标是简化多台机器间的配置同步,提升管理效 阅读全文
posted @ 2025-03-31 11:23 LeeHang 阅读(82) 评论(0) 推荐(0)
07-Slurm和Lustre集群配置健康监控
摘要:以下是为Slurm和Lustre集群配置健康监控的完整方案,包含工具选型、关键指标采集、可视化及告警配置: 一、监控架构设计 + + | Visualization | | Grafana |<-- 统一仪表盘 + + ^ | 查询 + + | Metrics Storage | | Prometh 阅读全文
posted @ 2025-03-29 20:22 LeeHang 阅读(223) 评论(0) 推荐(0)
05-Lustre常用命令以及日常故障排错
摘要:以下是Lustre文件系统的常用命令及日常故障排除场景的详细说明: 一、Lustre常用命令手册 1. 文件系统管理 命令 用途 示例 mkfs.lustre 创建Lustre文件系统 mkfs.lustre --fsname=eda --mdt --mgs --index=0 /dev/sdb m 阅读全文
posted @ 2025-03-29 20:17 LeeHang 阅读(454) 评论(0) 推荐(0)
04-Lustre核心架构、组成原理以及详细工作流程
摘要:以下是关于Lustre高性能分布式文件系统的核心架构、组成原理及详细工作流程的技术解析: 一、Lustre核心架构 1. 架构分层 + + | Client Nodes | # 计算节点(通过Lustre客户端访问) + + | | LNet (Lustre Networking) v + + | 阅读全文
posted @ 2025-03-29 20:14 LeeHang 阅读(179) 评论(0) 推荐(0)
06-Slurm和Lustre的高可用HA集群配置
摘要:针对半导体EDA仿真场景下基于Slurm和Lustre的高可用集群配置,以下是详细技术方案及配置示例: 一、架构设计 + + | HA Cluster Layer | | [Pacemaker+Corosync] | + + | VIP: 10.0.0.100 | + + | Controller 阅读全文
posted @ 2025-03-29 20:09 LeeHang 阅读(190) 评论(0) 推荐(0)
03-Slurm调度作业常用命令以及日常使用场景
摘要:以下是 Slurm 调度作业的 常用命令 及其 日常使用场景 的详细说明,涵盖作业提交、管理、监控和调试等核心操作。无论是新手还是管理员,这些命令都值得掌握。 一、作业提交与管理命令 1. sbatch:提交批处理作业 用途:将脚本提交到队列,由 Slurm 调度执行。 常用参数: -J <name 阅读全文
posted @ 2025-03-29 19:56 LeeHang 阅读(333) 评论(0) 推荐(0)
01-Slurm调度作业工作流程以及配置文件参数详细说明
摘要:以下是关于Slurm作业调度工作流程及slurm.conf配置文件参数的详细说明: 一、Slurm作业调度工作流程 Slurm的作业调度流程可以分为以下几个核心阶段: 1. 作业提交(Submission) 用户通过命令行工具(如sbatch、srun)提交作业。 sbatch提交脚本示例:sbat 阅读全文
posted @ 2025-03-29 19:51 LeeHang 阅读(193) 评论(0) 推荐(0)
02-Slurm集群配置以及作业调度实战
摘要:以下是一个详细的步骤指南,帮助你在本地使用 VMware Workstation 模拟 3 台虚拟机,搭建一个简单的 Slurm 集群,并通过实际作业调度快速掌握其核心功能。整个过程分为 虚拟机配置、Slurm 安装、集群部署、作业提交 四个阶段。 一、虚拟机环境准备 1. 创建 3 台 CentO 阅读全文
posted @ 2025-03-29 19:05 LeeHang 阅读(462) 评论(0) 推荐(0)