【服务器】带外管理和带内管理
在服务器领域中,经常可以听见带外管理的概念。与之对应,肯定有带内管理的概念。
实际上理解服务器管理中的这两种方式非常重要,下面详细解释一下带外管理(Out-of-band Management, OOBM)和带内管理(In-band Management)的区别:
核心概念
-
“带”(Band)指的是什么? 这里的“带”指的是承载主要业务数据流的网络通道或路径。例如,连接服务器的生产网卡(NIC)到交换机的网络,主要用于传输应用程序数据(如网页、数据库查询、文件传输等)。
-
“内”和“外”的区别: 关键在于管理流量是否与主要的业务数据流量共享同一个网络路径和资源(如网卡、交换机端口、IP网络)。
1. 带内管理 (In-band Management)
-
定义: 管理流量(如监控、配置、软件更新)与服务器的主要业务数据流量共享相同的网络接口、网络路径和IP网络基础设施。通俗来讲,带内管理是指在服务器本身内运行管理软件,例:网管软件,可以通过操作系统提供的API来实现对服务器的管理和监控。
-
工作原理:
-
通过服务器的主业务网卡(连接到生产网络)进行管理。
-
管理流量(如SSH, RDP, SNMP, 基于Web的管理界面访问)和业务应用流量(如HTTP, SQL, NFS)在同一个物理或逻辑网络上传输。
-
通常需要服务器操作系统正常运行并加载了网络驱动程序和必要的管理服务(如SSH Daemon, SNMP Agent, Web Server)。
-
-
常见方式:
-
SSH (Secure Shell): 通过命令行远程登录和管理服务器。
-
RDP (Remote Desktop Protocol): 用于Windows服务器的图形化远程桌面。
-
基于Web的管理界面: 许多应用(如Web服务器、NAS设备)提供基于Web的配置界面。
-
SNMP (Simple Network Management Protocol): 用于监控设备状态和性能。
-
Telnet (不推荐,不安全): 旧的命令行远程访问方式。
-
-
优点:
-
部署简单,成本低: 利用现有网络基础设施,无需额外硬件或专用网络。
-
方便: 管理员可以从任何连接到生产网络的地方进行管理。
-
功能丰富: 利用操作系统本身提供的强大管理工具和服务。
-
-
缺点:
-
依赖生产网络: 如果生产网络出现故障、拥塞或被攻击,管理通道也会中断或变得不可用。
-
依赖操作系统: 如果操作系统崩溃、蓝屏、网络驱动/服务失效、或系统负载过高,你将无法通过带内方式访问服务器。
-
安全性顾虑: 管理流量暴露在承载用户/应用流量的同一网络上,可能面临更多攻击面。需要严格的安全措施(如VPN、防火墙规则)。
-
网络拥塞: 管理流量(如大型软件更新)可能会占用业务带宽,影响应用性能。
-
故障排除受限: 当服务器网络或操作系统出现问题时,难以进行诊断和恢复。
-
2. 带外管理 (Out-of-band Management, OOBM)
-
定义: 管理流量与主要的业务数据流量完全分离,使用独立的、专用的网络接口、网络路径和(通常)独立的IP网络基础设施。它绕过了主操作系统和主网络堆栈。 带外管理最初是由Intel在2000年提出的,通过使用网卡或专用管理口与服务器连接,实现对服务器的远程管理和监控。
-
工作原理:
-
服务器配备一个专用的管理端口(通常是一个单独的RJ45网口,标签如 iLO, iDRAC, IPMI, BMC, IMM)。这个端口连接到一个独立的管理网络(物理隔离或逻辑隔离的VLAN)。
-
管理流量通过这个专用端口和专用网络传输。
-
管理功能由一个嵌入在服务器硬件中的独立子系统(如BMC - Baseboard Management Controller)提供。这个子系统有自己的处理器、内存、网络连接和固件,独立于主CPU和操作系统运行。
-
关键特性: 即使服务器关机(但需接通电源)、操作系统无响应(死机、蓝屏)、主网卡故障或主网络中断,只要管理子系统有电源并网络连通,你依然可以进行管理。
-
-
常见方式/协议:
-
IPMI (Intelligent Platform Management Interface): 开源标准,提供基本OOBM功能(电源控制、传感器监控、串口重定向、KVM over IP)。
-
厂商专有方案:
-
HPE: iLO (Integrated Lights-Out)
-
Dell: iDRAC (Integrated Dell Remote Access Controller)
-
Lenovo: XClarity Controller (XCC) / IMM (Integrated Management Module)
-
Cisco: CIMC (Cisco Integrated Management Controller)
-
Supermicro: IPMI
-
-
主要功能:
-
远程电源控制: 开机、关机、硬重启、查看电源状态。
-
远程控制台: KVM over IP (Keyboard, Video, Mouse) - 像坐在机器前一样操作,无论操作系统状态如何(BIOS设置、OS安装、故障诊断)。
-
串口重定向: 访问服务器的串行控制台输出。
-
硬件监控: 实时查看温度、风扇转速、电压、电源状态、硬盘状态等传感器信息。
-
日志访问: 查看硬件事件日志 (SEL),即使系统崩溃也能获取故障信息。
-
远程介质挂载: 将本地的ISO镜像或USB设备远程挂载给服务器,用于安装操作系统或加载工具。
-
固件更新: 更新BMC/管理控制器自身的固件,有时也能更新其他组件(需操作系统支持)。
-
-
-
优点:
-
高可用性与可靠性: 独立于生产网络和主操作系统运行。在网络中断或系统崩溃时仍可访问和管理服务器,是真正的“最后手段”。
-
强大的故障诊断与恢复能力: KVM、串口重定向、远程电源控制、日志访问等功能在系统故障时至关重要,可以远程诊断和尝试恢复,减少现场维护需求。
-
增强安全性(物理/逻辑隔离): 管理流量在专用网络上传输,与生产流量隔离,减少了暴露面和攻击风险。
-
不影响业务网络性能: 管理流量不会占用生产网络带宽。
-
支持“无头”管理: 服务器可以没有连接显示器、键盘、鼠标(Headless),完全远程部署和管理。
-
-
缺点:
-
额外成本: 需要购买支持OOBM的服务器硬件(通常中高端服务器标配或作为选件),并且需要建设和维护独立的管理网络(交换机、布线、IP地址)。
-
配置复杂性: 需要单独配置管理网络、IP地址、用户账户和权限(通常比带内管理更严格)。
-
安全加固需求: 专用网络虽然隔离,但管理控制器本身是一个攻击目标(如IPMI漏洞),必须严格加固(强密码、固件更新、网络访问控制、VPN)。
-
功能可能依赖许可证: 厂商的高级OOBM功能(如高级KVM、远程介质、冗余管理端口)可能需要额外购买许可证。
-
总结:
带内管理和带外管理的主要区别在于管理和控制的方式和范围。带外走独立网络,而带内走服务器生产网络。
带内管理是通过服务器内部的接口进行管理和控制,带内管理的优点是可以对服务器进行实时监控和维护,但它的缺点是需要占用服务器的计算资源,可能会影响服务器的性能。
带外管理则是通过专用的网卡或管理口来实现对服务器的管理,可以不受操作系统和硬件故障的影响,提供更加稳定的管理方式。而带内管理则是在服务器本身运行的管理软件,需要依赖操作系统提供的API,受操作系统和硬件故障的影响较大。带外管理可以通过一些专用硬件设备(例如BMC、DRAC、iLO等)进行实现,也可以通过管理软件和云平台实现。带外管理的优点是可以实现远程管理和监控,不需要物理接触服务器,同时也不会影响服务器的性能。带外管理可以对服务器进行开关机、重启、系统安装、远程控制等操作,非常适用于远程数据中心、云计算环境等场景。

浙公网安备 33010602011771号