Infiniband网络问题

https://github.com/huaweicloudDocs/bms/blob/master/cn.zh-cn/用户指南/IB网络概述.md

IB网络因其低延迟、高带宽的网络特性被用于很多高性能计算(High Performance Computing,HPC)项目,IB网络采用了100G Mellanox IB网卡,通过专用IB交换机和控制器软件UFM实现网络通信和管理。IB网络通过Partition Key实现网络隔离,不同租户的IB网络可通过不同的Partition Key来隔离,类似于以太网的VLAN。在BMS场景,IB网络支持RDMA和IPoIB通信方式。

裸金属服务器IB网络的发放是通过在创建BMS时选择支持IB网络的规格实现的,即可动态创建IB网络。IB网络发放完成后,即可在裸金属服务器上通过RDMA方式实现高速通信。在IPoIB通信模式下,需要在IB网口上配置IP地址,有静态配置和DHCP动态分配两种方式。静态配置举例如下:

/etc/sysconfig/network/ifcfg-ib0

DEVICE=ib0
TYPE=InfiniBand
ONBOOT=yes
HWADDR=80:00:00:4c:fe:80:00:00:00:00:00:00:f4:52:14:03:00:7b:cb:a1
BOOTPROTO=none
IPADDR=172.31.0.254
PREFIX=24
NETWORK=172.31.0.0
BROADCAST=172.31.0.255
IPV4_FAILURE_FATAL=yes
IPV6INIT=no
MTU=65520
CONNECTED_MODE=yes
NAME=ib0

一文就够——IB网络初识与场景深入理解

6个常见的IB网络不通问题

ib网卡测试命令

rdma 技术

https://github.com/w180112/RDMA-example/

Using RDMA CM

rdma core
librdma

roce网络pfc

etcd backup

https://github.com/acidonper/ocp42-etcd-backup-restore-ansible

https://github.com/vmware-archive/ansible-etcd-cluster/tree/master

posted @ 2025-02-09 22:11  todaygood  阅读(222)  评论(0)    收藏  举报