云计算基础

0x01.云计算的定义

云计算是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机和其他设备。云计算依赖资源的共享以达成规模经济,类似基础设施(如电力网)。

0x02.云计算市场机遇

云计算技术本身是一个新技术,但是它所用到的关键技术都是传统技术。云计算爆发式发展是在2008年之后开始,下图左边的三角形是传统的IT市场的成本结构,随着互联网技术的发展,中小型IT创业公司出现了,大量的资金投入到采购基础设施设备,但是其核心竞争力是软件应用。随着云计算的出现,基础设施不用再一次性采购,大大降低了成本。
image

0x03.云计算的本质

云计算是新技术+IT业务模式的创新。IT消费模式转变是一个重大的转变:云计算需要通过技术将IT资源池化和服务化,通过互联网提供IT服务,而用户由网络浏览器或轻量级终端软件来获取和使用这些IT服务,从"购买软硬件产品"向"购买信息服务"转变。简单来说,就是把应用程序和数据都放在由大量服务器组成的云中,用户需要什么只要购买相应服务并使用即可。

0x04.云计算的价值

云计算的特点:①按需、自助;②可度量的服务;③广阔的网络访问;④资源池;⑤快速、灵活。

0x05.云计算的分类

服务模型分类:基础架构即服务IaaS、平台即服务PaaS、软件即服务SaaS。
部署模型分类:公有云、私有云、混合云。
云计算的部署模式——公有云
通过Internet为外部客户提供服务的云。云服务提供商通过客户资源的使用情况(vCPU数、磁盘空间大小、时长等)进行收费。一般用户,会结合自身的投入成本,应用访问的方式,选择相应的公有云服务。
典型的公有云有Amazon EC2、阿里云、腾讯云等。
优点:所有的应用、服务、数据都存放在公有云提供商处,客户无需硬件投资与建设及管理。
缺点:数据没有存放在自己的数据中心,安全性存在很大的风险;公有云的可用性不受使用者的控制,存在不确定性。
主要场景:互联网初创公司:由于创业初期,没有太多资金购买相应的IT硬件和软件,通过公有云,能够快速的部署信息化的应用,并且按照使用时长付费,避免一次性投入过多成本。类似的还有科研、高性能计算、大数据、基因测序等,都是自身不需要投入IT建设,按需付费获取这些服务。
云计算的部署模式——私有云
由企业或机构独享使用和掌控的云,仅供自己内部人员或分支机构使用。一般在企业或机构的数据中心部署;适合于有众多分支机构的大型企业、政府部门、行业机构。
优点:数据安全性和系统可用性可控;对现有IT流程管理影响较小、IT资源利用率高。
缺点:投资较大,尤其是一次性的建设投资较大。
主要场景:企业云化数据中心:一般企业客户,会通过私有云的技术,打造一个面向内部各个部门的IT服务平台,比如为营销部门提供虚拟主机,方便建设企业门户网站,未开发部门提供开发软件所需要的虚拟主机等。还有像集团化的大企业,建设企业私有云可以为子公司提供虚拟化的IT基础设施平台。避免重复采购,重复建设,并且还可以将富余的IT资源以服务的方式售卖给外部的用户。
云计算的部署模式——混合云
对于同一份数据、同一套应用,同时采用了私有云技术构建了自己的IT服务平台,同时又采购了公有云服务商提供的IT服务,一般是需要具备可控的前提下,具备一定的弹性或者可靠性,典型的应用场景有:潮汐应用、混合云灾备。
优点:对现有的业务进行合理的区分,对不可预见的访问规模的业务,通过混合云保障业务的弹性,私有云的资源不够,调度公有云的资源,具备弹性,并且可以保障可控性的同时兼顾建设成本。
缺点:IT业务管理的界面不统一,需要投入相应的混合云的管理成本。
主要场景:云灾备、潮汐应用、电商大促、秒杀、游戏公测。
image
作为一种服务模式,根据交付内容的不同,云计算主要包括以下几个层次的服务:

  • IaaS(Infrastructrue-as-a-Service),基础设施即服务。用户可以通过网络使用计算机(物理机或虚拟机)、存储空间、网络连接等完善的计算机基础设施服务。
  • PaaS(Platform-as-a-Service),平台即服务。将软件研发的平台作为一种服务提交给用户,意在加快SaaS应用的开发速度。
  • SaaS(Software-as-a-Service),软件即服务。通过Internet提供软件的模式,用户无需购买软件,而是向提供商租用基于Web的软件,来管理企业经营活动。

0x06.云计算的重要组成要素

云计算由三个要素组成:分为处理资源请求和资源分发的云平台,以及中间的网络管道,以及云使用的终端用户。
云服务平台=数据中心
管道=互联网
数据中心是一个云计算后端基础设施的承载体,就好比"用电"后端的电厂。云计算依托数据中心提供各种云计算的服务。
数据中心是一个云计算后端基础设施的承载体,数据中心内有:门禁安防、视频系统、消防系统、综合布线系统、供电系统、制冷系统、网络、安全、优化、存储、服务器、操作系统、虚拟化、应用软件等。
数据中心是云这个抽象概念的一个实际的物理载体。
image

0x07.云计算的逻辑架构

image

0x08.数据中心系统

电子子系统
image
ATS柜:Automatic Transfer Switch,自动转换开关
UPS:非中断电力系统
空调子系统
image
监控子系统
image
消防子系统
image
机柜子系统
!image
布线子系统
image
KVM子系统
image
通讯子系统
image

0x09.云数据中心

传统IT架构:
image
缺点:缺乏灵活性,资源利用率低,自动化程度低。
互联网背景下的数据中心设计:
image
云化数据中心的云计算管理平台:
image
云计算管理平台的用户服务流程:
image

0x0A.服务器构成

硬件组成:

  • CPU(微架构,类型,主频,核数,线程数,L3缓存等)
  • 内存(标准,类型,容量,运行频率等)
  • 存储(磁盘类型,外形形态,接口类型和带宽,机械磁盘转速,单盘容量等)
  • I/O(类型,外形形态,插槽标准和带宽,接口标准和带宽等)
  • 电源(交流/直流模块,N+1/N+N/N+M冗余,热插拔,能效比,接口标准和类型等)
  • 散热(主动式/被动式,冗余/热插拔风扇等)
  • 管理(带内/带外,远程管理卡,串口/VGA/KVM等)
    软件组成:
  • 固件(系统固件,硬件固件,如BIOS/UEFI)
  • 系统软件(编程语言程序,操作系统,各种服务性程序,数据库管理系统等)
  • 应用软件(通用应用软件,定制应用软件;商用软件和开源软件等)

0x0B.服务器分类

  • 按外形分类:
    image
  • 按体系架构分类:
    image
  • 按网络规模/应用层次分类:
    企业级服务器/入门级服务器。
    x86服务器:又称CISC(复杂指令集)架构服务器,即通常所讲的PC服务器,它是基于PC机体系结构,使用Intel或其他兼容x86指令集的处理器芯片和Windows/Linux操作系统的服务器。
    非x86服务器:包括大型机、小型机和UNIX服务器,它们是使用RISC(精简指令集)或EPIC(并行指令代码)处理器,并且主要采用UNIX和其他专用操作系统的服务器。
    UNIX服务器:也就是中国业内习惯上说的小型机,在服务器市场中处于中高端位置。小型机不是通用机,基本上,各厂家UNIX服务器使用自家的UNIX版本的操作系统和专属的处理器。使用小型机的用户一般是看中UNIX操作系统和专用服务器的安全性、可靠性、纵向扩展性以及高并发访问下的出色处理能力。小型机最引以为傲的就是高RAS(Reliability、Availability、Serviceability):高可靠性、高可用性、高服务型。随着CPU和虚拟化技术的发展,x86服务器的可靠性和可用性早已不是问题,为用户提供了更多的选择。

0x0C.CPU

中央处理器(CPU,Central Processing Unit)是一块超大规模的集成电路,是一台计算机的运算核心(Core)和控制核心(Control Unit)。
主频:表示CPU的处理频率,常见的频率1.7-3.1GHz。数值越高,处理的速度越快。
超频:表示CPU可以“超速”行驶。
核数:表示CPU的并行处理能力。核数越多并行处理速度越快。
超线程:表示CPU可以“高负荷”处理。
VT(Virtualization Technology):虚拟化技术,为了适应信息化发展,Intel推出VT系列以满足不同的上层操作系统对底层处理器的调用。如:VT-x、VT-d、VT-c。

0x0D.内存

内存(Memory)也被称为内存储器,其作用是用于暂时存放CPU中的运算数据,以及硬盘等外部存储器交换的数据。
内存主频:内存主频和CPU主频一样,习惯上被用来表示内存的速度,它代表着该内存所能达到的最高工作频率。
ROM:只读存储器。
RAM:随机存储器。
Cache:高速缓存。

0x0E.硬盘

硬盘(Disk):数据的最终归属地。
分类:机械硬盘(HDD)、固态硬盘(SSD)。
image

0x0F.网卡、存储卡和RAID卡

网卡:通过网络连接线与网络交换机连接。
存储卡:通过网络连接线和存储设备对接。
RAID卡:通过总线和硬盘连接。
image
常用接口:PCI、PCI-X、PCI-E。

0x10.光模块

光模块的作用是光电转换,发送端把电信号转换成光信号,通过光纤传送后,接受端再把光信号转换成电信号。
根据封装类型分为:GBIC(1G)、SFP(1G)、SFP+(10G)、QSFP+(40G)、XFP(10G)等。
根据接口类型分为:SC、LC、FC、ST等。GBIC光模块通常采用SC光纤接口,而SFP和XFP通常采用LC光纤接口。
根据传输距离分为:单模、多模。其中单模传输距离远,多模传输距离近,一般2KM以内的连接均可用多模。
image

0x11.存储基础

0001.什么是存储

存储是根据不同的应用程序环境,通过采取合理、安全、有效的方式将数据保存到某些介质上,并能保证有效的访问。

0002.存储系统的分类

从存储的连接或者构建方式分类:

  • DAS(Direct-Attached Storage 直连附属存储)
  • NAS(Network Attached Storage 网络附属存储)
  • SAN(Storage Area Network 存储区域网络)

0003.DAS存储

DAS(直连附属存储)即主机设备或者计算设备直接通过物理接口和线缆连接存储磁盘,从而获得存储资源。
image
优点:简单。
缺点:独立的数据存储模式,不能共享访问。

0004.NAS存储

image
优点:可实现跨平台的数据共享。
缺点:应用有局限,比如无法在NAS存储上安装操作系统。

0005.SAN存储

image
优点:可靠性高。
缺点:成本较高,维护有难度。
SAN存储主要包括两种网络架构的SAN:一种是基于IP网络的IP SAN,另一种是基于FC网络的FC SAN。

IP SAN
主机端:额外的网卡接口和客户端(OS一般自带)
网络:线速以太网交换机
存储端:具备iscsi的接口
优点:利旧、扩展性好
缺点:开销大、可靠性相比FC差
FC SAN
主机端:FC HBA卡
网络:FC的交换机
存储段:具备FC接口(4G/8G/16G)
优点:可靠性高、性能比IPSAN好
缺点:需要FC网络,扩展性差

image

0006.存储服务类型

image

0007.存储相关的数据保护技术名词

RAID(Redundent Array of Independent Disks)独立磁盘冗余阵列
实现RAID功能的部件:服务器有一块单独的RAID卡,存储设备上有相应的RAID控制器。
image
RAID 0:数据条带化,无校验,逻辑磁盘容量等于磁盘容量之和。
RAID 1:数据镜像,无校验,逻辑磁盘容量等于物理磁盘容量之和的1/2。
image
RAID 5:数据条带化,校验信息分布式存放,逻辑磁盘容量等于(N-1)块磁盘的容量之和。
image
备份
传统意义上的备份是指利用备份软件把数据从磁盘备份到(磁带)磁盘进行离线保存,由如下组件组成:
image
备份的要素:
1.备份管理服务器(安装了备份服务端软件的服务器)
2.备份网络(可以是以太网或FC网络)
3.备份软件(安装在需要备份的主机上)
4.备份存储介质(用于保存数据的存储空间)
快照
快照是特定数据集的一个完整可用拷贝,该数据集包含源数据在拷贝点的静态映像。
image
持续数据保护CDP
CDP是一个“录像机”,能够记录下来每一次IO的变化,并且可指定恢复到具体节点。是一种实时备份的技术,和传统的备份技术相比,它可以持续跟踪数据变化,并记录。
image
IOPS:每一秒能够处理IO的数量。
例如:一块普通的PC硬盘的IOPS在80左右,而一块高性能的SSD固态硬盘的IOPS在10-20万左右。
IO吞吐量:吞吐的单位一般为MB/s,比如U盘拷贝数据的时候,一般可以到10-60MB/秒。
IO Response Time(响应时间):这个是衡量IO成功操作的响应时间,取决于很多因素,比如网络带宽,自身的IOPS能力。

0x12.大二层网络技术

0001.为什么需要大二层网络

数据中心呈现云化的趋势,服务器虚拟化技术是把一台物理服务器虚拟化成多台逻辑服务器。这种逻辑服务器被称为虚拟机(VM),每个VM都可以独立运行,有自己的OS、APP,当前也有自己独立的MAC地址和IP地址,它们通过服务器内部的虚拟交换机(vSwitch)与外部实体网络连接。
image
服务器虚拟化后,带来了一项伴生的技术,那就是虚拟机动态迁移,就是保证虚拟机上服务正常运行的同时,将一个虚拟机系统从一个物理服务器移动到另一个物理服务器的过程。为了保证迁移时业务不中断,就要求在迁移时,不仅虚拟机的IP地址不变,而且虚拟机的运行状态也必须保持原状(例如TCP会话状态),所以虚拟机的动态迁移只能在一个较小的局部范围内进行,为了打破这种限制,实现虚拟机的大范围甚至跨地域的动态迁移,就要求把VM迁移可能涉及的所有服务器都纳入同一个二层网络域,这样才能实现VM的大范围障碍迁移。

0002.传统的二层网络为什么大不起来

广播风暴&VLAN
传统的二层网络中每个二层域就是一个广播域,在同一个广播域里所有的终端都会收到广播流量。在二层域较大时,更容易产生广播风暴,广播风暴的影响范围更广。
为了解决广播风暴问题,通过划分vlan来缩小二层的范围和规模,来控制广播风暴的规模。但是vlan由于协议的原因,只有4096个,无法满足大规模数据中心的要求。
image
xSTP的问题
由于xSTP的收敛性能等原因(如果xSTP的节点过多,那么整网的收敛速度会呈指数级下降),所以一般情况下xSTP的网络规模不会超过100台交换机。同时由于xSTP需要阻塞掉冗余设备和链路,也降低了网络资源的带宽利用率。因此在实际网络规划时,从转发性能、利用率、可靠性等方面考虑,会尽可能控制xSTP网络范围。所以xSTP协议也无法很好的支撑大二层网络的需求。
image
传统二层的规模:基于VLAN+xSTP技术的二层网络,可能容纳的主机数量通常都不会超过1K,远远无法满足大型数据中心的要求

0003.如何实现真正意义上的大二层

网络设备虚拟化技术
网络设备虚拟化技术,就是将相互冗余的两台或多台物理网络设备组合在一起,虚拟化成一台逻辑网络设备,在整个网络中只呈现为一个节点。以网络设备虚拟化+链路聚合技术构建的二层网络天然没有环路,其规模仅受限于虚拟网络设备所能支持的接入能力,只要虚拟网络设备允许,二层网络就可以想做多大就做多大。
常见的网络设备虚拟化技术有华为的CSS、iStack、SVF、CISCO的VSS、FEX、H3C的IRF等。
image
网络设备虚拟化技术方案也有一定的缺点:
1)扩展性受限:由于控制平面合一,整个虚拟机框系统控制平面的重担全部压在了主交换机身上,控制平面的处理能力最多不超过系统中单台设备的处理能力。目前最大规模的堆叠/集群大概可以支持接入1~2万主机,对于超大型的数据中心来说,有时候就显得力不从心了。
2)可靠性问题:控制平面合一的另一大问题是可靠性问题,由于控制平面完全集中在主交换机上,一旦主交换机出现故障,可能会导致较长时间的丢包或者整个系统停止运行。
TRILL协议
二层以太网的帧交换不能有环路,冗余链路必须阻塞掉。但是三层转发网络也是有环路的,为什么就没有这些问题呢?而且三层网络还可以利用冗余链路做ECMP。它们的区别在哪里?
二层网络的设备只看到和自己相连的链路,不知道整个网络的拓扑结构,转发的时候只能通过大喊大叫来寻找目标(向除入端口之外的其他端口广播),这种喊话的声音来回传递就形成了广播风暴。
三层网络是依靠路由协议来计算转发路径的。通过路由协议,各台路由设备就可以收集、扩散和更新彼此的路由信息,进而每一台设备可以知道全部或者局部网络的拓扑信息,所以在数据转发的时候,可以保证从某个主机发出的报文只会向着目标主机一路前进,而不会再返回前序节点造成路径循环。
能不能把三层网络的路由转发方式引入到二层网络中来呢?
通过二层报文前插入额外的帧头,并且采用路由计算的方式控制整网数据的转发,不仅可以在冗余链路下防止广播风暴,而且可以做ECMP。这样可以将二层网络的规模扩展到整张网络,而不受核心交换机数量的限制。当然这需要交换机改变传统的基于MAC的二层转发行为,而采用新的协议机制来进行二层报文的转发。
image
概念介绍:RB(路由桥):运行TRILL协议的设备称为RB,也写作RBridge。RB包含传统交换机的所有功能,同时又具有传统路由器的功能。根据RB在TRILL网络中的位置,又可将其分为Ingress RB、Transit RB和Egress RB三种,分别表示报文进入TRILL网络的入节点、在TRILL网络中经过的中间节点以及离开TRILL网络的出节点。
TRILL将路由协议IS-IS的设计思路引入到二层技术中,同时对IS-IS进行了必要的改造,形成TRILL IS-IS协议。在组网方面,TRILL网络的核心设备RB,众多RB组成TRILL网络。RB之间通过运行TRILL IS-IS协议来感知整个TRILL网络的拓扑,每个RB使用SPF算法生成从自身到TRILL网络中其他RB的路由转发表项,用以完成数据报文的转发。
运行机制:RB通过运行自己的链路状态协议学习TRILL网络拓扑,同时使用SPF(最短路径优先)算法生成从自身到TRILL网络的各个RB的单播路由转发表项以及组播路由转发表项。当一台RB接收到普通以太网数据帧时就查找本地MAC表,若存在,同时该MAC源发自某TRILL网络中的某边缘RB,就将数据帧转换成TRILL数据帧按单播路由转发表项在TRILL网络里转发;如果RB接收到的普通以太网报文的目的MAC在其MAC表中不存在,或此报文为广播或组播报文,就将数据帧转换成TRILL数据帧按组播路由转发表在TRILL网络里转发。当报文转发到TRILL网络出口时由出口RB设备对报文进行解封装,还原成最初进入TRILL网络的以太网数据帧,再进行转发。
TRILL缺点:
1.租户数量问题:和xSTP类似,TRILL也通过VLAN ID来标识用户,VLAN ID仅有12bit,仅支持4000户左右的租户规模。
2.部署成本问题:TRILL技术引入了新的转发标识,增加了新的转发流程,不可避免地需要对设备的转发芯片进行升级换代。所以存量网络使用旧版芯片的设备是无法使用TRILL技术的,增加了客户的部署成本。
Overlay技术
Overlay技术是通过用隧道封装的方式,将源主机发出的原始二层报文封装后在现有网络中进行透明传输,到达目的地之后再解封装得到原始报文,转发给目标主机,从而实现主机之间的二层通信。Overlay方案的核心就是通过点到多点的隧道封装协议,完全忽略中间的网络结构和细节,把整个中间网络虚拟成一台“巨大无比的二层交换机”,每一台主机都是直接连在这台“巨大交换机”的一个端口上。而基础网络之间如何转发都是这台“巨大交换机”内部的事情,主机完全无需关心。
Overlay派的典型技术主要有VXLAN、NVGRE、STT等。
image
当收到从vxlan网络到普通网络的数据时,vxlan网关会去掉外层包头,根据内存够的原始帧头转发到普通端口上。
当有数据从普通网络进入到vxlan网络时,vxlan网关会负责打上外层包头,并根据原始vxlan id对应到一个VNI,同时去掉包头的VXLAN ID信息。
image

0x13.VXLAN网络

0001.VXLAN技术介绍

VXLAN(可扩展虚拟局域网)是基于IP网络,采用“MAC in UDP”封装形式的二层VPN技术,具体封装报文格式如下。VXLAN可以基于已有的服务器提供商或企业IP网络,为分散的物理站点提供二层互联功能,主要应用于数据中心网络。
image

0002.VXLAN技术解决的问题

  • 针对虚拟机规模受网络规格限制
    VXLAN将虚拟机发出的数据包封装在UDP中,并使用物理网络的IP、MAC地址作为外层头进行封装,对网络只表现为封装后的参数。因此,极大降低了大二层网络对MAC地址规格的需求。
  • 针对网络隔离能力的限制
    VXLAN引入了类似VLAN ID的用户标识,称为VXLAN的网络标识VNI,由24比特组成,支持多达16M的VXLAN端,从而满足了大量的用户标识。
  • 针对虚拟机迁移范围受网络架构限制
    VXLAN通过采用MAC in UDP封装来延申二层网络,将以太报文封装在IP报文之上,通过路由再网络中传输,无需关注虚拟机的MAC地址,且路由网络无网络结构限制,具备大规模扩展能力、故障自愈能力、负载均衡能力。通过路由网络,虚拟机迁移不受网络架构限制。

0003.VXLAN基本概念

NVE:网络虚拟边缘节点,实现网络虚拟化功能的网络实体。
VTEP:VXLAN隧道端点,封装在NVE中,用于VXLAN报文的封装和解封装。VTEP与物理网络相连,分配有物理网络的IP地址,该地址与虚拟网络无关。VXLAN报文中源IP地址为本节点的VTEP地址,VXLAN报文中目的IP地址为对端节点的VTEP地址,一对VTEP地址就对应着一个VXLAN隧道。
VNI:VXLAN网络标识,VNI类似VLAN ID,用于区分VXLAN段,不同VXLAN段的虚拟机不能直接二层相互通信。一个VNI表示一个租户,即使多个终端用户属于同一个VNI,也表示一个租户。VNI由24比特组成,支持多达16M的租户。
BD:VXLAN网络中转发数据报文的二层广播域。在VXLAN网络中,将VNI映射到广播域BD,BD称为VXLAN网络转发数据报文的实体。
VBDIF接口:基于BD创建的三层逻辑接口。通过VBDIF接口配置IP地址可实现不同网段的VXLAN间,及VXLAN和非VXLAN的通信,也可实现二层网络接入三层网络。
网关:和VLAN类似,不同VNI之间的VXLAN及VXLAN和非VXLAN之间不能直接相互通信。为了使VXLAN之间,以及VXLAN和非VXLAN之间能够进行通信,VXLAN引入了VXLAN网关。VXLAN网关分为:
①二层网关:用于解决租户接入VXLAN虚拟网络的问题,也可用于同一VXLAN虚拟网络的子网通信。
②三层网关:用于VXLAN虚拟网络的跨子网通信以及外部网络的访问。
image

0004.Underlay网络和Overlay网络

建立VXLAN隧道的基础网络称为Underlay网络,VXLAN隧道所承载的业务网络称为Overlay网络。
Underlay层的路由协议主要有OSPF和EBGP两种。通常来说,针对大多数情况,推荐OSPF作为路由协议的首选协议,只有在网络规模较大,需分区部署,且需要BGP灵活的路由控制能力的情况下,才推荐使用EBGP。
Overlay层采用EVPN协议作为控制平面。可实现VTEP自动发现、VXLAN隧道自动建立,从而降低网络部署、扩展的难度。EVPN可以同时发布二层MAC和三层路由信息。可以减少网络中的泛洪流量。
image

0005.静态方式部署分布式网关-MAC地址学习流程

1.Host3发送源MAC为MAC3,目的MAC为全F、源IP为IP3、目的IP为IP2的ARP请求报文,请求Host2的MAC地址。
2.Leaf1收到该RP请求后,根据二层子接口上的配置判断该请求报文需进入VXLAN隧道,并确定根据报文所对应的VNI(20)。同时Leaf1学习到了Host3的MAC地址、BDID(二层广播域标识)和报文入接口(即二层子接口对应的物理接口Port1)的对应关系,并在本地MAC表中生成Host3的MAC表项,其出接口为Port1。
3.Leaf1对该ARP请求报文进行VXLAN封装,封装的VNI是绑定当前BD的VNI,封装的外层源IP地址为Leaf1的VTEP IP地址,外层目的IP地址为Leaf2的VTEP IP地址,外层源MAC地址为Leaf1的NVE1接口MAC地址,外层目的MAC地址为去往目的IP的网络下一跳的MAC地址。封装后的报文根据外层MAC和IP信息在IP网络中传输,送达Leaf2。
4.Leaf2收到报文后进行解封装,得到Host3发送的原始ARP请求报文,同时Leaf2学习到Host3的MAC地址、BDID和Leaf1上VTEP IP地址的对应关系,并在本地的MAC表中生成Host3的MAC表项,其出接口需根据下一跳(即Leaf1的VTEP IP地址)进行迭代,最终迭代结果是指向Leaf1的VXLAN隧道。
5.Leaf2在对应的二层域内广播ARP请求。Host2收到ARP请求后,比较报文中的目的IP是否为本机的IP地址,如果是,则将Host3的MAC地址保存到本地的MAC表中,并进行ARP应答。
由于此时Host2已经学习到了Host3的MAC地址,所以ARP应答报文为单播报文,后续的ARP应答报文发送过程与上述过程类似,这里不在赘述。Host3和Host2互相学习到对方的MAC地址之后,双方将采用单播通信。
image

0006.静态方式部署分布式网关-已知单播报文转发

1.Leaf1收到来自Host3的报文,根据报文中接入的端口和VLAN信息获取对应的二层广播域,并在该二层广播域内查找出接口和封装信息。
2.Leaf1上VTEP根据查找到的封装信息对数据报文进行VXLAN封装,然后根据查找到的出接口进行报文转发。
3.Leaf2上VTEP收到VXLAN报文后,根据UDP目的端口号、源/目的IP地址、VNI判断VXLAN报文的合法有效性。然后依据VNI获取对应的二层广播域,进行VXLAN解封装,获取内层的二层报文。
4.Leaf2根据内层二层报文的目的MAC,从本地MAC表找到对应的出接口和封装信息,为报文添加VLAN Tag,转发给对应的主机Host2。Host2向Host3发送报文的过程类似,这里不再赘述。
image

posted @ 2026-03-29 13:57  77板烧鸡腿堡  阅读(5)  评论(0)    收藏  举报