计算机网络-第五章-网络层(控制平面)

第五章网络层：控制平面

本章的5.2节为原理，即一些路由选择算法

5.3节为实现，具体的协议

5.1 导论

回顾:2个网络层功能:

转发:将分组从路由器的一数据平面个输入端口移到合适的输出端口
路由:确定分组从源到目标控制平面的路径

2种构建网络控制平面功能的方法:

每个路由器控制功能实现（传统)
逻辑上集中的控制功能实现(software defined networking)

传统方式：每-路由器(Per-router)控制平面

在每一个路由器中的单独路由器算法元件，在控制平面进行交互

SDN方式：逻辑上集中的控制平面

一个不同的（通常是远程的）控制器与本地控制代理（CAs）交互. 上发状态，下发流表

5.2 路由选择算法

路由选择算法(routing algorithm):网络层软件的一部分,完成路由功能

5.2.1 路由(route)的概念

路由:按照某种指标(传输延迟,所经过的站点数目等)找到一条从源节点到目标节点的较好路径

较好路径: 按照某种指标较小的路径
指标:站数、延迟、费用、队列长度等, 或者是一些单纯指标的加权平均
采用什么样的指标,表示网络使用者希望网络在什么方面表现突出,什么指标网络使用者比较重视

以网络为单位路由

网络到网络的路由= 路由器-路由器之间路由

网络对应的路由器到其他网络对应的路由器的路由
在一个网络中：路由器-主机之间的通信，链路层解决
到了这个路由器就是到了这个网络

以网络为单位进行路由（路由信息通告+路由计算）

网络为单位进行路由，路由信息传输、计算和匹配的代价低
前提条件是：一个网络所有节点地址前缀相同，且物理上聚集
路由就是：计算网络到其他网络如何走的问题

5.2.2 网络的图抽象

(1) 图抽象

图：G = (N, E)
N = 路由器集合 =
E = 链路集合 ={ (u,v), (u,x), (v,x), (v,w), (x,w), (x,y), (w,y), (w,z), (y,z) } 边有代价

就是一个无向有价图

边的代价

c(x,x’) = 链路的代价 (x,x’)，e.g. c(x, x') = 5
Cost of path (x₁, x₂, x₃,…, x_p) = c(x₁,x₂) + c(x₂,x₃) + … + c(x_p-1,x_p)
代价可能总为１(所有边都平等)
或是链路带宽的倒数（求得的是边最短→链路带宽最小→链路最大的边）
或是拥塞情况的倒数（求得的是最不拥塞的路）

总之，希望越大越好的代价，那么边的代价就是改值的倒数

(2) 最优化原则

最优化原则 (optimality principle)

汇集树(sink tree)

此节点到所有其它节点的最优路径形成的树 (源节点) 到源节点的最短距离
路由选择算法就是为所有路由器找到并使用汇集树

路由(算法)的输入：拓扑、边的代价、源节点
输出(算法)的输出：源节点的汇集树

5.2.3 路由的原则

路由选择算法的原则

原则	说明
正确性(correctness)	算法必须是正确的和完整的,使分组一站一站接力，正确发向目标站；完整：目标所有的站地址，在路由表中都能找到相应的表项；没有处理不了的目标站地址；
简单性(simplicity)	算法在计算机上应简单：最优但复杂的算法，时间上延迟很大，不实用，不应为了获取路由信息增加很多的通信量；
健壮性(鲁棒性)(robustness)	算法应能适应通信量和网络拓扑的变化：通信量变化，网络拓扑的变化算法能很快适应；不向很拥挤的链路发数据，不向断了的链路发送数据；
稳定性(stability)	产生的路由不应该摇摆
公平性(fairness)	对每一个站点都公平
最优性(optimality)	某一个指标的最优，时间上，费用上，等指标，或综合指标；实际上，获取最优的结果代价较高，可以是次优的

5.2.4 路由算法分类

全局或者局部路由信息?

类型	说明	举例
全局	所有的路由器拥有完整的拓和边的代价的信息	link state链路状态算法
分布式	路由器只知道与它有物理连接关系的邻居路由器，和到相应邻居路由器的代价值如果想要知道其他节点的代价值，必须通过邻居路由器叠代地与邻居交换路由信息、计算路由信息	distance vector算法

动态或者静态的？

类型	特点	说明
静态	路由随时间变化缓慢	非自适应算法(non-adaptive algorithm)：不能适应网络拓扑和通信量的变化,路由表是事先计算好的
动态	路由变化很快：周期性更新；根据链路代价的变化而变化	自适应路由选择(adaptive algorithm)：能适应网络拓扑和通信量的变化 —— 网络拓扑状态和边的代价状态

5.2.5 链路状态路由(LS)

链路状态(link state)算法，本质上就是迪杰斯特拉算法，只是在计算机网络中成为链路状态算法

(1) 基本思路

配置LS路由选择算法的路由工作过程

各点通过各种渠道获得整个网络拓扑, 网络中所有链路代价等信息（这部分和算法没关系，属于协议和实现）
使用LS路由算法(迪杰斯特拉算法),计算本站点到其它站点的最优路径(汇集树),得到路由表
按照此路由表转发分组(datagram方式)
- 严格意义上说不是路由的一个步骤
- 分发到输入端口的网络层

(2) 基本工作流程

LS路由的基本工作过程

各点通过各种渠道获得整个网络拓扑, 网络中所有链路代价等信息

发现相邻节点,获知对方网络地址
测量到相邻节点的代价(延迟,开销)
组装一个LS分组,描述它到相邻节点的代价情况
将分组通过扩散的方法发到所有其它路由器以上4步让每个路由器获得拓扑和边代价

使用LS路由算法(迪杰斯特拉算法),计算本站点到其它站点的最优路径(汇集树),得到路由表

通过Dijkstra算法找出最短路径（这才是路由算法，上面的是协议的要求）
1. 每个节点独立算出来到其他节点（路由器=网络）的最短路径
2. 迭代算法：第k步能够知道本节点到k个其他节点的最短路径

(3) 详细过程

是上面基本工作流程的详细版本

发现相邻节点,获知对方网络地址
1. 一个路由器上电之后,向所有线路发送HELLO分组
2. 其它路由器收到HELLO分组,回送应答,在应答分组中,告知自己的名字(全局唯一)
3. 在LAN中,通过广播HELLO分组,获得其它路由器的信息, 可以认为引入一个人工节点

测量到相邻节点的代价(延迟,开销)
1. 实测法,发送一个分组要求对方立即响应
2. 回送一个ECHO分组
3. 通过测量时间可以估算出延迟情况
组装一个分组，描述相邻节点的情况
1. 发送者名称
2. 序号,年龄
3. 列表: 给出它相邻节点,和它到相邻节点的延迟

将分组通过扩散(泛洪)的方法发到所有其它路由器

泛洪存在广播风暴的问题，每个节点都泛洪，而且网络中存在环，可能没完没了了，有两种方法：

TTL，每经过一个节点就-1

顺序号，记录已经转发过的分组

顺序号:用于控制无穷的扩散,每个路由器都记录( 源路由器,顺序号),发现重复的或老的就不扩散
- 具体问题1: 循环使用问题
- 具体问题2: 路由器崩溃之后序号从0开始
- 具体问题3:序号出现错误
解决问题的办法:年龄字段(age) （实际上就是TTL）
- 生成一个分组时,年龄字段不为0
- 每个一个时间段,AGE字段减1
- AGE字段为0的分组将被抛弃

链路状态的泛洪是可靠的，就是C→A分组之后，要A要给C ACK信息，否则C会再次给A分组

关于扩散分组的数据结构

项目	说明
Source	从哪个节点收到LS分组
Seq,Age	序号,年龄
Send flags	发送标记,必须向指定的哪些相邻站点转发LS分组
ACK flags	本站点必须向哪些相邻站点发送应答
DATA	来自source站点的LS分组

在下图中

节点B与A、C、F相邻，其为数据结构

Source	Seq	Age	Send flags A	Send flags C	Send flags F	\|	ACK flags A	ACK flags C	ACK flags F
A(相邻)	21	60(初始TTL)	0	1	1	\|	1(A与B相邻，直接获取A的分组，给A ACK)	0	0
F(相邻)	21	60	1	1	0	\|	0	0	1
E(通过A、F获取)	21	59(一次hop)	0	1	0	\|	1(E通过A获取，给A ACK)	0	1
C(相邻)	20	60	1	0	1	\|	0	1	0
D(通过C、F获取)	21	59	1	0	0	\|	0	1	1

通过Dijkstra算法找出最短路径
1. 路由器获得各站点LS分组和整个网络的拓扑
2. 通过Dijkstra算法计算出到其它各路由器的最短路径(汇集树)
3. 将计算结果安装到路由表中

(4) LS应用情况

OSPF协议是一种LS协议,被用于Internet上
IS-IS(intermediate system- intermediate system): 被用于Internet主干中, Netware

(5) Dijkstra算法

每个路由器只需要知道自己到别的节点的最短路径即可，因此使用Dijkstra就行了，不用使用Floyd算法

① 符号标记

c(i,j): 从节点i 到j链路代价(初始状态下非相邻节点之间的链路代价为∞)
D(v): 从源节点到节点V的当前路径代价(节点的代价)
p(v): 从源到节点V的路径前序节点
N’: 当前已经知道最优路径的的节点集合(永久节点的集合)

LS路由选择算法（Dijkstra算法）的工作原理

节点标记: 每一个节点v使用(D(v),p(v)) 如:(3,B)

D(v)从源节点由已知最优路径到达本节点的距离
P(v)前序节点来标注

2类节点

临时节点(tentative node) :还没有找到从源节点到此节点的最优路径的节点
永久节点(permanent node) N’:已经找到了从源节点到此节点的最优路径的节点

② 算法流程

初始化 N' =
- 除了源节点外,所有节点都为临时节点
- 节点代价除了与源节点代价相邻的节点外,都为∞
从所有临时节点中找到一个节点代价最小的临时节点,将之变成永久节点(当前节点)W —— 选择
对此节点的所有在临时节点集合中的邻节点(V) —— 更新
- 如 D(v)>D(w) + c(w,v), 则重新标注此点, (D(W)+C(W,V), W)
- 否则，不重新标注
开始一个新的循环——循环（不断地选择 + 更新）

这个与之前使用的Dijkstra算法的区别：

每个节点都记录其代价和前序节点，根据代价排序

选择节点的时候，只需要从列表中选择最下代价的节点即可（不需要遍历每一个节点了，只需要从数组选择即可）

每次选择一个节点之后，都使用这个节点更新没有选择到的节点，更新其代价和前序节点

③ 例子

例子:

Dijkstra算法的例子

(6) 性能和问题

算法复杂度: n节点

每一次迭代: 需要检查所有不在永久集合N中节点
n(n+1)/2 次比较: O(n2 )
有很有效的实现: O(nlogn)

可能会出现震荡问题：

例如：链路代价 = 链路承载的流量
路径改变次数过多

5.2.6 距离矢量路由(DV)

距离矢量路由（distance vector routing）

DV算法历史及应用情况

1957 Bellman, 1962 Ford Fulkerson
用于ARPANET, Internet(RIP) DECnet , Novell, ApplTalk

(1) 基本思路

距离矢量路由选择的基本思想，以每个点为中心更新路由表

各路由器维护一张路由表,结构如下

To(目标)	Next(到达目标的代价最小的路径中，下一跳)	cost(到目标的代价)
A	Z	14
...	...	...

各路由器与相邻路由器交换路由表(待续)
根据获得的路由信息,更新路由表(待续)

代价及相邻节点间代价的获得
- 跳数(hops), 延迟(delay),队列长度
- 相邻节点间代价的获得：通过实测
路由信息的更新
- 根据实测得到本节点A到相邻站点的代价（如:延迟）
- 根据各相邻站点声称它们到目标站点B的代价，计算出本站点A经过各相邻站点到目标站点B的代价
- 找到一个最小的代价，和相应的下一个节点Z，到达节点B经过此节点Z，并且代价为A-Z-B的代价
- 其它所有的目标节点同样的计算方法

(2) 例子1

距离矢量路由：例子1

以当前节点J为例,相邻节点 A,I,H,K
J测得到A,I,H,K的延迟为 8ms,10ms,12ms,6ms
通过交换DV, 从A,I,H,K获得到它们到G的延迟为 18ms,31ms,6ms,31ms
因此从J经过A,I,H,K到G的延迟为26ms(8 + 18),41ms(10 + 31),18ms(12 + 6), 37ms(31 + 6)
将到G的路由表项更新为18ms, 下一跳为：H(18ms对应的节点)
其它目标一样，除了本节点J

(3) 核心算法

① Bellman-Ford 方程

Bellman-Ford方程（动态规划）

设 d_x(y) := 从x到y的最小路径代价，那么 d_x(y) = min {c(x,v) + dv(y) }

其中：v是x的邻居

例题

明显的,

d_v(z) = 5, d_x(z) = 3, d_w(z) = 3

由于B-F方程得到：

d_u(z) = min { c(u,v) + dv(z), c(u,x) + dx(z), c(u,w) + dw(z) } = min {2 + 5, 1 + 3, 5 + 3} = 4
那个能够达到目标z最小代价的节点x，就在到目标
节点的下一条路径上, 在转发表中使用

② 核心思路

D_x(y) = 节点x到y代价最小值的估计
- x 节点维护距离矢量D_x = [D_x (y): y ∈ N ]
节点x:
- 知道到所有邻居v的代价: c(x,v)
- 收到并维护一个它邻居的距离矢量集
- 对于每个邻居, x 维护 D_v = [D_v (y): y є N ]

每个节点都将自己的距离矢量估计值传送给邻居，定时或者DV有变化时，让对方去算
当x从邻居收到DV时，自己运算，更新它自己的距离矢量（采用B-F equation）
D_x(y) ← min_v{c(x,v) + D_v(y)} 对于每个节点y ∈ N
X往y的代价x到邻居v代价v声称到y的代价
D_x(y)估计值最终收敛于实际的最小代价值dx(y)

③ 算法特点

异步式,迭代: 每次本地迭代被以下事件触发:

本地链路代价变化了
从邻居来了DV的更新消息

也就是当本地到相邻节点的链路发生变化的时候，迭代本地的路由表

或者邻居传来了DV的更新消息的时候，迭代本地的路由表

分布式:

每个节点只是在自己的DV改变之后向邻居通告
然后邻居们在有必要的时候通知他们的邻居

④ 无穷计算问题

DV的特点

好消息传的快坏消息传的慢
好消息的传播以每一个交换周期前进一个路由器的速度进行

此处的好消息是指网络中的好消息，并不是说分组中的数据

例如

好消息:某个路由器接入或有更短的路径

举例

DV的无穷计算问题

坏消息的传播速度非常慢(无穷计算问题)
例子:
- AB之间断开了
- 第一次交换之后, B从C处获得信息,C可以到达A(C-A, 要经过B本身),但是路径是2,因此B变成3,从C处走
- 第二次交换,C从B处获得消息, B可以到达A,路径为3, 因此,C到A从B走,代价为3（因为每次改变都会向周围传递Dv ）
- 无限此之后, 到A的距离变成INF,不可达

⑤ 水平分裂(split horizon)算法

一种对无穷计算问题的解决办法 —— 结局坏消息传的慢的问题

当AB断开之后，C进行交换
C知道要经过B才能到达A，所以C向B报告它到A的距离为INF；C 告诉D它到A的真实距离2（就这样一边传递INF，一边传递真实举例2，水平方向分裂）
下一阶段，C发现到A的路径断开了，D进行交换
D告诉E,它到A的距离,但D告诉C它通向A的距离为INF
第一次交换: B通过测试发现到A的路径为INF,而C也告诉B到A的距离为INF,因此,B到A的距离为INF
第二次交换: C从B和D那里获知,到A的距离为INF,因此将它到A的距离为INF
……坏消息以一次交换一个节点的速度传播

告诉B 无穷，D真实值

⑥ 水平分裂算法问题

水平分裂(split horizon)算法

水平分裂的问题:在某些拓扑形式下会失败（存在环路）

例子:

A,B到D的距离为2, C到D的距离为1
如果C-D路径失败
C获知到D为INF,从A,B获知到D的距离为INF,因此C认为D不可达
A从C获知D的距离为INF,但从B处获知它到D的距离为2,因此A到B的距离为3,从B走
B也有类似的问题
经过无限次之后,A和B都知道到D的距离为INF

(4) 例子2

横坐标是时间，纵坐标是节点的链路表

(5) 问题

这里再来总结一下问题：

无穷计数问题：好消息传的快，坏消息传的慢
ping-pong回路问题：就是左右两个一直来回

5.2.7 LS vs DV

消息复杂度（DV胜出） O(NE)

收敛时间（LS胜出） O(NlogN)

健壮性（LS胜出）节点之间影响较小

性能指标	LS特点	DV特点	比较结果
消息复杂度	有n 节点, E 条链路,发送报文O(nE)个；（局部的路由信息；全局传播）	只和邻居交换信息（全局的路由信息，局部传播）	DV胜出
收敛时间	O(n²) 算法；有可能震荡	收敛较慢；可能存在路由环路；count-to-infinity 问题	LS胜出
健壮性 (路由器故障会发生什么)	节点会通告不正确的链路代价每个节点只计算自己的路由表错误信息影响较小，局部，路由较健壮	节点可能通告对全网所有节点的不正确路径代价每一个节点的路由表可能被其它节点使用错误可以扩散到全网	LS胜出

5.3 因特网中的路由协议

5.2仅仅是理论上介绍了LS和DV两个路由选择算法，5.3介绍互联网中真实实现路由选择算法(实际的、内部的)，也就是协议

5.3.1 路由层次

(1) 平面路由及其问题

一个平面的路由

一个网络中的所有路由器的地位一样
通过LS, DV，或者其他路由算法，所有路由器都要知道其他所有路由器（子网）如何走
所有路由器在一个平面

平面路由的问题

规模问题：规模巨大的网络中，路由信息的存储、传输和计算代价巨大
- DV: 距离矢量很大，且不能够收敛（在收敛的过程中链路变了又得重新计算）
- LS：几百万个节点的LS分组的泛洪传输，存储以及最短路径算法的计算，数据量太大
管理问题：（一个平面搞不定）
- 不同的网络所有者希望按照自己的方式管理网络
- 希望对外隐藏自己网络的细节
- 当然，还希望和其它网络互联

(2) 层次路由的实现

层次路由：将互联网在物理层面上分成一个个AS(路由器区域)

某个区域内的路由器集合，自治系统 “autonomous systems” (AS)
一个AS用AS Number （ASN)唯一标示
一个ISP可能包括1个或者多个AS

路由变成了: 2个层次路由

AS内部路由：在同一个AS 内路由器运行相同的路由协议
- “intra-AS” routing protocol：内部网关协议
- 不同的AS可能运行着不同的内部网关协议
- 能够解决规模和管理问题
- 如：RIP,OSPF,IGRP
- 网关路由器：AS边缘路由器，可以连接到其他AS
AS间运行AS间路由协议
- “inter-AS” routing protocol：外部网关协议
- 解决AS之间的路由问题，完成AS之间的互联互通

(3) 层次路由的优点

解决了规模问题
- 内部网关协议解决:AS内部数量有限的路由器相互到达的间题，AS内部规模可控
  - 如AS节点太多，可分割AS，使得AS内部的节点数量有限
- AS之间的路由的规模问题
  - 增加一个As，对于AS之间的路由从总体上来说，只是增加了一个节点=子网(每个AS可以用一个点来表示)
  - 对于其他AS来说只是增加了一个表项，就是这个新增的AS如何走的问题
  - 扩展性强:规模增大，性能不会减得太多
解决了管理问题
- 各个AS可以运行不同的内部网关协议
- 可以使自己网络的细节不向外透露

5.3.2 内部网关协议

(1) RIP协议

RIP ( Routing Information Protocol)

① 基本概述

在 1982年发布的BSD-UNIX 中实现

使用Distance vector 算法
距离矢量:每条链路cost=1，max = 15hops（也就是说，一条链路表示1跳，到目标子网的举例就是看有多少跳）
DV每隔30秒和邻居交换DV，通告
每个通告包括：最多25个目标子网（路由的单位就是子网）

② RIP通告时间和范围

RIP 通告（advertisements）

通告时间
- 在邻居之间每30秒交换通告报文
- 定期，而且在改变路由的时候发送通告报文
- 在对方的请求下可以发送通告报文
通告范围
- 每一个通告: 至多AS内部的25个目标网络的 DV
- 目标网络+跳数，一次公告最多25个子网最大跳数为16

最多25个：如果一个区域内只有25个子网及以下，可以使用RIP；一般用于小的网络；（互联网的网络数量太多，不能使用RIP）

③ 例子

④ 链路失效和恢复

如果180秒（6个周期）没有收到通告信息，认为邻居或者链路失效

发现经过这个邻居的路由已失效
新的通告报文会传递给邻居
邻居因此发出新的通告 (如果路由变化的话)
链路失效快速(?)地在整网中传输
使用毒性逆转（poison reverse），也就是水平分路阻止ping-pong回路 ( 不可达的距离：跳数无限 = 16 段)

⑤ 进程处理

RIP 以应用进程的方式实现：route-d (daemon) （就是开启一个守护进程处理）
通告报文通过UDP报文传送，周期性重复
网络层的协议使用了传输层的服务，以应用层实体的方式实现

RIP是网络层的协议

RIP协议使用了进程的方式实现

并且使用了传输层的UDP报文

(2) OSPF协议

OSPF(Open Shortest Path First)

① 基本概述

“open”: 标准可公开获得
- 使用LS算法
- LS 分组在网络中（一个AS内部）分发（泛洪）
- 全局网络拓扑、代价在每一个节点中都保持
- 路由计算采用Dijkstra算法
OSPF通告信息中携带：每一个邻居路由器一个表项（就是本节点到邻居节点的信息）
通告信息会传遍AS全部（通过泛洪）
- 在IP数据报上直接传送OSPF报文 (而不是通过UDP和TCP)
IS-IS路由协议：几乎和OSPF一样

② OSPF优点

是指比RIP协议好的

安全:所有的OSPF报文都是经过认证的(防止恶意的攻击)
允许有多个代价相同的路径存在(在RIP协议中只有一个)（可以做负载均衡）
对于每一个链路，对于不同的TOS有多重代价矩阵（可以有多种指标来表示路径的代价）
- 例如:卫星链路代价对于尽力而为的服务代价设置比较低，对实时服务代价设置的比较高
- 支持按照不同的代价计算最优路径，如:按照时间和延迟分别计算最优路径
对单播和多播的集成支持:
- Multicast OSPF(MOSPF)使用相同的拓扑数据库，就像在OSPF中一样
在大型网络中支持层次性OSPF

③ 示意图

在每个范围内进行泛洪

2个级别的层次性: 本地, 骨干
- 链路状态通告仅仅在本地区域Area范围内进行
- 每一个节点拥有本地区域的拓扑信息；
关于其他区域，知道去它的方向，通过区域边界路由器area border routers（最短路径）
区域边界路由器: “汇总（聚集）”到自己区域内网络的距离, 向其它区域边界路由器通告.
骨干路由器: 仅仅在骨干区域内，运行OSPF路由
边界路由器: 连接其它的AS’s.

5.3.3 边界网关协议 BGP

BGP (Border Gateway Protocol):自治区域间路由协议

此处的BGP仅仅是简单地介绍，实际的BGP是非常复杂的

项目	内容
路由算法	距离矢量算法DV
传输层协议	TCP

(1) 基本思路

BGP提供给每个AS以以下方法:

eBGP:从相邻的AS那里获得子网可达信息
iBGP:将获得的子网可达信息传遍到AS内部的所有路由器
根据子网可达信息和策略来决定到达子网的"好"路径

BGP使用距离矢量算法(路径矢量)

子网可达信息：不仅仅是距离矢量，还包括到达各个目标网络的详细路径（AS序号的列表），让其可以计算出其中的环路，避免简单DV算法的ping-pang回路，无穷计算问题

(2) 协议基本概念

BGP 会话: 2个BGP路由器(“peers”)在一个半永久的TCP连接上交换BGP报文，通告向不同目标子网前缀的“路径”（BGP是一个“路径矢量”协议）

现在X子网加入了网络，并且将自己的子网可达信息传给了AS3，要最终传给AS1

当AS3网关路由器 3a 向AS2的网关路由器 2c 通告路径： AS3,X（其含义如下）
- 3a参与AS内路由运算，知道本AS所有子网X信息
- 语义上：AS3向AS2承诺，它可以向子网X转发数据报
- 3a是2c关于X的下一跳（next hop）

(3) BGP转发/通告内容

也就是路径的属性

当通告一个子网前缀时，通告包括BGP 属性（就是在传递子网前缀的时候，还会传递BGP属性），属性包括：

AS-PATH: 前缀的通告所经过的AS列表: AS 67 AS 17
- 检测环路；多路径选择
- 在向其它AS转发时，需要将自己的AS号加在路径上
NEXT-HOP: 从当前AS到下一跳AS有多个链路，在NETX-HOP属性中，告诉对方通过那个I 转发.
其它属性：路由偏好指标，如何被插入的属性

BGP采用TCP协议交换BGP报文，含有如下信息

属性	含义
OPEN	打开TCP连接，认证发送方
UPDATE	通告新路径(或者撤销原路径)
KEEPALIVE	在没有更新时保持连接，也用于对OPEN 请求确认
NOTIFICATION	报告以前消息的错误，也用来关闭连接

(4) 路径通告流程

接下来来举一个例子

路由器AS2.2c从AS3.3a接收到的AS3,X路由通告(通过eBGP)
基于AS2的输入策略，AS2.2c决定接收AS3,X的通告，而且通过iBGP向AS2的所有路由器进行通告
基于AS2的策略，AS2路由器2a通过eBGP向AS1.1c路由器通告AS2,AS3,X 路由信息
路径上加上了AS2自己作为AS序列的一跳

(5) 转发表表象

转发表表象

Q:路由器是如何设置到这些远程子网前缀的转发表表项的？

路由表项是由AS内和AS间的路由共同决定的

如图，1d收到多个到达X的路径，然后根据策略，选择了从接口1输出是最优路径（这是由AS内和AS间的路由共同决定的）

1a：通过OSPF内部网关路由协议，为了到达1c必须要通过本地接口2

(6) 路径选择

① 网关路由器路径选择

网关路由器可能获取有关一个子网X的多条路径，从多个eBGP会话上：

AS1 网关路由器1c从2a学习到路径：AS2,AS3,X
AS1网关路由器1c从3a处学习到路径AS3,X（此时收到了两条到达X的路径）
基于策略，AS1路由器1c选择了路径：AS3,X，而且通过iBGP告诉所有AS1内部的路由器

② 子网内路由器路径选择

路由器可能获得一个网络前缀的多个路径，路由器必须进行路径的选择，路由选择可以基于：

本地偏好值属性: 偏好策略决定
最短AS-PATH ：AS的跳数
最近的NEXT-HOP路由器:热土豆路由
附加的判据：使用BGP标示

一个前缀对应着多种路径，采用消除规则直到留下一条路径

热土豆路由

很形象的名字，扔过来一个热土豆，不管三七二十一，直接扔给最近的人

2d是一个子网内的路由器

2d通过iBGP获知，它可以通过2a或者2c到达X
热土豆策略：选择具备最小内部区域代价的网关作为往X的出口（如：2d选择2a，即使往X可能有比较多的AS跳数）：不要操心域间的代价！
(就是2c和2a都是网关路由器，2d到达2a的代价最小，因此给2a传递，尽管2c的整体跳数要小)

(7) 通过通告路径执行策略

这里就是通过eBGP来执行策略

假设一个ISP只想路由流量到/去往它的客户网络(不想承载其他ISPs之间的流量，即不通告：不是去往我的客户，也不是来自我的客户)

A 向B和C通告路径Aw
B选择不向C通告BAw：B从CBAw的路由上无法获得收益，因为C,A,w都不是B的客户
C从而无法获知CBAw路径的存在：每个ISP感知到的网络和真实不一致
C可能会通过CAw (而不是使用B)最终路由到w

A,B,C 是提供商网络;X,W,Y 是桩网络（stub networks）或者叫端网络
X 是双重接入的，多宿桩网络，接入了2个网络
策略强制让X：
- X不想路由从B通过X到C的分组
- 因而X就不通告给B，它实际上可以路由到C

5.3.4 网关协议: 内部 vs 外部

内部网关协议更加注重性能
外部网关协议注重策略要大于性能（就是一个子网是否要将自己的路径信息转给外部的路径信息，从而让外部的子网的路由来使用自己的网络传输，这有政治策略和经济策略）
- 政治策略：比如说不希望自己的流量被竞争公司使用；
- 经济策略：比如不希望不是自己的用户使用自己的子网的流量；

可以理解为，一个网络是某个单位管理的，外部网关协议决定这个单位是否希望别的子网使用内部的流量；内部网关协议更加注重性能

策略:

Inter-AS: 管理员需要控制通信路径，谁在使用它的网络进行数据传输；
Intra-AS: 一个管理者，所以无需策略：AS内部的各子网的主机尽可能地利用资源进行快速路由

规模:

AS间路由必须考虑规模问题，以便支持全网的数据转发
AS内部路由规模不是一个大的问题
如果AS 太大，可将此AS分成小的AS；规模可控
AS之间只不过多了一个点而已
或者AS内部路由支持层次性，层次性路由节约了表空间, 降低了更新的数据流量

5.4 SDN控制平面

5.4.1 SDN架构

(1) 数据平面交换机

数据平面交换机

快速，简单，商业化交换设备采用硬件实现通用转发功能
流表被控制器计算和安装
基于南向API（例如OpenFlow ），SDN控制器访问基于流的交换机
- 定义了哪些可以被控制哪些不能
也定义了和控制器的协议 (e.g., OpenFlow)

(2) SDN控制器(网络OS)

SDN 控制器(网络OS):

维护网络状态信息
通过上面的北向API和网络控制应用交互
通过下面的南向API和网络交换机交互
逻辑上集中，但是在实现上通常由于性能、可扩展性、容错性以及鲁棒性采用分布式方法

(3) 控制应用

网络控制应用:

控制的大脑：采用下层提供的服务（SDN控制器提供的 API)，实现网络功能
- 路由器交换机
- 接入控制防火墙
- 负载均衡
- 其他功能
非绑定：可以被第三方提供，与控制器厂商以通常上不同，与分组交换机厂商也可以不同

5.4.2 SDN控制器组成

层级	说明
界面层	网络控制应用的界面层抽象API
管理层	网络范围的状态管理层: 网络链路、交互设备和服务的状态: 分布式数据库
通信层	SDN控制器和SDN交换机之间进行通信

5.4.3 OpenFlow协议

(1) 介绍

控制器和SDN交换机交互的协议之一
采用TCP 来交换报文（加密可选）

(2) 报文类型

3种OpenFlow报文类型
- 控制器 → 交换机
- 异步（交换机 → 控制器）
- 对称(misc)

一些关键的控制器到交换机的报文

报文类型	说明
特性	控制器查询交换机特性，交换机应答
配置	交换机查询/设置交换机的配置参数
修改状态	增加删除修改OpenFlow表中的流表
packet-out	控制器可以将分组通过特定的端口发出
分组进入	将分组（和它的控制）传给控制器，见来自控制器的packet-out报文
流移除	在交换机上删除流表项
端口状态	通告控制器端口的变化

幸运的是, 网络管理员不需要直接通过创建/发送流表来编程交换机，而是采用在控制器上的app自动运算和配置

(3) 数据交互案例

S1, 经历了链路失效，采用OpenFlow报文通告控制器:端口状态报文
SDN 控制器接收OpenFlow报文，更新链路状态信息
Dijkstra路由算法应用被调用（前面注册过这个状态变化消息）
Dijkstra路由算法访问控制器中的网络拓扑信息，链路状态信息计算新路由
链路状态路由app和SDN控制器中流表计算元件交互，计算出新的所需流表
控制器采用OpenFlow在交换机上安装新的需要更新的流表

5.4.4 OpenDaylight()ODL控制器

ODL Lithium 控制器
网络应用可以在SDN 控制内或者外面
服务抽象层SAL：和内部以及外部的应用以及服务进行交互
控制应用和控制器分离（应用app在控制器外部）
意图框架：服务的高级规范：描述什么而不是如何
相当多的重点聚焦在分布式核心上，以提高服务的可靠性，性能的可扩展性

5.4.5 SDN面临的挑战

强化控制平面：可信、可靠、性能可扩展性、安全的分布式系统
- 对于失效的鲁棒性：利用为控制平面可靠分布式系统的强大理论
- 可信任，安全：从开始就进行铸造
网络、协议要满足特殊任务的需求，例如实时性，超高可靠性、超高安全性
要满足互联网络范围内的扩展性而不是仅仅在一个AS的内部部署，全网部署

5.6 ICMP

5.6.1 概念和报文格式

（Internet Control Message Protocol）因特网控制报文协议

由主机、路由器、网关用于传达网络层控制信息
- 错误报告：主机不可到达、网络、端口、协议
- Echo 请求和回复（ping）
ICMP处在网络层，但是是在IP协议的上面：ICMP消息由IP数据报承载（并且IP头部信息的上方协议也包含ICMP）
ICMP 报文:
- 类型、编码、加上IP数据报的头8B（第一个导致该ICMP报文的IP数据报）

Type	Code	description
0	0	echo reply (ping)
3	0	dest. network unreachable
3	1	dest host unreachable
3	2	dest protocol unreachable
3	3	dest port unreachable
3	6	dest network unknown
3	7	dest host unknown
4	0	source quench (congestion control - not used)
8	0	echo request (ping)
9	0	route advertisement
10	0	router discovery
11	0	TTL expired
12	0	bad IP header

5.6.2 工作流程

源主机发送一系列UDP段给目标主机
- 第一个：TTL =1
- 第二个： TTL=2, etc.
- 一个不可达的端口号
当第n个数据报到达第n个路由器
1. TTL = 0，路由器抛弃数据报
2. 然后发送一个给源的ICMP报文(type 11, code 0)
3. 报文包括了路由器的名字和IP地址
4. 当ICMP报文到达，源端计算RTT
5. 对于一个nTraceroute做3次
停止的判据
- UDP 段最终到达目标主机
- 目标返回给源主机ICMP “端口不可达”报文(type 3, code 3)
- 当源主机获得这个报文时，停止

5.7 网络管理和SNMP(略）

5.7.1 定义

自治系统（autonomous systems, aka “network”): 1000多个相互的软件和硬件部件

其他复杂系统也需要被监视和控制: 如喷气飞机、核电站

“网络管理”包括了硬件、软件和人类元素的设置，综合和协调，以便监测，测试，轮询，配置，分析，评价和控制网络和网元资源，用合理的成本满足实时性，运行能和服务质量的要求；

5.7.2 网络管理功能

类型	说明
性能管理	性能(利用率、吞吐量)量化、测量、报告、分析和控制不同网络部件的性能涉及到的部件：单独部件（网卡，协议实体），端到端的路径
故障管理	记录、检测和响应故障；性能管理为长期监测设备性能故障管理：突然发生的强度大的性能降低，强调对故障的响应
配置管理	跟踪设备的配置，管理设备配置信息
账户管理	定义、记录和控制用户和设备访问网络资源限额使用、给予使用的收费，以及分配资源访问权限
安全管理	定义安全策略，控制对网络资源的使用

5.7.3 网络管理架构

被管设备包含若干被管对象它们的数据被收集在Management Information Base (MIB)

5.7.4 SNMP协议

报文类型	功能
GetRequest GetNextRequest GetBulkRequest	管理实体-代理: “给我数据”(instance,next in list, block)
InformRequest	实体-实体: 给你MIB值
SetRequest	实体-代理: set MIB value
Response	代理-实体: 值，对请求的响应
Trap	代理-实体: 异常事件的报告

posted @ 2023-07-16 19:23 Crispy·Candy 阅读(961) 评论(0) 收藏举报

刷新页面返回顶部

酥心糖

计算机网络-第五章-网络层(控制平面)

第五章 网络层：控制平面

5.1 导论

5.2 路由选择算法

5.2.1 路由(route)的概念

5.2.2 网络的图抽象

(1) 图抽象

(2) 最优化原则

5.2.3 路由的原则

5.2.4 路由算法分类

5.2.5 链路状态路由(LS)

(1) 基本思路

(2) 基本工作流程

(3) 详细过程

(4) LS应用情况

(5) Dijkstra算法

① 符号标记

② 算法流程

③ 例子

(6) 性能和问题

5.2.6 距离矢量路由(DV)

(1) 基本思路

(2) 例子1

(3) 核心算法

① Bellman-Ford 方程

② 核心思路

③ 算法特点

④ 无穷计算问题

⑤ 水平分裂(split horizon)算法

⑥ 水平分裂算法问题

(4) 例子2

(5) 问题

5.2.7 LS vs DV

5.3 因特网中的路由协议

5.3.1 路由层次

(1) 平面路由及其问题

(2) 层次路由的实现

(3) 层次路由的优点

5.3.2 内部网关协议

(1) RIP协议

① 基本概述

② RIP通告时间和范围

③ 例子

④ 链路失效和恢复

⑤ 进程处理

(2) OSPF协议

① 基本概述

② OSPF优点

③ 示意图

5.3.3 边界网关协议 BGP

(1) 基本思路

(2) 协议基本概念

(3) BGP转发/通告内容

(4) 路径通告流程

(5) 转发表表象

(6) 路径选择

① 网关路由器路径选择

② 子网内路由器路径选择

(7) 通过通告路径执行策略

5.3.4 网关协议: 内部 vs 外部

5.4 SDN控制平面

5.4.1 SDN架构

(1) 数据平面交换机

(2) SDN控制器(网络OS)

(3) 控制应用

5.4.2 SDN控制器组成

5.4.3 OpenFlow协议

(1) 介绍

(2) 报文类型

(3) 数据交互案例

5.4.4 OpenDaylight()ODL控制器

5.4.5 SDN面临的挑战

5.6 ICMP

5.6.1 概念和报文格式

5.6.2 工作流程

5.7 网络管理和SNMP(略）

5.7.1 定义

5.7.2 网络管理功能

5.7.3 网络管理架构

第五章网络层：控制平面