文献:Technology-related Disasters:A Survey toward Disaster-resilient Software Defined Networks

DISASTER的定义和影响(本文中)

定义范围:

  • 自然灾害,比如洪水、地震等造成一定范围类的节点故障;
  • 恶意攻击,DDOS攻击或者电磁脉冲攻击造成节点故障;
  • 技术相关的问题,配置错误或者误操作等;

影响:

  • 断电;
  • 硬件问题;
  • 某个节点宕机后导致的级联问题;
    • 级联故障:在一个网络中,由于其中网络节点宕机,导致数据分流到其他节点进而导致其他节点负载加大,甚至出现故障。

SDN相关的故障:

  • DOS导致的节点瘫痪,包括控制平面的节点;
  • 恶意应用;
  • Control-Switch的通讯不可靠(由于灾害等原因);

原文还将冲突的流规则认为是故障的一种,但是很多OpenFLow交换机都有各自的匹配顺序用来解决冲突的流规则,故在此不讨论

数据平面

  对于数据平面,虽然可以利用上层的网络应用来解决,但是将故障网络底层的情况交给控制平面再由控制平面做出决策的时延太大(超过50ms);
  使用BFD(Bidirectional Forwarding Detection)来检测Source-Destance,或者单个链路的故障,之后利用FF机制重路由到预先设置好的备用路径;即,这类方法需要有一个活跃的监视协议以及计算最优路径的算法;

控制平面

  控制平面对于故障的恢复主要在分割数据平面,为每个子数据平面(域)分配一个控制器,这些控制器互为主备。这样的多控制器设计需要考虑控制器之间的信息交互。

posted @ 2018-09-12 10:10  孙敏铭  阅读(177)  评论(0编辑  收藏  举报