Controller Plane

Toward Highly Available and Scalable Software Defined Networks for Service Providers

  • IEEE Communications Magazine
  • 2017
  • 综述类,讨论了控制器作为一个故障点的问题。控制器之间的同步机制以及主备控制器的切换;

Response Time and Availability Study of RAFT Consensus in Distributed SDN Control Plane

  • IEEE Transactions on Network and Service Management
  • 2018
  • 问题:单控制器不可靠;
     并且,对于强一致性的分布式协议(RAFT),提交每个请求(选举备用控制器等)前需要集群中每个成员确认,可能花费大量时间(这与集群大小,网络延迟相关),而很多网络服务是时延敏感的;
  • 方法:基于RAFT,提出一种快速恢复的过程;

Heuristic Approaches to the Controller Placement Problem in Large Scale SDN Networks

  • IEEE Transactions on Network and Service Management
  • 2015
  • 问题:一个网络中满足可用性和快速恢复的最少控制器数量;
     在大多数场景中,很多条件无法同时满足;
     大规模网络或动态网络中,底层资源变化频繁,无法快速找到最佳的恢复方法;
  • 方法:提供工具集,考虑各种条件优先的情况下的分布式控制器放置;
     在大规模网络或动态网络中,提供启发式算法来尽快地找到备用控制器;

In-band control, queuing, and failure recovery functionalities for openflow

  • IEEE Network
  • 2016
  • 问题:带内的OpenFLow网络中的故障会导致服务的中断,而这种网络的故障恢复还没被考虑;
  • 方法:利用BFD和队列方式来进行带内OpenFlow的快速恢复;

An Efficient Algorithm for Constructing Controller Trees in SDN

  • IEEE Global Communications Conference
  • 2017
  • 问题:以控制器为根的树形SDN网络拓扑中,当一个父节点宕机时,其子树的交换机会失去与控制器的连接;
  • 方法:根据交换机到控制器的距离和非树内边来构造树形拓扑;

Capacity-aware and Delay-guaranteed Resilient Controller Placement for Software-Defined WANs

  • IEEE Transactions on Network and Service Management
  • 2018
  • 解决:控制器放置问题(CCP),针对广域网中的控制器数量和放置方面来提高网络的弹性;
  • 方法:对CCP进行建模,考虑了单个控制器节点宕机时的恢复情况,将备用控制器的选举从CCP问题独立出来,以达到更好的灵活性;

Beehive: Simple distributed programming in software-defined networks

  • Symposium on Software Defined Networking
  • 2016
  • 问题:分布式控制器对于网络编程不友好;
     大部分控制器使用额外的数据库造成时延及其他的问题;
  • 方法:实现一种对编程友好的分布式控制器架构,提供key-value存储,消息队列,故障恢复和实时检测等功能;并为编程人员提供了友好的API;

Ravana: controller fault-tolerance in software-defined networking

  • ACM SIGCOMM Symposium on Software Defined Networking Research
  • 2015
  • 问题:主备控制器切换时,由于状态(控制器和交换机)的不一致导致网络行为不一致;
  • 方法:将网络事件的处理过程看做一个事务处理,发送故障是根据log进行处理;
     使用两段备份协议来备份状态;

FASIC: A Fast-Recovery, Adaptively Spanning In-Band Control Plane in Software-Defined Network

  • IEEE Global Communications Conference
  • 2017
  • 问题:在带内的SDN网络中,由于数据流量和控制流量共享相同的物理连接和设备,数据流的增大可能会导致控制流量丢失或者延迟;
    方法:设计一种带内SDN网络的控制平面,包括自治的控制平面初始化、流量感知来避免控制流量阻塞及快速恢复;快速恢复方面:下发部分的控制逻辑到交换机,允许交换机在控制器不可达时寻找新的控制器;

Primary-Backup Controller Mapping for Byzantine Fault Tolerance in Software Defined Networks

  • IEEE Global Communications Conference
  • 2017
  • 问题:解决拜占庭将军故障恢复问题需要的大量控制器,并且交换机需要同时给多个控制器发送消息;
  • 方法:减少每个交换机的备用控制器的数量,并允许多个交换机共享备用的控制器;同时,在交换机与控制器连接方面,考虑控制器的负债和OF的时延;
posted @ 2018-09-24 20:36  孙敏铭  阅读(677)  评论(0编辑  收藏  举报