分布式系统系列--(四)LVS基础知识点介绍

LVS基础知识

LVS

LVS的全称是Linux Vitual Server,即Linux虚拟服务器,它是我国的章高嵩博士的一个开源项目。针对高可伸缩、高可用网络服务的需求,我们给出了基于IP层和基于内容请求分发的负载均衡调度解决方法,并在Linux内核中实现了这些方法,将一组服务器构成一个实现可伸缩的、高可用网络服务的虚拟服务器

LVS的作用

LVS主要用于多服务器的负载均衡。它工作在网络4层模型上,可以实现高性能,高可用的服务器集群技术

网络四层模型从上到下依次为:应用层、传输层、网际层和网络接口层。

特点

  • 廉价,可把许多低性能的服务器组合在一起形成一个超级服务器。
  • 易用,配置简单,且多种负载均衡的方法。
  • 稳定可靠,即使集群中的服务器有某台无法正常工作,也不影响整体的效果,且可扩展性好。

体系结构

虚拟服务器的体系结构如下图,
LVS体系结构图
一组服务器通过高速的局域网或者地理分布的广域网相互连接,在它的前端有一个负载调度器。负载调度器能无缝地将网络请求调度到真实服务器上,从而使得服务器集群的机构对用户是透明的,客户访问集群系统提供的网络服务就像访问一台高性能、高可用的服务器一样。由于我们的负载调度系统是在Linux内核中实现的,所以我称之为Linux虚拟服务器(LVS)。

LVS项目提供的框架

  • IPVS: 提供了含有三种IP负载均衡技术的IP虚拟服务器软件。
  • KTCPVS: 基于内容请求分发的内核Layer-7交换机。
  • Cluster Management: 集群管理软件。

IP虚拟服务器软件(IPVS)

在调度器的实现技术中,IP负载均衡技术是效率最高的。IPVS软件实现了三种IP负载均衡技术:

  • Virtual Server via Direct Routing(VS/DR)
    VS/DR通过改写请求报文的MAC地址,将请求发送到真实服务器,而真实服务器将响应直接返回给客户。同VS/TUN技术一样,VS/DR技术可极大地提高集群系统的伸缩性。这种方法没有IP隧道的开销,对集群中的真实服务器也没有必须支持IP隧道协议的要求,但是要求调度器与真实服务器都有一块网卡连在同一物理网段上。
  • Virtual Server via Network Address Translation(VS/NAT)
    通过网络地址转换,调度器重写请求报文的目标地址,根据预设的调度算法,将请求分派给后端的真实服务器;真实服务器的响应报文通过调度器时,报文的原地址被重写,再返回给客户,完成整个负载调度过程。
  • Virtual Server via IP Tunneling(VS/TUN)
    采用NAT技术时,由于请求和响应报文都必须经过调度器地址重写,当客户请求越来越多时,调度器的处理能力将成为瓶颈。为了解决这个问题,调度器把请求报文通过IP隧道转发至真实服务器,而真实服务器将响应直接返回给客户,所以调度器只处理请求报文。由于一般网络服务应答比请求报文大许多,采用VS/TUN技术后,集群系统的最大吞吐量可以提高10倍。

IPVS调度算法

针对不同的网络服务需求和服务器配置,IPVS调度器实现了如下八种负载调度算法:

  • 轮叫(Round Robin)
  • 加权轮叫(Weighted Round Robin)
  • 最少链接(Least Connections)
  • 加权最少链接(加权轮叫(Weighted Least Connections)
  • 基于局部性最少链接(Locality-based Least Connections)
  • 带复制的基于局部性最少链接(Locality-based Least Connections with Replication)
  • 目标地址散列(Destination Hashing)
  • 源地址散列(Source Hashing)

内核Layer-7交换机(KTCPVS)

在基于IP负载调度技术中,当一个TCP连接的初始SYN报文到达时,调度器就选择一台服务器,将报文转发给它。此后通过查发报文的IP和TCP报文头地址,保证此连接的后继报文被转发到该服务器。这样,IPVS无法检查到请求结果的内容再选择服务器,这就要求后端服务器组提供相同的服务,不管请求被发送到哪一台服务器,返回结果都是一样的。
但是有些应用中后端服务器功能不一,有的提供HTML文档,有的提供图片,有的提供CGI,这就需要基于内容的调度
由于用户空间TCP Gateway的开销太大,我们提出在操作系统的内核中实现Layer-7交换方法,来避免用户空间与核心空间的切换和内存复制的开销。在Linux内核中,我们实现了Layer-7交换,称之为KTCPVS(Kernel TCP Virtual Server)。
虽然应用层交换处理复杂,它的伸缩性有限,但是应用层交换的好处有:

  • 相同页面的请求被发送到同一服务器,可以提高单台服务器的Cache命中率
  • 一些研究表明WEB访问流中存在局部性。Layer-7交换可以充分利用访问的局部性,将相同类型的请求发送到同一服务器,使得每台服务器收到的请求具有更好的相似性,可以进一步提高单台服务器的Cache命中率。
  • 后端服务器可运行不同类型的服务,如文档服务,图片服务,CGI服务和数据库服务等。

LVS集群特点

LVS集群往往包含以下角色:

  1. DS:Director Server,指的是前端负载均衡器节点
  2. RS:Real Server,后端真实的工作服务器
  3. VIP:向外部直接面向用户请求,作为用户请求的目标的IP地址(虚拟IP)
  4. DIP:Director Server IP,主要用于和内部主机通讯的IP地址
  5. RIP:Real Server IP,后端服务器的IP地址
  6. CIP:Client IP,访问客户端的IP地址

功能

  1. 有实现三种IP负载均衡技术和八种连接调度算法的IPVS软件。
  2. 在IPVS内部实现上,采用了高效的Hash函数和垃圾回收机制,能正确处理所调度报文相关的ICMP消息。
  3. 虚拟服务的设置数目没有限制,每个虚拟服务都有自己的服务器集。
  4. 它支持持久的虚拟服务(如HTTP Cookie和HTTPS等需要该功能的支持),并提供详尽的统计数据,如连接的处理速率和报文的流量等。
  5. 针对大规模拒绝服务攻击,实现了三种防卫策略。
  6. 有基于内容请求分发的应用层交换软件KTCPVS,它也是在Linux内核中实现的。
  7. 有相关的集群管理软件对资源进行监测,能及时将故障屏蔽,实现系统的高可用性。
  8. 主、从调度器能周期性地进行状态同步,从而实现更高的可用性。

适用性

后端服务器可运行任何支持TCP/IP的操作系统,包括Linux、Mac os/windows NT/2000等,负载调度器能够支持大多数的TCP/UDP协议。

性能

LVS服务器集群系统具有良好的伸缩性,可支持几百万个并发连接。

可靠性

LVS服务器集群软件已经在很多大型的、关键性的站点得到很好的应用,所以他的可靠性在真实应用得到很好的证实。

软件许可证

LVS集群软件是按GPL(GNU Pulblic Licence)许可证发行的自由软件,这意味着你可以得到软件的源码,有权对其进行更改,但必须也是GPL方式发行的。

posted @ 2020-09-24 14:59  爪哇洋  阅读(374)  评论(0编辑  收藏  举报