LVS 负载均衡器总结

　　下面部分原理部分,是从网上摘录，源网址已经无从获取，我将其中一小部分模糊的说明加入了一些自己的理解，仅最大可能让全文容易阅读，也方便自己以后参考，若你是大牛希望能给我一些宝贵的建议，将理解有误的地方加以修改，若你跟我一样也在学习中，这会让你对LVS有更深入的了解，以便在此基础上,能快的进步。

　　-------------依然不忘：快就是慢，慢就是快！谨记。

负载均衡和高可用的简单介绍

　　 1.LB(LoadBalancer)负载均衡,或称为调度器
　　　　硬件：F5 Big-IP ， Citrix(思杰) Netscaler 最常用，A10
　　　　软件：LVS(4层)：根据套接字来负载均衡。套接字=IP + 端口
　　　　　　 Nginx(7层) ：更适合http，smtp，pop3，imap的负载均衡
　　　　　　 Haproxy(7层) :根据用户请求的内容来调度。
　　　　　　　　　　　　它支持4层和7层的负载均衡，其更适合http，tcp(如：mysql，smtp)

　　　　LB集群主要以提高并发能力为根本

　　　　LB的功能：
　　　　　　1. 监控主服务器的存活情况
　　　　　　2. 故障切换时，完成挂载存储，启动服务，抢占VIP

　　2. HA(HighAvailability) 高可用集群
　　　　在线时间/(在线时间 + 故障恢复时间)
　　　　RHCS,heartbeat,pacemaker,rose(windows),PowerHA(AIX)：目前这些使用都不多了。
　　　　主流是：Keepalived,目前官方也非常活跃,更新版本为2.x。

　　　　高可用指标：99％, 99.9%, 99.99%, 99.999%

　　#HA集群主要解决提高服务在线时间为根本

　　3. HPC(High-Performance Computing):高性能计算【HPC集群主要解决大任务计算的问题】
　　　　MapReduce
　　　　追踪任务完成的状态
　　　　Hadoop
　　

LVS的工作原理:

　　 LVS的两大组件：
　　　　用户空间： ipvsadm
　　　　内核空间： ipvs
　　　　当用户请求被网卡收到，该请求将最先来到PREROUTING链，接着进入INPUT链，当请求进入INPUT链后，ipvs将监听
　　到这个连接请求，并将该连接请求重定向到自己，接着根据内部调度规则进行匹配，若没有匹配到则将该请求原封不动的
　　转交给INPUT链，最终被INPUT链转发给监听在指定套接字(IP+Port)的应用程序。若匹配调度规则，则ipvs将修改该请求
　　的相关地址(NAT模型：修改VIP-->RIP; DR模型：修改目的MAC为RealSRV的MAC)后，重定向到POSTROUTING链上，最终
　　转发到后端的Real Server上。

　　使用LVS所需要的加载的几个重要内核模块:
　　　- ip_vs
　　　- ip_vs_rr
　　　- ip_vs_wrr
　　　- ip_vs_sh
　　　- nf_conntrack_ipv4　　 # kernel < 4.19
　　　- nf_conntrack 　　　　 # kernel >= 4.19

LVS的四种工作模式介绍：
　　1.Virtual server via NAT（VS-NAT）
　　　　优点：集群中的物理服务器可以使用任何支持TCP/IP操作系统，物理服务器可以分配Internet的
　　　　　　保留私有地址，只有负载均衡器需要一个合法的IP地址。
　　　　缺点：扩展性有限。当服务器节点（普通PC服务器）数据增长到20个或更多时,负载均衡器
　　　　　　将成为整个系统的瓶颈，因为所有的请求包和应答包都需要经过负载均衡器。假使TCP包的
　　　　　　平均长度是536字节的话，平均每个包重新构建,延迟时间大约为60us（在Pentium处理器上计算的，
　　　　　　采用更快的处理器将使得这个延迟时间变短），负载均衡器的最大容许能力为8.93M/s，假定每台
　　　　　　物理服务器的平台容许能力为400K/s来计算，负载均衡器能为22台物理服务器提供计算。

　　　解决办法：即使是是负载均衡器成为整个系统的瓶颈，如果是这样也有两种方法来解决它。
　　　　　　一种是混合处理: 如果采用混合处理的方法，将需要许多同属单一的RR(DNS的资源记录) DNS域。
　　　　　　另一种是采用Virtual Server via IP tunneling(即:Tunl模型)或Virtual Server via direct routing(即:DR模型) :
　　　　　　　　若使用此方式可以获得更好的可扩展性；也可以嵌套使用负载均衡器，在最前端的是VS-Tunneling或
　　　　　　　　VS-DR的负载均衡器，然后后面采用VS-NAT的负载均衡器。

　　2.Virtual server via IP tunneling（VS-TUN）
　　　　我们发现，许多Internet服务（例如WEB服务器）的请求包很短小，而应答包通常很大。
　　　　优点：负载均衡器只负责将请求包分发给物理服务器，而物理服务器将应答包直接发给用户。所以，
　　　　　　负载均衡器能处理很巨大的请求量，这种方式，一台负载均衡能为超过100台的物理服务器服务，
　　　　　　负载均衡器不再是系统的瓶颈。使用VS-TUN方式，如果你的负载均衡器拥有100M的全双工网卡的话，
　　　　　　就能使得整个Virtual Server能达到1G的吞吐量。
　　　　缺点：但是，这种方式需要所有的服务器支持"IP Tunneling"(IP Encapsulation)协议，我仅在Linux系统上
　　　　　　实现了这个，目前其它操作系统的支持还在探索之中。

　　3.Virtual Server via Direct Routing（VS-DR）
　　　　优点：和VS－TUN一样，负载均衡器也只是分发请求，应答包通过单独的路由方法返回给客户端。与VS-TUN相比，
　　　　　　VS-DR这种实现方式不需要隧道结构，因此可以使用大多数操作系统做为物理服务器，其中包括：
　　　　　　Linux、Solaris 、FreeBSD 、windows、IRIX 6.5；HPUX11等。
　　　　缺点：要求负载均衡器的网卡必须与物理网卡在一个物理段上。

　 4. LVS-FullNAT
　　　通过同时修改请求报文的源IP地址和目标IP地址进行转发（CIP --> DIP, VIP --> RIP ）
　　　此模式在跨机房，跨多个不同网络时,FullNAT模式也可实现调度。
　　因为此时实际是将IP包的源和目标都修改了,就好象调度器直接去访问远端RealServer,远端RealServer只需要
　　　按照自己本地路由,找到网关,将包回应给远端调度器，远端调度器再次将回应包，返回给用户。

　　(1) VIP是公网地址，RIP和DIP是私网地址，且通常不在同一IP网络；因此，RIP的网关一般不会指向DIP
　　(2) RS收到的请求报文源地址是DIP，因此，只需响应给DIP；但Director还要将其发往Client
　　(3) 请求和响应报文都经由Director
　　(4) 支持端口映射
　　注意：此类型kernel默认不支持
　　此中使用场景较少,仅阿里云内部的SLB使用此种模式.

对上面三种IP负载均衡技术的优缺点比较:
杂项　　　　　　　　　VS/NAT　　　　 VS/TUN　　　　　　VS/DR
服务器操作系统　　　　任意　　　　　　支持隧道　　　　　多数(支持Non-arp )
服务器网络　　　　　　私有网络　　　　局域网/广域网　　局域网
服务器数目(100M网络) 10-20　　　　　　100　　　　　　　多(100)
服务器网关　　　　　　负载均衡器　　　自己的路由　　　　自己的路由
效率　　　　　　　　　一般　　　　　　高　　　　　　　　最高

LVS的调度算法介绍：
　　1.轮叫调度（Round Robin）(简称rr)
　　　　不考虑RealServer实际连接数,系统负载,只是轮流给每个RealServer分配请求.

　　2.加权轮叫（Weighted Round Robin）（简称wrr)
　　　　根据实际RealServer的主机配置,将主机配置强的RealServer更大的权重,让调度器分配更多请求给它处理,
　　　同时调度器可自动询问RealServer的负载请求,并动态调整其权重值.

　　3.最少链接（Least Connections）(LC) : 将新的链接请求分配到当前链接数最小的服务器上.
　　　　调度器需要记录每个Server已经建立链接的数目,当调度器给A调度一个请求,则将A的总链接数+1,当链接中止/超时,
　　则总链接-1。
　　　　缺陷：
　　　　　　1. Server性能相同：可平滑分发负载，但不能将长链接的请求发向同一Server.
　　　　　　2. Server性能不同：该算法并不理会。
　　　　　　因为TCP连接处理请求后会进入TIME_WAIT状态,TCP的TIME_WAIT一般为2分钟,此时连接还占用服务器的资源,
　　　　所以会出现这样情形,性能高的服务器已处理所收到的连接,连接处于TIME_WAIT状态,而性能低的服务器已经忙于
　　　　　处理所收到的连接,还不断地收到新的连接请求。

　　4.加权最少链接（Weighted Least Connections）(WLC)
　　　　在集群系统中的服务器性能差异较大的情况下，调度器采用“加权最少链接”调度算法优化负载均衡性能，具有较高权值
　　的服务器将承受较大比例的活动连接负载。调度器可以自动问询真实服务器的负载情况，并动态地调整其权值。

　　5.目标地址散列（Destination Hashing）(DH)
　　　　“目标地址散列”调度算法根据请求的目标IP地址，作为散列键（Hash Key）从静态分配的散列表找出对应的服务器，
　　　若该服务器是可用的且未超载，将请求发送到该服务器，否则返回空。
　　　　补充：
　　　　目标地址散列调度(Destination Hashing Scheduling)算法,是针对目标IP地址的负载均衡,它是一种静态映射算法,
　　　　通过一个散列函数将一个目标IP地址映射为一台服务器。
　　　　目标地址散列算法会先根据请求的目标IP,计算散列哈希(hash key),从静态分配的散列表找出对应的服务器,
　　　　若该服务器是可用且未超载，则将请求发给该服务器，否则返回空,重新调度。
　　　　哈希散列表可理解如下：

　　　　在此算法中,默认它使用256个哈希桶来将目标IP的哈希值前1个字节划分,平均分成256份，每一份
　　　就是一个范围,这样我只要计算出目标IP的哈希值,马上就能确定它应该在那个桶中,然后定位到该桶，
　　　这样在做小范围表扫描，速度就非常快。另外还需要注意：在此算法中它类似于一致性哈希算法，
　　它会事先将所有可用服务器均匀循环分布到每个桶中，更简单理解就是本来就是一张有256条记录的大表,
　　该表中事先将所有可用服务器全部顺序循环插入到每一行记录中,然后将这张大表拆分成多个小表，
　　并按前面的方法,将一个范围值作为进入该小表的条件，这样就可以最大限度均匀每一台服务器的负载。

　　6.源地址散列（Source Hashing）(SH)
　　　　“源地址散列”调度算法根据请求的源IP地址，作为散列键（Hash Key）从静态分配的散列表找出对应的服务器，
　　　若该服务器是可用的且未超载，将请求发送到该服务器，否则返回空。

　　7.基于局部性的最少链接（Locality-Based Least Connections）(LBLC)
　　　　“基于局部性的最少链接”调度算法是针对目标IP地址的负载均衡，目前主要用于Cache集群系统。该算法根据
　　　请求的目标IP地址找出该目标IP地址最近使用的服务器，若该服务器是可用的且没有超载，将请求发送到该服务器；
　　　若服务器不存在，或者该服务器超载且有服务器处于一半的工作负载，则用“最少链接” 的原则选出一个可用的服务器，
　　　将请求发送到该服务器。

　　8.带复制的基于局部性最少链接（Locality-Based Least Connections with Replication）(LBLCR)

　　　　 “带复制的基于局部性最少链接”调度算法也是针对目标IP地址的负载均衡，目前主要用于Cache集群系统。
　　　它与LBLC算法的不同之处是它要维护从一个目标 IP地址到一组服务器的映射，而LBLC算法维护从一个目标IP
　　地址到一台服务器的映射。该算法根据请求的目标IP地址找出该目标IP地址对应的服务器组，按“最小连接”原则
　　从服务器组中选出一台服务器，若服务器没有超载，将请求发送到该服务器；
　　　　若所选服务器超载（超负载的标准是:该服务器正在处理的连接总数 > 其权重值的2倍），则按“最小连接”原则
　　从这个集群中选出一台服务器，将该服务器加入到服务器组中，将请求发送到该服务器。同时，当该所选服务器组
　　有一段时间没有被修改过,则所选服务器加入新缓存复制组后,很可能导致复制流量大量增加，因此将最忙的服务器
　　从服务器组中删除，以降低复制流量的程度。
　　　　我的理解:
　　　　　　因为缓存的热点数据可能仅有20%是有效的,最繁忙的服务器缓存的数据量很大，但有效的经常被访问的热点
　　　　　数据并不一定很多,因此总体考虑,该组中其它服务器上现有的缓存数据可应对一定量的请求,即便损失最繁忙的
　　　　服务器的数据也不会造成太大影响，但若留着它,新加入到节点,可能需要跟它同步缓存数据,将会导致更大的网络
　　　　　带宽被占用，很可能导致整个组的不可用,因此宁愿损失一小部分缓存数据,也不能让整体不可用。
　　　【注意：以上理解不一定正确，仅供参考】

　　9. 最短的期望的延迟（Shortest Expected Delay Scheduling SED）(SED)
　　　　基于wlc算法。这个必须举例来说了
　　　　ABC三台机器分别权重1，2，3 ，连接数也分别是1，2，3。那么如果使用WLC算法的话一个新请求进入时
　　　　它可能会分给ABC中的任意一个，使用sed算法后会进行这样一个运算
　　　　　　A：(1+1)/1 = 2
　　　　　　B：(1+2)/2 = 1.5
　　　　　　C：(1+3)/3 = 1.3334
　　　　根据运算结果，把连接交给C，因为C的处理延时最小。

　　10.最少队列调度（Never Queue Scheduling NQ）(NQ)
　　　　无需队列。如果有台 realserver的连接数＝0就直接分配过去，不需要在进行sed运算。

下面对三种模式做示例配置说明:

　1. LVS-NAT模型：

　　简单的来说，LVS的NAT模型如下图：

　　　　
　　本质是多目标IP的DNAT，通过将请求报文中的目标地址和目标端口修改为通过调度算法挑出
　的RS的RIP和PORT实现转发。

　　 LVS-NAT模型:
　　（1）RealServer和调度器应在同一个IP网络，且应使用私网地址；RealServer的网关要指向调度器的IP
　　（2）调度器(Director)是RealServer的网关, 因此请求和响应报文都将由调度器转发,因此调度器容易成为系统瓶颈.
　　（3）支持端口映射，可修改请求报文的目标PORT
　　（4）LVS必须是Linux系统，RS可以是任意OS系统

　　上面拓扑图的配置如下:
　　Client:
　　　　使用我的物理机,将默认网关指向ISP，当然使用VM也可以.

　　ISP:
　　　　ip addr add dev eth0 192.168.10.254/24
　　　　ip addr add dev eth1 1.0.0.1/24
　　　　Systemctl stop firewalld #关闭firewalld,手动使用iptables来管理防火墙.
　　　　iptables -t nat -A POSTROUTING -s 192.168.10.0/24 !-d 192.168.10.0/24 -j MASQUERADE
　　　　此实验中让Client可访问企业Web,也可用简单的方式:
　　　　　　在ISP和企业防火墙直接互相将默认网关指向对方.

　　企业FireWall：
　　　　ip addr add dev eth0 1.0.0.2/24
　　　　ip addr add dev eth1 192.168.80.254/24
　　　　systemctl stop firewalld
　　　　iptables -t nat -A PREROUTING -d 1.0.0.2 -p tcp --dport 80 -j DNAT --to-destination 192.168.80.10:80
　　　　echo "net.ipv4.ip_forward = 1" >> /etc/sysctl.conf
　　　　sysctl -p

　　Director LVS:
　　　　ip addr add dev eth0 192.168.80.10/24
　　　　firewall-cmd --add-service=http --permanent ; firewall-cmd --reload

　　　　yum install -y ipvsadm
　　　　ipvsadm -A -t 192.168.80.10:80 -s wrr
　　　　ipvsadm -a -t 192.168.80.10:80 -r 192.168.80.11:8080 -m -w 3
　　　　ipvsadm -a -t 192.168.80.10:80 -r 192.168.80.12:8080 -m -w 2
　　　　ipvsadm -a -t 192.168.80.10:80 -r 192.168.80.13:8080 -m
　　
　　　　ipvsadm -L -n (后来截的图,权重不符)

　　三台RealServer上只需配置IP,并安装httpd软件，然后启动即可.
　　　　firewall-cmd --add-port=8080/tcp --permanent; firewall-cmd --reload

　　　　在任意一台上查看httpd的日志:

　　　　　　可以看到CIP是ISP上的IP,即客户端的默认网关外网接口的IP.

　2. LVS-DR模型

　　实验拓扑说明：
　　　　这个拓扑中必须有一个独立的网关，因为用户请求发来时，GW将请求发给VIP，而VIP只有调度器会响应，
　　　GW将请求发给调度器，【注意：调度器的VIP,尽量使用32位掩码，这非必须】，在DR模式下，调度器上与
　　　GW连接的接口上有两个IP，一个是VIP(Virtual IP)，一个是DIP(Director IP)；当调度器收到来自GW的包后,
　　　发现目标是VIP,并且访问的服务与自身定义的虚拟服务一样，接着调度器将数据包中的源MAC修改为自己的MAC，
　　　而目的MAC的修改是根据调度算法，选择一台Real Server后，将该Real Server的MAC填写在目的MAC上，
　　　接着将包发给后端服务器，如此例为Real Server 1，RIP1收到后将解包发现其IP是本地loopback的接口IP，因此RIP1
　　　继续解包，最终将包送给上层服务，如本例是Web服务；Web开始进行响应，最终封包时，将源MAC写为自己，
　　　目的MAC写为GW，源IP写VIP，目的IP写Client IP，并发给GW出去响应。

　　（1）DIP, RIP 和 VIP : 可在同一网段，也可不在同一网段，但他们必须在同一个交换网络。
　　（2）Director(调度器)和RealServer他们的网关都必须指向真实网关(Firewall)，并且都要配置VIP.
　　（3）Director可以响应ARP查询VIP的MAC，但RealServer一律都不回应查询VIP的ARP请求.

　　以上拓扑图的配置如下:　　

　　　　Client:
　　　　　　将默认网关指向ISP

　　　　ISP:
　　　　　　ip addr add dev eth0 192.168.10.254/24
　　　　　　ip addr add dev eth1 1.0.0.1/24
　　　　　　Systemctl stop firewalld 　　　　 #关闭firewalld,手动使用iptables来管理防火墙.
　　　　　　iptables -t nat -A POSTROUTING -s 192.168.10.0/24 !-d 192.168.10.0/24 -j MASQUERADE
　　　　　　此实验中让Client可访问企业Web,也可用简单的方式:
　　　　　　　　在ISP和企业防火墙直接互相将默认网关指向对方.

　　　　企业FireWall：
　　　　　　ip addr add dev eth0 1.0.0.2/24
　　　　　　ip addr add dev eth1 192.168.80.254/24
　　　　　　systemctl stop firewalld
　　　　　　iptables -t nat -A PREROUTING -d 1.0.0.2 -p tcp --dport 80 -j DNAT --to-destination 192.168.80.10:80
　　　　　　echo "net.ipv4.ip_forward = 1" >> /etc/sysctl.conf
　　　　　　sysctl -p

　　　　Director LVS:
　　　　　　ip addr add dev eth0 192.168.80.10/24
　　　　　　ip addr add dev lo 192.168.80.66/32
　　　　　　firewall-cmd --add-service=http --permanent ; firewall-cmd --reload

　　　　　　yum install -y ipvsadm
　　　　　　ipvsadm -A -t 192.168.80.10:80 -s wrr
　　　　　　ipvsadm -a -t 192.168.80.10:80 -r 192.168.80.11:8080 -g -w 3
　　　　　　ipvsadm -a -t 192.168.80.10:80 -r 192.168.80.12:8080 -g -w 2
　　　　　　ipvsadm -a -t 192.168.80.10:80 -r 192.168.80.13:8080 -g

　　　　三台RealServer:
　　　　　　ip addr add dev eth0 192.168.80.11/24 #三台分别配置11，12，13
　　　　　　ip addr add dev lo 192.168.80.66/32 #不一定非要是32,可以是24.

　　　　　　#下面配置实际上是只允许lo接口收到与lo直接连接的接口发来的ARP请求时,
　　　　　　#才响应关于192.168.80.66的MAC响应.同时不在发生免费ARP做自问自答.
　　　　　　#向网络中宣告我要使用192.168.80.66这个IP了。
　　　　　　echo "net.ipv4.conf.all.arp_ignore = 1" >> /etc/sysctl.conf
　　　　　　echo "net.ipv4.conf.all.arp_announce = 2" >> /etc/sysctl.conf
　　　　　　echo "net.ipv4.conf.lo.arp_ignore = 1" >> /etc/sysctl.conf
　　　　　　echo "net.ipv4.conf.lo.arp_announce = 2" >> /etc/sysctl.conf
　　　　　　sysctl -p

　　　　　　firewall-cmd --add-port=80/tcp --permanent; firewall-cmd --reload

　　　查看通信过程的提示:
　　　　1. 在调度器或RealServer使用
　　　　　　tcpdump -i 接口 -n -nn port 80 -w director.cap
　　　　　　　　#这样可捕获通信过程中的所有包,包括调度器收到的,转发给RealServer的,
　　　　　　　　以及RealServer发生给Firewall的.
　　　　　　　　#若向单独查看调度器收到和发送的包，在RealServer上查看自己收到的包和发送的包可：
　　　　　　　　　　tcpdump -i 接口 -n -nn -p port 80
　　　　　　　　　　　　#-p : 仅捕获发给自己的包,非自己的不要.

　　　 2. 在Firewall上查看所有的MAC
　　　　　　ip addr show dev eth1 |grep link/ether
　　　　　　ip neigh

　　　 3. 使用Wireshare查看时,通过添加自定义列来查看MAC的变化

3. LVS Tunnel模式
　　　　拓扑：

　　　LVS Tunnel模式配置要点：
　　　　(1) LVS调度节点、RealServer节点、VIP都必须是公网IP
　　　　(2) LVS调度节点、RealServer节点都必须配置VIP
　　　　(3) 调度节点与 RS间必须打通一条隧道
　　　　(4) 客户端请求发往调度节点，调度节点通过隧道将请求报文封装起来发给RS,
　　　　　　RS在隧道另一端去掉GRE封装,发现是去往VIP的,随即转给tunl0处理,最终Tunl0
　　　　将响应报文从RS的默认路由发出。
　　　　(5) 调度节点要在所有设备上启用只接收网关发送的ICMP的重定向报文。
　　　　(6) 调度节点和 RS上都必须关闭路由转发(ip_forward), RS上关闭ARP响应和返回路径过滤
　　　　　　(即:源是A口,要从B口出,B口不丢该包).

　　LVS Tunnel环境搭建
　　　　(1) 路由器模拟:
　　　　　　echo 1 > /proc/sys/net/ipv4/ip_forward
　　　　　　ifconfig eth0 20.0.0.254/24 up
　　　　　　ifconfig eth1 30.0.0.254/24 up
　　　　　　ifconfig eth2 40.0.0.254/24 up
　　　　　　ifconfig eth3 192.168.10.254/24 up
　　　　　　iptables -t nat -A POSTROUTING -s 192.168.10.0/24 ! -d 192.168.10.0/24 -j SNAT --to 192.168.10.254

　　　(2) LVS调度节点
　　　　#关闭路由转发（默认是关闭.）
　　　　 echo 0 > /proc/sys/net/ipv4/ip_forward

　　　　#在所有接口、默认接口、eth0上都打开仅接收来自网关的ICMP重定向.
　　　　#注：默认应该是打开的,从抓包和分析上看,ICMP重定向是必须,因为客户端访问的调度器的子接口,
　　　　# 而调度器的主接口IP是20.0.0.1,子(次)接口IP20.0.0.2,网关通过ARP发现,客户端访问的VIP20.0.0.2
　　　　# 是在调度器接口上，因此,将去往20.0.0.2的请求重定向给调度器。
　　　　echo 1 > /proc/sys/net/ipv4/conf/all/send_redirects
　　　　echo 1 > /proc/sys/net/ipv4/conf/default/send_redirects
　　　　echo 1 > /proc/sys/net/ipv4/conf/eth0/send_redirects

　　　　#先关闭所有接口,用到那个激活那个。
　　　　　　service network stop

　　　　　　ifconfig eth0 20.0.0.1/24 up
　　　　　　ifconfig eth0:0 20.0.0.2 broadcast 20.0.0.2 netmask 255.255.255.255 up
　　　　　　ip tunnel add tun1 mode gre remote 30.0.0.1 local 20.0.0.1
　　　　　　ifconfig tun1 10.0.0.1/30 up
　　　　　　ip tunnel add tun2 mode gre remote 40.0.0.1 local 20.0.0.1
　　　　　　ifconfig tun2 10.0.0.5/30 up
　　　　　　#注：
　　　　　　　　GRE(通用路由封装) ： https://blog.csdn.net/taozpwater/article/details/9774123
　　　　　　　　简单理解: GRE就是在将原始IP包,再次封装在GRE内部, 接着在再次将GRE包封装到新IP包中,
　　　　　　　　　　然后在加入如链路层帧头,最后发出去.其实GRE,VxLAN,NVGRE,IPSec都可认为是一种VPN.
　　　　　　　　　　MAC帧[IP头[GRE头【IP头[TCP头[应用协议数据]]】]]
　　　　　　　　注意：
　　　　　　　　GRE封装后,若后端是调度器,则该调度器将永远只能看到一个IP来访问自己,因此要注意使用调度算法.

　　　#添加默认路由
　　　　route add default gw 20.0.0.254
　　 #添加主机路由,以便Linux收到去往20.0.0.2的报文后,知道转到那个接口上。
　　　　route add -host 20.0.0.2 dev eth0:0

　　　　yum install ipvsadm
　　　　ipvsadm -A -t 20.0.0.2:80 -s rr
　　　　ipvsadm -a -t 20.0.0.2:80 -r 10.0.0.2 -i 　　 #注意:这里必须使用tunnel模式,即“-i”
　　　　ipvsadm -a -t 20.0.0.2:80 -r 10.0.0.6 -i

　　(2) RealServer1的配置:
　　　　ifconfig eth0 30.0.0.1/24 up
　　　　ifconfig tunl0 20.0.0.2 broadcast 20.0.0.2 netmask 255.255.255.255 up
　　　　#注意：一定要添加一条主机路由,否则Linux的tun0接口收到GRE封包后,
　　　　# 解开发现是一个去往20.0.0.2的IP报文,查本机转发表若没有找到,就可能丢弃该报文.
　　　　# 那么客户端可能就打不开网页了。
　　　　route add -host 20.0.0.2 dev tunl0
　　　　ip tunnel add tun0 mode gre remote 20.0.0.1 local 30.0.0.1
　　　　ifconfig tun0 10.0.0.2/30 up

　　　　#关闭路由转发
　　　　　　echo 0 > /proc/sys/net/ipv4/ip_forward

　　　　#arp_ignore: 定义接收到ARP请求时的响应级别；
　　　　#　　 0：只要本地配置的有相应地址，就给予响应；
　　　　#　　 1：仅响应目的IP配置在此接口上的ARP广播请求
　　　　#arp_announce: 定义将自己的地址向外通告时的通告级别(此行为仅发生在网络设备刚接入网络时)
　　　　#　　 0：将本地任何接口上的任何地址向外通告；
　　　　# 　　 1：试图仅向目标网络通告与其网络匹配的地址；
　　　　# 　　 2：仅向与本地接口上地址匹配的网络进行通告；
　　　　echo 1 > /proc/sys/net/ipv4/conf/tunl0/arp_ignore
　　　　echo 2 > /proc/sys/net/ipv4/conf/tunl0/arp_announce
　　　　echo 1 > /proc/sys/net/ipv4/conf/all/arp_ignore
　　　　echo 2 > /proc/sys/net/ipv4/conf/all/arp_announce

　　　　#关闭tunl0、eth0上返回路径过滤
　　　　echo 0 > /proc/sys/net/ipv4/conf/tunl0/rp_filter
　　　　echo 0 > /proc/sys/net/ipv4/conf/eth0/rp_filter
　　　　echo 0 > /proc/sys/net/ipv4/conf/all/rp_filter

　　(2) RealServer2的配置:
　　　　ifconfig eth0 40.0.0.1/24 up
　　　　ifconfig tunl0 20.0.0.2 broadcast 20.0.0.2 netmask 255.255.255.255 up
　　　　#注意：一定要添加一条主机路由,否则Linux的tun0接口收到GRE封包后,
　　　　# 解开发现是一个去往20.0.0.2的IP报文,查本机转发表若没有找到,就可能丢弃该报文.
　　　　# 那么客户端可能就打不开网页了。
　　　　route add -host 20.0.0.2 dev tunl0
　　　　ip tunnel add tun0 mode gre remote 20.0.0.1 local 40.0.0.1
　　　　ifconfig tun0 10.0.0.6/30 up

　　　　#关闭路由转发
　　　　　　echo 0 > /proc/sys/net/ipv4/ip_forward
　　　　　　echo 1 > /proc/sys/net/ipv4/conf/tunl0/arp_ignore
　　　　　　echo 2 > /proc/sys/net/ipv4/conf/tunl0/arp_announce
　　　　　　echo 1 > /proc/sys/net/ipv4/conf/all/arp_ignore
　　　　　　echo 2 > /proc/sys/net/ipv4/conf/all/arp_announce

　　　#关闭tunl0、eth0上返回路径过滤
　　　　　　echo 0 > /proc/sys/net/ipv4/conf/tunl0/rp_filter
　　　　　　echo 0 > /proc/sys/net/ipv4/conf/eth0/rp_filter
　　　　　　echo 0 > /proc/sys/net/ipv4/conf/all/rp_filter

　　LVS调度器收到来客户端的访问报文：
　　　　#先重定向

　　　 #调度后发送的报文，注意每个IP报文内部的内容,在该IP报文看来都仅仅是数据而已。

　　　 #RealServer2收到GRE报文解封装后，将该报文发给tun0接口后：

　　　 #RealServer2的tun0接口去掉IP层后，发现还是IP报文,随机转发给tunl0接口:

　　 #回应

posted @ 2019-05-24 17:35 张朝锋阅读(1998) 评论(0) 收藏举报

刷新页面返回顶部

wn1m

LVS 负载均衡器总结

公告