1、技术架构
2、LVS技术特点

3、Tengine技术特点
4、更多功能

SLB（Server Load Balancer）服务通过设置虚拟服务地址（IP），将位于同一地域（Region）的多台云服务器（Elastic Compute Service，简称ECS）资源虚拟成一个高性能、高可用的应用服务池；再根据应用指定的方式，将来自客户端的网络请求分发到云服务器池中。

SLB服务会检查云服务器池中ECS的健康状态，自动隔离异常状态的ECS，从而解决了单台ECS的单点问题，同时提高了应用的整体服务能力。在标准的负载均衡功能之外，SLB服务还具备TCP与HTTP抗DDoS攻击的特性，增强了应用服务器的防护能力。

SLB服务是ECS面向多机方案的一个配套服务，需要同ECS结合使用。

1、技术架构

整个负载均衡系统由3部分构成：四层负载均衡、七层负载均衡和控制系统，如下图所示：

四层负载均衡
采用开源软件LVS（Linux Virtual Server）构建，并根据云计算需求对其进行了定制和优化。
七层负载均衡
采用开源软件Tengine构建。
控制系统
用于配置和监控负载均衡系统。

2、LVS技术特点

LVS是全球最流行的四层负载均衡开源软件，可以实现LINUX平台下的负载均衡。

LVS是基于Linux Netfilter框架实现的一个内核模块（ IPTables是基于Netfilter基本架构实现的一个可扩展的数据报高级管理系统或核外配置工具），名称为IPVS。其钩子函数分别HOOK在LOCAL_IN和FORWARD两个HOOK点，如下图所示：

在云计算大规模网络环境下，官方LVS存在如下问题：

问题1：LVS支持NAT/DR/TUNNEL三种转发模式，上述模式在多VLAN网络环境下部署时，存在网络拓扑复杂，运维成本高的问题。
问题2：和商用负载均衡设备（如F5等）相比，LVS缺少DDOS攻击防御功能。
问题3：LVS采用PC服务器，常用Keepalived软件的VRRP心跳协议进行主备部署，其性能无法扩展。
问题4：LVS常用管理软件Keepalived的配置和健康检查性能不足。

为了解决上述问题， SLB在官方LVS基础上进行了如下定制化和优化：

解决1：新增转发模式FULLNAT，实现LVS-RealServer间跨VLAN通讯。
解决2：新增了SYNPROXY等TCP标志位DDOS攻击防御功能。
解决3：采用LVS集群方式部署。
解决4：对Keepalived的性能进行了优化。

技术分享

Aliyun-LVS开源地址： https://github.com/alibaba/LVS 。更多相关说明如下所述。

FULLNAT技术概述

如下图所示，FULLNAT主要实现方式为：

引入local address（内网IP地址）。cip-vip转换为lip->rip，而 lip和rip均为IDC内网IP，可以跨VLAN通讯。
IN/OUT的数据流全部经过LVS，为了保证带宽，采用万兆（10G）网卡。
FULLNAT转发模式，当前仅支持TCP协议。

技术分享

SYNPROXY技术概述

LVS针对TCP标志位DDOS攻击，采取如下策略：

对于SYN flood类型攻击，利用SYNPROXY模块进行防御。

如下图所示，主要实现方式为：参照Linux TCP协议栈中SYN cookie的思想，LVS代理TCP三次握手。代理过程：

1) Client发送SYN包给LVS。

2) LVS构造特殊SEQ的SYN ACK包给Client。

3) Client回复ACK给LVS。

4) LVS验证ACK包中ack_seq是否合法。

5) 如果合法，则LVS再和Realserver建立3次握手。

对于ACK/FIN/RSTFlood类型攻击，查找连接表，如果不存在，则直接丢弃。

集群部署方式

LVS集群部署方式实现的主要方式为：

LVS和上联交换机间运行OSPF协议。
上联交换机通过ECMP等价路由，将数据流分发给LVS集群。
LVS集群再转发给业务服务器。

集群方式部署极大的保证了异常情况下，负载均衡服务的稳定性：

健壮性
LVS和交换机间运行OSPF心跳。1个VIP配置在集群的所有LVS上。当一台LVS down，交换机会自动发现并将其从ECMP等价路由中剔除。
可扩展
如果当前LVS集群无法支撑某个VIP的流量，LVS集群可以进行水平扩容。

技术分享

Keepalived优化

阿里云在SLB中针对LVS管理软件Keepalived进行了全面优化，主要包括：

优化了网络异步模型，select方式改为epoll方式。
优化了reload过程。

综上所述，基于LVS的SLB四层负载均衡产品具有如下特点；

高可用：LVS集群保证了冗余性，无单点。
安全：LVS自带攻击防御+云盾，提供了接近于实时防御的能力。
健康检查：SLB对后端ECS进行健康检查，自动屏蔽异常状态的ECS，待该ECS恢复正常后自动解除屏蔽。

3、Tengine技术特点

Tengine是阿里巴巴发起的WEB服务器项目，其在Nginx的基础上，针对大访问量网站的需求，添加了很多高级功能和特性是当前最流行的7层负载均衡开源软件之一。Tengine的性能和稳定性已经在大型的网站如淘宝网，天猫商城等得到了很好的检验。它的最终目标是打造一个高效、稳定、安全、易用的Web平台。

注：Tengine开源地址http://tengine.taobao.org/。

针对云计算场景，Tengine定制的主要特性如下：

继承Nginx-1.4.6的所有特性，100%兼容Nginx的配置。
动态模块加载（DSO）支持。加入一个模块不再需要重新编译整个Tengine。
更加强大的负载均衡能力，包括一致性Hash模块、会话保持模块，还可以对后端的服务器进行主动健康检查，根据服务器状态自动上线下线。
监控系统的负载和资源占用从而对系统进行保护。
对运维人员更友好的出错信息，便于定位出错机器。
更强大的防攻击（访问速度限制等）模块。

采用Tengine作为SLB的基础模块的阿里云SLB七层负载均衡产品，具有如下特点：

高可用：Tengine集群保证了冗余性，无单点。
安全：多维度的CC攻击防御能力。
健康检查：SLB对后端ECS进行健康检查，自动屏蔽异常状态的ECS，待该ECS恢复正常后自动解除屏蔽。
会话保持：支持7层会话保持功能。
一致性：支持一致性hash调度。

4、更多功能

SLB作为负载均衡设备，其最重要的指标是【稳定性】，在进一步提高稳定性方面，主要工作包括：

支持集群内部 session同步。
采用Anycast技术实现同城双A。

在功能方面有更多支持，包括：

白名单访问控制
从SLB层面实现访问控制，用户可以在SLB系统上配置白名单，便于用户灵活限定外部访问请求。
更多服务协议的支持
当前已经支持HTTPS、UDP。

四层和七层负载均衡的区别

　　首先简单介绍一下LVS (Linux Virtual Server)到底是什么东西，其实它是一种集群(Cluster)技术，采用IP负载均衡技术和基于内容请求分发技术。调度器具有很好的吞吐率，将请求均衡地转移到不同的服务器上执行，且调度器自动屏蔽掉服务器的故障，从而将一组服务器构成一个高性能的、高可用的虚拟服务器。整个服务器集群的结构对客户是透明的，而且无需修改客户端和服务器端的程序。

　　为此，在设计时需要考虑系统的透明性、可伸缩性、高可用性和易管理性。一般来说，LVS集

　　负载调度器(load balancer/ Director)，它是整个集群对外面的前端机，负责将客户的请求发送到一组服务器上执行，而客户认为服务是来自一个IP地址(我们可称之为虚拟IP地址)上的。

　　服务器池(server pool/ Realserver)，是一组真正执行客户请求的服务器，执行的服务一般有WEB、MAIL、FTP和DNS等。

　　共享存储(shared storage)，它为服务器池提供一个共享的存储区，这样很容易使得服务器池拥有相同的内容，提供相同的服务。

　　VS/NAT是一种最简单的方式，所有的RealServer只需要将自己的网关指向Director即可。客户端可以是任意操作系统，但此方式下，一个Director能够带动的RealServer比较有限。在VS/NAT的方式下，Director也可以兼为一台RealServer。VS/NAT的体系结构如图所示。

　　IP隧道(IP tunneling)是将一个IP报文封装在另一个IP报文的技术，这可以使得目标为一个IP地址的数据报文能被封装和转发到另一个IP地址。IP隧道技术亦称为IP封装技术(IP encapsulation)。IP隧道主要用于移动主机和虚拟私有网络(Virtual Private Network)，在其中隧道都是静态建立的，隧道一端有一个IP地址，另一端也有唯一的IP地址。它的连接调度和管理与VS/NAT中的一样，只是它的报文转发方法不同。调度器根据各个服务器的负载情况，动态地选择一台服务器，将请求报文封装在另一个IP报文中，再将封装后的IP报文转发给选出的服务器;服务器收到报文后，先将报文解封获得原来目标地址为 VIP 的报文，服务器发现VIP地址被配置在本地的IP隧道设备上，所以就处理这个请求，然后根据路由表将响应报文直接返回给客户。

　　VS/DR方式是通过改写请求报文中的MAC地址部分来实现的。Director和RealServer必需在物理上有一个网卡通过不间断的局域网相连。 RealServer上绑定的VIP配置在各自Non-ARP的网络设备上(如lo或tunl),Director的VIP地址对外可见，而RealServer的VIP对外是不可见的。RealServer的地址即可以是内部地址，也可以是真实地址。

　　VS/DR的工作流程如图所示：它的连接调度和管理与VS/NAT和VS/TUN中的一样，它的报文转发方法又有不同，将报文直接路由给目标服务器。在VS/DR中，调度器根据各个服务器的负载情况，动态地选择一台服务器，不修改也不封装IP报文，而是将数据帧的MAC地址改为选出服务器的MAC地址，再将修改后的数据帧在与服务器组的局域网上发送。因为数据帧的MAC地址是选出的服务器，所以服务器肯定可以收到这个数据帧，从中可以获得该IP报文。当服务器发现报文的目标地址VIP是在本地的网络设备上，服务器处理这个报文，然后根据路由表将响应报文直接返回给客户。

　　VS/NAT 的优点是服务器可以运行任何支持TCP/IP的操作系统，它只需要一个IP地址配置在调度器上，服务器组可以用私有的IP地址。缺点是它的伸缩能力有限，当服务器结点数目升到20时，调度器本身有可能成为系统的新瓶颈，因为在VS/NAT中请求和响应报文都需要通过负载调度器。我们在Pentium166 处理器的主机上测得重写报文的平均延时为60us，性能更高的处理器上延时会短一些。假设TCP报文的平均长度为536 Bytes，则调度器的最大吞吐量为8.93 MBytes/s. 我们再假设每台服务器的吞吐量为800KBytes/s，这样一个调度器可以带动10台服务器。(注：这是很早以前测得的数据)

　　基于 VS/NAT的的集群系统可以适合许多服务器的性能要求。如果负载调度器成为系统新的瓶颈，可以有三种方法解决这个问题：混合方法、VS/TUN和 VS/DR。在DNS混合集群系统中，有若干个VS/NAT负调度器，每个负载调度器带自己的服务器集群，同时这些负载调度器又通过RR-DNS组成简单的域名。

　　对于那些将IP地址或者端口号在报文数据中传送的网络服务，需要编写相应的应用模块来转换报文数据中的IP地址或者端口号。这会带来实现的工作量，同时应用模块检查报文的开销会降低系统的吞吐率。

　　在VS/TUN 的集群系统中，负载调度器只将请求调度到不同的后端服务器，后端服务器将应答的数据直接返回给用户。这样，负载调度器就可以处理大量的请求，它甚至可以调度百台以上的服务器(同等规模的服务器)，而它不会成为系统的瓶颈。即使负载调度器只有100Mbps的全双工网卡，整个系统的最大吞吐量可超过 1Gbps。所以，VS/TUN可以极大地增加负载调度器调度的服务器数量。VS/TUN调度器可以调度上百台服务器，而它本身不会成为系统的瓶颈，可以用来构建高性能的超级服务器。VS/TUN技术对服务器有要求，即所有的服务器必须支持“IP Tunneling”或者“IP Encapsulation”协议。目前，VS/TUN的后端服务器主要运行Linux操作系统，我们没对其他操作系统进行测试。因为“IP Tunneling”正成为各个操作系统的标准协议，所以VS/TUN应该会适用运行其他操作系统的后端服务器。

　　跟VS/TUN方法一样，VS/DR调度器只处理客户到服务器端的连接，响应数据可以直接从独立的网络路由返回给客户。这可以极大地提高LVS集群系统的伸缩性。跟VS/TUN相比，这种方法没有IP隧道的开销，但是要求负载调度器与实际服务器都有一块网卡连在同一物理网段上，服务器网络设备(或者设备别名)不作ARP响应，或者能将报文重定向(Redirect)到本地的Socket端口上。

　　注：以上三种方法所能支持最大服务器数目的估计是假设调度器使用100M网卡，调度器的硬件配置与后端服务器的硬件配置相同，而且是对一般Web服务。使用更高的硬件配置(如千兆网卡和更快的处理器)作为调度器，调度器所能调度的服务器数量会相应增加。当应用不同时，服务器的数目也会相应地改变。所以，以上数据估计主要是为三种方法的伸缩性进行量化比较。

　　◆最少的连接方式(Least Connection)：传递新的连接给那些进行最少连接处理的服务器。当其中某个服务器发生第二到第7 层的故障，BIG-IP 就把其从服务器队列中拿出，不参加下一次的用户请求的分配, 直到其恢复正常。

　　◆最快模式(Fastest)：传递连接给那些响应最快的服务器。当其中某个服务器发生第二到第7 层的故障，BIG-IP 就把其从服务器队列中拿出，不参加下一次的用户请求的分配，直到其恢复正常。

　　◆观察模式(Observed)：连接数目和响应时间以这两项的最佳平衡为依据为新的请求选择服务器。当其中某个服务器发生第二到第7 层的故障，BIG-IP就把其从服务器队列中拿出，不参加下一次的用户请求的分配，直到其恢复正常。

　　◆预测模式(Predictive)：BIG-IP利用收集到的服务器当前的性能指标，进行预测分析，选择一台服务器在下一个时间片内，其性能将达到最佳的服务器相应用户的请求。(被BIG-IP 进行检测)

　　◆动态性能分配(Dynamic Ratio-APM):BIG-IP 收集到的应用程序和应用服务器的各项性能参数，动态调整流量分配。

　　◆动态服务器补充(Dynamic Server Act.):当主服务器群中因故障导致数量减少时，动态地将备份服务器补充至主服务器群。

　　◆服务类型(ToS): 按不同的服务类型(在Type of Field中标识)负载均衡对数据流进行分配。

　　◆规则模式：针对不同的数据流设置导向规则，用户可自行

分享阿里云SLB-负载均衡的实现基本原理架构

负载均衡技术原理浅析

1、技术架构

2、LVS技术特点

FULLNAT技术概述

SYNPROXY技术概述

集群部署方式

Keepalived优化

3、Tengine技术特点

4、更多功能

四层和七层负载均衡的区别

LVS：三种负载均衡方式比较