keepalived实战之小试牛刀

keepalived是什么

keepalived是集群管理中保证集群高可用的一个服务软件,其功能类似于heartbeat,用来防止单点故障。

keepalived工作原理

keepalived是以VRRP协议为实现基础的,VRRP全称Virtual Router Redundancy Protocol,即虚拟路由冗余协议。 虚拟路由冗余协议,可以认为是实现路由器高可用的协议,即将N台提供相同功能的路由器组成一个路由器组,这个组里面有一个master和多个backup,master上面有一个对外提供服务的vip(该路由器所在局域网内其他机器的默认路由为该vip),master会发组播,当backup收不到vrrp包时就认为master宕掉了,这时就需要根据VRRP的优先级来选举一个backup当master。这样的话就可以保证路由器的高可用了。 keepalived主要有三个模块,分别是core、check和vrrp。core模块为keepalived的核心,负责主进程的启动、维护以及全局配置文件的加载和解析。check负责健康检查,包括常见的各种检查方式。vrrp模块是来实现VRRP协议的。

keepalived的配置文件

keepalived只有一个配置文件keepalived.conf,里面主要包括以下几个配置区域:
global_defs 主要是配置故障发生时的通知对象以及机器标识
static_ipaddress和static_routes区域配置的是是本节点的IP和路由信息
vrrp_script用来做健康检查的,当时检查失败时会将vrrp_instance的priority减少相应的值
vrrp_instance用来定义对外提供服务的VIP区域及其相关属性
vrrp_rsync_group用来定义vrrp_intance组,使得这个组内成员动作一致

keepalived实战之-小试牛刀主备模型

实验目标: 通过keepalived+lvs部署DR类型集群,实现高可用、负载均衡;主、备两台调度器均处于在线状态,当任意一台调度器宕机或出现故障时,VIP会“漂移”到另外一台服务器上,继续提供服务。

1.机器准备,做好时间同步,host解析

172.16.251.90  node1 [keepalived master]
172.16.251.91  node2 [keepalived backup]
172.16.251.92  node3 [web1 httpd rs1] 
172.16.251.94  node4 [web2 httpd rs2] 
172.16.251.95  node5 [client]

2.安装lvs和keepalived,我们在node1,node2上安装
node1:
(1).安装ipvsadm组件

yum install ipvsadm keepalived -y

(2).启动网卡间核心转发功能

sysctl -w net.ipv4.ip_forward=1
cat /proc/sys/net/ipv4/ip_forward

node2:同上

3.准备好web服务,实现web访问正常
node3:
(1).安装httpd

yum install httpd -y
echo "this is web1 test page." >/var/www/html/index.html

(2).启动httpd并测试一下子

systemctl start httpd
curl 127.0.0.1
[root@node3 ~]# curl 127.0.0.1
this is web1 test page.

node4:
(1).安装httpd

yum install httpd -y
echo "this is web2 test page." >/var/www/html/index.html

(2).启动httpd并测试一下子

systemctl start httpd
[root@node4 bin]# curl 127.0.0.1
this is web2 test page.

4.在node3,node4节点上配置vip

node3节点:
(1).配置VIP

ifconfig lo:0 172.16.50.50 netmask 255.255.255.255 broadcast 172.16.50.50 up
route add -host 172.16.50.50 dev lo:0

(2).配置rs主机参数

echo 1 > /proc/sys/net/ipv4/conf/all/arp_ignore
echo 2 > /proc/sys/net/ipv4/conf/all/arp_announce
echo 1 > /proc/sys/net/ipv4/conf/lo/arp_ignore
echo 2 > /proc/sys/net/ipv4/conf/lo/arp_announce

node4节点同上:

我们这里有个脚本可以通行配置:

cd /server/script/
vim setparam.sh

#!/bin/bash
        #
        vip=172.16.50.50
        mask='255.255.255.255'

        case $1 in
        start)
          echo 1 > /proc/sys/net/ipv4/conf/all/arp_ignore
          echo 1 > /proc/sys/net/ipv4/conf/lo/arp_ignore
          echo 2 > /proc/sys/net/ipv4/conf/all/arp_announce
          echo 2 > /proc/sys/net/ipv4/conf/lo/arp_announce

          ifconfig lo:0 $vip netmask $mask broadcast $vip up
          route add -host $vip dev lo:0
          ;;

         stop)
          ifconfig lo:0 down
          echo 0 > /proc/sys/net/ipv4/conf/all/arp_ignore
          echo 0 > /proc/sys/net/ipv4/conf/lo/arp_ignore
          echo 0 > /proc/sys/net/ipv4/conf/all/arp_announce
          echo 0 > /proc/sys/net/ipv4/conf/lo/arp_announce
          ;;

         *) 
          echo "Usage $(basename $0) start|stop"
          exit 1
      ;;
esac

5.在node1,node2上配置keepalived脚本

vim /etc/keepalived/keepalived.conf

node1脚本如下:

! Configuration File for keepalived

global_defs {

   #故障发生时给谁发邮件通知
   notification_email {
     root@localhost
   }
   #通知邮件从哪个地址发出
   notification_email_from keepalived@localhost
   #通知邮件的smtp地址
   smtp_server 127.0.0.1
   #连接smtp服务器的超时时间
   smtp_connect_timeout 30
   #通过组播地址通告状态和优先级信息
   vrrp_mcast_group4 224.0.100.24  
}

vrrp_instance sr1 {
    #MASTER或BACKUP
    state MASTER
    #节点固有IP(非VIP)的网卡,用来发VRRP包
    interface ens33
    #取值在0-255之间,用来区分多个instance的VRRP组播
    virtual_router_id 51
    #设置优先级,选举master,取值范围1-255
    priority 100
    #健康查检时间间隔
    advert_int 1
    #定义 router_id
    router_id node1
    #认证区域,认证类型有PASS和HA(IPSEC),密码8位字符
    authentication {
        auth_type PASS
        auth_pass r9RbiPlp
    }
    #配置要监控的网络接口,一旦接口出现故障,则转为FAULT状态;
    track_interface {    
        ens33                        
    }
    #nopreempt #非抢占模式
    #配置虚拟IP地址(vip)
    virtual_ipaddress {
        172.16.50.50/24 dev ens33 label ens33:0
    }
}

virtual_server 172.16.50.50 80 {
    #定义延迟轮询时间(单位秒)  
    delay_loop 6
    #设定VS的调用算法
    lb_algo wrr
    #设定lvs调度类型
    lb_kind DR
    persistence_timeout 50
    #工作的协议
    protocol TCP
    #当所有real server宕掉时,sorry server顶替
    sorry_server 127.0.0.1 80     

    #真正提供服务的服务器RS1
    real_server 172.16.251.92 80 {
        #权重
        weight 1

        #设置健康状态检测方法
        HTTP_GET  {
            url {

              #定义要监控的URL;
              path /

              #判断上述检测机制为健康状态的响应码;
              status_code 200
            }

            #连接请求的超时时长
            connect_timeout 3
            #重试次数
            nb_get_retry 3
            #下次重试的延迟时间
            delay_before_retry 1
        }
    }

    #真正提供服务的服务器RS2
    real_server 172.16.251.94 80 {
        #权重
        weight 1

        #设置健康状态检测方法
        HTTP_GET  {
            url {

              #定义要监控的URL;
              path /

              #判断上述检测机制为健康状态的响应码;
              status_code 200
            }

            #连接请求的超时时长
            connect_timeout 3
            #重试次数
            nb_get_retry 3
            #下次重试的延迟时间
            delay_before_retry 1
        }
    }


}

node2脚本如下:

! Configuration File for keepalived

global_defs {

   #故障发生时给谁发邮件通知
   notification_email {
     root@localhost
   }
   #通知邮件从哪个地址发出
   notification_email_from keepalived@localhost
   #通知邮件的smtp地址
   smtp_server 127.0.0.1
   #连接smtp服务器的超时时间
   smtp_connect_timeout 30
   #通过组播地址通告状态和优先级信息
   vrrp_mcast_group4 224.0.100.24  
}

vrrp_instance sr1 {
    #MASTER或BACKUP
    state BACKUP
    #节点固有IP(非VIP)的网卡,用来发VRRP包
    interface ens33
    #取值在0-255之间,用来区分多个instance的VRRP组播
    virtual_router_id 51
    #设置优先级,选举master,取值范围1-255
    priority 96
    #健康查检时间间隔
    advert_int 1
    #定义 router_id
    router_id node2
    #认证区域,认证类型有PASS和HA(IPSEC),密码8位字符
    authentication {
        auth_type PASS
        auth_pass r9RbiPlp
    }
    #配置要监控的网络接口,一旦接口出现故障,则转为FAULT状态;
    track_interface {    
        ens33                        
    }
    #nopreempt #非抢占模式
    #配置虚拟IP地址(vip)
    virtual_ipaddress {
        172.16.50.50/24 dev ens33 label ens33:0
    }
}

virtual_server 172.16.50.50 80 {
    #定义延迟轮询时间(单位秒)  
    delay_loop 6
    #设定VS的调用算法
    lb_algo wrr
    #设定lvs调度类型
    lb_kind DR
    nat_mask 255.255.255.255
    persistence_timeout 50
    #工作的协议
    protocol TCP
    #当所有real server宕掉时,sorry server顶替
    sorry_server 127.0.0.1 80     

    #真正提供服务的服务器RS1
    real_server 172.16.251.92 80 {
        #权重
        weight 1

        #设置健康状态检测方法
        HTTP_GET  {
            url {

              #定义要监控的URL;
              path /

              #判断上述检测机制为健康状态的响应码;
              status_code 200
            }

            #连接请求的超时时长
            connect_timeout 3
            #重试次数
            nb_get_retry 3
            #下次重试的延迟时间
            delay_before_retry 1
        }
    }

    #真正提供服务的服务器RS2
    real_server 172.16.251.94 80 {
        #权重
        weight 1

        #设置健康状态检测方法
        HTTP_GET  {
            url {

              #定义要监控的URL;
              path /

              #判断上述检测机制为健康状态的响应码;
              status_code 200
            }

            #连接请求的超时时长
            connect_timeout 3
            #重试次数
            nb_get_retry 3
            #下次重试的延迟时间
            delay_before_retry 1
        }
    }


}

6.测试关掉其中任何一个keepalived,都可访问curl 172.16.50.50

keepalived实战之-小试牛刀双主模型

我们刚刚做了一个主备模型,现在我们将这个主备模型稍微改造一下,我们只需要改造keepalived的配置文件即可:

1.在这之前,因为我们做的是lvs-dr模型,所以同样我们需要在node3,node4上做另外一个vip 因此在node3,node4上操作:

ifconfig lo:1 172.16.60.60 netmask 255.255.255.255 broadcast 172.16.60.60 up
route add -host 172.16.60.60 dev lo:1

我们用ifconfig可以看到两个

lo:0: flags=73<UP,LOOPBACK,RUNNING>  mtu 65536
        inet 172.16.50.50  netmask 255.255.255.255
        loop  txqueuelen 1  (Local Loopback)

lo:1: flags=73<UP,LOOPBACK,RUNNING>  mtu 65536
        inet 172.16.60.60  netmask 255.255.255.255
        loop  txqueuelen 1  (Local Loopback)

通用脚本改成如下:

#!/bin/bash

# Filename:    setvip.sh
# Revision:    1.1
# Date:        2017/06/24
# Author:      Srayban
# Email:       626612631@qq.com
# Website:     no
# Description: 设置vip

. /etc/init.d/functions


vip="172.16.50.50"
vip2="172.16.60.60"
mask="255.255.255.255"
case $1 in
start)
     echo 1 > /proc/sys/net/ipv4/conf/all/arp_ignore
     echo 1 > /proc/sys/net/ipv4/conf/lo/arp_ignore
     echo 2 > /proc/sys/net/ipv4/conf/all/arp_announce
     echo 2 > /proc/sys/net/ipv4/conf/lo/arp_announce

     ifconfig lo:0 $vip netmask $mask broadcast $vip up
     ifconfig lo:1 $vip2 netmask $mask broadcast $vip2 up
     route add -host $vip dev lo:0
     route add -host $vip2 dev lo:1
     ;;

 stop)
     ifconfig lo:0 down
     ifconfig lo:1 down
     echo 0 > /proc/sys/net/ipv4/conf/all/arp_ignore
     echo 0 > /proc/sys/net/ipv4/conf/lo/arp_ignore
     echo 0 > /proc/sys/net/ipv4/conf/all/arp_announce
     echo 0 > /proc/sys/net/ipv4/conf/lo/arp_announce
     ;;

 *) 
     echo "Usage $(basename $0) start|stop"
     exit 1
     ;;
 esac
 action "setvip is success." true

2.在node1,node2上改造keepalived脚本

vim /etc/keepalived/keepalived.conf

node1脚本如下:

! Configuration File for keepalived

global_defs {

   #故障发生时给谁发邮件通知
   notification_email {
     root@localhost
   }
   #通知邮件从哪个地址发出
   notification_email_from keepalived@localhost
   #通知邮件的smtp地址
   smtp_server 127.0.0.1
   #连接smtp服务器的超时时间
   smtp_connect_timeout 30
   #通过组播地址通告状态和优先级信息
   vrrp_mcast_group4 224.0.100.24  
}

vrrp_instance sr1 {
    #MASTER或BACKUP
    state MASTER
    #节点固有IP(非VIP)的网卡,用来发VRRP包
    interface ens33
    #取值在0-255之间,用来区分多个instance的VRRP组播
    virtual_router_id 51
    #设置优先级,选举master,取值范围1-255
    priority 100
    #健康查检时间间隔
    advert_int 1
    #定义 router_id
    router_id node1
    #认证区域,认证类型有PASS和HA(IPSEC),密码8位字符
    authentication {
        auth_type PASS
        auth_pass r9RbiPlp
    }
    #配置要监控的网络接口,一旦接口出现故障,则转为FAULT状态;
    track_interface {    
        ens33                        
    }
    #nopreempt #非抢占模式
    #配置虚拟IP地址(vip)
    virtual_ipaddress {
        172.16.50.50/24 dev ens33 label ens33:0
    }
}


vrrp_instance sr2 {
    #MASTER或BACKUP
    state BACKUP
    #节点固有IP(非VIP)的网卡,用来发VRRP包
    interface ens33
    #取值在0-255之间,用来区分多个instance的VRRP组播
    virtual_router_id 61
    #设置优先级,选举master,取值范围1-255
    priority 96
    #健康查检时间间隔
    advert_int 1
    #定义 router_id
    router_id node1
    #认证区域,认证类型有PASS和HA(IPSEC),密码8位字符
    authentication {
        auth_type PASS
        auth_pass r9ObiP0p
    }
    #配置要监控的网络接口,一旦接口出现故障,则转为FAULT状态;
    track_interface {    
        ens33                        
    }
    #nopreempt #非抢占模式
    #配置虚拟IP地址(vip)
    virtual_ipaddress {
        172.16.60.60/24 dev ens33 label ens33:1
    }
}


virtual_server 172.16.60.60  80 {
    #定义延迟轮询时间(单位秒)  
    delay_loop 6
    #设定VS的调用算法
    lb_algo wrr
    #设定lvs调度类型
    lb_kind DR
    persistence_timeout 50
    #工作的协议
    protocol TCP
    #当所有real server宕掉时,sorry server顶替
    sorry_server 127.0.0.1 80     

    #真正提供服务的服务器RS1
    real_server 172.16.251.92 80 {
        #权重
        weight 1

        #设置健康状态检测方法
        HTTP_GET  {
            url {

              #定义要监控的URL;
              path /

              #判断上述检测机制为健康状态的响应码;
              status_code 200
            }

            #连接请求的超时时长
            connect_timeout 3
            #重试次数
            nb_get_retry 3
            #下次重试的延迟时间
            delay_before_retry 1
        }
    }

    #真正提供服务的服务器RS2
    real_server 172.16.251.94 80 {
        #权重
        weight 1

        #设置健康状态检测方法
        HTTP_GET  {
            url {

              #定义要监控的URL;
              path /

              #判断上述检测机制为健康状态的响应码;
              status_code 200
            }

            #连接请求的超时时长
            connect_timeout 3
            #重试次数
            nb_get_retry 3
            #下次重试的延迟时间
            delay_before_retry 1
        }
    }


}


virtual_server 172.16.50.50 80 {
    #定义延迟轮询时间(单位秒)  
    delay_loop 6
    #设定VS的调用算法
    lb_algo wrr
    #设定lvs调度类型
    lb_kind DR
    persistence_timeout 50
    #工作的协议
    protocol TCP
    #当所有real server宕掉时,sorry server顶替
    sorry_server 127.0.0.1 80     

    #真正提供服务的服务器RS1
    real_server 172.16.251.92 80 {
        #权重
        weight 1

        #设置健康状态检测方法
        HTTP_GET  {
            url {

              #定义要监控的URL;
              path /

              #判断上述检测机制为健康状态的响应码;
              status_code 200
            }

            #连接请求的超时时长
            connect_timeout 3
            #重试次数
            nb_get_retry 3
            #下次重试的延迟时间
            delay_before_retry 1
        }
    }

    #真正提供服务的服务器RS2
    real_server 172.16.251.94 80 {
        #权重
        weight 1

        #设置健康状态检测方法
        HTTP_GET  {
            url {

              #定义要监控的URL;
              path /

              #判断上述检测机制为健康状态的响应码;
              status_code 200
            }

            #连接请求的超时时长
            connect_timeout 3
            #重试次数
            nb_get_retry 3
            #下次重试的延迟时间
            delay_before_retry 1
        }
    }


}

node2脚本如下:

! Configuration File for keepalived

global_defs {

   #故障发生时给谁发邮件通知
   notification_email {
     root@localhost
   }
   #通知邮件从哪个地址发出
   notification_email_from keepalived@localhost
   #通知邮件的smtp地址
   smtp_server 127.0.0.1
   #连接smtp服务器的超时时间
   smtp_connect_timeout 30
   #通过组播地址通告状态和优先级信息
   vrrp_mcast_group4 224.0.100.24  
}

vrrp_instance sr1 {
    #MASTER或BACKUP
    state BACKUP
    #节点固有IP(非VIP)的网卡,用来发VRRP包
    interface ens33
    #取值在0-255之间,用来区分多个instance的VRRP组播
    virtual_router_id 51
    #设置优先级,选举master,取值范围1-255
    priority 96
    #健康查检时间间隔
    advert_int 1
    #定义 router_id
    router_id node2
    #认证区域,认证类型有PASS和HA(IPSEC),密码8位字符
    authentication {
        auth_type PASS
        auth_pass r9RbiPlp
    }
    #配置要监控的网络接口,一旦接口出现故障,则转为FAULT状态;
    track_interface {    
        ens33                        
    }
    #nopreempt #非抢占模式
    #配置虚拟IP地址(vip)
    virtual_ipaddress {
        172.16.50.50/24 dev ens33 label ens33:0
    }
}


vrrp_instance sr2 {
    #MASTER或BACKUP
    state MASTER
    #节点固有IP(非VIP)的网卡,用来发VRRP包
    interface ens33
    #取值在0-255之间,用来区分多个instance的VRRP组播
    virtual_router_id 61
    #设置优先级,选举master,取值范围1-255
    priority 100
    #健康查检时间间隔
    advert_int 1
    #定义 router_id
    router_id node2
    #认证区域,认证类型有PASS和HA(IPSEC),密码8位字符
    authentication {
        auth_type PASS
        auth_pass r9ObiP0p
    }
    #配置要监控的网络接口,一旦接口出现故障,则转为FAULT状态;
    track_interface {    
        ens33                        
    }
    #nopreempt #非抢占模式
    #配置虚拟IP地址(vip)
    virtual_ipaddress {
        172.16.60.60/24 dev ens33 label ens33:1
    }
}


virtual_server 172.16.60.60  80 {
    #定义延迟轮询时间(单位秒)  
    delay_loop 6
    #设定VS的调用算法
    lb_algo wrr
    #设定lvs调度类型
    lb_kind DR
    nat_mask 255.255.255.255
    persistence_timeout 50
    #工作的协议
    protocol TCP
    #当所有real server宕掉时,sorry server顶替
    sorry_server 127.0.0.1 80     

    #真正提供服务的服务器RS1
    real_server 172.16.251.92 80 {
        #权重
        weight 1

        #设置健康状态检测方法
        HTTP_GET  {
            url {

              #定义要监控的URL;
              path /

              #判断上述检测机制为健康状态的响应码;
              status_code 200
            }

            #连接请求的超时时长
            connect_timeout 3
            #重试次数
            nb_get_retry 3
            #下次重试的延迟时间
            delay_before_retry 1
        }
    }

    #真正提供服务的服务器RS2
    real_server 172.16.251.94 80 {
        #权重
        weight 1

        #设置健康状态检测方法
        HTTP_GET  {
            url {

              #定义要监控的URL;
              path /

              #判断上述检测机制为健康状态的响应码;
              status_code 200
            }

            #连接请求的超时时长
            connect_timeout 3
            #重试次数
            nb_get_retry 3
            #下次重试的延迟时间
            delay_before_retry 1
        }
    }


}

virtual_server 172.16.50.50 80 {
    #定义延迟轮询时间(单位秒)  
    delay_loop 6
    #设定VS的调用算法
    lb_algo wrr
    #设定lvs调度类型
    lb_kind DR
    nat_mask 255.255.255.255
    persistence_timeout 50
    #工作的协议
    protocol TCP
    #当所有real server宕掉时,sorry server顶替
    sorry_server 127.0.0.1 80     

    #真正提供服务的服务器RS1
    real_server 172.16.251.92 80 {
        #权重
        weight 1

        #设置健康状态检测方法
        HTTP_GET  {
            url {

              #定义要监控的URL;
              path /

              #判断上述检测机制为健康状态的响应码;
              status_code 200
            }

            #连接请求的超时时长
            connect_timeout 3
            #重试次数
            nb_get_retry 3
            #下次重试的延迟时间
            delay_before_retry 1
        }
    }

    #真正提供服务的服务器RS2
    real_server 172.16.251.94 80 {
        #权重
        weight 1

        #设置健康状态检测方法
        HTTP_GET  {
            url {

              #定义要监控的URL;
              path /

              #判断上述检测机制为健康状态的响应码;
              status_code 200
            }

            #连接请求的超时时长
            connect_timeout 3
            #重试次数
            nb_get_retry 3
            #下次重试的延迟时间
            delay_before_retry 1
        }
    }


}

3.脚本改造以后,启动keepalived

for i in {1..12};do curl 172.16.50.50; curl 172.16.60.60; done

可以看到两个都能正常访问了

原创文章,作者:srayban,如若转载,请注明出处:http://www.178linux.com/78490

(0)
sraybansrayban
上一篇 2017-06-24
下一篇 2017-06-25

相关推荐

  • 计算机入门

    Linux入门 与 计算机

    Linux干货 2018-02-07
  • Linux的用户,组及文件权限管理

    Linux用户与组的创建,删除,属性修改,文件权限管理

    Linux干货 2018-02-24
  • linux中软链接和硬链接简单说明

    linux链接文件 在 Linux 上文件系统被分成两个部分:数据 (user data) 与元数据 (metadata)。数据,即文件数据块 (data block),数据块是记录文件真实内容的地方;而元数据则是文件的附加属性,如:文件大小、创建时间、所有者等信息。在 Linux 中,元数据中的 inode 号(inode 是文件元数据的一部分但其并不包含…

    Linux干货 2016-12-05
  • Btrfs文件系统的管理

    BTRFS文件系统 核心特性 支持将多个底层物理设备组合成同一个设备使用,即多物理卷支持。btrfs可由多个底层物理卷组成:支持RAID,以连击“添加”、“移除”、“修改” 写时复制,在修改文件时,先将文件复制一份,然后在新文件上进行修改,最后将文件名的指针指向新文件,所以原文件还是存在的。 数据及元数据校验码:checksum 子卷:在一个卷上创建子卷,每…

    Linux干货 2016-07-16
  • 搜索引擎-倒排索引基础知识

    1.单词——文档矩阵        单词-文档矩阵是表达两者之间所具有的一种包含关系的概念模型,图3-1展示了其含义。图3-1的每列代表一个文档,每行代表一个单词,打对勾的位置代表包含关系。          …

    Linux干货 2015-12-10