varnish浅述

安装varnish,安装包需要到官网下载http://www.varnish-cache.org/releases/index.html

varnish的程序环境:

/etc/varnish/varnish.params:配置varnish服务进程的工作特性,例如监听的地址、端口及缓存机制等;
/etc/varnish/default.vcl:配置各Child/Cache线程的工作属性;
/usr/sbin/varnishd:ansible的主程序
/usr/bin/varnishadm:命令行接口工具

共享内存日志的交互工具:
    /usr/bin/varnishhist
    /usr/bin/varnishlog
    /usr/bin/varnishncsa
    /usr/bin/varnishstat
    /usr/bin/varnishtop

/usr/bin/varnishtest:测试工具程序
/usr/sbin/varnish_reload_vcl:vcl配置文件重载程序,在varnishadm命令中有一个内置命令vcl.load可达到同样效果
    [root@localhost ~]# varnishadm -S /etc/varnish/secret -T 127.0.0.1:6082

systemd unit file:
    /usr/lib/systemd/system/varnish.service:varnish服务
    /usr/lib/systemd/system/varnishlog.service:日志持久的服务
    /usr/lib/systemd/system/varnishncsa.service:日志持久的服务

varnish的缓存存储机制:

malloc [,size]:内存存储,size用于定义空间大小;重启后所有缓存项失效;
file [,path[,size[,granularity]]]:文件格式存储,是一个黑盒文件(对用户不可见,其组织格式,用户是无法参与的),重启后所有缓存项失效;
persistent [path,size]:文件格式存储,黑盒文件,重启后所有缓存项有效,但目前在实验阶段;

varnish程序的选项:

/etc/varnish/varnish.params文件的变量和/usr/lib/systemd/system/varnish.service文件是相联系的

程序选项:/etc/varnish/varnish.params文件
    -a address[:port][,address[:port][...],默认为6081端口; 
    -T address[:port],默认为6082端口;
    -s [name=]type[,options],定义缓存存储机制;
    -u user
    -g group
    -f config:VCL配置文件;
    -F:运行于前台;
    ...
运行时参数:/etc/varnish/varnish.params文件, DEAMON_OPTS
DAEMON_OPTS="-p thread_pool_min=5 -p thread_pool_max=500 -p thread_pool_timeout=300"

    -p param=value:设定运行参数及其值; 可重复使用多次;
    -r param[,param...]: 设定指定的参数为只读状态;

varnishadm -S /etc/varnish/secret -T [ADDRESS:]PORT 有以下内置命令

help [<command>]
ping [<timestamp>]
auth <response>
quit
banner
status:显示当前varnish服务状态
start:启动进程
stop:停止进程
vcl.load <configname> <filename>:手动加载一个配置文件版本(原文件修改了)
vcl.inline <configname> <quoted_VCLstring>
vcl.use <configname>:指定要使用的配置列表中的某个配置文件(版本)
vcl.discard <configname>:删除某个版本的配置文件
vcl.list:列出编译成功的配置列表
param.show [-l] [<param>]:列出可使用的配置参数
param.set <param> <value>:修改某个配置参数
    eg:param.set thread_pool_max 1024
panic.show
panic.clear
storage.list
vcl.show [-v] <configname>
backend.list [<backend_expression>]:列出后端服务器列表
backend.set_health <backend_expression> <state>:定义后端主机的健康状态的检查机制
ban <field> <operator> <arg> [&& <field> <oper> <arg>]...
ban.list

配置文件相关:
    vcl.list 
    vcl.load:装载,加载并编译;
    vcl.use:激活;
    vcl.discard:删除;
    vcl.show [-v] <configname>:查看指定的配置文件的详细信息;

运行时参数:
    param.show -l:显示列表;
    param.show <PARAM>
    param.set <PARAM> <VALUE>

缓存存储:
    storage.list

后端服务器:
    backend.list

VCL:

varnish的规则配置语言,是“域”专有类型的配置语言
VCL有多个状态引擎,状态之间存在相关性,但彼此间互相隔离;每个状态引擎可使用return(x)指明关联至哪个下一级引擎;如:vcl_hash --> return(hit) --> vcl_hit

vcl流程图

varnish浅述

状态引擎切换机制:

request报文由vcl_recv接收,response报文由vcl_deliber发送,几种常用切换如下:

(1)vcl_recv --> vcl_hash --> vcl_hit --> vcl_deliver
(2)vcl_recv --> vcl_hash --> vcl_miss --> vcl_backend_fetch --> vcl_backend_response(vcl_backend_error) --> vcl_dliver
(3)vcl_recv --> vcl_hash --> vcl_purge --> vcl_synth
(4)vcl_recv --> vcl_hash --> vcl_pipe

两个特殊的引擎:
    vcl_init:在处理任何请求之前要执行的vcl代码:主要用于初始化VMODs;
    vcl_fini:所有的请求都已经结束,在vcl配置被丢弃时调用;主要用于清理VMODs;

vcl的语法格式:

(1) VCL files start with vcl 4.0; 以下语法适合4.0,需放在default.vcl文件第一行
(2) //, # and /* foo */ for comments; 用于注释
(3) Subroutines(子程序) are declared with the sub keyword;子例程使用sub关键字进行声明,例如sub vcl_recv { ... }
(4) No loops, state-limited variables;不支持循环,支持限于引擎的内建的状态变量(req* , bereq* , obj* , ...)
(5) Terminating statements with a keyword for next action as argument of the return() function, i.e.: return(action);
(6) Domain-specific; 域专用状态

The VCL Finite(有限的) State Machine(vcl的有限状态机)

(1) Each request is processed separately; 每个请求都被单独处理
(2) Each request is independent from others at any given time; 每个请求在任何时间与其他请求之间都是隔离的
(3) States are related(关联的), but isolated(分离的);
(4) return(action); exits one state and instructs(命令) Varnish to proceed to the next state;  状态切换是靠return完成的
(5) Built-in VCL code is always present and appended(附加) below your own VCL;  内建vcl代码一直有效并附加在你自定义的vcl之后(在varnishadm中使用vcl.show查看)

VCL Built-in Functions and Keywords(vcl的内建函数和keyword)

函数:
    regsub(str, regex, sub):基于"str"字符串,被regex匹配到的字符串替换为"sub"
    regsuball(str, regex, sub):全局替换
    ban(boolean expression)
    hash_data(input)
    synthetic(str)

Keywords:
    call subroutine
    return(action)
    new
    set
    unset 

操作符:
    ==, !=, ~, >, >=, <, <=
    逻辑操作符:&&, ||, !
    变量赋值:=

示例:如下图

varnish浅述

varnish变量类型:

内建变量:
    req.*:request,表示由客户端发来的请求报文相关;
        req.http.*
            req.http.User-Agent, req.http.Referer, ...
    bereq.*:由varnish主机发往后端主机的httpd请求相关;
        bereq.http.*
    beresp.*:由后端主机响应给varnish主机的响应报文相关;
        beresp.http.*
    resp.*:由varnish响应给client相关;
    obj.*:存储在缓存空间中的缓存对象的属性;只读;

常用变量:
    bereq.*, req.*:
        bereq.http.HEADERS:http请求报文的某个首部
        bereq.request:请求方法;
        bereq.url:请求的url;
        bereq.proto:请求的协议版本;
        bereq.backend:指明要调用的后端主机;

        req.http.Cookie:客户端的请求报文中Cookie首部的值; 
        req.http.User-Agent ~ "chrome"


    beresp.*, resp.*:
        beresp.http.HEADERS
        beresp.status:响应的状态码;
        reresp.proto:协议版本;
        beresp.backend.name:BE主机的主机名;
        beresp.ttl:BE主机响应的内容的余下的可缓存时长;

    obj.*
        obj.hits:此对象从缓存中命中的次数;
        obj.ttl:对象的ttl值

    server.*
        server.ip
        server.hostname
    client.*
        client.ip                   

用户自定义:
    set 
    unset

示例1:强制对某类资源的请求不检查缓存:

sub vcl_recv {
    if (req.url ~ "(?i)^/(login|admin)"){
        return(pass); (login或admin开头的URL直接miss,不查询缓存)
    }
}

此列不能再浏览器中测试,因为浏览器会在miss后varnish后直接请求后端主机,用下面命令查看
[root@keepalived2 ~]# curl -I http://10.1.51.10/login/index.html

示例2:对于特定类型的资源,例如公开的图片等,取消其私有标识,并强行设定其可以由varnish缓存的时长;

sub vcl_backend_response { 
    if (beresp.http.cache-control !~ "s-maxage") {
        if (bereq.url ~ "(?i)\.(jpg|jpeg|png|gif|css|js)$") {
            unset beresp.http.Set-Cookie;
            set beresp.ttl = 3600s;
        }
    }
}

varnish浅述

varnish浅述

varnish浅述

缓存对象的修剪(仅授权管理员):purge(清理单个缓存), ban (清理能被模式匹配到的所有缓存)

示例1:

sub vcl_recv {
    if (req.method == "PURGE") {
        return (purge);  (定义请求方法为PURGE)
    }
}

sub vcl_purge {
        return(synth(200,"purged")); (当purge请求时,返回自定义状态)
}

需要使用curl命令测试,先用-X选项指定用PURGE方法请求,此时会清理对应请求的缓存,再用-I选项时可看到结果为miss。

示例2:限制指定用户可使用purge;

acl purgers {   
    "127.0.0.0"/8;
    "10.1.0.0"/16;
}  (定义预习使用purge的用户)

sub vcl_recv {
    if (req.method == "PURGE") {
        if (!client.ip ~ purgers) {
            return(synth(405,"Purging not allowed for " + client.ip));
        }
        return(purge);
    }
}

如果非指定用户(ip)访问,会返回405状态码(curl命令测试)

director轮询

(1)不同请求响应不同内容

backend default {
    .host = "10.1.51.20";
    .port = "80";
}

backend appsrv {
        .host = "10.1.51.30";
        .port = "80";
}

sub vcl_recv {
    if (req.url ~ "(?i)\.php$") {(后缀为php的则访问主机appsrv,其他访问default)
        set req.backend_hint = appsrv;
    }else {
        set req.backend_hint = default;
    }
}

(2)轮询,负载均衡效果

import directors;

backend default {
    .host = "10.1.51.20";
    .port = "80";
}

backend appsrv {
    .host = "10.1.51.30";
    .port = "80";
}

sub vcl_init {
        new websrvs = directors.round_robin();
        websrvs.add_backend(default);
        websrvs.add_backend(appsrv);
}

sub vcl_recv {
    set req.backend_hint = websrvs;
}

使用curl命令进行测试可以更好的看到效果,浏览器会在命中后,在缓存有效期内都只会返回第二次命中的后端主机的记录。

后端主机的健康检测:

.probe:定义健康状态检测方法;
    .url:检测时请求的URL,默认为”/"; 
    .request:发出的具体请求;
        .request = 
            "GET /.healthtest.html HTTP/1.1"
            "Host: www.magedu.com"
            "Connection: close"
    .window:基于最近的多少次检查来判断其健康状态; 
    .threshold:最近.window中定义的这么多次检查中至有.threshhold定义的次数是成功的;如.window=5 .threshhold=3,那5次检测中至少3次成功的才为成功
    .interval:检测频度; 
    .timeout:超时时长;
    .expected_response:期望的响应码,默认为200;

示例:

probe check {
        .url = "/.healthcheck.html"; (在根目录中定义一个测试网页)
        .window = 5;
        .threshold = 4;
        .interval = 2s;
        .timeout = 1s;
}

backend default {
    .host = "10.1.51.20";
    .port = "80";
    .probe = check;
}

backend appsrv {
    .host = "10.1.51.30";
    .port = "80";
    .probe = check;
}

注意probe放置的位置,在最前面是,如果测试失败则该主机后面的网页不能访问
在varnishadm中使用内置命令backend.list可以查看命中(测试)的结果,可使用backend.set_health命令手动设置后端主机的健康状态(sick,healthy 永久哦)

varnish的运行参数:param.show -l查看所有参数

线程相关的参数:
    在线程池内部,其每一个请求由一个线程来处理; 其worker线程的最大数决定了varnish的并发响应能力;

    thread_pools:Number of worker thread pools. 最好小于或等于CPU核心数量; 
    thread_pool_max:The maximum number of worker threads in each pool.每个线程池的最大线程数
    thread_pool_min:The minimum number of worker threads in each pool. 额外意义为“最大空闲线程数”;

        最大并发连接数=thread_pools  * thread_pool_max

    thread_pool_timeout:Thread idle threshold.  Threads in excess of thread_pool_min, which have been idle for at least this long, will be destroyed.每个线程空闲超时时长,超时就杀掉,但是不能低于最小线程数;
    thread_pool_add_delay:Wait at least this long after creating a thread.
    thread_pool_destroy_delay:Wait this long after destroying a thread.

    设置方式:在varnishadm中
        vcl.param 

    永久有效的方法:
        varnish.params文件最后一行
            DEAMON_OPTS="-p PARAM1=VALUE -p PARAM2=VALUE"

varnish日志区域:

1、varnishstat - Varnish Cache statistics
    -1 :将某时刻的状态全部列出
    -1 -f FILED_NAME 
    -l:可用于-f选项指定的字段名称列表;

    示例:
    # varnishstat -1 -f MAIN.cache_hit -f MAIN.cache_miss

2、varnishtop - Varnish log entry ranking
    -1     Instead of a continously updated display, print the statistics once and exit.
    -i taglist,可以同时使用多个-i选项,也可以一个选项跟上多个标签;
    -I <[taglist:]regex>
    -x taglist:排除列表
    -X  <[taglist:]regex>

    示例:
    # varnishtop -I ReqURL:/ -I ReqURL:/

3、varnishlog - Display Varnish logs

4、 varnishncsa - Display Varnish logs in Apache / NCSA combined log format

原创文章,作者:pao,如若转载,请注明出处:http://www.178linux.com/59342

(0)
paopao
上一篇 2016-11-15
下一篇 2016-11-15

相关推荐

  • Linux发展史

    Linux发展史 Linux是一套自由加开放源代码的类Unix操作系统,诞生于1991年10月5日(第一次正式向外公布),由芬兰学生Linus Torvalds和后来陆续加入的众多爱好者共同开发完成。 Linux这个词本身只表示Linux内核,但实际上人们已经习惯了用Linux来形容整个基于Linux内核,并且使用GNU工程各种工具和数据库的操作系统。 li…

    Linux干货 2017-05-20
  • Linux文件系统:从inode理解软链接与硬链接

    什么是inode? 在Linux磁盘存储文件系统中,我们以块划分磁盘为两部分:超级块(superblock)和数据块(data block);同时划分单文件为用户数据(user data)和元数据(meta data)两个部分。 用户数据记录的是文件的真实内容。比如你的血液、骨骼和各器官等等。 元数据这是附加于文件的属性信息。比如身高、体重、血型和年龄等等。…

    Linux干货 2016-08-07
  • 为你的网络传输加把锁(OpenSSL)

    互联网形成的初期,更多关注的是设备之间通过网络相互访问功能的实现,我们都知道,两个设备之间要想相互通信,就必需遵循某种协议,于是早期的互联网也出现来众多的协议,比如传输层最著名的协议就是tcp和udp,而应用层比较著名的协议有:http、ftp、pop、smtp、dns、telnet等等,而这些协议这开发初期,更多是关注功能的实现,数据这网络上传输是明文方式…

    Linux干货 2015-12-06
  • Linux Zabbix监控

                           Linux Zabbix监控 zabbix监控系统:    zabbix是基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。zab…

    Linux干货 2016-11-19
  • Linux基础之创建私有CA过程详解

    创建私有CA过程详解 颁发CA自签证书 创建序列号文件,序列号从01开始 echo 01 > /etc/pki/CA/serial 基于rsa算法生成非对称加密的密钥对 umask 077; openssl genrsa -out/etc/pki/CA/private/cakey.pem 2048 颁自签证书 openssl req -new -x50…

    2017-09-16
  • Linux系统解压缩

    Linux系统解压缩 gzip/gunzip 语法gzip [OPTIONS] + 压缩之后的路径 + 要压缩的文件 -#:压缩比 (不常用) -d:解压缩,相当于gunzip -c:将压缩后的数据输出至标准输出 -r:递归至目录中对每个文件进行压缩 zcat :查看压缩文件的内容 ——————————————————————————————————————…

    Linux干货 2017-08-15