无心写博客

测试

web cache

  1. 程序的局部性特征

     - 时间局部性:刚刚访问过的数据,在很短的时间内会被再次访问到。
     - 空间局部性:一个数据如果被访问到了,则它周边的数据也可能被访问到。
    
  2. 设备层级衔接方式

     - 两个设备间衔接不上,加用中间层,如缓存
    
  3. 什么是缓存命中?

     - 从缓存中找到了需要的数据
    
  4. 什么是命中率?

     - 命中资源数hit/(命中资源数hit+miss资源数),分两类
     	- 页面命中率:基于页面数量进行衡量
     	- 字节命中率:基于页面的体积进行衡量
    
  5. 与缓存相关的首部

     - Expires:定义响应资源的过期时间,绝对时间标记,简单粗暴
     - Cache-Control:请求报文和响应报文缓存控制
     - Etag:资源标签
     - If-None-Match:资源标签是否改变
     - Last-Modified:最后一次修改时间
     - If-Modified-Since:缓存时的时间戳
     - Vary
     - Age
    
  6. Cache-Control控制项

  7. HTTP Validation条件式请求,检查缓存项和原始服务器资源内容是否一致

     - Last Modified/If-Modified-Since
     	- 请求服务器使用If-Modified-since,从此缓存时间戳,与原始服务器上是否匹配,如果改变,直接响应(200)
     	- 若没变,last-modified (304),不适用变化频繁的资源
     - Etag/If-None-Match
     	- 给同样内容加一个标签Etag,内容改变时Etag标签也会改变,
     	- 请求服务器使用If-None-Match向http服务器询问标签是不是不匹配,若匹配则响应not modifyed(304),
     	- 否则http服务器直接响应(200)
     - 相对时间和检查机制结合使用 
     	- 在缓存有效期内从缓存响应,过期后去服务器检查资源是否更新
    

varnish

  1. 缓存开源解决方案

     	- varnish
     		- 充分利用epoll机制(能显著提高程序在大量并发连接中只有少量活跃的情况下的系统CPU利用率),并发量大,单连接资源较轻
     	- squid
     		- 在较大并发下,稳点性好,老当益壮
    
  2. 什么是varnish

     - varnish是一个轻量级的Cache和反向代理软件,通常只为httpd提供缓存
    
  3. varnish架构

    - 主要由核心守护进程varnishd组成
    - Manager Process
    - 管理进程,相当于nginx的主控进程,不处理用户请求
    - Cacher Process
    - 线程Storage:完成缓存存储管理
    - 线程Log/Stats:日志记录----->存入共享内存Shared Memory Log中
    - 线程Worker threads:真正处理用户请求,通过线程池来定义,最大并发(线程池*线程池最大并发)
    - shared memory log
    - varnishlog:读取日志文件,保存在磁盘中
    - varnishstat:读取统计数据,计数器
    - VCL配置接口:varnish配置语言
    - varnishadm:让varnish加载新配置文件
    - VCC Process:varnish的c编译器

  4. 安装(centos 7中varnish被收入epel仓库)

     - [root@ _1_ ~]# yum -y install varnish
    
  5. 程序环境

     配置文件:
     	- /etc/varnish/varnish.params(/etc/sysconfig/varnishd):配置varnish服务进程的工作特性(监听地址和端口,缓存机制等)
     	- /etc/varnish/default.vcl:配置各Child/Cache线程的工作特性
     主程序:
     	- /usr/sbin/varnishd
     CLI interface:
     	- /usr/bin/varnishadmin:通过此管理工具,完成与Manager Process的交互,进而控制varnish的工作特性
     Share Memory Log交互工具:
     	- /usr/bin/varnishhist:日志历史
     	- /usr/binvarnishlog:记录详细log(请求报文首部,响应报文首部等)
     	- /usr/bin/varnishcsa:格式化记录日志
     	- /usr/bin/varnishstat:日志统计
     	- /usr/bin/varnishtop:日志排序分析
     测试工具程序:
     	- /usr/bin/varnishtest
     VCL配置文件重载程序:
     	- /usr/sbin/varnish_reload_vcl:此程序会编译配置文件
     Systemd Unit File:
     	- /usr/lib/systemd/system/varnish.service:varnish服务
     	- /usr/lib/systemd/system/varnishlog.service:原始记录日志(保存磁在盘上)
     	- /usr/lib/systemd/system/varnishncsa.service:ncsa格式日志(保存磁在盘上)
    
  6. varnish的缓存存储机制(Storage Types):

     - malloc[,size]:内存存储,[,size]用于定义空间大小,重启后所有缓存项失效
     - file[,path[,size[,granularity]]]:文件存储,黑盒,重启后所有缓存项失效
     - persistent,path,size:文件存储,黑盒,重启后所有缓存项有效(试验阶段)
    
  7. varnish的程序选项

     - 程序选项:/etc/varnish/varnish.params文件;
     	- -a address[:port][,address[:port][...]:默认为6081端口;
     	- -T address[:port]:默认为6082端口;
     	- -s [name=]type[,options]:定义缓存存储机制;
     	- -u user
     	- -g group
     	- -f config:VCL配置文件;
     	- -F:运行于前台;
     - 运行时参数:/etc/varnish/varnish.params文件, DEAMON_OPTS
     	- DAEMON_OPTS="-p thread_pool_min=5 -p thread_pool_max=500 -p thread_pool_timeout=300"
     	- -p param=value:设定运行参数及其值,可重复使用多次
     	- -r param[,param...]:设定指定的参数为只读状态
    
  8. 重载vcl配置文件:

     	- ~]# varnish_reload_vcl
    
  9. varnishadm管理工具

     连接:
     	- ~]# varnishadm -S /etc	/varnish/secret -T [ADDRESS:]PORT
     配置文件相关:
     	- vcl.list:查看所有编译过的配置文件
     	- vcl.load <configname> <filename>:装载,加载并编译
     	- vcl.use <configname>:激活
     	- vcl.discard <configname>:删除配置文件
     运行时参数:
     	- param.show -l:显示列表
     	- param.show <PARAM> 显示指定PARAM参数
     	- param.set <PARAM> <VALUE> 设置PARAM的值
    
     缓存存储:
     	- storage.list
     后端服务器:
     	- backend.list
    
  10. 缓存流程图解

    - 一个请求进入,varnish收下这个请求,判断是否对这个请求做处理
    - 访问控制,直接拒绝
    - 请求方法不识别,直接找后端服务器响应
    - 正常请求,进入下一步
    - 查询此请求方法是否能缓存
    - 不能缓存(如post,put),交给vcl_fetcg,由vcl_fetch投递给后端服务器响应
    - 能缓存,进入下一步
    - vcl_hash基于hash查找缓存中是否有对应资源
    - 如果命中,从本地缓存中直接响应给客户端
    - 若未命中,通过vcl_fetch到后端服务器取回资源,然后先缓存,再响应给客户端

  11. VCL状态引擎切换

    - vcl_recv收到请求,查找vcl_hash
    - 若命中(传递值hit),交由vcl_hit
    - hit命中,直接从缓存中响应,交由vcl_deliver投递给客户端
    - vcl_hash -(hit)-> vcl_hit --> vcl_deliver
    - 未命中(传递值miss),交由vcl_miss
    - 交由vcl_backend_fetch请求后端服务器
    - vcl_hash -(miss)-> vcl_miss --> vcl_backend_fetch --> vcl_backend_response --> vcl_deliver
    - 若要删除缓存项(传递值purge),交由vcl_purge
    - 交由vcl_synh管理缓存,删除对应缓存
    - vcl_hash -(purge)-> vcl_purge --> vcl_synth
    - 若不能理解请求(传递值pipe),交由vcl_pipe,请求被直接送至后端服务器
    - vcl_hash -(pipe)-> vcl_pipe
    - 并发连接超出(传递值busy),进入waiting状态,会等待重新请求查询缓存
    - 传递值(pass,hit-for-pass),交由vcl_pass
    - vcl_hit和vcl_miss也能交由给pass
    - 两个特殊引擎:
    - vcl_init:在处理任何请求之前要执行的vcl代码:主要用于初始化vMODS
    - vcl_fini:所有的请求都已经结束,在vcl配置被丢弃时调用,主要用于清理vMODS


VCL语法(4.0)

  1. 语法格式

     - 文件开始要注明vcl版本号:vcl 4.0;
     - //,#,/*,*/为注释
     - 子例行Subroutines使用sub关键字;例如sub_recv {...};
     - 不支持循环,但支持条件语法,支持內建变量(受限于引擎)
     - 使用一个keyword基于return函数终止当前状态引擎,并决定交给哪一个状态引擎
     - “域”专用配置,在一个状态引擎中的配置只对当前状态引擎有效
    
  2. VCL Finite State MAchine

     - 每一个请求被单独处理
     - 请求和请求间任何时间都是隔离的
     - 各状态引擎有相关性,通过return连接
     - 內建VCL code一直有效,并附加在自建的代码之后(vcl.show -v boot)
    
  3. 三类主要语法

     - sub subroutine {
     		...
     	}
     - if CONDITION {
     		...
     	} else {	
     		...
     	}
     - return(), hash_data()
    
  4. 內建函数和keyword

     函数:
     	regsub(str,regex,sub):字符串为str,根据正则regex模式匹配,把匹配到的内容替换为sub,只替换一次
     	regsuball(str,regex,sub):和regsub相同,替换所有
     	ban(boolean expression):符合表达式的都清理
     	hash_data(input):对input做hash计算
     	synthetic:
     Keywords:
     	call subrouting:调用子例行程序
     	return(action):指明下一个动作
     	new:
     	set:设定变量的值
     	unset:取消变量的值
     布尔型表达式操作符:
     	==,!=,~,>,>=,<,<=
     	逻辑操作符:&&,||,!
     	变量赋值:=
    
  5. 例:若通过缓存响应给客户端,在响应首部添加X-Cache,并设置值

     在deliver段中添加条件判断
     			sub vcl_deliver {
     	    # Happens when we have all the pieces we need, and are about to send the
     	    # response to the client.
     	    #
     	    # You can do accounting or modifying the final object here.
     	    if (obj.hits>0) {
     			set resp.http.X-Cache = "HIT via " + server.ip;
     		} else {
     			set resp.http.X-Cache = "MISS via " + server.ip;
     		}
     	}
     重新加载配置文件
     	[root@ _18_ /etc/varnish]# varnishadm -S /etc/varnish/secret -T 127.0.0.1:6082
     	varnish> vcl.load conf1 default.vcl 
     	200        
     	VCL compiled.
    
     	vcl.list
     	200
     	active     		0 boot
     	available       0 conf1
    
     	vcl.use conf1
     	200        
     	VCL 'conf1' now active
    
     	varnish> vcl.list
     	200        
     	available       0 boot
     	active          0 conf1
    
  6. 客户端第一次访问,响应码为200,资源由web服务器返回。X-Cache为MISS

  7. 客户端第二次访问,响应码340,资源由缓存服务器返回。X-Cache为HIT

  8. 变量类型


  9. 示例:URL中带有login或admin的字符串不检查缓存

     			sub vcl_recv {
     	    # Happens before we check if we have this in cache already.
     	    #
     	    # Typically you clean up the request here, removing cookies you don't need,
     	    # rewriting the request, etc.
     	    if (req.url ~ "(?i)^/(login|admin)") {   #(?!)为正则表达式模式标志位,i为不区分大小写
     	        return(pass);
     	    }
     	}
     第一次访问:X-Cache值为MISS
     	Request URL:http://192.168.100.73/admin/
     	Request Method:GET
     	Status Code:304 Not Modified
     	Remote Address:192.168.100.73:80
    
     	Age:0
     	Connection:keep-alive
     	Date:Wed, 02 Nov 2016 02:41:24 GMT
     	ETag:"e0102-6-5403f450439af"
     	Server:Apache/2.2.15 (CentOS)
     	Via:1.1 varnish-v4
     	X-Cache:MISS via 192.168.100.73
     	X-Varnish:33
     第二次访问,X-Cache的值依然为MISS,varnish并未通过缓存响应
     	Request URL:http://192.168.100.73/admin/
     	Request Method:GET
     	Status Code:304 Not Modified
     	Remote Address:192.168.100.73:80
     	Response Headers
     	view source
     	Age:0
     	Connection:keep-alive
     	Date:Wed, 02 Nov 2016 02:50:04 GMT
     	ETag:"e0102-6-5403f450439af"
     	Server:Apache/2.2.15 (CentOS)
     	Via:1.1 varnish-v4
     	X-Cache:MISS via 192.168.100.73
     	X-Varnish:32780
    
  10. 对于特定类型的资源,例如公开的图片等,取消其私有标识,并强行设定其可以由varnish缓存的时长;

    if (beresp.http.cache-control !~ "s-maxage") {
    		if (bereq.url ~ "(?i)\.(jpg|jpeg|png|gif|css|js)$") {
    			unset beresp.http.Set-Cookie;
    			set beresp.ttl = 3600s;
    		}
    	}
    
  11. 缓存对象的修剪:purge,ban (purge:对某特定资源清理缓存,ban:清理符合条件的缓存)

    执行purge操作:
    	sub vcl_purge {
    		return (synth(200,"Purged"));	#vcl_purge清理缓存,调用synth,合成响应报文
    
    客户端第一次请求
    	[root@ _26_ /etc/varnish]# curl -I http://192.168.100.73
    	HTTP/1.1 200 OK
    	Date: Sat, 12 Nov 2016 10:44:03 GMT
    	Server: Apache/2.2.15 (CentOS)
    	Last-Modified: Tue, 01 Nov 2016 15:50:24 GMT
    	ETag: "e0104-7-5403f48611496"
    	Content-Length: 7
    	Content-Type: text/html; charset=UTF-8
    	X-Varnish: 65552 65548
    	Age: 4
    	Via: 1.1 varnish-v4
    	X-Cache: MISS via 192.168.100.73
    	Connection: keep-alive
    
    客户端第二次请求:
    	[root@ _23_ /etc/varnish]# curl -I http://192.168.100.73
    	HTTP/1.1 200 OK
    	Date: Sat, 12 Nov 2016 10:44:03 GMT
    	Server: Apache/2.2.15 (CentOS)
    	Last-Modified: Tue, 01 Nov 2016 15:50:24 GMT
    	ETag: "e0104-7-5403f48611496"
    	Content-Length: 7
    	Content-Type: text/html; charset=UTF-8
    	X-Varnish: 32780 65548
    	Age: 1
    	Via: 1.1 varnish-v4
    	X-Cache: HIT via 192.168.100.73
    	Connection: keep-alive
    
    客户端使用PURGE请求:
    	[root@ _27_ /etc/varnish]# curl -X PURGE -I http://192.168.100.73
    	HTTP/1.1 501 Method Not Implemented
    	Date: Sat, 12 Nov 2016 10:54:01 GMT
    	Server: Apache/2.2.15 (CentOS)
    	Allow: GET,HEAD,POST,OPTIONS,TRACE
    	Content-Length: 297
    	Connection: close
    	Content-Type: text/html; charset=iso-8859-1
    
    客户端再次请求:显示X-Cache为MISS,达到了清理缓存的效果
    
    	[root@ _28_ /etc/varnish]# curl -I http://192.168.100.73
    	HTTP/1.1 200 OK
    	Date: Sat, 12 Nov 2016 10:54:32 GMT
    	Server: Apache/2.2.15 (CentOS)
    	Last-Modified: Tue, 01 Nov 2016 15:50:24 GMT
    	ETag: "e0104-7-5403f48611496"
    	Content-Length: 7
    	Content-Type: text/html; charset=UTF-8
    	X-Varnish: 65554
    	Age: 0
    	Via: 1.1 varnish-v4
    	X-Cache: MISS via 192.168.100.73
    	Connection: keep-alive
    
  12. 何时执行purge操作

    sub vcl_recv {
    	if(req.method == "PURGE") {
    		return(purge);
    	}
    }
    
  13. 添加purge请求的访问控制法则

    acl purges {
    	"127.0.0.0"/8;
    	"10.1.0.0"/16;
    }
    
    sub vcl_recv {
    	if(req.method == "PURGE") {
    		if(client.ip ~ purges) {
    			return(synth(405,"Purging not allowed for" + client.ip))	
    		}
    	}
    }
    

posted on 2016-11-12 22:02  无心写博客  阅读(348)  评论(0)    收藏  举报

导航