快速掌握Nginx(四) —— Nginx日志切片和常用配置总结

1.Nginx日志管理

1.日志简单介绍

  Nginx提供了日志记录的功能,日志文件在对我们管理网站十分有用,通过访问日志(access_log)我们可以获取请求来源、客户端信息、请求的资源等信息;通过错误日志(error_log)可以获取错误发生时间、错误信息等,方便我们及时定位和修复错误。看一下Nginx中日志相关的指令。

#设置访问日志:访问日志文件为nginx/logs/mysite.access.log,格式为main
  access_log  logs/mysite.access.log  main;
          位置 格式
#设置错误日志:错误日志文件为nginx/logs/mysite.error.log,记录级别为error   error_log logs/mysite.error.log error;
            位置        级别
#定义main格式的日志 log_format main '$remote_addr - $remote_user [$time_local] "$request" ' '$status $body_bytes_sent "$http_referer" ' '"$http_user_agent" "$http_x_forwarded_for"';

  在Nginx日志中严重程度:debug<info<notice<warn<error<crit,一般记录warn/error级别;定义日志格式中,$开头的是Nginx中的变量,在前面已经总结过了,为了方便查看本篇底部也放了一份。记录网站的访问/错误日志,十分简单,只需要把access_log/error_log指令放在需要记录的server主机内即可。也可以把access_log/error_log指令放在http中用来记录全局日志。

  看一个简单的Nginx配置文件,为了方便演示,这里只配置了默认主机,并删去了Nginx中一些和日志不相关的配置:

worker_processes 2;
events {
    worker_connections  1024;
}

http {
    include       mime.types;
    default_type  application/octet-stream;#定义main格式的日志
    log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '
                      '$status $body_bytes_sent "$http_referer" '
                      '"$http_user_agent" "$http_x_forwarded_for"';
  #默认主机
  server{
        listen 80;
        server_name localhost;
        location /{
                root html;
                index index.html;
         }
        #访问日志,名字问nginx/logs/mysite.access.log,格式为main格式
        access_log  logs/mysite.access.log  main;
        #错误日志,记录级别为error
        error_log logs/mysite.error.log error;
      }
}

  当我们输入虚拟机IP会访问到默认主机,这时在nginx/logs目录下自动生成访问日志mysite.access.log和错误日志mysite.error.log。内容如下:

mysite.access.log内容

 

  访问日志的内容为main格式中定义的信息,某些信息不存在没有显示。我们也可以自定义访问日志的格式。

mysite.error.log内容

  可以看到错误原因是favicon.ico文件找不到,我们也可以知道错误发生的时间,请求,客户端和服务端IP等信息。

 2.日志切片

  上边我们已经知道怎么去设置访问日志和错误日志,但是这样设置有一个弊端:日志文件都放在同一个文件中,长时间运行后日志文件很大,可能达到几个G,甚至十几个G大小,查看起来很不方便。为了解决这个问题就需要进行日志切片,如每小时或者每天的日志放在一个单独的文件中。怎么实现呢?总体思路是:设置一个定时任务,每隔一段时间将日志文件剪切到一个特定的目录下。

  这里以访问日志切片为例,为了方便演示这里把每分钟的访问日志放在一个单独的文件中,首先,添加一个存放日志文件的目录,执行命令 mkdir /usr/local/nginx/logs/mysitelogs ,我们打算把mysite的所有访问日志都放在这个文件夹下。然后添加一个切割日志的脚本,执行命令 vim /usr/local/nginx/mysitelog.sh ,脚本内容如下:

#mysite.com虚拟主机的日志存放路径
LOGPATH=/usr/local/nginx/logs/mysite.access.log
#日志备份文件目录,mysite虚拟主机的备份日志放在logs下的单独目录下
BASEPATH=/usr/local/nginx/logs/mysitelogs
#一分钟记录一次 
bak=$BASEPATH/$(date -d today +%Y%m%d%H%M).mysite.access.log
#重名日志文件
mv $LOGPATH $bak
touch $LOGPATH
#向nginx主进程发送信号,重新写日志
/usr/local/nginx/sbin/nginx -s reopen

最后添加一个定时任务,执行命令 crontab -e ,编辑内容如下,表示每分钟执行一次mysitelog.sh脚本:

* * * * * sh /usr/local/nginx/mysitelog.sh

到这里日志切片就结束了,我们看一个日志文件, cd /usr/local/nginx/logs/mysitelogs 到日志文件夹下,看到日志文件为每分钟存储一次,前缀格式为yyyyMMddhhmm:

 

补充:我们在实际使用时一般把一天的日志放在一个文件中(高并发量的除外),下边的脚本实现每天晚上11:30分存储一次日志文件:

#-------------------shell脚本   
#该虚拟主机的日志存放路径
LOGPATH=/usr/local/nginx/logs/mysite.access.log
#日志备份文件目录,mysite虚拟主机的备份日志放在logs下的单独目录下
BASEPATH=/usr/local/nginx/logs/mysitelogs
#一天记录一次,格式为20190326mysite.access.log
bak=$BASEPATH/$(date -d yesterday +%Y%m%d)mysite.access.log
#重名日志文件
echo $bak
mv $LOGPATH $bak
touch $LOGPATH
#向nginx主进程发送信号,重新打开日志
/usr/local/nginx/sbin/nginx -s reopen

#------------------定时任务
30 23 * * * sh /usr/local/nginx/mysitelog.sh
View Code

2.常用Nginx配置总结

  Nginx的介绍到这里就基本结束了,这里汇总了一些Nginx中最常用的配置

2.1 基本配置

# 用户和用户组
user wyy wyy

#工作进程个数,通常设置和逻辑cpu个数一致
worker_processes  8;
#cpu亲和性,每个进程分配一个cpu  00000001表示第一个cpu,00000010表示第二个cpu,依次类推
worker_cpu_affinity 00000001 00000010 00000100 00001000 00010000 00100000 01000000 10000000;
#如果是两个逻辑cpu,可以设置worker_processes  2; worker_cpu_affinity 01 10;

#一个nginx工作进程最多可以打开的文件描述符个数 ,最好和linux最多能打开的文件描述符个数(查看命令:ulimit-n)保持一致。
#出现报错:too open many file,这时我们把worker_rlimit_nofile 值设置大一些就可以了。
worker_rlimit_nofile 65535


#记录的级别严重程度:debug<info<notice<warn<error<crit],一般记录warn/error级别
#错误日志,级别为error
error_log  logs/error.log  error;

#记录nginx的master进程的pid
pid        logs/nginx.pid;

 
events {
    use epoll ;               #多路复用IO的一种方式,效率很高,支持linux2.6以上内核
    worker_connections  1024; #每个工作进程的最大连接数,一台nginx的理论最大连接数就是(单个工作进程的最大连接数*工作进程个数)
    multi_accept on;          #尽可能多地接受请求
}


http {
    #媒体类型,定义在nginx/conf/mine.types中
    include       mime.types;
    #默认的媒体类型
    default_type  application/octet-stream;
    #main日志格式
    log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '
                      '$status $body_bytes_sent "$http_referer" '
                      '"$http_user_agent" "$http_x_forwarded_for"';
  #访问日志
    access_log  logs/access.log  main;
  #nginx是否调用sendfile函数(zero,copy等)来输出文件,普通应用都应该设置成on
    sendfile        on;
  #默认开启,nginx接受到数据包不马上发送,等到数据包达到一定大小再发送,使用Nagle算法控制。减少tcp传输次数,防止网络阻塞
    tcp_nopush      on;
  #tcp不延迟,和tcp_nopush相反,接收到数据包就发送,提高数据的实时响应
  #tcp_nodelay off;
    #长连接,请求资源获取完毕后不断开连接,60s后关闭该连接
    keepalive_timeout  60;
 
   #上传时单个文件最大为10M
  client_max_body_size 10m;
  #客户端的请求头缓冲区大小,一般设置为系统分页大小即可(查询系统分页命令:getconf PAGESIZE)
  #client_header_buffer_size 4k;
  #客户端的请求体缓冲区大小,超过这个大小存放在临时文件中,
  #client_body_buffer_size 8k;

  ######超时管理 代理服务器时才有用 (超时都返回502超时错误)
  #nginx连接后台服务器超时时间,
  proxy_connect_timeout 90;
  #后台服务器回传数据超时时间,90s传输数据未完成就报错
  proxy_send_timeout 90;
  #连接成功,等待后台服务器响应的超时时间
  proxy_read_timeout 90;

  #为打开文件设定缓存,默认是不启用的,max指定缓存数量,建议和最多能打开文件描述符个数(查询命令:ulimit -n)一致,inactive是指经过多长时间文件没被请求后删除缓存
  open_file_cache max=65535 inactive=60s;
  #多久检查一次缓存的有效信息
  open_file_cache_valid 30s;
  
  #定义负载均衡模块,
  upstream mysiteServers{
      server 123.11.1.2:8080 weight=1 max_fails=2 fail_timeout=30s;
      server 123.11.1.3:8080 weight=2 max_fails=2 fail_timeout=30s;
      server 123.11.1.4:8080 weight=3 max_fails=2 fail_timeout=30s;
  }

  server{
       servername :www.site1.com  www.site1.cn;
    #首页 
  location = / {
      proxy_pass http:/123.11.1.1:8080/Home/Index;
    }

  #静态文件
  location ~* \.(gif|jpg|jpeg|png|css|js|ico)$ {
      root /webroot/res/;
    #缓存十分钟
    expires:600;
    }
  #通用规则,用来转发动态请求到后端应用服务器
  location / {
      proxy_pass http://mysiteServers;
    }
 }

2.2 压缩配置

  gzip可以放在http/server/location/if下,用于压缩请求资源,减小网络传输的数据尺寸。gzip压缩常用于文本类型(css/js等)文件压缩,二进制文件(如图片,视频)压缩比不大,建议使用缓存(expires)进行优化:

#开启gzip压缩
gzip  on;
#最小压缩大小4000字节,小于4000字节就不压缩了
gzip_min_length 4000;
#压缩的缓冲设置,缓冲32块开始输出,每块4k大小
#gzip_buffers 32 4k;
#压缩采用的版本
gzip_http_version 1.1;
#压缩级别,级别越大压缩后尺寸越小方便传输,但同时压缩时耗费cpu资源也越大(最大为9,一般不要超过6)
gizp_comp_level 4;
#压缩的文件类型,不属于这些类型的就不压缩(可以通过 cat nginx/conf/mine.types查看文件类型),注:二进制文件如图片/视频的压缩比不大,不建议压缩
gzip_types  application/javascript  text/plain  text/css text/xml;   
# 是否传输gzip压缩标志,请求头中有vary标志的返回压缩版本文件,没有vary头的返回原始文件
gzip_vary on;

2.3 负载均衡配置

#1.weight
#指定轮询权重,weight越大,转发几率越大,一般用于后端服务器性能不均的情况。
  upstream mysiteServers{
    server 192.168.70.1:8080 weight=1;
    server 192.168.70.2:8080 weight=3;
  }
#2.ip_hash
#每个请求按访问ip的hash结果分配,这样每个访客固定访问一个后端服务器,适用后台服务器缓存多的场合,也可以解决session的问题。
  upstream mysiteServers{
    ip_hash;
    server 192.168.70.1:8080;
    server 192.168.70.2:8080;
  }
        
#一些参数
  upstream mysiteServers{
    server 192.168.70.1:8080 down;
    server 192.168.70.1:8081 weight=2;
    server 192.168.70.2:8080;
    server 192.168.70.2:8081 backup;
  }
#1.down表示的server暂时不参与负载均衡,请求不会转发给这台服务器;
#2.weight为weight越大,负载的权重就越大;
#3.max_fails续请求失败的次数默认为1.当超过最大次数时,不再转发请求给这台服务器;
#4.fail_timeout:max_fails次失败后,暂停多久后再向这台服务器转发请求;
#5.backup: 其它所有的非backup机器down或者忙的时候,请求backup机器。所以这台机器压力会最轻。


补充:也可以使用第三方模块实现其他负载均衡模式: ①添加nginx-upstream-fair模块可以实现按响应性能进行负载均衡,响应速度越快的服务器分发请求的几率越大; ②添加nginx_upstream_hash模块可以实现按请求url来进行转发请求,url相同的请求由同一个服务器处理,适用于缓存较多场景。

 补充:Nginx的一些全局变量

 

变量

含义

$args

请求中的参数,同$query_string

$content length

请求头中的Content-length字段。

$content_type

请求头中的Content-Type字段。

$document_root

当前请求在root指令中指定的值。

$host

请求主机头字段,否则为服务器名称。

$http_user_agent

用户代理,一般为用户浏览器信息

$http_cookie

客户端cookie信息

$limit_rate

这个变量可以限制连接速率。

$request_method

客户端请求的动作,通常为GET或POST。

$remote_addr

客户端的IP地址。

$remote_port

客户端的端口。

$remote_user

已经经过Auth Basic Module验证的用户名。

$request_filename

当前请求的文件路径,由root或alias指令与URI请求生成。

$scheme

协议名(如http,https)。

$server_protocol

请求使用的协议,通常是HTTP/1.0或HTTP/1.1。

$server_addr

服务器地址,在完成一次系统调用后可以确定这个值。

$server_name

服务器名称。

$server_port

请求到达服务器的端口号。

$request_uri

包含请求参数的原始URI,不包含主机名,如”/user/getuser?id=100”。

$uri

不带请求参数的当前URI,$uri不包含主机名,如”/user/getuser”。

$document_uri

与$uri相同

$http_x_forwarded_for

 代理过程的IP

posted @ 2019-04-13 17:09  捞月亮的猴子  阅读(2737)  评论(1编辑  收藏  举报