jjzjj

nginx埋点,按天输出日志,filebeat收集日志到elasticsearch

晨宸辰成 2023-10-10 原文

一、Nginx 按天生成日志

定义时间变量指定格式

    map $time_iso8601 $logdate {
        '~^(?<ymd>\d{4}-\d{2}-\d{2})' $ymd;
        default    'date-not-found';
    }

自定义日志json格式

log_format  json_log '{"time":"$logdate","demo1":"$arg_demo1","demo2":"$arg_demo2"}';

$args $arg_name 是nginx预定义变量
$args 可以接收请求uri后面的参数
$arg_name 当前请求中名为 name 的参数的值,而且还是未解码的原始形式的值
例:http://192.168.31.112:80/web?demo1=aaaa&demo2=bbb
此时$args 的值为demo1=aaaa&demo2=bbb
$arg_demo1 的值为 aaaa
$arg_demo2 的值为 bbb
存储日志

access_log  logs/ng_$logdate.log  json_log;

二、埋点

前端发送一个请求,ng拦截该请求,返回一个空gif,并将本次请求存入日志

location ^~/web {
            access_log  logs/ng_$logdate.log  json_log;
            empty_gif;
}

之后通过filebeat收集日志,在es中做数据统计

完整nginx.conf


worker_processes  1;

events {
    worker_connections  1024;
}


http {
    include       mime.types;
    #default_type  application/octet-stream;

    map $time_iso8601 $logdate {
        '~^(?<ymd>\d{4}-\d{2}-\d{2})' $ymd;
        default    'date-not-found';
    }
    #默认日志
    log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '
                      '$status $body_bytes_sent "$http_referer" '
                      '"$http_user_agent" "$http_x_forwarded_for"';
    #自定义日志格式
    log_format  json_log '{"time":"$logdate","demo1":"$arg_demo1","demo2":"$arg_demo2"}';

    sendfile        on;
    keepalive_timeout  65;

    server {
        listen       80;
        server_name  localhost;
        #按天输出access日志
        access_log  logs/access_$logdate.log  main;

        location / {
            root   html;
            index  index.html index.htm;
        }

       location ^~/demo {
            access_log  logs/ng_$logdate.log  json_log;
            empty_gif;
        }

        error_page   500 502 503 504  /50x.html;
        location = /50x.html {
            root   html;
        }
    }

}

测试

浏览器发送请求
(注:默认情况下访问nginx静态资源只能用get请求,post请求会报405)
http://192.168.31.112:80/web?demo1=aaaa&demo2=bbb

nginx的logs目录下会多出一个ng_2023-01-06.log的日志文件
查看日志:

{"time":"2023-01-06","demo1":"aaaa","demo2":"bbb"}

三、filebeat收集日志并以json保存在elasticsearch中

filebeat安装步骤 略
在filebeat的目录下创建文件filebeat-nginx.yml

filebeat.inputs:
- type: log
  enabled: true
  paths:
    #nginx日志所在绝对路径,用* 去匹配
    - /usr/local/nginx/logs/ng_*.log
  fields:
    index: nginx
  json.keys_under_root: true              
  json.overwrite_keys: true
#===================================
output.elasticsearch:
    #es连接地址,多个用逗号分隔
    hosts: ["192.168.31.112:9200"]
    username: "elastic"
    password: "123456"
    index: "elk-%{[fields.source]}-*"
    indices:
      - index: "elk-nginx-%{+yyyy.MM.dd}"
        when.equals:
          fields:
            index: "nginx"
#===================================
setup.kibana:
  host: "192.168.31.112:5601"
#===================================
# 允许自动生成index模板
setup.template.enabled: true
# 如果存在模块则覆盖
setup.template.overwrite: true
#和前面的index保持一致
setup.template.name: "elk-nginx"
setup.template.pattern: "elk-*"
setup.ilm.enabled: auto
# 这里一定要注意 会在alias后面自动添加-*
setup.ilm.rollover_alias: "park-ssm"
setup.ilm.pattern: "{now/d}"
# 当我们该属性为false时,就不再遵循ilm的管理,而是索引到我们自己指定的index中
setup.ilm.enabled: false
重要:一定要清空es之前收集的传统日志格式的数据,还要把nginx日志情况,如果有多台nginx服务器,则改完json格式的日志后,一定要把日志清空,否则将会在kibana中显示两种日志格式;删除原有(如果有)elk-nginx-* 的索引

DELETE /elk-nginx-*

启动filebeat:
前台指定配置文件启动:

./filebeat -e -c filebeat-nginx.yml -d "publish"

后台启动

nohup ./filebeat -c /usr/local/filebeat/filebeat-nginx.yml -e > /usr/local/filebeat/logs/filebeat.log 2>&1

敲重点:
此时你关闭终端,断开ssh连接,会导致这个nohup进程也同时终止。因为断开连接时,会发送SIGHUP信号给当前shell的作业列表的所有进程,nohup进程接收到SIGHUP信号后终止。也就是说后台启动的filebeat会停止运行。

解决办法
解决终端关闭导致后台的nohup进程停止的有两种办法。

第一种是,在关闭xshell终端之前,先用exit命令断开ssh连接,然后就可以关闭终端了。但该方法一定程度上仍可能存在直接关闭终端导致nohup进程终止的危险。

第二种是,在原来的命令之前加上disown参数,这个参数将会使启动的nohup进程从当前shell的作业列表中清除,从而避免nohup进程在关闭这个shell时接收到SIGHUP信号。

nohup ./filebeat -c /usr/local/filebeat/filebeat-nginx.yml -e > /usr/local/filebeat/logs/filebeat.log 2>&1 & disown

在浏览器中发送器请求
http://192.168.31.112:80/web?demo1=aaaa&demo2=bbb

在kibana中查询

GET /elk-nginx-2023.01.06/_search
{
  "query": {
    "match_all": {}
  }
}

会发现数据已经是根据自己定义的键值对存储

四、将filebeat做成服务

#进入对应目录
cd /etc/systemd/system
#创建文件
touch filebeat.service
#赋予可执行权限
chmod 777 filebeat.service
#编辑内容
vi filebeat.service

在文件中输入如下内容

[Unit]
Description=filebeat
Wants=network-online.target
After=network-online.target
[Service]
User=root
ExecStart=/usr/local/filebeat-7.17.8/filebeat -e -c /usr/local/filebeat-7.17.8/filebeat-nginx.yml
Restart=always
[Install]
WantedBy=multi-user.target

systemctl daemon-reload
systemctl enable filebeat
systemctl start filebeat
systemctl status filebeat
systemctl stop filebeat

ok

参考连接:filebeat收集json格式的nginx程序日志

有关nginx埋点,按天输出日志,filebeat收集日志到elasticsearch的更多相关文章

  1. ruby-on-rails - 按天对 Mongoid 对象进行分组 - 2

    在控制台中反复尝试之后,我想到了这种方法,可以按发生日期对类似activerecord的(Mongoid)对象进行分组。我不确定这是完成此任务的最佳方法,但它确实有效。有没有人有更好的建议,或者这是一个很好的方法?#eventsisanarrayofactiverecord-likeobjectsthatincludeatimeattributeevents.map{|event|#converteventsarrayintoanarrayofhasheswiththedayofthemonthandtheevent{:number=>event.time.day,:event=>ev

  2. ruby - 检查 "command"的输出应该包含 NilClass 的意外崩溃 - 2

    为了将Cucumber用于命令行脚本,我按照提供的说明安装了arubagem。它在我的Gemfile中,我可以验证是否安装了正确的版本并且我已经包含了require'aruba/cucumber'在'features/env.rb'中为了确保它能正常工作,我写了以下场景:@announceScenario:Testingcucumber/arubaGivenablankslateThentheoutputfrom"ls-la"shouldcontain"drw"假设事情应该失败。它确实失败了,但失败的原因是错误的:@announceScenario:Testingcucumber/ar

  3. ruby-on-rails - 如何优雅地重启 thin + nginx? - 2

    我的瘦服务器配置了nginx,我的ROR应用程序正在它们上运行。在我发布代码更新时运行thinrestart会给我的应用程序带来一些停机时间。我试图弄清楚如何优雅地重启正在运行的Thin实例,但找不到好的解决方案。有没有人能做到这一点? 最佳答案 #Restartjustthethinserverdescribedbythatconfigsudothin-C/etc/thin/mysite.ymlrestartNginx将继续运行并代理请求。如果您将Nginx设置为使用多个上游服务器,例如server{listen80;server

  4. ruby - 通过 erb 模板输出 ruby​​ 数组 - 2

    我正在使用puppet为ruby​​程序提供一组常量。我需要提供一组主机名,我的程序将对其进行迭代。在我之前使用的bash脚本中,我只是将它作为一个puppet变量hosts=>"host1,host2"我将其提供给bash脚本作为HOSTS=显然这对ruby​​不太适用——我需要它的格式hosts=["host1","host2"]自从phosts和putsmy_array.inspect提供输出["host1","host2"]我希望使用其中之一。不幸的是,我终其一生都无法弄清楚如何让它发挥作用。我尝试了以下各项:我发现某处他们指出我需要在函数调用前放置“function_”……这

  5. ruby - 如何进行排列以有效地定制输出 - 2

    这是一道面试题,我没有答对,但还是很好奇怎么解。你有N个人的大家庭,分别是1,2,3,...,N岁。你想给你的大家庭拍张照片。所有的家庭成员都排成一排。“我是家里的friend,建议家庭成员安排如下:”1岁的家庭成员坐在这一排的最左边。每两个坐在一起的家庭成员的年龄相差不得超过2岁。输入:整数N,1≤N≤55。输出:摄影师可以拍摄的照片数量。示例->输入:4,输出:4符合条件的数组:[1,2,3,4][1,2,4,3][1,3,2,4][1,3,4,2]另一个例子:输入:5输出:6符合条件的数组:[1,2,3,4,5][1,2,3,5,4][1,2,4,3,5][1,2,4,5,3][

  6. ruby - 将 spawn() 的标准输出/标准错误重定向到 Ruby 中的字符串 - 2

    我想使用spawn(针对多个并发子进程)在Ruby中执行一个外部进程,并将标准输出或标准错误收集到一个字符串中,其方式类似于使用Python的子进程Popen.communicate()可以完成的操作。我尝试将:out/:err重定向到一个新的StringIO对象,但这会生成一个ArgumentError,并且临时重新定义$stdxxx会混淆子进程的输出。 最佳答案 如果你不喜欢popen,这是我的方法:r,w=IO.pipepid=Process.spawn(command,:out=>w,:err=>[:child,:out])

  7. ruby - Ruby 是否使用 $stdout 来写入 puts 和 return 的输出? - 2

    我想知道Ruby用来在命令行打印这些东西的输出流:irb(main):001:0>a="test"=>"test"irb(main):002:0>putsatest=>nilirb(main):003:0>a=>"test"$stdout是否用于irb(main):002:0>和irb(main):003:0>?而且,在这两次调用之间,$stdout的值是否有任何变化?另外,有人能告诉我打印/写入这些内容的Ruby源代码吗? 最佳答案 是的。而且很容易向自己测试/证明。在命令行试试这个:ruby-e'puts"foo"'>test.

  8. ruby-on-rails - 无法在 Rails 助手中捕获 block 的输出 - 2

    我在使用自定义RailsFormBuilder时遇到了问题,从昨天晚上开始我就发疯了。基本上我想对我的构建器方法之一有一个可选block,以便我可以在我的主要content_tag中显示其他内容。:defform_field(method,&block)content_tag(:div,class:'field')doconcatlabel(method,"Label#{method}")concattext_field(method)capture(&block)ifblock_given?endend当我在我的一个Slim模板中调用该方法时,如下所示:=f.form_field:e

  9. ruby-on-rails - 连接字符串时如何在 <%=%> block 内输出 html_safe? - 2

    考虑一下:现在这些情况:#output:http://domain.com/?foo=1&bar=2#output:http://domain.com/?foo=1&bar=2#output:http://domain.com/?foo=1&bar=2#output:http://domain.com/?foo=1&bar=2我需要用其他字符串输出URL。我如何保证&符号不会被转义?由于我无法控制的原因,我无法发送&。求助!把我的头发拉到这里:\编辑:为了澄清,我实际上有一个像这样的数组:@images=[{:id=>"fooid",:url=>"http://

  10. ruby-on-rails - 如何用不同的用户运行nginx主进程 - 2

    A/ctohttp://wiki.nginx.org/CoreModule#usermaster进程曾经以root用户运行,是否可以以不同的用户运行nginxmaster进程? 最佳答案 只需以非root身份运行init脚本(即/etc/init.d/nginxstart),就可以用不同的用户运行nginxmaster进程。如果这真的是你想要做的,你将需要确保日志和pid目录(通常是/var/log/nginx&/var/run/nginx.pid)对该用户是可写的,并且您所有的listen调用都是针对大于1024的端口(因为绑定(

随机推荐