Nginx-log-collector ΡƒΡ‚ΠΈΠ»ΠΈΡ‚Π° ΠΎΡ‚ Авито для ΠΎΡ‚ΠΏΡ€Π°Π²ΠΊΠΈ Π»ΠΎΠ³ΠΎΠ² nginx Π² Clickhouse

Π’ этой ΡΡ‚Π°Ρ‚ΡŒΠ΅ Π±ΡƒΠ΄Π΅Ρ‚ Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°Ρ‚ΡŒΡΡ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ nginx-log-collector, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π±ΡƒΠ΄Π΅Ρ‚ Ρ‡ΠΈΡ‚Π°Ρ‚ΡŒ Π»ΠΎΠ³ΠΈ nginx, ΠΎΡ‚ΠΏΡ€Π°Π²Π»ΡΡ‚ΡŒ ΠΈΡ… Π² кластСр Clickhouse. ΠžΠ±Ρ‹Ρ‡Π½ΠΎ для Π»ΠΎΠ³ΠΎΠ² ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ ElasticSearch. Для Clickhouse трСбуСтся мСньшС рСсурсов (дисковоС пространство, ΠžΠ—Π£, ЦПУ). Clickhouse быстрСС записываСт Π΄Π°Π½Π½Ρ‹Π΅. Clickhouse сТимаСт Π΄Π°Π½Π½Ρ‹Π΅, Ρ‡Ρ‚ΠΎ Π΄Π΅Π»Π°Π΅Ρ‚ Π΄Π°Π½Π½Ρ‹Π΅ Π½Π° дискС Π΅Ρ‰Π΅ ΠΊΠΎΠΌΠΏΠ°ΠΊΡ‚Π½Π΅Π΅. ΠŸΡ€Π΅ΠΈΠΌΡƒΡ‰Π΅ΡΡ‚Π²Π° Clickhouse Π²ΠΈΠ΄Π½Ρ‹ ΠΏΠΎ 2 слайдам с Π΄ΠΎΠΊΠ»Π°Π΄Π° Как VK вставляСт Π΄Π°Π½Π½Ρ‹Π΅ Π² ClickHouse с дСсятков тысяч сСрвСров.

Nginx-log-collector ΡƒΡ‚ΠΈΠ»ΠΈΡ‚Π° ΠΎΡ‚ Авито для ΠΎΡ‚ΠΏΡ€Π°Π²ΠΊΠΈ Π»ΠΎΠ³ΠΎΠ² nginx Π² Clickhouse

Nginx-log-collector ΡƒΡ‚ΠΈΠ»ΠΈΡ‚Π° ΠΎΡ‚ Авито для ΠΎΡ‚ΠΏΡ€Π°Π²ΠΊΠΈ Π»ΠΎΠ³ΠΎΠ² nginx Π² Clickhouse

Для просмотра Π°Π½Π°Π»ΠΈΡ‚ΠΈΠΊΠΈ ΠΏΠΎ Π»ΠΎΠ³Π°ΠΌ создадим Π΄Π°ΡˆΠ±ΠΎΡ€Π΄ для Grafana.

ΠšΠΎΠΌΡƒ интСрСсно, Π΄ΠΎΠ±Ρ€ΠΎ ΠΏΠΎΠΆΠ°Π»ΠΎΠ²Π°Ρ‚ΡŒ ΠΏΠΎΠ΄ ΠΊΠ°Ρ‚.

УстанавливаСм nginx, grafana стандартным способом.

УстанавливаСм кластСр clickhouse с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ansible-playbook ΠΎΡ‚ ДСниса ΠŸΡ€ΠΎΡΠΊΡƒΡ€ΠΈΠ½Π°.

Π‘ΠΎΠ·Π΄Π°Π½ΠΈΠ΅ Π±Π΄ ΠΈ Ρ‚Π°Π±Π»ΠΈΡ† Π² Clickhouse

Π’ этом Ρ„Π°ΠΉΠ»Π΅ описаны SQL запросы для создания Π±Π΄ ΠΈ Ρ‚Π°Π±Π»ΠΈΡ† для nginx-log-collector Π² Clickhouse.

ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ запрос Π΄Π΅Π»Π°Π΅ΠΌ ΠΏΠΎΠΎΡ‡Π΅Ρ€Π΅Π΄Π½ΠΎ Π½Π° ΠΊΠ°ΠΆΠ΄ΠΎΠΌ сСрвСрС кластСра Clickhouse.

Π’Π°ΠΆΠ½ΠΎΠ΅ Π·Π°ΠΌΠ΅Ρ‡Π°Π½ΠΈΠ΅. Π’ этой строкС logs_cluster Π½ΡƒΠΆΠ½ΠΎ Π·Π°ΠΌΠ΅Π½ΠΈΡ‚ΡŒ Π½Π° вашС Π½Π°Π·Π²Π°Π½ΠΈΠ΅ кластСра ΠΈΠ· Ρ„Π°ΠΉΠ»Π° clickhouse_remote_servers.xml ΠΌΠ΅ΠΆΠ΄Ρƒ "remote_servers" and "shard".

ENGINE = Distributed('logs_cluster', 'nginx', 'access_log_shard', rand())

Устанавливка ΠΈ настройка nginx-log-collector-rpm

Nginx-log-collector Π½Π΅ ΠΈΠΌΠ΅Π΅Ρ‚ rpm. Π—Π΄Π΅ΡΡŒ https://github.com/patsevanton/nginx-log-collector-rpm создаСм Π΅ΠΌΡƒ rpm. Π‘ΠΎΠ±ΠΈΡ€Π°Ρ‚ΡŒΡΡ rpm Π±ΡƒΠ΄Π΅Ρ‚ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Fedora Copr

УстанавливаСм rpm ΠΏΠ°ΠΊΠ΅Ρ‚ nginx-log-collector-rpm

yum -y install yum-plugin-copr
yum copr enable antonpatsev/nginx-log-collector-rpm
yum -y install nginx-log-collector
systemctl start nginx-log-collector

ΠŸΡ€Π°Π²ΠΈΠΌ ΠΊΠΎΠ½Ρ„ΠΈΠ³ /etc/nginx-log-collector/config.yaml:

  .......
  upload:
    table: nginx.access_log
    dsn: http://ip-адрСс-кластСра-clickhouse:8123/

- tag: "nginx_error:"
  format: error  # access | error
  buffer_size: 1048576
  upload:
    table: nginx.error_log
    dsn: http://ip-адрСс-кластСра-clickhouse:8123/

Настройка nginx

ΠžΠ±Ρ‰ΠΈΠΉ ΠΊΠΎΠ½Ρ„ΠΈΠ³ nginx:

user  nginx;
worker_processes  auto;

#error_log  /var/log/nginx/error.log warn;
pid        /var/run/nginx.pid;

events {
    worker_connections  1024;
}

http {
    include       /etc/nginx/mime.types;
    default_type  application/octet-stream;

    log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '
                      '$status $body_bytes_sent "$http_referer" '
                      '"$http_user_agent" "$http_x_forwarded_for"';

    log_format avito_json escape=json
                     '{'
                     '"event_datetime": "$time_iso8601", '
                     '"server_name": "$server_name", '
                     '"remote_addr": "$remote_addr", '
                     '"remote_user": "$remote_user", '
                     '"http_x_real_ip": "$http_x_real_ip", '
                     '"status": "$status", '
                     '"scheme": "$scheme", '
                     '"request_method": "$request_method", '
                     '"request_uri": "$request_uri", '
                     '"server_protocol": "$server_protocol", '
                     '"body_bytes_sent": $body_bytes_sent, '
                     '"http_referer": "$http_referer", '
                     '"http_user_agent": "$http_user_agent", '
                     '"request_bytes": "$request_length", '
                     '"request_time": "$request_time", '
                     '"upstream_addr": "$upstream_addr", '
                     '"upstream_response_time": "$upstream_response_time", '
                     '"hostname": "$hostname", '
                     '"host": "$host"'
                     '}';

    access_log     syslog_server=unix:/var/run/nginx_log.sock,nohostname,tag=nginx avito_json; #ClickHouse
    error_log      syslog_server=unix:/var/run/nginx_log.sock,nohostname,tag=nginx_error; #ClickHouse

    #access_log  /var/log/nginx/access.log  main;

    proxy_ignore_client_abort on;
    sendfile        on;
    keepalive_timeout  65;
    include /etc/nginx/conf.d/*.conf;
}

Π’ΠΈΡ€Ρ‚ΡƒΠ°Π»ΡŒΠ½Ρ‹ΠΉ хост ΠΎΠ΄ΠΈΠ½:

vhost1.conf:

upstream backend {
    server ip-адрСс-сСрвСра-с-stub_http_server:8080;
    server ip-адрСс-сСрвСра-с-stub_http_server:8080;
    server ip-адрСс-сСрвСра-с-stub_http_server:8080;
    server ip-адрСс-сСрвСра-с-stub_http_server:8080;
    server ip-адрСс-сСрвСра-с-stub_http_server:8080;
}

server {
    listen   80;
    server_name vhost1;
    location / {
        proxy_pass http://backend;
    }
}

ДобавляСм Π² Ρ„Π°ΠΉΠ» /etc/hosts Π²ΠΈΡ€Ρ‚ΡƒΠ°Π»ΡŒΠ½Ρ‹Π΅ хосты:

ip-адрСс-сСрвСра-с-nginx vhost1

Эмулятор HTTP сСрвСра

Π’ качСствС эмулятора HTTP сСрвСра Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ nodejs-stub-server ΠΎΡ‚ Maxim Ignatenko

Nodejs-stub-server Π½Π΅ ΠΈΠΌΠ΅Π΅Ρ‚ rpm. Π—Π΄Π΅ΡΡŒ https://github.com/patsevanton/nodejs-stub-server создаСм Π΅ΠΌΡƒ rpm. Π‘ΠΎΠ±ΠΈΡ€Π°Ρ‚ΡŒΡΡ rpm Π±ΡƒΠ΄Π΅Ρ‚ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Fedora Copr

УстанавливаСм Π½Π° upstream nginx rpm ΠΏΠ°ΠΊΠ΅Ρ‚ nodejs-stub-server

yum -y install yum-plugin-copr
yum copr enable antonpatsev/nodejs-stub-server
yum -y install stub_http_server
systemctl start stub_http_server

НагрузочноС тСстированиС

ВСстированиС ΠΏΡ€ΠΎΠ²ΠΎΠ΄ΠΈΠΌ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Apache benchmark.

УстанавливаСм Π΅Π³ΠΎ:

yum install -y httpd-tools

ЗапускаСм тСстированиС с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Apache benchmark c 5 Ρ€Π°Π·Π½Ρ‹Ρ… сСрвСров:

while true; do ab -H "User-Agent: 1server" -c 10 -n 10 -t 10 http://vhost1/; sleep 1; done
while true; do ab -H "User-Agent: 2server" -c 10 -n 10 -t 10 http://vhost1/; sleep 1; done
while true; do ab -H "User-Agent: 3server" -c 10 -n 10 -t 10 http://vhost1/; sleep 1; done
while true; do ab -H "User-Agent: 4server" -c 10 -n 10 -t 10 http://vhost1/; sleep 1; done
while true; do ab -H "User-Agent: 5server" -c 10 -n 10 -t 10 http://vhost1/; sleep 1; done

Настройка Grafana

На ΠΎΡ„ΠΈΡ†ΠΈΠ°Π»ΡŒΠ½ΠΎΠΌ сайтС Grafana Π²Ρ‹ Π½Π΅ Π½Π°ΠΉΠ΄Π΅Ρ‚Π΅ Π΄Π°ΡˆΠ±ΠΎΡ€Π΄.

ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ Π±ΡƒΠ΄Π΅ΠΌ Π΄Π΅Π»Π°Ρ‚ΡŒ Π΅Π³ΠΎ Π²Ρ€ΡƒΡ‡ΡƒΡŽ.

Мой сохранСнный Π΄Π°ΡˆΠ±ΠΎΡ€Π΄ Π²Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Π½Π°ΠΉΡ‚ΠΈ Ρ‚ΡƒΡ‚.

Π’Π°ΠΊ ΠΆΠ΅ Π²Π°ΠΌ Π½ΡƒΠΆΠ½ΠΎ ΡΠΎΠ·Π΄Π°Ρ‚ΡŒ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΡƒΡŽ table с содСрТимым nginx.access_log.
Nginx-log-collector ΡƒΡ‚ΠΈΠ»ΠΈΡ‚Π° ΠΎΡ‚ Авито для ΠΎΡ‚ΠΏΡ€Π°Π²ΠΊΠΈ Π»ΠΎΠ³ΠΎΠ² nginx Π² Clickhouse

Singlestat Total Requests:

SELECT
 1 as t,
 count(*) as c
 FROM $table
 WHERE $timeFilter GROUP BY t

Nginx-log-collector ΡƒΡ‚ΠΈΠ»ΠΈΡ‚Π° ΠΎΡ‚ Авито для ΠΎΡ‚ΠΏΡ€Π°Π²ΠΊΠΈ Π»ΠΎΠ³ΠΎΠ² nginx Π² Clickhouse

Singlestat Failed Requests:

SELECT
 1 as t,
 count(*) as c
 FROM $table
 WHERE $timeFilter AND status NOT IN (200, 201, 401) GROUP BY t

Nginx-log-collector ΡƒΡ‚ΠΈΠ»ΠΈΡ‚Π° ΠΎΡ‚ Авито для ΠΎΡ‚ΠΏΡ€Π°Π²ΠΊΠΈ Π»ΠΎΠ³ΠΎΠ² nginx Π² Clickhouse

Singlestat Failing Percent:

SELECT
 1 as t, (sum(status = 500 or status = 499)/sum(status = 200 or status = 201 or status = 401))*100 FROM $table
 WHERE $timeFilter GROUP BY t

Nginx-log-collector ΡƒΡ‚ΠΈΠ»ΠΈΡ‚Π° ΠΎΡ‚ Авито для ΠΎΡ‚ΠΏΡ€Π°Π²ΠΊΠΈ Π»ΠΎΠ³ΠΎΠ² nginx Π² Clickhouse

Singlestat Avg Response Time:

SELECT
 1, avg(request_time) FROM $table
 WHERE $timeFilter GROUP BY 1

Nginx-log-collector ΡƒΡ‚ΠΈΠ»ΠΈΡ‚Π° ΠΎΡ‚ Авито для ΠΎΡ‚ΠΏΡ€Π°Π²ΠΊΠΈ Π»ΠΎΠ³ΠΎΠ² nginx Π² Clickhouse

Singlestat Max Response Time:

SELECT
 1 as t, max(request_time) as c
 FROM $table
 WHERE $timeFilter GROUP BY t

Nginx-log-collector ΡƒΡ‚ΠΈΠ»ΠΈΡ‚Π° ΠΎΡ‚ Авито для ΠΎΡ‚ΠΏΡ€Π°Π²ΠΊΠΈ Π»ΠΎΠ³ΠΎΠ² nginx Π² Clickhouse

Count Status:

$columns(status, count(*) as c) from $table

Nginx-log-collector ΡƒΡ‚ΠΈΠ»ΠΈΡ‚Π° ΠΎΡ‚ Авито для ΠΎΡ‚ΠΏΡ€Π°Π²ΠΊΠΈ Π»ΠΎΠ³ΠΎΠ² nginx Π² Clickhouse

Для Π²Ρ‹Π²ΠΎΠ΄Π° Π΄Π°Π½Π½Ρ‹Ρ… ΠΊΠ°ΠΊ ΠΏΠΈΡ€ΠΎΠ³, Π½ΡƒΠΆΠ½ΠΎ ΡƒΡΡ‚Π°Π½ΠΎΠ²ΠΈΡ‚ΡŒ ΠΏΠ»Π°Π³ΠΈΠ½ ΠΈ ΠΏΠ΅Ρ€Π΅Π·Π°Π³Ρ€ΡƒΠ·ΠΈΡ‚ΡŒ grafana.

grafana-cli plugins install grafana-piechart-panel
service grafana-server restart

Pie TOP 5 Status:

SELECT
    1, /* fake timestamp value */
    status,
    sum(status) AS Reqs
FROM $table
WHERE $timeFilter
GROUP BY status
ORDER BY Reqs desc
LIMIT 5

Nginx-log-collector ΡƒΡ‚ΠΈΠ»ΠΈΡ‚Π° ΠΎΡ‚ Авито для ΠΎΡ‚ΠΏΡ€Π°Π²ΠΊΠΈ Π»ΠΎΠ³ΠΎΠ² nginx Π² Clickhouse

Π”Π°Π»ΡŒΡˆΠ΅ Π±ΡƒΠ΄Ρƒ ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ΡŒ запросы Π±Π΅Π· ΡΠΊΡ€ΠΈΠ½ΡˆΠΎΡ‚ΠΎΠ²:

Count http_user_agent:

$columns(http_user_agent, count(*) c) FROM $table

GoodRate/BadRate:

$rate(countIf(status = 200) AS good, countIf(status != 200) AS bad) FROM $table

Response Timing:

$rate(avg(request_time) as request_time) FROM $table

Upstream response time (врСмя ΠΎΡ‚Π²Π΅Ρ‚Π° 1-Π³ΠΎ upstream):

$rate(avg(arrayElement(upstream_response_time,1)) as upstream_response_time) FROM $table

Table Count Status for all vhost:

$columns(status, count(*) as c) from $table

ΠžΠ±Ρ‰ΠΈΠΉ Π²ΠΈΠ΄ Π΄Π°ΡˆΠ±ΠΎΡ€Π΄Π°

Nginx-log-collector ΡƒΡ‚ΠΈΠ»ΠΈΡ‚Π° ΠΎΡ‚ Авито для ΠΎΡ‚ΠΏΡ€Π°Π²ΠΊΠΈ Π»ΠΎΠ³ΠΎΠ² nginx Π² Clickhouse

Nginx-log-collector ΡƒΡ‚ΠΈΠ»ΠΈΡ‚Π° ΠΎΡ‚ Авито для ΠΎΡ‚ΠΏΡ€Π°Π²ΠΊΠΈ Π»ΠΎΠ³ΠΎΠ² nginx Π² Clickhouse

Nginx-log-collector ΡƒΡ‚ΠΈΠ»ΠΈΡ‚Π° ΠΎΡ‚ Авито для ΠΎΡ‚ΠΏΡ€Π°Π²ΠΊΠΈ Π»ΠΎΠ³ΠΎΠ² nginx Π² Clickhouse

Π‘Ρ€Π°Π²Π½Π΅Π½ΠΈΠ΅ avg() ΠΈ quantile()

avg()
Nginx-log-collector ΡƒΡ‚ΠΈΠ»ΠΈΡ‚Π° ΠΎΡ‚ Авито для ΠΎΡ‚ΠΏΡ€Π°Π²ΠΊΠΈ Π»ΠΎΠ³ΠΎΠ² nginx Π² Clickhouse
quantile()
Nginx-log-collector ΡƒΡ‚ΠΈΠ»ΠΈΡ‚Π° ΠΎΡ‚ Авито для ΠΎΡ‚ΠΏΡ€Π°Π²ΠΊΠΈ Π»ΠΎΠ³ΠΎΠ² nginx Π² Clickhouse

Π’Ρ‹Π²ΠΎΠ΄:

НадСюсь, сообщСство ΠΏΠΎΠ΄ΠΊΠ»ΡŽΡ‡ΠΈΡ‚ΡΡ ΠΊ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠ΅/Ρ‚Π΅ΡΡ‚ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡŽ ΠΈ использованию nginx-log-collector.
И ΠΊΡ‚ΠΎ-Π½ΠΈΠ±ΡƒΠ΄ΡŒ ΠΊΠΎΠ³Π΄Π° Π²Π½Π΅Π΄Ρ€ΠΈΡ‚ nginx-log-collector расскаТСт сколько сэкономил диска, ΠžΠ—Π£, ЦПУ.

Telegram ΠΊΠ°Π½Π°Π»Ρ‹:

ΠœΠΈΠ»Π»ΠΈΡΠ΅ΠΊΡƒΠ½Π΄Ρ‹:

ΠšΠΎΠΌΡƒ Π²Π°ΠΆΠ½Ρ‹ миллисСкунды, Π½Π°ΠΏΠΈΡˆΠΈΡ‚Π΅ ΠΈΠ»ΠΈ проголосуйтС, поТалуйста, Π² этом issue.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ: habr.com