nginx ログを Clickhouse に送信するための Avito の Nginx-log-collector ユーティリティ

この記事ではプロジェクトについて説明します nginx-ログコレクター、nginx ログを読み取り、Clickhouse クラスターに送信します。 通常、ログには ElasticSearch が使用されます。 Clickhouse では必要なリソース (ディスク容量、RAM、CPU) が少なくなります。 Clickhouse はデータをより速く記録します。 Clickhouse はデータを圧縮し、ディスク上のデータをさらにコンパクトにします。 Clickhouse の利点は、レポートの 2 つのスライドで確認できます。 VK が数万台のサーバーから ClickHouse にデータを挿入する方法。

nginx ログを Clickhouse に送信するための Avito の Nginx-log-collector ユーティリティ

nginx ログを Clickhouse に送信するための Avito の Nginx-log-collector ユーティリティ

ログに基づいた分析を表示するには、Grafana のダッシュボードを作成します。

興味のある方は猫へようこそ。

標準的な方法でnginx、grafanaをインストールします。

ansible-playbook を使用してクリックハウス クラスターをインストールする デニス・プロスクリン.

Clickhouse でのデータベースとテーブルの作成

この中 ファイル Clickhouse で nginx-log-collector のデータベースとテーブルを作成するための SQL クエリについて説明します。

Clickhouse クラスター内の各サーバーで各リクエストを XNUMX つずつ実行します。

重要な注意点。 この行の logs_cluster は、「remote_servers」と「shard」の間にある clickhouse_remote_servers.xml ファイルのクラスター名に置き換える必要があります。

ENGINE = Distributed('logs_cluster', 'nginx', 'access_log_shard', rand())

nginx-log-collector-rpm のインストールと構成

Nginx-log-collector には rpm がありません。 ここ https://github.com/patsevanton/nginx-log-collector-rpm そのための rpm を作成します。 rpm は次を使用してコンパイルされます フェドーラ警察

rpm パッケージ nginx-log-collector-rpm をインストールする

yum -y install yum-plugin-copr
yum copr enable antonpatsev/nginx-log-collector-rpm
yum -y install nginx-log-collector
systemctl start nginx-log-collector

構成 /etc/nginx-log-collector/config.yaml を編集します。

  .......
  upload:
    table: nginx.access_log
    dsn: http://ip-адрес-кластера-clickhouse:8123/

- tag: "nginx_error:"
  format: error  # access | error
  buffer_size: 1048576
  upload:
    table: nginx.error_log
    dsn: http://ip-адрес-кластера-clickhouse:8123/

nginxのセットアップ

一般的な nginx 構成:

user  nginx;
worker_processes  auto;

#error_log  /var/log/nginx/error.log warn;
pid        /var/run/nginx.pid;

events {
    worker_connections  1024;
}

http {
    include       /etc/nginx/mime.types;
    default_type  application/octet-stream;

    log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '
                      '$status $body_bytes_sent "$http_referer" '
                      '"$http_user_agent" "$http_x_forwarded_for"';

    log_format avito_json escape=json
                     '{'
                     '"event_datetime": "$time_iso8601", '
                     '"server_name": "$server_name", '
                     '"remote_addr": "$remote_addr", '
                     '"remote_user": "$remote_user", '
                     '"http_x_real_ip": "$http_x_real_ip", '
                     '"status": "$status", '
                     '"scheme": "$scheme", '
                     '"request_method": "$request_method", '
                     '"request_uri": "$request_uri", '
                     '"server_protocol": "$server_protocol", '
                     '"body_bytes_sent": $body_bytes_sent, '
                     '"http_referer": "$http_referer", '
                     '"http_user_agent": "$http_user_agent", '
                     '"request_bytes": "$request_length", '
                     '"request_time": "$request_time", '
                     '"upstream_addr": "$upstream_addr", '
                     '"upstream_response_time": "$upstream_response_time", '
                     '"hostname": "$hostname", '
                     '"host": "$host"'
                     '}';

    access_log     syslog_server=unix:/var/run/nginx_log.sock,nohostname,tag=nginx avito_json; #ClickHouse
    error_log      syslog_server=unix:/var/run/nginx_log.sock,nohostname,tag=nginx_error; #ClickHouse

    #access_log  /var/log/nginx/access.log  main;

    proxy_ignore_client_abort on;
    sendfile        on;
    keepalive_timeout  65;
    include /etc/nginx/conf.d/*.conf;
}

XNUMX つの仮想ホスト:

vhost1.conf:

upstream backend {
    server ip-адрес-сервера-с-stub_http_server:8080;
    server ip-адрес-сервера-с-stub_http_server:8080;
    server ip-адрес-сервера-с-stub_http_server:8080;
    server ip-адрес-сервера-с-stub_http_server:8080;
    server ip-адрес-сервера-с-stub_http_server:8080;
}

server {
    listen   80;
    server_name vhost1;
    location / {
        proxy_pass http://backend;
    }
}

仮想ホストを /etc/hosts ファイルに追加します。

ip-адрес-сервера-с-nginx vhost1

HTTPサーバーエミュレータ

HTTPサーバーエミュレータとして使用します ノードjs-スタブサーバー から マキシム・イグナテンコ

Nodejs-stub-server には rpm がありません。 ここ https://github.com/patsevanton/nodejs-stub-server そのための rpm を作成します。 rpm は次を使用してコンパイルされます フェドーラ警察

アップストリームの nginx rpm に nodejs-stub-server パッケージをインストールします

yum -y install yum-plugin-copr
yum copr enable antonpatsev/nodejs-stub-server
yum -y install stub_http_server
systemctl start stub_http_server

ストレステスト

Apacheベンチマークを使用してテストを実施します。

インストールします:

yum install -y httpd-tools

5 つの異なるサーバーから Apache ベンチマークを使用してテストを開始します。

while true; do ab -H "User-Agent: 1server" -c 10 -n 10 -t 10 http://vhost1/; sleep 1; done
while true; do ab -H "User-Agent: 2server" -c 10 -n 10 -t 10 http://vhost1/; sleep 1; done
while true; do ab -H "User-Agent: 3server" -c 10 -n 10 -t 10 http://vhost1/; sleep 1; done
while true; do ab -H "User-Agent: 4server" -c 10 -n 10 -t 10 http://vhost1/; sleep 1; done
while true; do ab -H "User-Agent: 5server" -c 10 -n 10 -t 10 http://vhost1/; sleep 1; done

Grafana のセットアップ

Grafana の公式 Web サイトにはダッシュボードがありません。

したがって、手作業で行います。

保存したダッシュボードを見つけることができます ここで.

内容を含むテーブル変数を作成する必要もあります。 nginx.access_log.
nginx ログを Clickhouse に送信するための Avito の Nginx-log-collector ユーティリティ

Singlestat リクエストの合計数:

SELECT
 1 as t,
 count(*) as c
 FROM $table
 WHERE $timeFilter GROUP BY t

nginx ログを Clickhouse に送信するための Avito の Nginx-log-collector ユーティリティ

Singlestat の失敗したリクエスト:

SELECT
 1 as t,
 count(*) as c
 FROM $table
 WHERE $timeFilter AND status NOT IN (200, 201, 401) GROUP BY t

nginx ログを Clickhouse に送信するための Avito の Nginx-log-collector ユーティリティ

シングルスタットの失敗率:

SELECT
 1 as t, (sum(status = 500 or status = 499)/sum(status = 200 or status = 201 or status = 401))*100 FROM $table
 WHERE $timeFilter GROUP BY t

nginx ログを Clickhouse に送信するための Avito の Nginx-log-collector ユーティリティ

Singlestat の平均応答時間:

SELECT
 1, avg(request_time) FROM $table
 WHERE $timeFilter GROUP BY 1

nginx ログを Clickhouse に送信するための Avito の Nginx-log-collector ユーティリティ

シングルスタットの最大応答時間:

SELECT
 1 as t, max(request_time) as c
 FROM $table
 WHERE $timeFilter GROUP BY t

nginx ログを Clickhouse に送信するための Avito の Nginx-log-collector ユーティリティ

カウントステータス:

$columns(status, count(*) as c) from $table

nginx ログを Clickhouse に送信するための Avito の Nginx-log-collector ユーティリティ

円グラフのようにデータを出力するには、プラグインをインストールし、grafana を再起動する必要があります。

grafana-cli plugins install grafana-piechart-panel
service grafana-server restart

パイトップ 5 ステータス:

SELECT
    1, /* fake timestamp value */
    status,
    sum(status) AS Reqs
FROM $table
WHERE $timeFilter
GROUP BY status
ORDER BY Reqs desc
LIMIT 5

nginx ログを Clickhouse に送信するための Avito の Nginx-log-collector ユーティリティ

さらに、スクリーンショットなしでリクエストを出します。

http_user_agent をカウントします:

$columns(http_user_agent, count(*) c) FROM $table

良いレート/悪いレート:

$rate(countIf(status = 200) AS good, countIf(status != 200) AS bad) FROM $table

応答タイミング:

$rate(avg(request_time) as request_time) FROM $table

アップストリーム応答時間 (最初のアップストリーム応答時間):

$rate(avg(arrayElement(upstream_response_time,1)) as upstream_response_time) FROM $table

すべての仮想ホストのテーブル数ステータス:

$columns(status, count(*) as c) from $table

ダッシュボードの全体図

nginx ログを Clickhouse に送信するための Avito の Nginx-log-collector ユーティリティ

nginx ログを Clickhouse に送信するための Avito の Nginx-log-collector ユーティリティ

nginx ログを Clickhouse に送信するための Avito の Nginx-log-collector ユーティリティ

avg() と quantile() の比較

平均()
nginx ログを Clickhouse に送信するための Avito の Nginx-log-collector ユーティリティ
分位数()
nginx ログを Clickhouse に送信するための Avito の Nginx-log-collector ユーティリティ

結論:

コミュニティが nginx-log-collector の開発/テストと使用に参加してくれることを願っています。
そして、誰かが nginx-log-collector を実装すると、ディスク、RAM、CPU をどれだけ節約したかがわかります。

電報チャンネル:

ミリ秒:

ミリ秒が重要な方は、これに書くか投票してください。 問題.

出所: habr.com

コメントを追加します