この記事ではプロジェクトについて説明します
ログに基づいた分析を表示するには、Grafana のダッシュボードを作成します。
興味のある方は猫へようこそ。
標準的な方法でnginx、grafanaをインストールします。
ansible-playbook を使用してクリックハウス クラスターをインストールする
Clickhouse でのデータベースとテーブルの作成
この中
Clickhouse クラスター内の各サーバーで各リクエストを XNUMX つずつ実行します。
重要な注意点。 この行の logs_cluster は、「remote_servers」と「shard」の間にある clickhouse_remote_servers.xml ファイルのクラスター名に置き換える必要があります。
ENGINE = Distributed('logs_cluster', 'nginx', 'access_log_shard', rand())
nginx-log-collector-rpm のインストールと構成
Nginx-log-collector には rpm がありません。 ここ
rpm パッケージ nginx-log-collector-rpm をインストールする
yum -y install yum-plugin-copr
yum copr enable antonpatsev/nginx-log-collector-rpm
yum -y install nginx-log-collector
systemctl start nginx-log-collector
構成 /etc/nginx-log-collector/config.yaml を編集します。
.......
upload:
table: nginx.access_log
dsn: http://ip-адрес-кластера-clickhouse:8123/
- tag: "nginx_error:"
format: error # access | error
buffer_size: 1048576
upload:
table: nginx.error_log
dsn: http://ip-адрес-кластера-clickhouse:8123/
nginxのセットアップ
一般的な nginx 構成:
user nginx;
worker_processes auto;
#error_log /var/log/nginx/error.log warn;
pid /var/run/nginx.pid;
events {
worker_connections 1024;
}
http {
include /etc/nginx/mime.types;
default_type application/octet-stream;
log_format main '$remote_addr - $remote_user [$time_local] "$request" '
'$status $body_bytes_sent "$http_referer" '
'"$http_user_agent" "$http_x_forwarded_for"';
log_format avito_json escape=json
'{'
'"event_datetime": "$time_iso8601", '
'"server_name": "$server_name", '
'"remote_addr": "$remote_addr", '
'"remote_user": "$remote_user", '
'"http_x_real_ip": "$http_x_real_ip", '
'"status": "$status", '
'"scheme": "$scheme", '
'"request_method": "$request_method", '
'"request_uri": "$request_uri", '
'"server_protocol": "$server_protocol", '
'"body_bytes_sent": $body_bytes_sent, '
'"http_referer": "$http_referer", '
'"http_user_agent": "$http_user_agent", '
'"request_bytes": "$request_length", '
'"request_time": "$request_time", '
'"upstream_addr": "$upstream_addr", '
'"upstream_response_time": "$upstream_response_time", '
'"hostname": "$hostname", '
'"host": "$host"'
'}';
access_log syslog_server=unix:/var/run/nginx_log.sock,nohostname,tag=nginx avito_json; #ClickHouse
error_log syslog_server=unix:/var/run/nginx_log.sock,nohostname,tag=nginx_error; #ClickHouse
#access_log /var/log/nginx/access.log main;
proxy_ignore_client_abort on;
sendfile on;
keepalive_timeout 65;
include /etc/nginx/conf.d/*.conf;
}
XNUMX つの仮想ホスト:
vhost1.conf:
upstream backend {
server ip-адрес-сервера-с-stub_http_server:8080;
server ip-адрес-сервера-с-stub_http_server:8080;
server ip-адрес-сервера-с-stub_http_server:8080;
server ip-адрес-сервера-с-stub_http_server:8080;
server ip-адрес-сервера-с-stub_http_server:8080;
}
server {
listen 80;
server_name vhost1;
location / {
proxy_pass http://backend;
}
}
仮想ホストを /etc/hosts ファイルに追加します。
ip-адрес-сервера-с-nginx vhost1
HTTPサーバーエミュレータ
HTTPサーバーエミュレータとして使用します
Nodejs-stub-server には rpm がありません。 ここ
アップストリームの nginx rpm に nodejs-stub-server パッケージをインストールします
yum -y install yum-plugin-copr
yum copr enable antonpatsev/nodejs-stub-server
yum -y install stub_http_server
systemctl start stub_http_server
ストレステスト
Apacheベンチマークを使用してテストを実施します。
インストールします:
yum install -y httpd-tools
5 つの異なるサーバーから Apache ベンチマークを使用してテストを開始します。
while true; do ab -H "User-Agent: 1server" -c 10 -n 10 -t 10 http://vhost1/; sleep 1; done
while true; do ab -H "User-Agent: 2server" -c 10 -n 10 -t 10 http://vhost1/; sleep 1; done
while true; do ab -H "User-Agent: 3server" -c 10 -n 10 -t 10 http://vhost1/; sleep 1; done
while true; do ab -H "User-Agent: 4server" -c 10 -n 10 -t 10 http://vhost1/; sleep 1; done
while true; do ab -H "User-Agent: 5server" -c 10 -n 10 -t 10 http://vhost1/; sleep 1; done
Grafana のセットアップ
Grafana の公式 Web サイトにはダッシュボードがありません。
したがって、手作業で行います。
保存したダッシュボードを見つけることができます
内容を含むテーブル変数を作成する必要もあります。 nginx.access_log
.
Singlestat リクエストの合計数:
SELECT
1 as t,
count(*) as c
FROM $table
WHERE $timeFilter GROUP BY t
Singlestat の失敗したリクエスト:
SELECT
1 as t,
count(*) as c
FROM $table
WHERE $timeFilter AND status NOT IN (200, 201, 401) GROUP BY t
シングルスタットの失敗率:
SELECT
1 as t, (sum(status = 500 or status = 499)/sum(status = 200 or status = 201 or status = 401))*100 FROM $table
WHERE $timeFilter GROUP BY t
Singlestat の平均応答時間:
SELECT
1, avg(request_time) FROM $table
WHERE $timeFilter GROUP BY 1
シングルスタットの最大応答時間:
SELECT
1 as t, max(request_time) as c
FROM $table
WHERE $timeFilter GROUP BY t
カウントステータス:
$columns(status, count(*) as c) from $table
円グラフのようにデータを出力するには、プラグインをインストールし、grafana を再起動する必要があります。
grafana-cli plugins install grafana-piechart-panel
service grafana-server restart
パイトップ 5 ステータス:
SELECT
1, /* fake timestamp value */
status,
sum(status) AS Reqs
FROM $table
WHERE $timeFilter
GROUP BY status
ORDER BY Reqs desc
LIMIT 5
さらに、スクリーンショットなしでリクエストを出します。
http_user_agent をカウントします:
$columns(http_user_agent, count(*) c) FROM $table
良いレート/悪いレート:
$rate(countIf(status = 200) AS good, countIf(status != 200) AS bad) FROM $table
応答タイミング:
$rate(avg(request_time) as request_time) FROM $table
アップストリーム応答時間 (最初のアップストリーム応答時間):
$rate(avg(arrayElement(upstream_response_time,1)) as upstream_response_time) FROM $table
すべての仮想ホストのテーブル数ステータス:
$columns(status, count(*) as c) from $table
ダッシュボードの全体図
avg() と quantile() の比較
平均()
分位数()
結論:
コミュニティが nginx-log-collector の開発/テストと使用に参加してくれることを願っています。
そして、誰かが nginx-log-collector を実装すると、ディスク、RAM、CPU をどれだけ節約したかがわかります。
電報チャンネル:
ミリ秒:
ミリ秒が重要な方は、これに書くか投票してください。
出所: habr.com