Rust dilində yazıldığı üçün analoqları ilə müqayisədə yüksək performans və aşağı RAM sərfiyyatı ilə seçilir. Bundan əlavə, düzgünlüklə əlaqəli funksiyalara, xüsusən də göndərilməmiş hadisələri diskdə buferə saxlamaq və faylları döndərmək imkanına çox diqqət yetirilir.
Memarlıq olaraq, Vector bir və ya daha çox mesaj qəbul edən bir hadisə yönləndiricisidir mənbələr, isteğe bağlı olaraq bu mesajlar üzərində tətbiq edilir çevrilmələr, və onları birinə və ya bir neçəsinə göndərir drenajlar.
Vector filebeat və logstash üçün əvəzdir, o, hər iki rolda çıxış edə bilər (logları qəbul etmək və göndərmək), onlar haqqında ətraflı məlumat Online.
Logstash-da zəncir giriş → filter → çıxış kimi qurulubsa, Vektorda belədir mənbələr → dəyişir → yuyulur
Nümunələr sənədlərdə tapıla bilər.
Bu təlimat yenidən işlənmiş təlimatdır Vyaçeslav Raxinski. Orijinal təlimatlarda geoip emal var. Daxili şəbəkədən geoip-i sınaqdan keçirərkən vektor xəta verdi.
Aug 05 06:25:31.889 DEBUG transform{name=nginx_parse_rename_fields type=rename_fields}: vector::transforms::rename_fields: Field did not exist field=«geoip.country_name» rate_limit_secs=30
Kiməsə geoip-i emal etmək lazımdırsa, orijinal təlimatlara baxın Vyaçeslav Raxinski.
Nginx (Access logs) → Vector (Client | Filebeat) → Vector (Server | Logstash) → ayrı-ayrılıqda Clickhouse-da və Elasticsearch-də ayrı-ayrılıqda konfiqurasiya edəcəyik. 4 server quraşdıracağıq. Baxmayaraq ki, onu 3 serverlə keçə bilərsiniz.
Sxem belə bir şeydir.
Bütün serverlərinizdə Selinux-u deaktiv edin
sed -i 's/^SELINUX=.*/SELINUX=disabled/g' /etc/selinux/config
reboot
Biz bütün serverlərdə HTTP server emulyatoru + utilitlər quraşdırırıq
ClickHouse SSE 4.2 təlimat dəstindən istifadə edir, ona görə də başqa cür göstərilməyibsə, istifadə olunan prosessorda onun dəstəyi əlavə sistem tələbinə çevrilir. Mövcud prosessorun SSE 4.2-ni dəstəklədiyini yoxlamaq üçün əmr budur:
Tək düyünlü rejim üçün Elasticsearch konfiqurasiya edilir 1 parça, 0 replika. Çox güman ki, çox sayda serverdən ibarət bir çoxluq olacaq və bunu etmək lazım deyil.
Gələcək indekslər üçün standart şablonu yeniləyin:
Cədvəllər yaratdıqdan sonra Vector-i işə sala bilərsiniz
systemctl enable vector
systemctl start vector
Vektor qeydlərinə aşağıdakı kimi baxmaq olar:
journalctl -f -u vector
Qeydlərdə belə qeydlər olmalıdır
INFO vector::topology::builder: Healthcheck: Passed.
INFO vector::topology::builder: Healthcheck: Passed.
Müştəridə (Veb server) - 1-ci server
Nginx ilə serverdə ipv6-nı deaktiv etməlisiniz, çünki clickhouse-dakı logs cədvəli sahədən istifadə edir. upstream_addr IPv4, çünki mən şəbəkə daxilində ipv6 istifadə etmirəm. Əgər ipv6 söndürülməyibsə, xətalar olacaq:
DB::Exception: Invalid IPv4 value.: (while read the value of key upstream_addr)
Əvvəlcə /etc/nginx/nginx.conf faylında Nginx-də log formatını konfiqurasiya etməliyik.
user nginx;
# you must set worker processes based on your CPU cores, nginx does not benefit from setting more than that
worker_processes auto; #some last versions calculate it automatically
# number of file descriptors used for nginx
# the limit for the maximum FDs on the server is usually set by the OS.
# if you don't set FD's then OS settings will be used which is by default 2000
worker_rlimit_nofile 100000;
error_log /var/log/nginx/error.log warn;
pid /var/run/nginx.pid;
# provides the configuration file context in which the directives that affect connection processing are specified.
events {
# determines how much clients will be served per worker
# max clients = worker_connections * worker_processes
# max clients is also limited by the number of socket connections available on the system (~64k)
worker_connections 4000;
# optimized to serve many clients with each thread, essential for linux -- for testing environment
use epoll;
# accept as many connections as possible, may flood worker connections if set too low -- for testing environment
multi_accept on;
}
http {
include /etc/nginx/mime.types;
default_type application/octet-stream;
log_format main '$remote_addr - $remote_user [$time_local] "$request" '
'$status $body_bytes_sent "$http_referer" '
'"$http_user_agent" "$http_x_forwarded_for"';
log_format vector escape=json
'{'
'"node_name":"nginx-vector",'
'"timestamp":"$time_iso8601",'
'"server_name":"$server_name",'
'"request_full": "$request",'
'"request_user_agent":"$http_user_agent",'
'"request_http_host":"$http_host",'
'"request_uri":"$request_uri",'
'"request_scheme": "$scheme",'
'"request_method":"$request_method",'
'"request_length":"$request_length",'
'"request_time": "$request_time",'
'"request_referrer":"$http_referer",'
'"response_status": "$status",'
'"response_body_bytes_sent":"$body_bytes_sent",'
'"response_content_type":"$sent_http_content_type",'
'"remote_addr": "$remote_addr",'
'"remote_port": "$remote_port",'
'"remote_user": "$remote_user",'
'"upstream_addr": "$upstream_addr",'
'"upstream_bytes_received": "$upstream_bytes_received",'
'"upstream_bytes_sent": "$upstream_bytes_sent",'
'"upstream_cache_status":"$upstream_cache_status",'
'"upstream_connect_time":"$upstream_connect_time",'
'"upstream_header_time":"$upstream_header_time",'
'"upstream_response_length":"$upstream_response_length",'
'"upstream_response_time":"$upstream_response_time",'
'"upstream_status": "$upstream_status",'
'"upstream_content_type":"$upstream_http_content_type"'
'}';
access_log /var/log/nginx/access.log main;
access_log /var/log/nginx/access.json.log vector; # Новый лог в формате json
sendfile on;
#tcp_nopush on;
keepalive_timeout 65;
#gzip on;
include /etc/nginx/conf.d/*.conf;
}
Cari konfiqurasiyanızı pozmamaq üçün Nginx sizə bir neçə access_log direktivinə malik olmağa imkan verir
access_log /var/log/nginx/access.log main; # Стандартный лог
access_log /var/log/nginx/access.json.log vector; # Новый лог в формате json
Yeni qeydlər üçün logrotasiya qaydası əlavə etməyi unutmayın (əgər log faylı .log ilə bitmirsə)
Və /etc/vector/vector.toml konfiqurasiyasında Filebeat əvəzini konfiqurasiya edin. IP ünvanı 172.26.10.108 log serverinin IP ünvanıdır (Vektor-Server)
data_dir = "/var/lib/vector"
[sources.nginx_file]
type = "file"
include = [ "/var/log/nginx/access.json.log" ]
start_at_beginning = false
fingerprinting.strategy = "device_and_inode"
[sinks.nginx_output_vector]
type = "vector"
inputs = [ "nginx_file" ]
address = "172.26.10.108:9876"
Vektor istifadəçisini tələb olunan qrupa əlavə etməyi unutmayın ki, o, log fayllarını oxuya bilsin. Məsələn, centos-da nginx adm qrup hüquqları ilə qeydlər yaradır.
usermod -a -G adm vector
Gəlin vektor xidmətinə başlayaq
systemctl enable vector
systemctl start vector
Vektor qeydlərinə aşağıdakı kimi baxmaq olar:
journalctl -f -u vector
Günlüklərdə belə bir giriş olmalıdır
INFO vector::topology::builder: Healthcheck: Passed.
Stress Testi
Test Apache benchmark istifadə edərək həyata keçirilir.
httpd-tools paketi bütün serverlərdə quraşdırılıb
Ekranda 4 fərqli serverdən Apache etalonundan istifadə edərək test etməyə başlayırıq. Əvvəlcə ekran terminalı multipleksorunu işə salırıq və sonra Apache etalonundan istifadə edərək test etməyə başlayırıq. Ekranla necə işləmək olar, burada tapa bilərsiniz məqalə.
1-ci serverdən
while true; do ab -H "User-Agent: 1server" -c 100 -n 10 -t 10 http://vhost1/; sleep 1; done
2-ci serverdən
while true; do ab -H "User-Agent: 2server" -c 100 -n 10 -t 10 http://vhost2/; sleep 1; done
3-ci serverdən
while true; do ab -H "User-Agent: 3server" -c 100 -n 10 -t 10 http://vhost3/; sleep 1; done
4-ci serverdən
while true; do ab -H "User-Agent: 4server" -c 100 -n 10 -t 10 http://vhost4/; sleep 1; done
select concat(database, '.', table) as table,
formatReadableSize(sum(bytes)) as size,
sum(rows) as rows,
max(modification_time) as latest_modification,
sum(bytes) as bytes_size,
any(engine) as engine,
formatReadableSize(sum(primary_key_bytes_in_memory)) as primary_keys_size
from system.parts
where active
group by database, table
order by bytes_size desc;
Gəlin, Clickhouse-da nə qədər log tutduğunu öyrənək.
Qeydlər cədvəlinin ölçüsü 857.19 MB-dır.
Elasticsearch-də indeksdəki eyni məlumatın ölçüsü 4,5 GB-dır.
Parametrlərdə vektorda məlumatları göstərməsəniz, Clickhouse Elasticsearch-dən 4500/857.19 = 5.24 dəfə az alır.
Vektorda sıxılma sahəsi standart olaraq istifadə olunur.