Duke qenë i shkruar në gjuhën Rust, karakterizohet nga performanca e lartë dhe konsumi i ulët i RAM-it në krahasim me analogët e tij. Për më tepër, shumë vëmendje i kushtohet funksioneve që lidhen me korrektësinë, në veçanti, aftësisë për të ruajtur ngjarjet e padërguara në një tampon në disk dhe për të rrotulluar skedarët.
Arkitekturisht, Vector është një ruter ngjarjesh që merr mesazhe nga një ose më shumë burimet, duke aplikuar opsionalisht mbi këto mesazhe transformimet, dhe dërgimi i tyre në një ose më shumë kullon.
Vektori është një zëvendësim për filebeat dhe logstash, ai mund të veprojë në të dy rolet (të marrë dhe të dërgojë regjistrat), më shumë detaje mbi to Online.
Ky udhëzim është një udhëzim i rishikuar nga Vyacheslav Rakhinsky. Udhëzimet origjinale përmbajnë përpunimin geoip. Gjatë testimit të geoip nga një rrjet i brendshëm, vektori dha një gabim.
Aug 05 06:25:31.889 DEBUG transform{name=nginx_parse_rename_fields type=rename_fields}: vector::transforms::rename_fields: Field did not exist field=«geoip.country_name» rate_limit_secs=30
Nëse dikush ka nevojë të përpunojë geoip, atëherë referojuni udhëzimeve origjinale nga Vyacheslav Rakhinsky.
Ne do tĂ« konfigurojmĂ« kombinimin e Nginx (Regjistrimet e hyrjes) â Vektori (Klienti | Filebeat) â Vektori (Serveri | Logstash) â veçmas nĂ« Clickhouse dhe veçmas nĂ« Elasticsearch. Do tĂ« instalojmĂ« 4 serverĂ«. Edhe pse mund ta anashkaloni me 3 serverĂ«.
Konfigurimi i Elasticsearch për modalitetin me një nyje 1 copë, 0 kopje. Me shumë mundësi do të keni një grup me një numër të madh serverësh dhe nuk keni nevojë ta bëni këtë.
Për indekset e ardhshme, përditësoni shabllonin e paracaktuar:
Pas krijimit të tabelave, mund të ekzekutoni Vector
systemctl enable vector
systemctl start vector
Regjistrat e vektorit mund të shihen si kjo:
journalctl -f -u vector
Duhet të ketë shënime të tilla në regjistrat
INFO vector::topology::builder: Healthcheck: Passed.
INFO vector::topology::builder: Healthcheck: Passed.
Në klient (server në internet) - serveri i parë
Në serverin me nginx, duhet të çaktivizoni ipv6, pasi tabela e regjistrave në clickhouse përdor fushën upstream_addr IPv4, pasi nuk e përdor ipv6 brenda rrjetit. Nëse ipv6 nuk fiket, do të ketë gabime:
DB::Exception: Invalid IPv4 value.: (while read the value of key upstream_addr)
Së pari, duhet të konfigurojmë formatin e regjistrit në Nginx në skedarin /etc/nginx/nginx.conf
user nginx;
# you must set worker processes based on your CPU cores, nginx does not benefit from setting more than that
worker_processes auto; #some last versions calculate it automatically
# number of file descriptors used for nginx
# the limit for the maximum FDs on the server is usually set by the OS.
# if you don't set FD's then OS settings will be used which is by default 2000
worker_rlimit_nofile 100000;
error_log /var/log/nginx/error.log warn;
pid /var/run/nginx.pid;
# provides the configuration file context in which the directives that affect connection processing are specified.
events {
# determines how much clients will be served per worker
# max clients = worker_connections * worker_processes
# max clients is also limited by the number of socket connections available on the system (~64k)
worker_connections 4000;
# optimized to serve many clients with each thread, essential for linux -- for testing environment
use epoll;
# accept as many connections as possible, may flood worker connections if set too low -- for testing environment
multi_accept on;
}
http {
include /etc/nginx/mime.types;
default_type application/octet-stream;
log_format main '$remote_addr - $remote_user [$time_local] "$request" '
'$status $body_bytes_sent "$http_referer" '
'"$http_user_agent" "$http_x_forwarded_for"';
log_format vector escape=json
'{'
'"node_name":"nginx-vector",'
'"timestamp":"$time_iso8601",'
'"server_name":"$server_name",'
'"request_full": "$request",'
'"request_user_agent":"$http_user_agent",'
'"request_http_host":"$http_host",'
'"request_uri":"$request_uri",'
'"request_scheme": "$scheme",'
'"request_method":"$request_method",'
'"request_length":"$request_length",'
'"request_time": "$request_time",'
'"request_referrer":"$http_referer",'
'"response_status": "$status",'
'"response_body_bytes_sent":"$body_bytes_sent",'
'"response_content_type":"$sent_http_content_type",'
'"remote_addr": "$remote_addr",'
'"remote_port": "$remote_port",'
'"remote_user": "$remote_user",'
'"upstream_addr": "$upstream_addr",'
'"upstream_bytes_received": "$upstream_bytes_received",'
'"upstream_bytes_sent": "$upstream_bytes_sent",'
'"upstream_cache_status":"$upstream_cache_status",'
'"upstream_connect_time":"$upstream_connect_time",'
'"upstream_header_time":"$upstream_header_time",'
'"upstream_response_length":"$upstream_response_length",'
'"upstream_response_time":"$upstream_response_time",'
'"upstream_status": "$upstream_status",'
'"upstream_content_type":"$upstream_http_content_type"'
'}';
access_log /var/log/nginx/access.log main;
access_log /var/log/nginx/access.json.log vector; # ĐĐŸĐČŃĐč Đ»ĐŸĐł ĐČ ŃĐŸŃĐŒĐ°ŃĐ” json
sendfile on;
#tcp_nopush on;
keepalive_timeout 65;
#gzip on;
include /etc/nginx/conf.d/*.conf;
}
Për të mos prishur konfigurimin tuaj aktual, Nginx ju lejon të keni disa direktiva access_log
Dhe konfiguroni zëvendësimin e Filebeat në konfigurimin /etc/vector/vector.toml. Adresa IP 172.26.10.108 është adresa IP e serverit të regjistrit (Vector-Server)
data_dir = "/var/lib/vector"
[sources.nginx_file]
type = "file"
include = [ "/var/log/nginx/access.json.log" ]
start_at_beginning = false
fingerprinting.strategy = "device_and_inode"
[sinks.nginx_output_vector]
type = "vector"
inputs = [ "nginx_file" ]
address = "172.26.10.108:9876"
Mos harroni të shtoni përdoruesin vektor në grupin e kërkuar në mënyrë që ai të mund të lexojë skedarët e regjistrit. Për shembull, nginx në centos krijon regjistra me të drejta të grupit adm.
usermod -a -G adm vector
Le të fillojmë shërbimin e vektorit
systemctl enable vector
systemctl start vector
Regjistrat e vektorit mund të shihen si kjo:
journalctl -f -u vector
Duhet të ketë një hyrje si kjo në regjistra
INFO vector::topology::builder: Healthcheck: Passed.
Testimi i stresit
Ne kryejmë testimin duke përdorur standardin Apache.
Paketa httpd-tools u instalua në të gjithë serverët
Ne fillojmë të testojmë duke përdorur standardin Apache nga 4 serverë të ndryshëm në ekran. Së pari, ne lëshojmë multiplekserin e terminalit të ekranit dhe më pas fillojmë testimin duke përdorur standardin Apache. Si të punoni me ekranin që mund ta gjeni artikull.
Nga serveri i parë
while true; do ab -H "User-Agent: 1server" -c 100 -n 10 -t 10 http://vhost1/; sleep 1; done
Nga serveri i parë
while true; do ab -H "User-Agent: 2server" -c 100 -n 10 -t 10 http://vhost2/; sleep 1; done
Nga serveri i parë
while true; do ab -H "User-Agent: 3server" -c 100 -n 10 -t 10 http://vhost3/; sleep 1; done
Nga serveri i parë
while true; do ab -H "User-Agent: 4server" -c 100 -n 10 -t 10 http://vhost4/; sleep 1; done
select concat(database, '.', table) as table,
formatReadableSize(sum(bytes)) as size,
sum(rows) as rows,
max(modification_time) as latest_modification,
sum(bytes) as bytes_size,
any(engine) as engine,
formatReadableSize(sum(primary_key_bytes_in_memory)) as primary_keys_size
from system.parts
where active
group by database, table
order by bytes_size desc;
Le të zbulojmë se sa shkrime morën në Clickhouse.
Madhësia e tabelës së regjistrave është 857.19 MB.