ರಸ್ಟ್ ಭಾಷೆಯಲ್ಲಿ ಬರೆಯಲ್ಪಟ್ಟಿರುವುದರಿಂದ, ಅದರ ಅನಲಾಗ್ಗಳಿಗೆ ಹೋಲಿಸಿದರೆ ಇದು ಹೆಚ್ಚಿನ ಕಾರ್ಯಕ್ಷಮತೆ ಮತ್ತು ಕಡಿಮೆ RAM ಬಳಕೆಯಿಂದ ನಿರೂಪಿಸಲ್ಪಟ್ಟಿದೆ. ಹೆಚ್ಚುವರಿಯಾಗಿ, ಸರಿಯಾದತೆಗೆ ಸಂಬಂಧಿಸಿದ ಕಾರ್ಯಗಳಿಗೆ ಹೆಚ್ಚಿನ ಗಮನವನ್ನು ನೀಡಲಾಗುತ್ತದೆ, ನಿರ್ದಿಷ್ಟವಾಗಿ, ಕಳುಹಿಸದ ಈವೆಂಟ್ಗಳನ್ನು ಡಿಸ್ಕ್ನಲ್ಲಿ ಬಫರ್ಗೆ ಉಳಿಸುವ ಮತ್ತು ಫೈಲ್ಗಳನ್ನು ತಿರುಗಿಸುವ ಸಾಮರ್ಥ್ಯ.
ವಾಸ್ತುಶಿಲ್ಪದ ಪ್ರಕಾರ, ವೆಕ್ಟರ್ ಒಂದು ಅಥವಾ ಹೆಚ್ಚಿನ ಸಂದೇಶಗಳನ್ನು ಸ್ವೀಕರಿಸುವ ಈವೆಂಟ್ ರೂಟರ್ ಆಗಿದೆ ಮೂಲಗಳು, ಐಚ್ಛಿಕವಾಗಿ ಈ ಸಂದೇಶಗಳ ಮೇಲೆ ಅನ್ವಯಿಸುವುದು ರೂಪಾಂತರಗಳು, ಮತ್ತು ಅವುಗಳನ್ನು ಒಂದು ಅಥವಾ ಹೆಚ್ಚಿನವರಿಗೆ ಕಳುಹಿಸುವುದು ಬರಿದಾಗುತ್ತದೆ.
ವೆಕ್ಟರ್ ಫೈಲ್ಬೀಟ್ ಮತ್ತು ಲಾಗ್ಸ್ಟ್ಯಾಶ್ಗೆ ಬದಲಿಯಾಗಿದೆ, ಇದು ಎರಡೂ ಪಾತ್ರಗಳಲ್ಲಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ (ಲಾಗ್ಗಳನ್ನು ಸ್ವೀಕರಿಸಿ ಮತ್ತು ಕಳುಹಿಸಿ), ಅವುಗಳ ಕುರಿತು ಹೆಚ್ಚಿನ ವಿವರಗಳು ಸೈಟ್.
ಈ ಸೂಚನೆಯು ಪರಿಷ್ಕೃತ ಸೂಚನೆಯಾಗಿದೆ ವ್ಯಾಚೆಸ್ಲಾವ್ ರಾಖಿನ್ಸ್ಕಿ. ಮೂಲ ಸೂಚನೆಗಳು ಜಿಯೋಪ್ ಸಂಸ್ಕರಣೆಯನ್ನು ಒಳಗೊಂಡಿರುತ್ತವೆ. ಆಂತರಿಕ ನೆಟ್ವರ್ಕ್ನಿಂದ ಜಿಯೋಪ್ ಅನ್ನು ಪರೀಕ್ಷಿಸುವಾಗ, ವೆಕ್ಟರ್ ದೋಷವನ್ನು ನೀಡಿತು.
Aug 05 06:25:31.889 DEBUG transform{name=nginx_parse_rename_fields type=rename_fields}: vector::transforms::rename_fields: Field did not exist field=«geoip.country_name» rate_limit_secs=30
ನಾವು Nginx (ಪ್ರವೇಶ ಲಾಗ್ಗಳು) → ವೆಕ್ಟರ್ (ಕ್ಲೈಂಟ್ | ಫೈಲ್ಬೀಟ್) → ವೆಕ್ಟರ್ (ಸರ್ವರ್ | ಲಾಗ್ಸ್ಟ್ಯಾಶ್) → ಸಂಯೋಜನೆಯನ್ನು ಪ್ರತ್ಯೇಕವಾಗಿ ಕ್ಲಿಕ್ಹೌಸ್ನಲ್ಲಿ ಮತ್ತು ಪ್ರತ್ಯೇಕವಾಗಿ ಎಲಾಸ್ಟಿಕ್ಸರ್ಚ್ನಲ್ಲಿ ಕಾನ್ಫಿಗರ್ ಮಾಡುತ್ತೇವೆ. ನಾವು 4 ಸರ್ವರ್ಗಳನ್ನು ಸ್ಥಾಪಿಸುತ್ತೇವೆ. ನೀವು ಅದನ್ನು 3 ಸರ್ವರ್ಗಳೊಂದಿಗೆ ಬೈಪಾಸ್ ಮಾಡಬಹುದು.
ಯೋಜನೆಯು ಈ ರೀತಿಯದ್ದಾಗಿದೆ.
ನಿಮ್ಮ ಎಲ್ಲಾ ಸರ್ವರ್ಗಳಲ್ಲಿ Selinux ಅನ್ನು ನಿಷ್ಕ್ರಿಯಗೊಳಿಸಿ
sed -i 's/^SELINUX=.*/SELINUX=disabled/g' /etc/selinux/config
reboot
ನಾವು ಎಲ್ಲಾ ಸರ್ವರ್ಗಳಲ್ಲಿ HTTP ಸರ್ವರ್ ಎಮ್ಯುಲೇಟರ್ + ಉಪಯುಕ್ತತೆಗಳನ್ನು ಸ್ಥಾಪಿಸುತ್ತೇವೆ
ಕ್ಲಿಕ್ಹೌಸ್ SSE 4.2 ಸೂಚನಾ ಸೆಟ್ ಅನ್ನು ಬಳಸುತ್ತದೆ, ಆದ್ದರಿಂದ ನಿರ್ದಿಷ್ಟಪಡಿಸದ ಹೊರತು, ಬಳಸಿದ ಪ್ರೊಸೆಸರ್ನಲ್ಲಿ ಅದಕ್ಕೆ ಬೆಂಬಲವು ಹೆಚ್ಚುವರಿ ಸಿಸ್ಟಮ್ ಅಗತ್ಯವಾಗುತ್ತದೆ. ಪ್ರಸ್ತುತ ಪ್ರೊಸೆಸರ್ SSE 4.2 ಅನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆಯೇ ಎಂದು ಪರಿಶೀಲಿಸಲು ಆಜ್ಞೆ ಇಲ್ಲಿದೆ:
ಏಕ-ನೋಡ್ ಮೋಡ್ 1 ಚೂರು, 0 ಪ್ರತಿಕೃತಿಗಾಗಿ ಸ್ಥಿತಿಸ್ಥಾಪಕ ಹುಡುಕಾಟವನ್ನು ಕಾನ್ಫಿಗರ್ ಮಾಡಲಾಗುತ್ತಿದೆ. ಹೆಚ್ಚಾಗಿ ನೀವು ಹೆಚ್ಚಿನ ಸಂಖ್ಯೆಯ ಸರ್ವರ್ಗಳ ಕ್ಲಸ್ಟರ್ ಅನ್ನು ಹೊಂದಿರುತ್ತೀರಿ ಮತ್ತು ನೀವು ಇದನ್ನು ಮಾಡಬೇಕಾಗಿಲ್ಲ.
ಭವಿಷ್ಯದ ಸೂಚಿಕೆಗಳಿಗಾಗಿ, ಡೀಫಾಲ್ಟ್ ಟೆಂಪ್ಲೇಟ್ ಅನ್ನು ನವೀಕರಿಸಿ:
ಕೋಷ್ಟಕಗಳನ್ನು ರಚಿಸಿದ ನಂತರ, ನೀವು ವೆಕ್ಟರ್ ಅನ್ನು ಚಲಾಯಿಸಬಹುದು
systemctl enable vector
systemctl start vector
ವೆಕ್ಟರ್ ಲಾಗ್ಗಳನ್ನು ಈ ರೀತಿ ವೀಕ್ಷಿಸಬಹುದು:
journalctl -f -u vector
ಲಾಗ್ಗಳಲ್ಲಿ ಈ ರೀತಿಯ ನಮೂದುಗಳು ಇರಬೇಕು
INFO vector::topology::builder: Healthcheck: Passed.
INFO vector::topology::builder: Healthcheck: Passed.
ಕ್ಲೈಂಟ್ನಲ್ಲಿ (ವೆಬ್ ಸರ್ವರ್) - 1 ನೇ ಸರ್ವರ್
nginx ನೊಂದಿಗೆ ಸರ್ವರ್ನಲ್ಲಿ, ನೀವು ipv6 ಅನ್ನು ನಿಷ್ಕ್ರಿಯಗೊಳಿಸಬೇಕಾಗಿದೆ, ಏಕೆಂದರೆ ಕ್ಲಿಕ್ಹೌಸ್ನಲ್ಲಿನ ಲಾಗ್ಗಳ ಕೋಷ್ಟಕವು ಕ್ಷೇತ್ರವನ್ನು ಬಳಸುತ್ತದೆ upstream_addr IPv4, ಏಕೆಂದರೆ ನಾನು ನೆಟ್ವರ್ಕ್ನಲ್ಲಿ ipv6 ಅನ್ನು ಬಳಸುವುದಿಲ್ಲ. ipv6 ಅನ್ನು ಆಫ್ ಮಾಡದಿದ್ದರೆ, ದೋಷಗಳು ಕಂಡುಬರುತ್ತವೆ:
DB::Exception: Invalid IPv4 value.: (while read the value of key upstream_addr)
ಬಹುಶಃ ಓದುಗರು, ipv6 ಬೆಂಬಲವನ್ನು ಸೇರಿಸಿ.
/etc/sysctl.d/98-disable-ipv6.conf ಫೈಲ್ ಅನ್ನು ರಚಿಸಿ
ಮೊದಲಿಗೆ, ನಾವು ಲಾಗ್ ಫಾರ್ಮ್ಯಾಟ್ ಅನ್ನು Nginx ನಲ್ಲಿ /etc/nginx/nginx.conf ಫೈಲ್ನಲ್ಲಿ ಕಾನ್ಫಿಗರ್ ಮಾಡಬೇಕಾಗುತ್ತದೆ
user nginx;
# you must set worker processes based on your CPU cores, nginx does not benefit from setting more than that
worker_processes auto; #some last versions calculate it automatically
# number of file descriptors used for nginx
# the limit for the maximum FDs on the server is usually set by the OS.
# if you don't set FD's then OS settings will be used which is by default 2000
worker_rlimit_nofile 100000;
error_log /var/log/nginx/error.log warn;
pid /var/run/nginx.pid;
# provides the configuration file context in which the directives that affect connection processing are specified.
events {
# determines how much clients will be served per worker
# max clients = worker_connections * worker_processes
# max clients is also limited by the number of socket connections available on the system (~64k)
worker_connections 4000;
# optimized to serve many clients with each thread, essential for linux -- for testing environment
use epoll;
# accept as many connections as possible, may flood worker connections if set too low -- for testing environment
multi_accept on;
}
http {
include /etc/nginx/mime.types;
default_type application/octet-stream;
log_format main '$remote_addr - $remote_user [$time_local] "$request" '
'$status $body_bytes_sent "$http_referer" '
'"$http_user_agent" "$http_x_forwarded_for"';
log_format vector escape=json
'{'
'"node_name":"nginx-vector",'
'"timestamp":"$time_iso8601",'
'"server_name":"$server_name",'
'"request_full": "$request",'
'"request_user_agent":"$http_user_agent",'
'"request_http_host":"$http_host",'
'"request_uri":"$request_uri",'
'"request_scheme": "$scheme",'
'"request_method":"$request_method",'
'"request_length":"$request_length",'
'"request_time": "$request_time",'
'"request_referrer":"$http_referer",'
'"response_status": "$status",'
'"response_body_bytes_sent":"$body_bytes_sent",'
'"response_content_type":"$sent_http_content_type",'
'"remote_addr": "$remote_addr",'
'"remote_port": "$remote_port",'
'"remote_user": "$remote_user",'
'"upstream_addr": "$upstream_addr",'
'"upstream_bytes_received": "$upstream_bytes_received",'
'"upstream_bytes_sent": "$upstream_bytes_sent",'
'"upstream_cache_status":"$upstream_cache_status",'
'"upstream_connect_time":"$upstream_connect_time",'
'"upstream_header_time":"$upstream_header_time",'
'"upstream_response_length":"$upstream_response_length",'
'"upstream_response_time":"$upstream_response_time",'
'"upstream_status": "$upstream_status",'
'"upstream_content_type":"$upstream_http_content_type"'
'}';
access_log /var/log/nginx/access.log main;
access_log /var/log/nginx/access.json.log vector; # Новый лог в формате json
sendfile on;
#tcp_nopush on;
keepalive_timeout 65;
#gzip on;
include /etc/nginx/conf.d/*.conf;
}
ನಿಮ್ಮ ಪ್ರಸ್ತುತ ಕಾನ್ಫಿಗರೇಶನ್ ಅನ್ನು ಮುರಿಯದಿರಲು, Nginx ನಿಮಗೆ ಹಲವಾರು access_log ನಿರ್ದೇಶನಗಳನ್ನು ಹೊಂದಲು ಅನುಮತಿಸುತ್ತದೆ
access_log /var/log/nginx/access.log main; # Стандартный лог
access_log /var/log/nginx/access.json.log vector; # Новый лог в формате json
ಹೊಸ ಲಾಗ್ಗಳಿಗಾಗಿ ಲಾಗ್ರೊಟೇಟ್ ಮಾಡಲು ನಿಯಮವನ್ನು ಸೇರಿಸಲು ಮರೆಯಬೇಡಿ (ಲಾಗ್ ಫೈಲ್ .log ನೊಂದಿಗೆ ಕೊನೆಗೊಳ್ಳದಿದ್ದರೆ)
/etc/nginx/conf.d/ ನಿಂದ default.conf ತೆಗೆದುಹಾಕಿ
rm -f /etc/nginx/conf.d/default.conf
ವರ್ಚುವಲ್ ಹೋಸ್ಟ್ /etc/nginx/conf.d/vhost1.conf ಸೇರಿಸಿ
ಮತ್ತು ಫೈಲ್ಬೀಟ್ ಬದಲಿಯನ್ನು /etc/vector/vector.toml ಸಂರಚನೆಯಲ್ಲಿ ಕಾನ್ಫಿಗರ್ ಮಾಡಿ. IP ವಿಳಾಸ 172.26.10.108 ಲಾಗ್ ಸರ್ವರ್ನ IP ವಿಳಾಸವಾಗಿದೆ (ವೆಕ್ಟರ್-ಸರ್ವರ್)
data_dir = "/var/lib/vector"
[sources.nginx_file]
type = "file"
include = [ "/var/log/nginx/access.json.log" ]
start_at_beginning = false
fingerprinting.strategy = "device_and_inode"
[sinks.nginx_output_vector]
type = "vector"
inputs = [ "nginx_file" ]
address = "172.26.10.108:9876"
ವೆಕ್ಟರ್ ಬಳಕೆದಾರರನ್ನು ಅಗತ್ಯವಿರುವ ಗುಂಪಿಗೆ ಸೇರಿಸಲು ಮರೆಯಬೇಡಿ ಇದರಿಂದ ಅವರು ಲಾಗ್ ಫೈಲ್ಗಳನ್ನು ಓದಬಹುದು. ಉದಾಹರಣೆಗೆ, centos ನಲ್ಲಿ nginx adm ಗುಂಪಿನ ಹಕ್ಕುಗಳೊಂದಿಗೆ ಲಾಗ್ಗಳನ್ನು ರಚಿಸುತ್ತದೆ.
usermod -a -G adm vector
ವೆಕ್ಟರ್ ಸೇವೆಯನ್ನು ಪ್ರಾರಂಭಿಸೋಣ
systemctl enable vector
systemctl start vector
ವೆಕ್ಟರ್ ಲಾಗ್ಗಳನ್ನು ಈ ರೀತಿ ವೀಕ್ಷಿಸಬಹುದು:
journalctl -f -u vector
ಲಾಗ್ಗಳಲ್ಲಿ ಈ ರೀತಿಯ ನಮೂದು ಇರಬೇಕು
INFO vector::topology::builder: Healthcheck: Passed.
ಒತ್ತಡ ಪರೀಕ್ಷೆ
ನಾವು ಅಪಾಚೆ ಮಾನದಂಡವನ್ನು ಬಳಸಿಕೊಂಡು ಪರೀಕ್ಷೆಯನ್ನು ನಡೆಸುತ್ತೇವೆ.
ಎಲ್ಲಾ ಸರ್ವರ್ಗಳಲ್ಲಿ httpd-tools ಪ್ಯಾಕೇಜ್ ಅನ್ನು ಸ್ಥಾಪಿಸಲಾಗಿದೆ
ನಾವು ಪರದೆಯ 4 ವಿಭಿನ್ನ ಸರ್ವರ್ಗಳಿಂದ ಅಪಾಚೆ ಮಾನದಂಡವನ್ನು ಬಳಸಿಕೊಂಡು ಪರೀಕ್ಷಿಸಲು ಪ್ರಾರಂಭಿಸುತ್ತೇವೆ. ಮೊದಲಿಗೆ, ನಾವು ಸ್ಕ್ರೀನ್ ಟರ್ಮಿನಲ್ ಮಲ್ಟಿಪ್ಲೆಕ್ಸರ್ ಅನ್ನು ಪ್ರಾರಂಭಿಸುತ್ತೇವೆ ಮತ್ತು ನಂತರ ನಾವು ಅಪಾಚೆ ಮಾನದಂಡವನ್ನು ಬಳಸಿಕೊಂಡು ಪರೀಕ್ಷೆಯನ್ನು ಪ್ರಾರಂಭಿಸುತ್ತೇವೆ. ನೀವು ಹುಡುಕಬಹುದಾದ ಪರದೆಯೊಂದಿಗೆ ಹೇಗೆ ಕೆಲಸ ಮಾಡುವುದು ಲೇಖನ.
1 ನೇ ಸರ್ವರ್ನಿಂದ
while true; do ab -H "User-Agent: 1server" -c 100 -n 10 -t 10 http://vhost1/; sleep 1; done
2 ನೇ ಸರ್ವರ್ನಿಂದ
while true; do ab -H "User-Agent: 2server" -c 100 -n 10 -t 10 http://vhost2/; sleep 1; done
3 ನೇ ಸರ್ವರ್ನಿಂದ
while true; do ab -H "User-Agent: 3server" -c 100 -n 10 -t 10 http://vhost3/; sleep 1; done
4 ನೇ ಸರ್ವರ್ನಿಂದ
while true; do ab -H "User-Agent: 4server" -c 100 -n 10 -t 10 http://vhost4/; sleep 1; done
ಕ್ಲಿಕ್ಹೌಸ್ನಲ್ಲಿ ಕೋಷ್ಟಕಗಳ ಗಾತ್ರವನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ
select concat(database, '.', table) as table,
formatReadableSize(sum(bytes)) as size,
sum(rows) as rows,
max(modification_time) as latest_modification,
sum(bytes) as bytes_size,
any(engine) as engine,
formatReadableSize(sum(primary_key_bytes_in_memory)) as primary_keys_size
from system.parts
where active
group by database, table
order by bytes_size desc;
ಕ್ಲಿಕ್ಹೌಸ್ನಲ್ಲಿ ಎಷ್ಟು ಲಾಗ್ಗಳನ್ನು ತೆಗೆದುಕೊಂಡಿದೆ ಎಂಬುದನ್ನು ಕಂಡುಹಿಡಿಯೋಣ.
ಲಾಗ್ಗಳ ಟೇಬಲ್ ಗಾತ್ರವು 857.19 MB ಆಗಿದೆ.
Elasticsearch ನಲ್ಲಿನ ಸೂಚ್ಯಂಕದಲ್ಲಿನ ಅದೇ ಡೇಟಾದ ಗಾತ್ರವು 4,5GB ಆಗಿದೆ.
ಪ್ಯಾರಾಮೀಟರ್ಗಳಲ್ಲಿ ವೆಕ್ಟರ್ನಲ್ಲಿ ಡೇಟಾವನ್ನು ನೀವು ನಿರ್ದಿಷ್ಟಪಡಿಸದಿದ್ದರೆ, ಕ್ಲಿಕ್ಹೌಸ್ ಎಲಾಸ್ಟಿಕ್ಸರ್ಚ್ಗಿಂತ 4500/857.19 = 5.24 ಪಟ್ಟು ಕಡಿಮೆ ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ.
ವೆಕ್ಟರ್ನಲ್ಲಿ, ಕಂಪ್ರೆಷನ್ ಕ್ಷೇತ್ರವನ್ನು ಪೂರ್ವನಿಯೋಜಿತವಾಗಿ ಬಳಸಲಾಗುತ್ತದೆ.