Γεια σε όλους. Τον Μάιο κυκλοφορεί το OTUS
περιβάλλον
Θα χρειαστούμε τα εξής:
- Kubernetes
- Χειριστής Προμηθέας
διαμόρφωση blackbox εξαγωγέα
Διαμόρφωση Blackbox μέσω ConfigMap
για ρυθμίσεις http
ενότητα παρακολούθησης υπηρεσιών web.
apiVersion: v1
kind: ConfigMap
metadata:
name: prometheus-blackbox-exporter
labels:
app: prometheus-blackbox-exporter
data:
blackbox.yaml: |
modules:
http_2xx:
http:
no_follow_redirects: false
preferred_ip_protocol: ip4
valid_http_versions:
- HTTP/1.1
- HTTP/2
valid_status_codes: []
prober: http
timeout: 5s
Ενότητα http_2xx
χρησιμοποιείται για την επαλήθευση ότι η υπηρεσία web επιστρέφει έναν κωδικό κατάστασης HTTP 2xx. Η διαμόρφωση του εξαγωγέα blackbox περιγράφεται με περισσότερες λεπτομέρειες στο
Αναπτύξτε τον εξαγωγέα blackbox στο σύμπλεγμα Kubernetes
Περιγράφω Deployment
и Service
για ανάπτυξη στο Kubernetes.
---
kind: Service
apiVersion: v1
metadata:
name: prometheus-blackbox-exporter
labels:
app: prometheus-blackbox-exporter
spec:
type: ClusterIP
ports:
- name: http
port: 9115
protocol: TCP
selector:
app: prometheus-blackbox-exporter
---
apiVersion: apps/v1
kind: Deployment
metadata:
name: prometheus-blackbox-exporter
labels:
app: prometheus-blackbox-exporter
spec:
replicas: 1
selector:
matchLabels:
app: prometheus-blackbox-exporter
template:
metadata:
labels:
app: prometheus-blackbox-exporter
spec:
restartPolicy: Always
containers:
- name: blackbox-exporter
image: "prom/blackbox-exporter:v0.15.1"
imagePullPolicy: IfNotPresent
securityContext:
readOnlyRootFilesystem: true
runAsNonRoot: true
runAsUser: 1000
args:
- "--config.file=/config/blackbox.yaml"
resources:
{}
ports:
- containerPort: 9115
name: http
livenessProbe:
httpGet:
path: /health
port: http
readinessProbe:
httpGet:
path: /health
port: http
volumeMounts:
- mountPath: /config
name: config
- name: configmap-reload
image: "jimmidyson/configmap-reload:v0.2.2"
imagePullPolicy: "IfNotPresent"
securityContext:
runAsNonRoot: true
runAsUser: 65534
args:
- --volume-dir=/etc/config
- --webhook-url=http://localhost:9115/-/reload
resources:
{}
volumeMounts:
- mountPath: /etc/config
name: config
readOnly: true
volumes:
- name: config
configMap:
name: prometheus-blackbox-exporter
Ο εξαγωγέας Blackbox μπορεί να αναπτυχθεί με την ακόλουθη εντολή. Χώρος ονομάτων monitoring
αναφέρεται στον Χειριστή Προμηθέα.
kubectl --namespace=monitoring apply -f blackbox-exporter.yaml
Βεβαιωθείτε ότι όλες οι υπηρεσίες εκτελούνται χρησιμοποιώντας την ακόλουθη εντολή:
kubectl --namespace=monitoring get all --selector=app=prometheus-blackbox-exporter
Έλεγχος Blackbox
Μπορείτε να αποκτήσετε πρόσβαση στη διεπαφή Ιστού του Blackbox Exporter με port-forward
:
kubectl --namespace=monitoring port-forward svc/prometheus-blackbox-exporter 9115:9115
Συνδεθείτε στη διεπαφή ιστού του Blackbox Exporter μέσω ενός προγράμματος περιήγησης ιστού στη διεύθυνση
Αν πάτε στο
Μετρική τιμή probe_success
ίσο με 1 σημαίνει επιτυχής έλεγχος. Η τιμή 0 υποδηλώνει σφάλμα.
Στήνοντας τον Προμηθέα
Μετά την ανάπτυξη του εξαγωγέα BlackBox, εγκαταστήστε το Prometheus prometheus-additional.yaml
.
- job_name: 'kube-api-blackbox'
scrape_interval: 1w
metrics_path: /probe
params:
module: [http_2xx]
static_configs:
- targets:
- https://www.google.com
- http://www.example.com
- https://prometheus.io
relabel_configs:
- source_labels: [__address__]
target_label: __param_target
- source_labels: [__param_target]
target_label: instance
- target_label: __address__
replacement: prometheus-blackbox-exporter:9115 # The blackbox exporter.
Δημιουργούμε Secret
χρησιμοποιώντας την παρακάτω εντολή.
PROMETHEUS_ADD_CONFIG=$(cat prometheus-additional.yaml | base64)
cat << EOF | kubectl --namespace=monitoring apply -f -
apiVersion: v1
kind: Secret
metadata:
name: additional-scrape-configs
type: Opaque
data:
prometheus-additional.yaml: $PROMETHEUS_ADD_CONFIG
EOF
Προσδιορίζω additional-scrape-configs
για Prometheus Operator χρησιμοποιώντας additionalScrapeConfigs
.
kubectl --namespace=monitoring edit prometheuses k8s
...
spec:
additionalScrapeConfigs:
key: prometheus-additional.yaml
name: additional-scrape-configs
Πηγαίνουμε στο web interface του Prometheus, ελέγχουμε τις μετρήσεις και τους στόχους.
kubectl --namespace=monitoring port-forward svc/prometheus-k8s 9090:9090
Βλέπουμε τις μετρήσεις και τους στόχους του Blackbox.
Προσθήκη κανόνων για ειδοποιήσεις (ειδοποίηση)
Για να λαμβάνετε ειδοποιήσεις από τον εξαγωγέα Blackbox, ας προσθέσουμε κανόνες στον χειριστή Prometheus.
kubectl --namespace=monitoring edit prometheusrules prometheus-k8s-rules
...
- name: blackbox-exporter
rules:
- alert: ProbeFailed
expr: probe_success == 0
for: 5m
labels:
severity: error
annotations:
summary: "Probe failed (instance {{ $labels.instance }})"
description: "Probe failedn VALUE = {{ $value }}n LABELS: {{ $labels }}"
- alert: SlowProbe
expr: avg_over_time(probe_duration_seconds[1m]) > 1
for: 5m
labels:
severity: warning
annotations:
summary: "Slow probe (instance {{ $labels.instance }})"
description: "Blackbox probe took more than 1s to completen VALUE = {{ $value }}n LABELS: {{ $labels }}"
- alert: HttpStatusCode
expr: probe_http_status_code <= 199 OR probe_http_status_code >= 400
for: 5m
labels:
severity: error
annotations:
summary: "HTTP Status Code (instance {{ $labels.instance }})"
description: "HTTP status code is not 200-399n VALUE = {{ $value }}n LABELS: {{ $labels }}"
- alert: SslCertificateWillExpireSoon
expr: probe_ssl_earliest_cert_expiry - time() < 86400 * 30
for: 5m
labels:
severity: warning
annotations:
summary: "SSL certificate will expire soon (instance {{ $labels.instance }})"
description: "SSL certificate expires in 30 daysn VALUE = {{ $value }}n LABELS: {{ $labels }}"
- alert: SslCertificateHasExpired
expr: probe_ssl_earliest_cert_expiry - time() <= 0
for: 5m
labels:
severity: error
annotations:
summary: "SSL certificate has expired (instance {{ $labels.instance }})"
description: "SSL certificate has expired alreadyn VALUE = {{ $value }}n LABELS: {{ $labels }}"
- alert: HttpSlowRequests
expr: avg_over_time(probe_http_duration_seconds[1m]) > 1
for: 5m
labels:
severity: warning
annotations:
summary: "HTTP slow requests (instance {{ $labels.instance }})"
description: "HTTP request took more than 1sn VALUE = {{ $value }}n LABELS: {{ $labels }}"
- alert: SlowPing
expr: avg_over_time(probe_icmp_duration_seconds[1m]) > 1
for: 5m
labels:
severity: warning
annotations:
summary: "Slow ping (instance {{ $labels.instance }})"
description: "Blackbox ping took more than 1sn VALUE = {{ $value }}n LABELS: {{ $labels }}"
Στη διεπαφή ιστού Prometheus, μεταβείτε στο Status => Rules και βρείτε τους κανόνες ειδοποίησης για τον blackbox-exporter.
Διαμόρφωση ειδοποιήσεων λήξης πιστοποιητικού SSL διακομιστή API Kubernetes
Ας διαμορφώσουμε την παρακολούθηση λήξης πιστοποιητικού SSL του διακομιστή Kubernetes API. Θα στέλνει ειδοποιήσεις μία φορά την εβδομάδα.
Προσθήκη της λειτουργικής μονάδας εξαγωγής Blackbox για τον έλεγχο ταυτότητας διακομιστή Kubernetes API.
kubectl --namespace=monitoring edit configmap prometheus-blackbox-exporter
...
kube-api:
http:
method: GET
no_follow_redirects: false
preferred_ip_protocol: ip4
tls_config:
insecure_skip_verify: false
ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
valid_http_versions:
- HTTP/1.1
- HTTP/2
valid_status_codes: []
prober: http
timeout: 5s
Προσθήκη της διαμόρφωσης scrape Prometheus
- job_name: 'kube-api-blackbox'
metrics_path: /probe
params:
module: [kube-api]
static_configs:
- targets:
- https://kubernetes.default.svc/api
relabel_configs:
- source_labels: [__address__]
target_label: __param_target
- source_labels: [__param_target]
target_label: instance
- target_label: __address__
replacement: prometheus-blackbox-exporter:9115 # The blackbox exporter.
Εφαρμόστε το Prometheus Secret
PROMETHEUS_ADD_CONFIG=$(cat prometheus-additional.yaml | base64)
cat << EOF | kubectl --namespace=monitoring apply -f -
apiVersion: v1
kind: Secret
metadata:
name: additional-scrape-configs
type: Opaque
data:
prometheus-additional.yaml: $PROMETHEUS_ADD_CONFIG
EOF
Προσθήκη κανόνων ειδοποίησης
kubectl --namespace=monitoring edit prometheusrules prometheus-k8s-rules
...
- name: k8s-api-server-cert-expiry
rules:
- alert: K8sAPIServerSSLCertExpiringAfterThreeMonths
expr: probe_ssl_earliest_cert_expiry{job="kube-api-blackbox"} - time() < 86400 * 90
for: 1w
labels:
severity: warning
annotations:
summary: "Kubernetes API Server SSL certificate will expire after three months (instance {{ $labels.instance }})"
description: "Kubernetes API Server SSL certificate expires in 90 daysn VALUE = {{ $value }}n LABELS: {{ $labels }}"
χρήσιμοι σύνδεσμοι
Πηγή: www.habr.com