рдирдорд╕реНрддреЗ рд╕рдмреИред рдореЗ рдорд╛ OTUS рд╕реБрд░реБ рд╣реБрдиреНрдЫ
рд╡рд╛рддрд╛рд╡рд░рдг
рд╣рд╛рдореАрд▓рд╛рдИ рдирд┐рдореНрди рдЖрд╡рд╢реНрдпрдХ рд╣реБрдиреЗрдЫ:
- рдХреБрдмрд░реНрдиреЗрдЯреНрд╕
- рдкреНрд░реЛрдореЗрдерд┐рдпрд╕ рдЕрдкрд░реЗрдЯрд░
рдирд┐рд░реНрдпрд╛рддрдХ рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдХрдиреНрдлрд┐рдЧрд░реЗрд╕рди
рдорд╛рд░реНрдлрдд рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдХрдиреНрдлрд┐рдЧрд░ рдЧрд░реНрджреИ ConfigMap
рд╕реЗрдЯрд┐рдЩрд╣рд░реВрдХреЛ рд▓рд╛рдЧрд┐ http
рд╡реЗрдм рд╕реЗрд╡рд╛ рдирд┐рдЧрд░рд╛рдиреА рдореЛрдбреНрдпреБрд▓ред
apiVersion: v1
kind: ConfigMap
metadata:
name: prometheus-blackbox-exporter
labels:
app: prometheus-blackbox-exporter
data:
blackbox.yaml: |
modules:
http_2xx:
http:
no_follow_redirects: false
preferred_ip_protocol: ip4
valid_http_versions:
- HTTP/1.1
- HTTP/2
valid_status_codes: []
prober: http
timeout: 5s
рдореЛрдбреНрдпреБрд▓ http_2xx
рд╡реЗрдм рд╕реЗрд╡рд╛рд▓реЗ HTTP 2xx рд╕реНрдерд┐рддрд┐ рдХреЛрдб рдлрд░реНрдХрд╛рдЙрдБрдЫ рднрдиреЗрд░ рдЬрд╛рдБрдЪ рдЧрд░реНрди рдкреНрд░рдпреЛрдЧ рдЧрд░рд┐рдиреНрдЫред рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рдХрдиреНрдлрд┐рдЧрд░реЗрд╕рдирдорд╛ рдердк рд╡рд┐рд╡рд░рдгрдорд╛ рд╡рд░реНрдгрди рдЧрд░рд┐рдПрдХреЛ рдЫ
Kubernetes рдХреНрд▓рд╕реНрдЯрд░рдорд╛ рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рддреИрдирд╛рде рдЧрд░реНрджреИ
рд╡рд░реНрдгрди рдЧрд░реНрдиреБрд╣реЛрд╕реН Deployment
╨╕ Service
Kubernetes рдорд╛ рддреИрдирд╛рддреА рдХреЛ рд▓рд╛рдЧреАред
---
kind: Service
apiVersion: v1
metadata:
name: prometheus-blackbox-exporter
labels:
app: prometheus-blackbox-exporter
spec:
type: ClusterIP
ports:
- name: http
port: 9115
protocol: TCP
selector:
app: prometheus-blackbox-exporter
---
apiVersion: apps/v1
kind: Deployment
metadata:
name: prometheus-blackbox-exporter
labels:
app: prometheus-blackbox-exporter
spec:
replicas: 1
selector:
matchLabels:
app: prometheus-blackbox-exporter
template:
metadata:
labels:
app: prometheus-blackbox-exporter
spec:
restartPolicy: Always
containers:
- name: blackbox-exporter
image: "prom/blackbox-exporter:v0.15.1"
imagePullPolicy: IfNotPresent
securityContext:
readOnlyRootFilesystem: true
runAsNonRoot: true
runAsUser: 1000
args:
- "--config.file=/config/blackbox.yaml"
resources:
{}
ports:
- containerPort: 9115
name: http
livenessProbe:
httpGet:
path: /health
port: http
readinessProbe:
httpGet:
path: /health
port: http
volumeMounts:
- mountPath: /config
name: config
- name: configmap-reload
image: "jimmidyson/configmap-reload:v0.2.2"
imagePullPolicy: "IfNotPresent"
securityContext:
runAsNonRoot: true
runAsUser: 65534
args:
- --volume-dir=/etc/config
- --webhook-url=http://localhost:9115/-/reload
resources:
{}
volumeMounts:
- mountPath: /etc/config
name: config
readOnly: true
volumes:
- name: config
configMap:
name: prometheus-blackbox-exporter
рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рдирд┐рдореНрди рдЖрджреЗрд╢ рдкреНрд░рдпреЛрдЧ рдЧрд░реЗрд░ рддреИрдирд╛рдд рдЧрд░реНрди рд╕рдХрд┐рдиреНрдЫред рдиреЗрдорд╕реНрдкреЗрд╕ monitoring
рдкреНрд░реЛрдорд┐рдерд┐рдпрд╕ рдЕрдкрд░реЗрдЯрд░рд▓рд╛рдИ рдмреБрдЭрд╛рдЙрдБрдЫред
kubectl --namespace=monitoring apply -f blackbox-exporter.yaml
рдирд┐рд╢реНрдЪрд┐рдд рдЧрд░реНрдиреБрд╣реЛрд╕реН рдХрд┐ рд╕рдмреИ рд╕реЗрд╡рд╛рд╣рд░реВ рдирд┐рдореНрди рдЖрджреЗрд╢ рдкреНрд░рдпреЛрдЧ рдЧрд░реЗрд░ рдЪрд▓рд┐рд░рд╣реЗрдХрд╛ рдЫрдиреН:
kubectl --namespace=monitoring get all --selector=app=prometheus-blackbox-exporter
рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдЬрд╛рдБрдЪ
рддрдкрд╛рдИрдВ рдкреНрд░рдпреЛрдЧ рдЧрд░реЗрд░ рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рд╡реЗрдм рдЗрдиреНрдЯрд░рдлреЗрд╕ рдкрд╣реБрдБрдЪ рдЧрд░реНрди рд╕рдХреНрдиреБрд╣реБрдиреНрдЫ port-forward
:
kubectl --namespace=monitoring port-forward svc/prometheus-blackbox-exporter 9115:9115
рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдПрдХреНрд╕рдкреЛрд░реНрдЯрд░ рд╡реЗрдм рдЗрдиреНрдЯрд░рдлреЗрд╕рдорд╛ рд╡реЗрдм рдмреНрд░рд╛рдЙрдЬрд░ рдорд╛рд░реНрдлрдд рдЬрдбрд╛рди рдЧрд░реНрдиреБрд╣реЛрд╕реН
рдпрджрд┐ рддрдкрд╛рдИрдВ рдареЗрдЧрд╛рдирд╛рдорд╛ рдЬрд╛рдиреБрд╣реБрдиреНрдЫ
рдореЗрдЯреНрд░рд┐рдХ рдорд╛рди probe_success
рдмрд░рд╛рдмрд░ 1 рднрдиреЗрдХреЛ рд╕рдлрд▓ рдЬрд╛рдБрдЪ рд╣реЛред реж рдХреЛ рдорд╛рдирд▓реЗ рддреНрд░реБрдЯрд┐рд▓рд╛рдИ рд╕рдВрдХреЗрдд рдЧрд░реНрдЫред
Prometheus рд╕реНрдерд╛рдкрдирд╛ рдЧрд░реНрджреИ
рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рддреИрдирд╛рдд рдЧрд░реЗрдкрдЫрд┐, рд╣рд╛рдореА рдкреНрд░реЛрдореЗрдерд┐рдпрд╕рд▓рд╛рдИ рдХрдиреНрдлрд┐рдЧрд░ рдЧрд░реНрдЫреМрдВ prometheus-additional.yaml
.
- job_name: 'kube-api-blackbox'
scrape_interval: 1w
metrics_path: /probe
params:
module: [http_2xx]
static_configs:
- targets:
- https://www.google.com
- http://www.example.com
- https://prometheus.io
relabel_configs:
- source_labels: [__address__]
target_label: __param_target
- source_labels: [__param_target]
target_label: instance
- target_label: __address__
replacement: prometheus-blackbox-exporter:9115 # The blackbox exporter.
рд╣рд╛рдореА рдЙрддреНрдкрдиреНрди рдЧрд░реНрдЫреМрдВ Secret
рдирд┐рдореНрди рдЖрджреЗрд╢ рдкреНрд░рдпреЛрдЧ рдЧрд░реЗрд░ред
PROMETHEUS_ADD_CONFIG=$(cat prometheus-additional.yaml | base64)
cat << EOF | kubectl --namespace=monitoring apply -f -
apiVersion: v1
kind: Secret
metadata:
name: additional-scrape-configs
type: Opaque
data:
prometheus-additional.yaml: $PROMETHEUS_ADD_CONFIG
EOF
рд╕рдВрдХреЗрдд additional-scrape-configs
рдкреНрд░реЛрдореЗрдерд┐рдпрд╕ рдЕрдкрд░реЗрдЯрд░ рдХреЛ рд▓рд╛рдЧреА рдкреНрд░рдпреЛрдЧ рдЧрд░реА additionalScrapeConfigs
.
kubectl --namespace=monitoring edit prometheuses k8s
...
spec:
additionalScrapeConfigs:
key: prometheus-additional.yaml
name: additional-scrape-configs
рд╣рд╛рдореА рдкреНрд░реЛрдореЗрдерд┐рдпрд╕ рд╡реЗрдм рдЗрдиреНрдЯрд░рдлреЗрд╕рдорд╛ рдЬрд╛рдиреНрдЫреМрдВ рд░ рдореЗрдЯреНрд░рд┐рдХреНрд╕ рд░ рд▓рдХреНрд╖реНрдпрд╣рд░реВ рдЬрд╛рдБрдЪ рдЧрд░реНрдЫреМрдВред
kubectl --namespace=monitoring port-forward svc/prometheus-k8s 9090:9090
рд╣рд╛рдореА рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕рдХреЛ рдореЗрдЯреНрд░рд┐рдХреНрд╕ рд░ рд▓рдХреНрд╖реНрдпрд╣рд░реВ рджреЗрдЦреНрдЫреМрдВред
рд╕реВрдЪрдирд╛рд╣рд░реВрдХрд╛ рд▓рд╛рдЧрд┐ рдирд┐рдпрдорд╣рд░реВ рдердкреНрджреИ (рд╕реВрдЪрдирд╛)
рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХрд░реНрддрд╛рдмрд╛рдЯ рд╕реВрдЪрдирд╛рд╣рд░реВ рдкреНрд░рд╛рдкреНрдд рдЧрд░реНрди, рд╣рд╛рдореА Prometheus рдЕрдкрд░реЗрдЯрд░рдорд╛ рдирд┐рдпрдорд╣рд░реВ рдердкреНрдиреЗрдЫреМрдВред
kubectl --namespace=monitoring edit prometheusrules prometheus-k8s-rules
...
- name: blackbox-exporter
rules:
- alert: ProbeFailed
expr: probe_success == 0
for: 5m
labels:
severity: error
annotations:
summary: "Probe failed (instance {{ $labels.instance }})"
description: "Probe failedn VALUE = {{ $value }}n LABELS: {{ $labels }}"
- alert: SlowProbe
expr: avg_over_time(probe_duration_seconds[1m]) > 1
for: 5m
labels:
severity: warning
annotations:
summary: "Slow probe (instance {{ $labels.instance }})"
description: "Blackbox probe took more than 1s to completen VALUE = {{ $value }}n LABELS: {{ $labels }}"
- alert: HttpStatusCode
expr: probe_http_status_code <= 199 OR probe_http_status_code >= 400
for: 5m
labels:
severity: error
annotations:
summary: "HTTP Status Code (instance {{ $labels.instance }})"
description: "HTTP status code is not 200-399n VALUE = {{ $value }}n LABELS: {{ $labels }}"
- alert: SslCertificateWillExpireSoon
expr: probe_ssl_earliest_cert_expiry - time() < 86400 * 30
for: 5m
labels:
severity: warning
annotations:
summary: "SSL certificate will expire soon (instance {{ $labels.instance }})"
description: "SSL certificate expires in 30 daysn VALUE = {{ $value }}n LABELS: {{ $labels }}"
- alert: SslCertificateHasExpired
expr: probe_ssl_earliest_cert_expiry - time() <= 0
for: 5m
labels:
severity: error
annotations:
summary: "SSL certificate has expired (instance {{ $labels.instance }})"
description: "SSL certificate has expired alreadyn VALUE = {{ $value }}n LABELS: {{ $labels }}"
- alert: HttpSlowRequests
expr: avg_over_time(probe_http_duration_seconds[1m]) > 1
for: 5m
labels:
severity: warning
annotations:
summary: "HTTP slow requests (instance {{ $labels.instance }})"
description: "HTTP request took more than 1sn VALUE = {{ $value }}n LABELS: {{ $labels }}"
- alert: SlowPing
expr: avg_over_time(probe_icmp_duration_seconds[1m]) > 1
for: 5m
labels:
severity: warning
annotations:
summary: "Slow ping (instance {{ $labels.instance }})"
description: "Blackbox ping took more than 1sn VALUE = {{ $value }}n LABELS: {{ $labels }}"
рдкреНрд░реЛрдорд┐рдерд┐рдпрд╕ рд╡реЗрдм рдЗрдиреНрдЯрд░рдлреЗрд╕рдорд╛, рд╕реНрдерд┐рддрд┐ => рдирд┐рдпрдорд╣рд░реВрдорд╛ рдЬрд╛рдиреБрд╣реЛрд╕реН рд░ рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕-рдирд┐рд░реНрдпрд╛рддрдХрд░реНрддрд╛рдХреЛ рд▓рд╛рдЧрд┐ рд╕рддрд░реНрдХ рдирд┐рдпрдорд╣рд░реВ рдлреЗрд▓рд╛ рдкрд╛рд░реНрдиреБрд╣реЛрд╕реНред
Kubernetes API рд╕рд░реНрднрд░ SSL рдкреНрд░рдорд╛рдгрдкрддреНрд░ рд╕рдорд╛рдкреНрддрд┐ рд╕реВрдЪрдирд╛рд╣рд░реВ рдХрдиреНрдлрд┐рдЧрд░ рдЧрд░реНрджреИ
Kubernetes API рд╕рд░реНрднрд░ SSL рдкреНрд░рдорд╛рдгрдкрддреНрд░ рдореНрдпрд╛рдж рд╕рдорд╛рдкреНрддрд┐ рдЕрдиреБрдЧрдорди рдХрдиреНрдлрд┐рдЧрд░ рдЧрд░реМрдВред рдпрд╕рд▓реЗ рд╣рдкреНрддрд╛рдорд╛ рдПрдХ рдкрдЯрдХ рд╕реВрдЪрдирд╛рд╣рд░реВ рдкрдард╛рдЙрдиреЗрдЫред
Kubernetes API рд╕рд░реНрднрд░ рдкреНрд░рдорд╛рдгреАрдХрд░рдгрдХреЛ рд▓рд╛рдЧрд┐ рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рдореЛрдбреНрдпреБрд▓ рдердкреНрджреИред
kubectl --namespace=monitoring edit configmap prometheus-blackbox-exporter
...
kube-api:
http:
method: GET
no_follow_redirects: false
preferred_ip_protocol: ip4
tls_config:
insecure_skip_verify: false
ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
valid_http_versions:
- HTTP/1.1
- HTTP/2
valid_status_codes: []
prober: http
timeout: 5s
рдкреНрд░реЛрдореЗрдерд┐рдпрд╕ рд╕реНрдХреНрд░реНрдпрд╛рдк рдХрдиреНрдлрд┐рдЧрд░реЗрд╕рди рдердкреНрджреИ
- job_name: 'kube-api-blackbox'
metrics_path: /probe
params:
module: [kube-api]
static_configs:
- targets:
- https://kubernetes.default.svc/api
relabel_configs:
- source_labels: [__address__]
target_label: __param_target
- source_labels: [__param_target]
target_label: instance
- target_label: __address__
replacement: prometheus-blackbox-exporter:9115 # The blackbox exporter.
рдкреНрд░реЛрдореЗрдерд┐рдпрд╕ рдЧреЛрдкреНрдп рдкреНрд░рдпреЛрдЧ рдЧрд░реНрджреИ
PROMETHEUS_ADD_CONFIG=$(cat prometheus-additional.yaml | base64)
cat << EOF | kubectl --namespace=monitoring apply -f -
apiVersion: v1
kind: Secret
metadata:
name: additional-scrape-configs
type: Opaque
data:
prometheus-additional.yaml: $PROMETHEUS_ADD_CONFIG
EOF
рдЕрд▓рд░реНрдЯ рдирд┐рдпрдорд╣рд░реВ рдердкреНрджреИ
kubectl --namespace=monitoring edit prometheusrules prometheus-k8s-rules
...
- name: k8s-api-server-cert-expiry
rules:
- alert: K8sAPIServerSSLCertExpiringAfterThreeMonths
expr: probe_ssl_earliest_cert_expiry{job="kube-api-blackbox"} - time() < 86400 * 90
for: 1w
labels:
severity: warning
annotations:
summary: "Kubernetes API Server SSL certificate will expire after three months (instance {{ $labels.instance }})"
description: "Kubernetes API Server SSL certificate expires in 90 daysn VALUE = {{ $value }}n LABELS: {{ $labels }}"
рдЙрдкрдпреЛрдЧреА рд▓рд┐рдЩреНрдХрд╣рд░реВ
рд╕реНрд░реЛрдд: www.habr.com