แฒกแแแแแ แงแแแแแก. แแแแกแจแ OTUS แแแแแแแก
แแแ แแแ
แแแแแญแแ แแแแ แจแแแแแแ:
- แแฃแแแ แแแขแแแ
- แแ แแแแแแก แแแแ แแขแแ แ
แแฅแกแแแ แขแแแ แแก แจแแแ แงแฃแแแก แแแแคแแแฃแ แแชแแ
Blackbox-แแก แแแแคแแแฃแ แแชแแ แแแจแแแแแแ ConfigMap
แแแ แแแแขแ แแแแกแแแแก http
แแแ แกแแ แแแกแแแแก แแแแแขแแ แแแแแก แแแแฃแแ.
apiVersion: v1
kind: ConfigMap
metadata:
name: prometheus-blackbox-exporter
labels:
app: prometheus-blackbox-exporter
data:
blackbox.yaml: |
modules:
http_2xx:
http:
no_follow_redirects: false
preferred_ip_protocol: ip4
valid_http_versions:
- HTTP/1.1
- HTTP/2
valid_status_codes: []
prober: http
timeout: 5s
แแแแฃแแ http_2xx
แแแแแแงแแแแแ แแแแก แจแแกแแแแฌแแแแแแ, แ แแ แแแ แกแแ แแแกแ แแแ แฃแแแแก HTTP 2xx แกแขแแขแฃแกแแก แแแแก. แจแแแ แงแฃแแแก แแฅแกแแแ แขแแแ แแก แแแแคแแแฃแ แแชแแ แฃแคแ แ แแแขแแแฃแ แแ แแ แแก แแฆแฌแแ แแแ
แจแแแ แงแฃแแแก แแฅแกแแแ แขแแแ แแก แแแแแแแแแ Kubernetes แแแแกแขแแ แจแ
แแฆแฌแแ แแ Deployment
ะธ Service
Kubernetes-แจแ แแแแแแแแแแกแแแแก.
---
kind: Service
apiVersion: v1
metadata:
name: prometheus-blackbox-exporter
labels:
app: prometheus-blackbox-exporter
spec:
type: ClusterIP
ports:
- name: http
port: 9115
protocol: TCP
selector:
app: prometheus-blackbox-exporter
---
apiVersion: apps/v1
kind: Deployment
metadata:
name: prometheus-blackbox-exporter
labels:
app: prometheus-blackbox-exporter
spec:
replicas: 1
selector:
matchLabels:
app: prometheus-blackbox-exporter
template:
metadata:
labels:
app: prometheus-blackbox-exporter
spec:
restartPolicy: Always
containers:
- name: blackbox-exporter
image: "prom/blackbox-exporter:v0.15.1"
imagePullPolicy: IfNotPresent
securityContext:
readOnlyRootFilesystem: true
runAsNonRoot: true
runAsUser: 1000
args:
- "--config.file=/config/blackbox.yaml"
resources:
{}
ports:
- containerPort: 9115
name: http
livenessProbe:
httpGet:
path: /health
port: http
readinessProbe:
httpGet:
path: /health
port: http
volumeMounts:
- mountPath: /config
name: config
- name: configmap-reload
image: "jimmidyson/configmap-reload:v0.2.2"
imagePullPolicy: "IfNotPresent"
securityContext:
runAsNonRoot: true
runAsUser: 65534
args:
- --volume-dir=/etc/config
- --webhook-url=http://localhost:9115/-/reload
resources:
{}
volumeMounts:
- mountPath: /etc/config
name: config
readOnly: true
volumes:
- name: config
configMap:
name: prometheus-blackbox-exporter
Blackbox แแฅแกแแแ แขแแแ แ แจแแแซแแแแ แแแแแแแแแก แจแแแแแแ แแ แซแแแแแแก แแแแแงแแแแแแ. แกแแฎแแแแ แกแแแ แชแ monitoring
แแฎแแแ แแ แแแแแแก แแแแ แแขแแ แก.
kubectl --namespace=monitoring apply -f blackbox-exporter.yaml
แแแ แฌแแฃแแแแ, แ แแ แงแแแแ แกแแ แแแกแ แแฃแจแแแแก แจแแแแแแ แแ แซแแแแแแก แแแแแงแแแแแแ:
kubectl --namespace=monitoring get all --selector=app=prometheus-blackbox-exporter
แจแแแ แงแฃแแแก แจแแแแฌแแแแ
แจแแแแซแแแแ Blackbox-แแก แแฅแกแแแ แขแแแ แแก แแแ แแแขแแ แคแแแกแแก แฌแแแแแ port-forward
:
kubectl --namespace=monitoring port-forward svc/prometheus-blackbox-exporter 9115:9115
แแแฃแแแแจแแ แแแ Blackbox-แแก แแฅแกแแแ แขแแแ แแก แแแ แแแขแแ แคแแแกแก แแแ แแ แแฃแแแ แแก แแแจแแแแแแ แแแกแแแแ แแแ
แแฃ แแแแแฎแแ แแแกแแแแ แแแ
แแแขแ แฃแแ แแแแจแแแแแแแ probe_success
1-แแก แขแแแ แแแจแแแแก แฌแแ แแแขแแแฃแ แจแแแแฌแแแแแก. แแแแจแแแแแแแ 0 แแแฃแแแแแแก แจแแชแแแแแแ.
แแ แแแแแแก แแแงแแแแแ
BlackBox แแฅแกแแแ แขแแแ แแก แแแแแแแแแแก แจแแแแแ, แฉแแแ แแแแแแคแแแฃแ แแ แแแ แแ แแแแแแก แจแแแแแ prometheus-additional.yaml
.
- job_name: 'kube-api-blackbox'
scrape_interval: 1w
metrics_path: /probe
params:
module: [http_2xx]
static_configs:
- targets:
- https://www.google.com
- http://www.example.com
- https://prometheus.io
relabel_configs:
- source_labels: [__address__]
target_label: __param_target
- source_labels: [__param_target]
target_label: instance
- target_label: __address__
replacement: prometheus-blackbox-exporter:9115 # The blackbox exporter.
แฉแแแ แแแฌแแ แแแแแ Secret
แจแแแแแแ แแ แซแแแแแแก แแแแแงแแแแแแ.
PROMETHEUS_ADD_CONFIG=$(cat prometheus-additional.yaml | base64)
cat << EOF | kubectl --namespace=monitoring apply -f -
apiVersion: v1
kind: Secret
metadata:
name: additional-scrape-configs
type: Opaque
data:
prometheus-additional.yaml: $PROMETHEUS_ADD_CONFIG
EOF
แฉแแแ แแแแฃแแแแแแ additional-scrape-configs
แแ แแแแแแก แแแแ แแขแแ แแก แแแแแงแแแแแแ additionalScrapeConfigs
.
kubectl --namespace=monitoring edit prometheuses k8s
...
spec:
additionalScrapeConfigs:
key: prometheus-additional.yaml
name: additional-scrape-configs
แฉแแแ แแแแแแแแ แ แแ แแแแแแก แแแ แแแขแแ แคแแแกแแ แแ แแแแแฌแแแแ แแแขแ แแแแกแ แแ แแแแแแแก.
kubectl --namespace=monitoring port-forward svc/prometheus-k8s 9090:9090
แฉแแแ แแฎแแแแแ Blackbox-แแก แแแขแ แแแแกแ แแ แแแแแแแก.
แจแแขแงแแแแแแแแแแก แฌแแกแแแแก แแแแแขแแแ (แแแคแ แแฎแแแแแ)
Blackbox-แแก แแฅแกแแแ แขแแแ แแกแแแ แจแแขแงแแแแแแแแแแก แแแกแแฆแแแแ, แแ แแแแแแก แแแแ แแขแแ แก แแแแแแแขแแแ แฌแแกแแแก.
kubectl --namespace=monitoring edit prometheusrules prometheus-k8s-rules
...
- name: blackbox-exporter
rules:
- alert: ProbeFailed
expr: probe_success == 0
for: 5m
labels:
severity: error
annotations:
summary: "Probe failed (instance {{ $labels.instance }})"
description: "Probe failedn VALUE = {{ $value }}n LABELS: {{ $labels }}"
- alert: SlowProbe
expr: avg_over_time(probe_duration_seconds[1m]) > 1
for: 5m
labels:
severity: warning
annotations:
summary: "Slow probe (instance {{ $labels.instance }})"
description: "Blackbox probe took more than 1s to completen VALUE = {{ $value }}n LABELS: {{ $labels }}"
- alert: HttpStatusCode
expr: probe_http_status_code <= 199 OR probe_http_status_code >= 400
for: 5m
labels:
severity: error
annotations:
summary: "HTTP Status Code (instance {{ $labels.instance }})"
description: "HTTP status code is not 200-399n VALUE = {{ $value }}n LABELS: {{ $labels }}"
- alert: SslCertificateWillExpireSoon
expr: probe_ssl_earliest_cert_expiry - time() < 86400 * 30
for: 5m
labels:
severity: warning
annotations:
summary: "SSL certificate will expire soon (instance {{ $labels.instance }})"
description: "SSL certificate expires in 30 daysn VALUE = {{ $value }}n LABELS: {{ $labels }}"
- alert: SslCertificateHasExpired
expr: probe_ssl_earliest_cert_expiry - time() <= 0
for: 5m
labels:
severity: error
annotations:
summary: "SSL certificate has expired (instance {{ $labels.instance }})"
description: "SSL certificate has expired alreadyn VALUE = {{ $value }}n LABELS: {{ $labels }}"
- alert: HttpSlowRequests
expr: avg_over_time(probe_http_duration_seconds[1m]) > 1
for: 5m
labels:
severity: warning
annotations:
summary: "HTTP slow requests (instance {{ $labels.instance }})"
description: "HTTP request took more than 1sn VALUE = {{ $value }}n LABELS: {{ $labels }}"
- alert: SlowPing
expr: avg_over_time(probe_icmp_duration_seconds[1m]) > 1
for: 5m
labels:
severity: warning
annotations:
summary: "Slow ping (instance {{ $labels.instance }})"
description: "Blackbox ping took more than 1sn VALUE = {{ $value }}n LABELS: {{ $labels }}"
แแ แแแแแแก แแแ แแแขแแ แคแแแกแจแ แแแแแแแ Status => Rules แแ แแแแแแ แแแคแ แแฎแแแแแแก แฌแแกแแแ blackbox-exporter-แแกแแแแก.
แแแแแแแแ แแแแก Kubernetes API แกแแ แแแ แแก SSL แกแแ แแแคแแแแขแแก แแแแแก แแแกแแแแก แจแแขแงแแแแแแแแแแก แแแแคแแแฃแ แแชแแ
แแแแแ แแแแแแแแคแแแฃแ แแ แแ Kubernetes API Server SSL แกแแ แขแแคแแแแขแแก แแแแแก แแแกแแแแก แแแแแขแแ แแแแ. แแก แแแแแแแแก แจแแขแงแแแแแแแแแก แแแแ แแจแ แแ แแฎแแ.
แจแแแ แงแฃแแแก แแฅแกแแแ แขแแแ แแก แแแแฃแแแก แแแแแขแแแ Kubernetes API แกแแ แแแ แแก แแแแแแขแแคแแแแชแแแกแแแแก.
kubectl --namespace=monitoring edit configmap prometheus-blackbox-exporter
...
kube-api:
http:
method: GET
no_follow_redirects: false
preferred_ip_protocol: ip4
tls_config:
insecure_skip_verify: false
ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
valid_http_versions:
- HTTP/1.1
- HTTP/2
valid_status_codes: []
prober: http
timeout: 5s
Prometheus scrape-แแก แแแแคแแแฃแ แแชแแแก แแแแแขแแแ
- job_name: 'kube-api-blackbox'
metrics_path: /probe
params:
module: [kube-api]
static_configs:
- targets:
- https://kubernetes.default.svc/api
relabel_configs:
- source_labels: [__address__]
target_label: __param_target
- source_labels: [__param_target]
target_label: instance
- target_label: __address__
replacement: prometheus-blackbox-exporter:9115 # The blackbox exporter.
แแ แแแแแแก แกแแแแฃแแแแก แแแแแงแแแแแ
PROMETHEUS_ADD_CONFIG=$(cat prometheus-additional.yaml | base64)
cat << EOF | kubectl --namespace=monitoring apply -f -
apiVersion: v1
kind: Secret
metadata:
name: additional-scrape-configs
type: Opaque
data:
prometheus-additional.yaml: $PROMETHEUS_ADD_CONFIG
EOF
แแแคแ แแฎแแแแแแก แฌแแกแแแแก แแแแแขแแแ
kubectl --namespace=monitoring edit prometheusrules prometheus-k8s-rules
...
- name: k8s-api-server-cert-expiry
rules:
- alert: K8sAPIServerSSLCertExpiringAfterThreeMonths
expr: probe_ssl_earliest_cert_expiry{job="kube-api-blackbox"} - time() < 86400 * 90
for: 1w
labels:
severity: warning
annotations:
summary: "Kubernetes API Server SSL certificate will expire after three months (instance {{ $labels.instance }})"
description: "Kubernetes API Server SSL certificate expires in 90 daysn VALUE = {{ $value }}n LABELS: {{ $labels }}"
แกแแกแแ แแแแแ แแแฃแแแแ
แฌแงแแ แ: www.habr.com