เจธเจพเจฐเจฟเจเจ เจจเฉเฉฐ เจธเจคเจฟ เจธเจผเฉเจฐเฉ เจ
เจเจพเจฒ. เจฎเจ เจตเจฟเฉฑเจ OTUS เจฒเจพเจเจ เจนเฉเฉฐเจฆเจพ เจนเฉ
เจตเจพเจคเจพเจตเจฐเจฃ
เจธเจพเจจเฉเฉฐ เจนเฉเจ เจฒเจฟเจเจฟเจเจ เจฆเฉ เจฒเฉเฉ เจชเจตเฉเจเฉ:
- เจเจฌเจฐเจจเฉเจเจฟเจธ
- เจชเฉเจฐเฉเจฎเฉเจฅเฉเจ เจธ เจเจชเจฐเฉเจเจฐ
เจจเจฟเจฐเจฏเจพเจค เจฌเจฒเฉเจเจฌเจพเจเจธ เจธเฉฐเจฐเจเจจเจพ
เจฆเฉเจเจฐเจพ เจฌเจฒเฉเจเจฌเจพเจเจธ เจฆเฉ เจธเฉฐเจฐเจเจจเจพ เจเฉเจคเฉ เจเจพ เจฐเจนเฉ เจนเฉ ConfigMap
เจธเฉเจเจฟเฉฐเจเจเจผ เจฒเจ http
เจตเฉเฉฑเจฌ เจธเฉเจตเจพเจตเจพเจ เจจเจฟเจเจฐเจพเจจเฉ เจฎเฉเจกเฉเจเจฒ.
apiVersion: v1
kind: ConfigMap
metadata:
name: prometheus-blackbox-exporter
labels:
app: prometheus-blackbox-exporter
data:
blackbox.yaml: |
modules:
http_2xx:
http:
no_follow_redirects: false
preferred_ip_protocol: ip4
valid_http_versions:
- HTTP/1.1
- HTTP/2
valid_status_codes: []
prober: http
timeout: 5s
เจฎเฉเจกเฉuleเจฒ http_2xx
เจเจน เจเจพเจเจ เจเจฐเจจ เจฒเจ เจตเจฐเจคเจฟเจ เจเจพเจเจฆเจพ เจนเฉ เจเจฟ เจตเฉเฉฑเจฌ เจธเฉเจตเจพ เจเฉฑเจ HTTP 2xx เจธเจฅเจฟเจคเฉ เจเฉเจก เจตเจพเจชเจธ เจเจฐเจฆเฉ เจนเฉเฅค เจฌเจฒเฉเจเจฌเจพเจเจธ เจจเจฟเจฐเจฏเจพเจคเจ เจธเฉฐเจฐเจเจจเจพ เจตเจฟเฉฑเจ เจนเฉเจฐ เจตเจฟเจธเจฅเจพเจฐ เจตเจฟเฉฑเจ เจฆเฉฑเจธเจฟเจ เจเจฟเจ เจนเฉ
เจฌเจฒเฉเจเจฌเจพเจเจธ เจจเจฟเจฐเจฏเจพเจคเจ เจจเฉเฉฐ เจเฉเจฌเจฐเจจเฉเจเจธ เจเจฒเฉฑเจธเจเจฐ เจตเจฟเฉฑเจ เจคเฉเจจเจพเจค เจเจฐเจจเจพ
เจตเจฟเจเจเจฟเจ Deployment
ะธ Service
เจเฉเจฌเจฐเจจเฉเจเจธ เจตเจฟเฉฑเจ เจคเฉเจจเจพเจคเฉ เจฒเจเฅค
---
kind: Service
apiVersion: v1
metadata:
name: prometheus-blackbox-exporter
labels:
app: prometheus-blackbox-exporter
spec:
type: ClusterIP
ports:
- name: http
port: 9115
protocol: TCP
selector:
app: prometheus-blackbox-exporter
---
apiVersion: apps/v1
kind: Deployment
metadata:
name: prometheus-blackbox-exporter
labels:
app: prometheus-blackbox-exporter
spec:
replicas: 1
selector:
matchLabels:
app: prometheus-blackbox-exporter
template:
metadata:
labels:
app: prometheus-blackbox-exporter
spec:
restartPolicy: Always
containers:
- name: blackbox-exporter
image: "prom/blackbox-exporter:v0.15.1"
imagePullPolicy: IfNotPresent
securityContext:
readOnlyRootFilesystem: true
runAsNonRoot: true
runAsUser: 1000
args:
- "--config.file=/config/blackbox.yaml"
resources:
{}
ports:
- containerPort: 9115
name: http
livenessProbe:
httpGet:
path: /health
port: http
readinessProbe:
httpGet:
path: /health
port: http
volumeMounts:
- mountPath: /config
name: config
- name: configmap-reload
image: "jimmidyson/configmap-reload:v0.2.2"
imagePullPolicy: "IfNotPresent"
securityContext:
runAsNonRoot: true
runAsUser: 65534
args:
- --volume-dir=/etc/config
- --webhook-url=http://localhost:9115/-/reload
resources:
{}
volumeMounts:
- mountPath: /etc/config
name: config
readOnly: true
volumes:
- name: config
configMap:
name: prometheus-blackbox-exporter
เจฌเจฒเฉเจเจฌเจพเจเจธ เจเจเจธเจชเฉเจฐเจเจฐ เจจเฉเฉฐ เจนเฉเจ เจฆเจฟเฉฑเจคเฉ เจเจฎเจพเจเจก เจฆเฉ เจตเจฐเจคเฉเจ เจเจฐเจเฉ เจคเฉเจจเจพเจค เจเฉเจคเจพ เจเจพ เจธเจเจฆเจพ เจนเฉเฅค เจจเฉเจฎเจธเจชเฉเจธ monitoring
เจชเฉเจฐเฉเจฎเฉเจฅเฉเจ
เจธ เจเจชเจฐเฉเจเจฐ เจฆเจพ เจนเจตเจพเจฒเจพ เจฆเจฟเฉฐเจฆเจพ เจนเฉเฅค
kubectl --namespace=monitoring apply -f blackbox-exporter.yaml
เจฏเจเฉเจจเฉ เจฌเจฃเจพเจ เจเจฟ เจธเจพเจฐเฉเจเจ เจธเฉเจตเจพเจตเจพเจ เจนเฉเจ เจพเจ เจฆเจฟเฉฑเจคเฉ เจเจฎเจพเจเจก เจฆเฉ เจตเจฐเจคเฉเจ เจเจฐเจเฉ เจเฉฑเจฒ เจฐเจนเฉเจเจ เจนเจจ:
kubectl --namespace=monitoring get all --selector=app=prometheus-blackbox-exporter
เจฌเจฒเฉเจเจฌเจพเจเจธ เจเฉเฉฑเจ
เจคเฉเจธเฉเจ เจฌเจฒเฉเจเจฌเจพเจเจธ เจเจเจธเจชเฉเจฐเจเจฐ เจตเฉเฉฑเจฌ เจเฉฐเจเจฐเจซเฉเจธ เจฆเฉ เจตเจฐเจคเฉเจ เจเจฐเจเฉ เจเจเจธเฉเจธ เจเจฐ เจธเจเจฆเฉ เจนเฉ port-forward
:
kubectl --namespace=monitoring port-forward svc/prometheus-blackbox-exporter 9115:9115
'เจคเฉ เจตเฉเฉฑเจฌ เจฌเฉเจฐเจพเจเจเจผเจฐ เจฐเจพเจนเฉเจ เจฌเจฒเฉเจเจฌเจพเจเจธ เจเจเจธเจชเฉเจฐเจเจฐ เจตเฉเฉฑเจฌ เจเฉฐเจเจฐเจซเฉเจธ เจจเจพเจฒ เจเฉเฉเฉ
เจเฉ เจคเฉเจธเฉเจ เจชเจคเฉ เจคเฉ เจเจพเจเจฆเฉ เจนเฉ
เจฎเฉเจเฉเจฐเจฟเจ เจฎเฉเฉฑเจฒ probe_success
1 เจฆเฉ เจฌเจฐเจพเจฌเจฐ เจฆเจพ เจฎเจคเจฒเจฌ เจนเฉ เจธเจซเจฒ เจเจพเจเจเฅค 0 เจฆเจพ เจฎเฉเฉฑเจฒ เจเฉฑเจ เจเจฒเจคเฉ เจฆเจฐเจธเจพเจเจเจฆเจพ เจนเฉเฅค
เจชเฉเจฐเฉเจฎเฉเจฅเฉเจ เจธ เจธเจฅเจพเจชเจค เจเจฐเจจเจพ
เจฌเจฒเฉเจเจฌเจพเจเจธ เจจเจฟเจฐเจฏเจพเจคเจ เจจเฉเฉฐ เจคเฉเจจเจพเจค เจเจฐเจจ เจคเฉเจ เจฌเจพเจ
เจฆ, เจ
เจธเฉเจ เจชเฉเจฐเฉเจฎเฉเจฅเฉเจ
เจธ เจจเฉเฉฐ เจธเฉฐเจฐเจเจฟเจค เจเจฐเจฆเฉ เจนเจพเจ prometheus-additional.yaml
.
- job_name: 'kube-api-blackbox'
scrape_interval: 1w
metrics_path: /probe
params:
module: [http_2xx]
static_configs:
- targets:
- https://www.google.com
- http://www.example.com
- https://prometheus.io
relabel_configs:
- source_labels: [__address__]
target_label: __param_target
- source_labels: [__param_target]
target_label: instance
- target_label: __address__
replacement: prometheus-blackbox-exporter:9115 # The blackbox exporter.
เจ
เจธเฉเจ เจชเฉเจฆเจพ เจเจฐเจฆเฉ เจนเจพเจ Secret
เจนเฉเจ เจฆเจฟเฉฑเจคเฉ เจเจฎเจพเจเจก เจฆเฉ เจตเจฐเจคเฉเจ เจเจฐเจเฉ.
PROMETHEUS_ADD_CONFIG=$(cat prometheus-additional.yaml | base64)
cat << EOF | kubectl --namespace=monitoring apply -f -
apiVersion: v1
kind: Secret
metadata:
name: additional-scrape-configs
type: Opaque
data:
prometheus-additional.yaml: $PROMETHEUS_ADD_CONFIG
EOF
เจธเฉฐเจเฉเจค additional-scrape-configs
เจตเจฐเจค เจเฉ เจชเฉเจฐเฉเจฎเฉเจฅเฉเจ
เจธ เจเจชเจฐเฉเจเจฐ เจฒเจ additionalScrapeConfigs
.
kubectl --namespace=monitoring edit prometheuses k8s
...
spec:
additionalScrapeConfigs:
key: prometheus-additional.yaml
name: additional-scrape-configs
เจ เจธเฉเจ เจชเฉเจฐเฉเจฎเฉเจฅเฉเจ เจธ เจตเฉเจฌ เจเฉฐเจเจฐเจซเฉเจธ เจคเฉ เจเจพเจเจฆเฉ เจนเจพเจ เจ เจคเฉ เจฎเฉเจเฉเจฐเจฟเจเจธ เจ เจคเฉ เจเฉเจเจฟเจเจ เจฆเฉ เจเจพเจเจ เจเจฐเจฆเฉ เจนเจพเจเฅค
kubectl --namespace=monitoring port-forward svc/prometheus-k8s 9090:9090
เจ เจธเฉเจ เจฌเจฒเฉเจเจฌเจพเจเจธ เจฆเฉ เจฎเฉเจเฉเจฐเจฟเจเจธ เจ เจคเฉ เจเฉเจเฉ เจฆเฉเจเจฆเฉ เจนเจพเจเฅค
เจธเฉเจเจจเจพเจตเจพเจ (เจธเฉเจเฉเจคเจจเจพ) เจฒเจ เจจเจฟเจฏเจฎ เจเฉเฉเจจเจพ
เจฌเจฒเฉเจเจฌเจพเจเจธ เจจเจฟเจฐเจฏเจพเจคเจ เจคเฉเจ เจธเฉเจเจจเจพเจตเจพเจ เจชเฉเจฐเจพเจชเจค เจเจฐเจจ เจฒเจ, เจ เจธเฉเจ เจชเฉเจฐเฉเจฎเฉเจฅเฉเจ เจธ เจเจชเจฐเฉเจเจฐ เจฒเจ เจจเจฟเจฏเจฎ เจเฉเฉเจพเจเจเฉเฅค
kubectl --namespace=monitoring edit prometheusrules prometheus-k8s-rules
...
- name: blackbox-exporter
rules:
- alert: ProbeFailed
expr: probe_success == 0
for: 5m
labels:
severity: error
annotations:
summary: "Probe failed (instance {{ $labels.instance }})"
description: "Probe failedn VALUE = {{ $value }}n LABELS: {{ $labels }}"
- alert: SlowProbe
expr: avg_over_time(probe_duration_seconds[1m]) > 1
for: 5m
labels:
severity: warning
annotations:
summary: "Slow probe (instance {{ $labels.instance }})"
description: "Blackbox probe took more than 1s to completen VALUE = {{ $value }}n LABELS: {{ $labels }}"
- alert: HttpStatusCode
expr: probe_http_status_code <= 199 OR probe_http_status_code >= 400
for: 5m
labels:
severity: error
annotations:
summary: "HTTP Status Code (instance {{ $labels.instance }})"
description: "HTTP status code is not 200-399n VALUE = {{ $value }}n LABELS: {{ $labels }}"
- alert: SslCertificateWillExpireSoon
expr: probe_ssl_earliest_cert_expiry - time() < 86400 * 30
for: 5m
labels:
severity: warning
annotations:
summary: "SSL certificate will expire soon (instance {{ $labels.instance }})"
description: "SSL certificate expires in 30 daysn VALUE = {{ $value }}n LABELS: {{ $labels }}"
- alert: SslCertificateHasExpired
expr: probe_ssl_earliest_cert_expiry - time() <= 0
for: 5m
labels:
severity: error
annotations:
summary: "SSL certificate has expired (instance {{ $labels.instance }})"
description: "SSL certificate has expired alreadyn VALUE = {{ $value }}n LABELS: {{ $labels }}"
- alert: HttpSlowRequests
expr: avg_over_time(probe_http_duration_seconds[1m]) > 1
for: 5m
labels:
severity: warning
annotations:
summary: "HTTP slow requests (instance {{ $labels.instance }})"
description: "HTTP request took more than 1sn VALUE = {{ $value }}n LABELS: {{ $labels }}"
- alert: SlowPing
expr: avg_over_time(probe_icmp_duration_seconds[1m]) > 1
for: 5m
labels:
severity: warning
annotations:
summary: "Slow ping (instance {{ $labels.instance }})"
description: "Blackbox ping took more than 1sn VALUE = {{ $value }}n LABELS: {{ $labels }}"
เจชเฉเจฐเฉเจฎเฉเจฅเฉเจ เจธ เจตเฉเฉฑเจฌ เจเฉฐเจเจฐเจซเฉเจธ เจตเจฟเฉฑเจ, เจธเจฅเจฟเจคเฉ => เจจเจฟเจฏเจฎเจพเจ 'เจคเฉ เจเจพเจ เจ เจคเฉ เจฌเจฒเฉเจเจฌเจพเจเจธ-เจเจเจธเจชเฉเจฐเจเจฐ เจฒเจ เจเฉเจคเจพเจตเจจเฉ เจจเจฟเจฏเจฎ เจฒเฉฑเจญเฉเฅค
เจเฉเจฌเจฐเจจเฉเจเจธ API เจธเจฐเจตเจฐ SSL เจธเจฐเจเฉเจซเจฟเจเฉเจ เจฆเฉ เจฎเจฟเจเจฆ เจชเฉเฉฑเจเจฃ เจฆเฉเจเจ เจธเฉเจเจจเจพเจตเจพเจ เจจเฉเฉฐ เจเฉเจเจซเจฟเจเจฐ เจเจฐเจจเจพ
เจเจฒเฉ Kubernetes API เจธเจฐเจตเจฐ SSL เจธเจฐเจเฉเจซเจฟเจเฉเจ เจฆเฉ เจฎเจฟเจเจฆ เจชเฉเฉฑเจเจฃ เจฆเฉ เจจเจฟเจเจฐเจพเจจเฉ เจจเฉเฉฐ เจเฉเจเจซเจฟเจเจฐ เจเจฐเฉเจเฅค เจเจน เจนเจซเจผเจคเฉ เจตเจฟเฉฑเจ เจเฉฑเจ เจตเจพเจฐ เจธเฉเจเจจเจพเจตเจพเจ เจญเฉเจเฉเจเจพเฅค
Kubernetes API เจธเจฐเจตเจฐ เจชเฉเจฐเจฎเจพเจฃเจฟเจเจคเจพ เจฒเจ เจฌเจฒเฉเจเจฌเจพเจเจธ เจเจเจธเจชเฉเจฐเจเจฐ เจฎเฉเจกเฉเจเจฒ เจเฉเฉเจจเจพเฅค
kubectl --namespace=monitoring edit configmap prometheus-blackbox-exporter
...
kube-api:
http:
method: GET
no_follow_redirects: false
preferred_ip_protocol: ip4
tls_config:
insecure_skip_verify: false
ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
valid_http_versions:
- HTTP/1.1
- HTTP/2
valid_status_codes: []
prober: http
timeout: 5s
เจชเฉเจฐเฉเจฎเฉเจฅเฉเจ เจธ เจธเจเฉเจฐเฉเจช เจเฉเจเจซเจฟเจเจฐเฉเจธเจผเจจ เจธเจผเจพเจฎเจฒ เจเจฐเจจเจพ
- job_name: 'kube-api-blackbox'
metrics_path: /probe
params:
module: [kube-api]
static_configs:
- targets:
- https://kubernetes.default.svc/api
relabel_configs:
- source_labels: [__address__]
target_label: __param_target
- source_labels: [__param_target]
target_label: instance
- target_label: __address__
replacement: prometheus-blackbox-exporter:9115 # The blackbox exporter.
เจชเฉเจฐเฉเจฎเฉเจฅเฉเจ เจธ เจธเฉเจเจฐเฉเจ เจฆเฉ เจตเจฐเจคเฉเจ เจเจฐเจจเจพ
PROMETHEUS_ADD_CONFIG=$(cat prometheus-additional.yaml | base64)
cat << EOF | kubectl --namespace=monitoring apply -f -
apiVersion: v1
kind: Secret
metadata:
name: additional-scrape-configs
type: Opaque
data:
prometheus-additional.yaml: $PROMETHEUS_ADD_CONFIG
EOF
เจเฉเจคเจพเจตเจจเฉ เจจเจฟเจฏเจฎ เจธเจผเจพเจฎเจฒ เจเจฐเจจเจพ
kubectl --namespace=monitoring edit prometheusrules prometheus-k8s-rules
...
- name: k8s-api-server-cert-expiry
rules:
- alert: K8sAPIServerSSLCertExpiringAfterThreeMonths
expr: probe_ssl_earliest_cert_expiry{job="kube-api-blackbox"} - time() < 86400 * 90
for: 1w
labels:
severity: warning
annotations:
summary: "Kubernetes API Server SSL certificate will expire after three months (instance {{ $labels.instance }})"
description: "Kubernetes API Server SSL certificate expires in 90 daysn VALUE = {{ $value }}n LABELS: {{ $labels }}"
เจเจชเจฏเฉเจเฉ เจฒเจฟเฉฐเจ
เจธเจฐเฉเจค: www.habr.com