Prometheus: ניטור HTTP באמצעות יצואן Blackbox

שלום לכולם. במאי משיקה OTUS סדנה בנושא ניטור ורישום, הן תשתית והן יישומים באמצעות Zabbix, Prometheus, Grafana ו-ELK. בהקשר זה, אנו חולקים באופן מסורתי חומר שימושי בנושא.

יצואן בלקבוקס עבור Prometheus מאפשר לך ליישם ניטור של שירותים חיצוניים באמצעות HTTP, HTTPS, DNS, TCP, ICMP. במאמר זה, אני אראה לך כיצד להגדיר ניטור HTTP/HTTPS באמצעות Blackbox Exporter. נשיק את יצואן Blackbox ב-Kubernetes.

הסביבה

נצטרך את הדברים הבאים:

  • קוברנט
  • מפעיל פרומתאוס

תצורת תיבת שחור ליצואן

הגדרת Blackbox באמצעות ConfigMap להגדרות http מודול ניטור שירותי אינטרנט.

apiVersion: v1
kind: ConfigMap
metadata:
  name: prometheus-blackbox-exporter
  labels:
    app: prometheus-blackbox-exporter
data:
  blackbox.yaml: |
    modules:
      http_2xx:
        http:
          no_follow_redirects: false
          preferred_ip_protocol: ip4
          valid_http_versions:
          - HTTP/1.1
          - HTTP/2
          valid_status_codes: []
        prober: http
        timeout: 5s

Модуль http_2xx משמש כדי לבדוק ששירות האינטרנט מחזיר קוד סטטוס HTTP 2xx. תצורת יצואן Blackbox מתוארת בפירוט רב יותר ב תיעוד.

פריסת יצואן Blackbox לאשכול Kubernetes

לְתַאֵר Deployment и Service לפריסה ב- Kubernetes.

---
kind: Service
apiVersion: v1
metadata:
  name: prometheus-blackbox-exporter
  labels:
    app: prometheus-blackbox-exporter
spec:
  type: ClusterIP
  ports:
    - name: http
      port: 9115
      protocol: TCP
  selector:
    app: prometheus-blackbox-exporter

---
apiVersion: apps/v1
kind: Deployment
metadata:
  name: prometheus-blackbox-exporter
  labels:
    app: prometheus-blackbox-exporter
spec:
  replicas: 1
  selector:
    matchLabels:
      app: prometheus-blackbox-exporter
  template:
    metadata:
      labels:
        app: prometheus-blackbox-exporter
    spec:
      restartPolicy: Always
      containers:
        - name: blackbox-exporter
          image: "prom/blackbox-exporter:v0.15.1"
          imagePullPolicy: IfNotPresent
          securityContext:
            readOnlyRootFilesystem: true
            runAsNonRoot: true
            runAsUser: 1000
          args:
            - "--config.file=/config/blackbox.yaml"
          resources:
            {}
          ports:
            - containerPort: 9115
              name: http
          livenessProbe:
            httpGet:
              path: /health
              port: http
          readinessProbe:
            httpGet:
              path: /health
              port: http
          volumeMounts:
            - mountPath: /config
              name: config
        - name: configmap-reload
          image: "jimmidyson/configmap-reload:v0.2.2"
          imagePullPolicy: "IfNotPresent"
          securityContext:
            runAsNonRoot: true
            runAsUser: 65534
          args:
            - --volume-dir=/etc/config
            - --webhook-url=http://localhost:9115/-/reload
          resources:
            {}
          volumeMounts:
            - mountPath: /etc/config
              name: config
              readOnly: true
      volumes:
        - name: config
          configMap:
            name: prometheus-blackbox-exporter

ניתן לפרוס את Blackbox Exporter באמצעות הפקודה הבאה. מרחב שמות monitoring מתייחס ל-Prometheus Operator.

kubectl --namespace=monitoring apply -f blackbox-exporter.yaml

ודא שכל השירותים פועלים באמצעות הפקודה הבאה:

kubectl --namespace=monitoring get all --selector=app=prometheus-blackbox-exporter

בדיקת Blackbox

אתה יכול לגשת לממשק האינטרנט של Blackbox Exporter באמצעות port-forward:

kubectl --namespace=monitoring port-forward svc/prometheus-blackbox-exporter 9115:9115

התחבר לממשק האינטרנט של Blackbox Exporter באמצעות דפדפן אינטרנט בכתובת localhost: 9115.

Prometheus: ניטור HTTP באמצעות יצואן Blackbox

אם אתה הולך לכתובת http://localhost:9115/probe?module=http_2xx&target=https://www.google.com, תראה את התוצאה של בדיקת כתובת האתר שצוינה (https://www.google.com).

Prometheus: ניטור HTTP באמצעות יצואן Blackbox

ערך מטרי probe_success שווה ל-1 פירושו בדיקה מוצלחת. ערך 0 מציין שגיאה.

הקמת פרומתאוס

לאחר פריסת יצואן BlackBox, אנו מגדירים את Prometheus ב prometheus-additional.yaml.

- job_name: 'kube-api-blackbox'
  scrape_interval: 1w
  metrics_path: /probe
  params:
    module: [http_2xx]
  static_configs:
   - targets:
      - https://www.google.com
      - http://www.example.com
      - https://prometheus.io
  relabel_configs:
   - source_labels: [__address__]
     target_label: __param_target
   - source_labels: [__param_target]
     target_label: instance
   - target_label: __address__
     replacement: prometheus-blackbox-exporter:9115 # The blackbox exporter.

אנחנו מייצרים Secretבאמצעות הפקודה הבאה.

PROMETHEUS_ADD_CONFIG=$(cat prometheus-additional.yaml | base64)
cat << EOF | kubectl --namespace=monitoring apply -f -
apiVersion: v1
kind: Secret
metadata:
  name: additional-scrape-configs
type: Opaque
data:
  prometheus-additional.yaml: $PROMETHEUS_ADD_CONFIG
EOF

אנו מציינים additional-scrape-configs עבור Prometheus Operator באמצעות additionalScrapeConfigs.

kubectl --namespace=monitoring edit prometheuses k8s
...
spec:
  additionalScrapeConfigs:
    key: prometheus-additional.yaml
    name: additional-scrape-configs

אנחנו נכנסים לממשק האינטרנט של פרומתאוס ובודקים את המדדים והיעדים.

kubectl --namespace=monitoring port-forward svc/prometheus-k8s 9090:9090

Prometheus: ניטור HTTP באמצעות יצואן Blackbox

Prometheus: ניטור HTTP באמצעות יצואן Blackbox

אנו רואים את המדדים והיעדים של Blackbox.

הוספת כללים להתראות (התראה)

כדי לקבל הודעות מיצואן Blackbox, נוסיף כללים ל-Prometheus Operator.

kubectl --namespace=monitoring edit prometheusrules prometheus-k8s-rules
...
  - name: blackbox-exporter
    rules:
    - alert: ProbeFailed
      expr: probe_success == 0
      for: 5m
      labels:
        severity: error
      annotations:
        summary: "Probe failed (instance {{ $labels.instance }})"
        description: "Probe failedn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: SlowProbe
      expr: avg_over_time(probe_duration_seconds[1m]) > 1
      for: 5m
      labels:
        severity: warning
      annotations:
        summary: "Slow probe (instance {{ $labels.instance }})"
        description: "Blackbox probe took more than 1s to completen  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: HttpStatusCode
      expr: probe_http_status_code <= 199 OR probe_http_status_code >= 400
      for: 5m
      labels:
        severity: error
      annotations:
        summary: "HTTP Status Code (instance {{ $labels.instance }})"
        description: "HTTP status code is not 200-399n  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: SslCertificateWillExpireSoon
      expr: probe_ssl_earliest_cert_expiry - time() < 86400 * 30
      for: 5m
      labels:
        severity: warning
      annotations:
        summary: "SSL certificate will expire soon (instance {{ $labels.instance }})"
        description: "SSL certificate expires in 30 daysn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: SslCertificateHasExpired
      expr: probe_ssl_earliest_cert_expiry - time()  <= 0
      for: 5m
      labels:
        severity: error
      annotations:
        summary: "SSL certificate has expired (instance {{ $labels.instance }})"
        description: "SSL certificate has expired alreadyn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: HttpSlowRequests
      expr: avg_over_time(probe_http_duration_seconds[1m]) > 1
      for: 5m
      labels:
        severity: warning
      annotations:
        summary: "HTTP slow requests (instance {{ $labels.instance }})"
        description: "HTTP request took more than 1sn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: SlowPing
      expr: avg_over_time(probe_icmp_duration_seconds[1m]) > 1
      for: 5m
      labels:
        severity: warning
      annotations:
        summary: "Slow ping (instance {{ $labels.instance }})"
        description: "Blackbox ping took more than 1sn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"

בממשק האינטרנט של Prometheus, עבור אל Status => Rules ומצא את כללי ההתראה עבור Blackbox-exporter.

Prometheus: ניטור HTTP באמצעות יצואן Blackbox

הגדרת הודעות תפוגה של אישור SSL של שרת Kubernetes API

בואו נגדיר תפוגת אישור SSL של Kubernetes API Server. זה ישלח הודעות פעם בשבוע.

הוספת מודול היצואן של Blackbox לאימות שרת Kubernetes API.

kubectl --namespace=monitoring edit configmap prometheus-blackbox-exporter
...
      kube-api:
        http:
          method: GET
          no_follow_redirects: false
          preferred_ip_protocol: ip4
          tls_config:
            insecure_skip_verify: false
            ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
          bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
          valid_http_versions:
          - HTTP/1.1
          - HTTP/2
          valid_status_codes: []
        prober: http
        timeout: 5s

הוספת תצורת גרידה של פרומתאוס

- job_name: 'kube-api-blackbox'
  metrics_path: /probe
  params:
    module: [kube-api]
  static_configs:
   - targets:
      - https://kubernetes.default.svc/api
  relabel_configs:
   - source_labels: [__address__]
     target_label: __param_target
   - source_labels: [__param_target]
     target_label: instance
   - target_label: __address__
     replacement: prometheus-blackbox-exporter:9115 # The blackbox exporter.

שימוש ב-Prometheus Secret

PROMETHEUS_ADD_CONFIG=$(cat prometheus-additional.yaml | base64)
cat << EOF | kubectl --namespace=monitoring apply -f -
apiVersion: v1
kind: Secret
metadata:
  name: additional-scrape-configs
type: Opaque
data:
  prometheus-additional.yaml: $PROMETHEUS_ADD_CONFIG
EOF

הוספת כללי התראה

kubectl --namespace=monitoring edit prometheusrules prometheus-k8s-rules
...
  - name: k8s-api-server-cert-expiry
    rules:
    - alert: K8sAPIServerSSLCertExpiringAfterThreeMonths
      expr: probe_ssl_earliest_cert_expiry{job="kube-api-blackbox"} - time() < 86400 * 90 
      for: 1w
      labels:
        severity: warning
      annotations:
        summary: "Kubernetes API Server SSL certificate will expire after three months (instance {{ $labels.instance }})"
        description: "Kubernetes API Server SSL certificate expires in 90 daysn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"

קישורים שימושיים

ניטור והתחברות ב-Docker

מקור: www.habr.com

קנה אירוח אמין לאתרים עם הגנת DDoS, שרתי VPS VDS 🔥 קנה אחסון אתרים אמין עם הגנת DDoS, שרתי VPS VDS | ProHoster