Prometheus: HTTP eftirlit með Blackbox útflytjanda

Hæ allir. Í maí kemur OTUS á markað vinnustofa um vöktun og skógarhögg, bæði innviði og forrit sem nota Zabbix, Prometheus, Grafana og ELK. Í þessu sambandi deilum við jafnan gagnlegu efni um efnið.

Blackbox útflytjandi fyrir Prometheus gerir þér kleift að innleiða eftirlit með ytri þjónustu í gegnum HTTP, HTTPS, DNS, TCP, ICMP. Í þessari grein mun ég sýna þér hvernig á að setja upp HTTP/HTTPS eftirlit með Blackbox útflytjanda. Við munum opna Blackbox útflytjanda í Kubernetes.

Umhverfið

Við munum þurfa eftirfarandi:

  • Kubernetes
  • Prometheus rekstraraðili

Blackbox stillingar útflytjanda

Stilla Blackbox í gegnum ConfigMap fyrir stillingar http Vöktunareining fyrir vefþjónustu.

apiVersion: v1
kind: ConfigMap
metadata:
  name: prometheus-blackbox-exporter
  labels:
    app: prometheus-blackbox-exporter
data:
  blackbox.yaml: |
    modules:
      http_2xx:
        http:
          no_follow_redirects: false
          preferred_ip_protocol: ip4
          valid_http_versions:
          - HTTP/1.1
          - HTTP/2
          valid_status_codes: []
        prober: http
        timeout: 5s

Module http_2xx notað til að athuga hvort vefþjónustan skili HTTP 2xx stöðukóða. Uppsetningu blackbox útflytjanda er lýst nánar í skjöl.

Sendir blackbox útflytjanda í Kubernetes klasa

Lýsa Deployment и Service til dreifingar í Kubernetes.

---
kind: Service
apiVersion: v1
metadata:
  name: prometheus-blackbox-exporter
  labels:
    app: prometheus-blackbox-exporter
spec:
  type: ClusterIP
  ports:
    - name: http
      port: 9115
      protocol: TCP
  selector:
    app: prometheus-blackbox-exporter

---
apiVersion: apps/v1
kind: Deployment
metadata:
  name: prometheus-blackbox-exporter
  labels:
    app: prometheus-blackbox-exporter
spec:
  replicas: 1
  selector:
    matchLabels:
      app: prometheus-blackbox-exporter
  template:
    metadata:
      labels:
        app: prometheus-blackbox-exporter
    spec:
      restartPolicy: Always
      containers:
        - name: blackbox-exporter
          image: "prom/blackbox-exporter:v0.15.1"
          imagePullPolicy: IfNotPresent
          securityContext:
            readOnlyRootFilesystem: true
            runAsNonRoot: true
            runAsUser: 1000
          args:
            - "--config.file=/config/blackbox.yaml"
          resources:
            {}
          ports:
            - containerPort: 9115
              name: http
          livenessProbe:
            httpGet:
              path: /health
              port: http
          readinessProbe:
            httpGet:
              path: /health
              port: http
          volumeMounts:
            - mountPath: /config
              name: config
        - name: configmap-reload
          image: "jimmidyson/configmap-reload:v0.2.2"
          imagePullPolicy: "IfNotPresent"
          securityContext:
            runAsNonRoot: true
            runAsUser: 65534
          args:
            - --volume-dir=/etc/config
            - --webhook-url=http://localhost:9115/-/reload
          resources:
            {}
          volumeMounts:
            - mountPath: /etc/config
              name: config
              readOnly: true
      volumes:
        - name: config
          configMap:
            name: prometheus-blackbox-exporter

Hægt er að nota Blackbox útflytjanda með eftirfarandi skipun. Nafnarými monitoring vísar til Prometheus Operator.

kubectl --namespace=monitoring apply -f blackbox-exporter.yaml

Gakktu úr skugga um að allar þjónustur séu í gangi með því að nota eftirfarandi skipun:

kubectl --namespace=monitoring get all --selector=app=prometheus-blackbox-exporter

Blackbox athuga

Þú getur fengið aðgang að Blackbox útflytjanda vefviðmótinu með því að nota port-forward:

kubectl --namespace=monitoring port-forward svc/prometheus-blackbox-exporter 9115:9115

Tengstu við Blackbox útflytjanda vefviðmótið í gegnum vafra á localhost: 9115.

Prometheus: HTTP eftirlit með Blackbox útflytjanda

Ef þú ferð á heimilisfangið http://localhost:9115/probe?module=http_2xx&target=https://www.google.com, munt þú sjá niðurstöðuna af því að athuga tilgreinda vefslóð (https://www.google.com).

Prometheus: HTTP eftirlit með Blackbox útflytjanda

Metragildi probe_success jafnt og 1 þýðir árangursríka athugun. Gildið 0 gefur til kynna villu.

Uppsetning Prometheus

Eftir að hafa sett upp BlackBox útflytjanda stillum við Prometheus inn prometheus-additional.yaml.

- job_name: 'kube-api-blackbox'
  scrape_interval: 1w
  metrics_path: /probe
  params:
    module: [http_2xx]
  static_configs:
   - targets:
      - https://www.google.com
      - http://www.example.com
      - https://prometheus.io
  relabel_configs:
   - source_labels: [__address__]
     target_label: __param_target
   - source_labels: [__param_target]
     target_label: instance
   - target_label: __address__
     replacement: prometheus-blackbox-exporter:9115 # The blackbox exporter.

Við búum til Secretmeð eftirfarandi skipun.

PROMETHEUS_ADD_CONFIG=$(cat prometheus-additional.yaml | base64)
cat << EOF | kubectl --namespace=monitoring apply -f -
apiVersion: v1
kind: Secret
metadata:
  name: additional-scrape-configs
type: Opaque
data:
  prometheus-additional.yaml: $PROMETHEUS_ADD_CONFIG
EOF

Við gefum til kynna additional-scrape-configs fyrir Prometheus Operator að nota additionalScrapeConfigs.

kubectl --namespace=monitoring edit prometheuses k8s
...
spec:
  additionalScrapeConfigs:
    key: prometheus-additional.yaml
    name: additional-scrape-configs

Við förum í Prometheus vefviðmótið og skoðum mælikvarða og markmið.

kubectl --namespace=monitoring port-forward svc/prometheus-k8s 9090:9090

Prometheus: HTTP eftirlit með Blackbox útflytjanda

Prometheus: HTTP eftirlit með Blackbox útflytjanda

Við sjáum mælikvarða og markmið Blackbox.

Bætir við reglum fyrir tilkynningar (viðvörun)

Til að fá tilkynningar frá Blackbox útflytjanda munum við bæta reglum við Prometheus Operator.

kubectl --namespace=monitoring edit prometheusrules prometheus-k8s-rules
...
  - name: blackbox-exporter
    rules:
    - alert: ProbeFailed
      expr: probe_success == 0
      for: 5m
      labels:
        severity: error
      annotations:
        summary: "Probe failed (instance {{ $labels.instance }})"
        description: "Probe failedn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: SlowProbe
      expr: avg_over_time(probe_duration_seconds[1m]) > 1
      for: 5m
      labels:
        severity: warning
      annotations:
        summary: "Slow probe (instance {{ $labels.instance }})"
        description: "Blackbox probe took more than 1s to completen  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: HttpStatusCode
      expr: probe_http_status_code <= 199 OR probe_http_status_code >= 400
      for: 5m
      labels:
        severity: error
      annotations:
        summary: "HTTP Status Code (instance {{ $labels.instance }})"
        description: "HTTP status code is not 200-399n  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: SslCertificateWillExpireSoon
      expr: probe_ssl_earliest_cert_expiry - time() < 86400 * 30
      for: 5m
      labels:
        severity: warning
      annotations:
        summary: "SSL certificate will expire soon (instance {{ $labels.instance }})"
        description: "SSL certificate expires in 30 daysn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: SslCertificateHasExpired
      expr: probe_ssl_earliest_cert_expiry - time()  <= 0
      for: 5m
      labels:
        severity: error
      annotations:
        summary: "SSL certificate has expired (instance {{ $labels.instance }})"
        description: "SSL certificate has expired alreadyn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: HttpSlowRequests
      expr: avg_over_time(probe_http_duration_seconds[1m]) > 1
      for: 5m
      labels:
        severity: warning
      annotations:
        summary: "HTTP slow requests (instance {{ $labels.instance }})"
        description: "HTTP request took more than 1sn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: SlowPing
      expr: avg_over_time(probe_icmp_duration_seconds[1m]) > 1
      for: 5m
      labels:
        severity: warning
      annotations:
        summary: "Slow ping (instance {{ $labels.instance }})"
        description: "Blackbox ping took more than 1sn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"

Í Prometheus vefviðmótinu, farðu í Staða => Reglur og finndu viðvörunarreglur fyrir blackbox-exporter.

Prometheus: HTTP eftirlit með Blackbox útflytjanda

Stilling Kubernetes API Server SSL Certificate Rennun tilkynningar

Við skulum stilla Kubernetes API Server SSL-vottorð fyrningar. Það mun senda tilkynningar einu sinni í viku.

Bætir við Blackbox útflutningseiningunni fyrir Kubernetes API Server Authentication.

kubectl --namespace=monitoring edit configmap prometheus-blackbox-exporter
...
      kube-api:
        http:
          method: GET
          no_follow_redirects: false
          preferred_ip_protocol: ip4
          tls_config:
            insecure_skip_verify: false
            ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
          bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
          valid_http_versions:
          - HTTP/1.1
          - HTTP/2
          valid_status_codes: []
        prober: http
        timeout: 5s

Bætir við Prometheus skrapstillingu

- job_name: 'kube-api-blackbox'
  metrics_path: /probe
  params:
    module: [kube-api]
  static_configs:
   - targets:
      - https://kubernetes.default.svc/api
  relabel_configs:
   - source_labels: [__address__]
     target_label: __param_target
   - source_labels: [__param_target]
     target_label: instance
   - target_label: __address__
     replacement: prometheus-blackbox-exporter:9115 # The blackbox exporter.

Að nota Prometheus Secret

PROMETHEUS_ADD_CONFIG=$(cat prometheus-additional.yaml | base64)
cat << EOF | kubectl --namespace=monitoring apply -f -
apiVersion: v1
kind: Secret
metadata:
  name: additional-scrape-configs
type: Opaque
data:
  prometheus-additional.yaml: $PROMETHEUS_ADD_CONFIG
EOF

Bætir viðvörunarreglum við

kubectl --namespace=monitoring edit prometheusrules prometheus-k8s-rules
...
  - name: k8s-api-server-cert-expiry
    rules:
    - alert: K8sAPIServerSSLCertExpiringAfterThreeMonths
      expr: probe_ssl_earliest_cert_expiry{job="kube-api-blackbox"} - time() < 86400 * 90 
      for: 1w
      labels:
        severity: warning
      annotations:
        summary: "Kubernetes API Server SSL certificate will expire after three months (instance {{ $labels.instance }})"
        description: "Kubernetes API Server SSL certificate expires in 90 daysn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"

gagnlegir krækjur

Vöktun og innskráning í Docker

Heimild: www.habr.com