рдкреНрд░реЛрдореЗрдерд┐рдпрд╕: рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рдорд╛рд░реНрдлрдд HTTP рдирд┐рдЧрд░рд╛рдиреА

рдирдорд╕реНрддреЗ рд╕рдмреИред рдореЗ рдорд╛ OTUS рд╕реБрд░реБ рд╣реБрдиреНрдЫ рдЕрдиреБрдЧрдорди рд░ рд▓рдЧрд┐рдЩ рдХрд╛рд░реНрдпрд╢рд╛рд▓рд╛, Zabbix, Prometheus, Grafana рд░ ELK рдкреНрд░рдпреЛрдЧ рдЧрд░реА рджреБрд╡реИ рдкреВрд░реНрд╡рд╛рдзрд╛рд░ рд░ рдЕрдиреБрдкреНрд░рдпреЛрдЧрд╣рд░реВред рдпрд╕ рд╕рдиреНрджрд░реНрднрдорд╛, рд╣рд╛рдореА рдкрд░рдореНрдкрд░рд╛рдЧрдд рд░реВрдкрдорд╛ рдпрд╕ рд╡рд┐рд╖рдпрдорд╛ рдЙрдкрдпреЛрдЧреА рд╕рд╛рдордЧреНрд░реА рд╕рд╛рдЭрд╛ рдЧрд░реНрдЫреМрдВред

рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ Prometheus рдХреЛ рд▓рд╛рдЧреА рддрдкрд╛рдИрдВрд▓рд╛рдИ HTTP, HTTPS, DNS, TCP, ICMP рдорд╛рд░реНрдлрдд рдмрд╛рд╣реНрдп рд╕реЗрд╡рд╛рд╣рд░реВрдХреЛ рдирд┐рдЧрд░рд╛рдиреА рд▓рд╛рдЧреВ рдЧрд░реНрди рдЕрдиреБрдорддрд┐ рджрд┐рдиреНрдЫред рдпрд╕ рд▓реЗрдЦрдорд╛, рдо рддрдкрд╛рдИрдВрд▓рд╛рдИ рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рдкреНрд░рдпреЛрдЧ рдЧрд░реЗрд░ HTTP/HTTPS рдирд┐рдЧрд░рд╛рдиреА рдХрд╕рд░реА рд╕реЗрдЯ рдЕрдк рдЧрд░реНрдиреЗ рднрдиреЗрд░ рджреЗрдЦрд╛рдЙрдиреЗрдЫреБред рд╣рд╛рдореА Kubernetes рдорд╛ Blackbox рдирд┐рд░реНрдпрд╛рддрдХ рд╕реБрд░реБ рдЧрд░реНрдиреЗрдЫреМрдВред

рд╡рд╛рддрд╛рд╡рд░рдг

рд╣рд╛рдореАрд▓рд╛рдИ рдирд┐рдореНрди рдЖрд╡рд╢реНрдпрдХ рд╣реБрдиреЗрдЫ:

  • рдХреБрдмрд░реНрдиреЗрдЯреНрд╕
  • рдкреНрд░реЛрдореЗрдерд┐рдпрд╕ рдЕрдкрд░реЗрдЯрд░

рдирд┐рд░реНрдпрд╛рддрдХ рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдХрдиреНрдлрд┐рдЧрд░реЗрд╕рди

рдорд╛рд░реНрдлрдд рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдХрдиреНрдлрд┐рдЧрд░ рдЧрд░реНрджреИ ConfigMap рд╕реЗрдЯрд┐рдЩрд╣рд░реВрдХреЛ рд▓рд╛рдЧрд┐ http рд╡реЗрдм рд╕реЗрд╡рд╛ рдирд┐рдЧрд░рд╛рдиреА рдореЛрдбреНрдпреБрд▓ред

apiVersion: v1
kind: ConfigMap
metadata:
  name: prometheus-blackbox-exporter
  labels:
    app: prometheus-blackbox-exporter
data:
  blackbox.yaml: |
    modules:
      http_2xx:
        http:
          no_follow_redirects: false
          preferred_ip_protocol: ip4
          valid_http_versions:
          - HTTP/1.1
          - HTTP/2
          valid_status_codes: []
        prober: http
        timeout: 5s

рдореЛрдбреНрдпреБрд▓ http_2xx рд╡реЗрдм рд╕реЗрд╡рд╛рд▓реЗ HTTP 2xx рд╕реНрдерд┐рддрд┐ рдХреЛрдб рдлрд░реНрдХрд╛рдЙрдБрдЫ рднрдиреЗрд░ рдЬрд╛рдБрдЪ рдЧрд░реНрди рдкреНрд░рдпреЛрдЧ рдЧрд░рд┐рдиреНрдЫред рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рдХрдиреНрдлрд┐рдЧрд░реЗрд╕рдирдорд╛ рдердк рд╡рд┐рд╡рд░рдгрдорд╛ рд╡рд░реНрдгрди рдЧрд░рд┐рдПрдХреЛ рдЫ рдХрд╛рдЧрдЬрд╛рдд.

Kubernetes рдХреНрд▓рд╕реНрдЯрд░рдорд╛ рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рддреИрдирд╛рде рдЧрд░реНрджреИ

рд╡рд░реНрдгрди рдЧрд░реНрдиреБрд╣реЛрд╕реН Deployment ╨╕ Service Kubernetes рдорд╛ рддреИрдирд╛рддреА рдХреЛ рд▓рд╛рдЧреАред

---
kind: Service
apiVersion: v1
metadata:
  name: prometheus-blackbox-exporter
  labels:
    app: prometheus-blackbox-exporter
spec:
  type: ClusterIP
  ports:
    - name: http
      port: 9115
      protocol: TCP
  selector:
    app: prometheus-blackbox-exporter

---
apiVersion: apps/v1
kind: Deployment
metadata:
  name: prometheus-blackbox-exporter
  labels:
    app: prometheus-blackbox-exporter
spec:
  replicas: 1
  selector:
    matchLabels:
      app: prometheus-blackbox-exporter
  template:
    metadata:
      labels:
        app: prometheus-blackbox-exporter
    spec:
      restartPolicy: Always
      containers:
        - name: blackbox-exporter
          image: "prom/blackbox-exporter:v0.15.1"
          imagePullPolicy: IfNotPresent
          securityContext:
            readOnlyRootFilesystem: true
            runAsNonRoot: true
            runAsUser: 1000
          args:
            - "--config.file=/config/blackbox.yaml"
          resources:
            {}
          ports:
            - containerPort: 9115
              name: http
          livenessProbe:
            httpGet:
              path: /health
              port: http
          readinessProbe:
            httpGet:
              path: /health
              port: http
          volumeMounts:
            - mountPath: /config
              name: config
        - name: configmap-reload
          image: "jimmidyson/configmap-reload:v0.2.2"
          imagePullPolicy: "IfNotPresent"
          securityContext:
            runAsNonRoot: true
            runAsUser: 65534
          args:
            - --volume-dir=/etc/config
            - --webhook-url=http://localhost:9115/-/reload
          resources:
            {}
          volumeMounts:
            - mountPath: /etc/config
              name: config
              readOnly: true
      volumes:
        - name: config
          configMap:
            name: prometheus-blackbox-exporter

рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рдирд┐рдореНрди рдЖрджреЗрд╢ рдкреНрд░рдпреЛрдЧ рдЧрд░реЗрд░ рддреИрдирд╛рдд рдЧрд░реНрди рд╕рдХрд┐рдиреНрдЫред рдиреЗрдорд╕реНрдкреЗрд╕ monitoring рдкреНрд░реЛрдорд┐рдерд┐рдпрд╕ рдЕрдкрд░реЗрдЯрд░рд▓рд╛рдИ рдмреБрдЭрд╛рдЙрдБрдЫред

kubectl --namespace=monitoring apply -f blackbox-exporter.yaml

рдирд┐рд╢реНрдЪрд┐рдд рдЧрд░реНрдиреБрд╣реЛрд╕реН рдХрд┐ рд╕рдмреИ рд╕реЗрд╡рд╛рд╣рд░реВ рдирд┐рдореНрди рдЖрджреЗрд╢ рдкреНрд░рдпреЛрдЧ рдЧрд░реЗрд░ рдЪрд▓рд┐рд░рд╣реЗрдХрд╛ рдЫрдиреН:

kubectl --namespace=monitoring get all --selector=app=prometheus-blackbox-exporter

рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдЬрд╛рдБрдЪ

рддрдкрд╛рдИрдВ рдкреНрд░рдпреЛрдЧ рдЧрд░реЗрд░ рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рд╡реЗрдм рдЗрдиреНрдЯрд░рдлреЗрд╕ рдкрд╣реБрдБрдЪ рдЧрд░реНрди рд╕рдХреНрдиреБрд╣реБрдиреНрдЫ port-forward:

kubectl --namespace=monitoring port-forward svc/prometheus-blackbox-exporter 9115:9115

рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдПрдХреНрд╕рдкреЛрд░реНрдЯрд░ рд╡реЗрдм рдЗрдиреНрдЯрд░рдлреЗрд╕рдорд╛ рд╡реЗрдм рдмреНрд░рд╛рдЙрдЬрд░ рдорд╛рд░реНрдлрдд рдЬрдбрд╛рди рдЧрд░реНрдиреБрд╣реЛрд╕реН рд▓реЛрдХрд▓рд╣реЛрд╕реНрдЯ: 9115ред

рдкреНрд░реЛрдореЗрдерд┐рдпрд╕: рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рдорд╛рд░реНрдлрдд HTTP рдирд┐рдЧрд░рд╛рдиреА

рдпрджрд┐ рддрдкрд╛рдИрдВ рдареЗрдЧрд╛рдирд╛рдорд╛ рдЬрд╛рдиреБрд╣реБрдиреНрдЫ http://localhost:9115/probe?module=http_2xx&target=https://www.google.com, рддрдкрд╛рдИрдВрд▓реЗ рдирд┐рд░реНрджрд┐рд╖реНрдЯ URL рдЬрд╛рдБрдЪрдХреЛ рдирддрд┐рдЬрд╛ рджреЗрдЦреНрдиреБрд╣реБрдиреЗрдЫ (https://www.google.com).

рдкреНрд░реЛрдореЗрдерд┐рдпрд╕: рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рдорд╛рд░реНрдлрдд HTTP рдирд┐рдЧрд░рд╛рдиреА

рдореЗрдЯреНрд░рд┐рдХ рдорд╛рди probe_success рдмрд░рд╛рдмрд░ 1 рднрдиреЗрдХреЛ рд╕рдлрд▓ рдЬрд╛рдБрдЪ рд╣реЛред реж рдХреЛ рдорд╛рдирд▓реЗ рддреНрд░реБрдЯрд┐рд▓рд╛рдИ рд╕рдВрдХреЗрдд рдЧрд░реНрдЫред

Prometheus рд╕реНрдерд╛рдкрдирд╛ рдЧрд░реНрджреИ

рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рддреИрдирд╛рдд рдЧрд░реЗрдкрдЫрд┐, рд╣рд╛рдореА рдкреНрд░реЛрдореЗрдерд┐рдпрд╕рд▓рд╛рдИ рдХрдиреНрдлрд┐рдЧрд░ рдЧрд░реНрдЫреМрдВ prometheus-additional.yaml.

- job_name: 'kube-api-blackbox'
  scrape_interval: 1w
  metrics_path: /probe
  params:
    module: [http_2xx]
  static_configs:
   - targets:
      - https://www.google.com
      - http://www.example.com
      - https://prometheus.io
  relabel_configs:
   - source_labels: [__address__]
     target_label: __param_target
   - source_labels: [__param_target]
     target_label: instance
   - target_label: __address__
     replacement: prometheus-blackbox-exporter:9115 # The blackbox exporter.

рд╣рд╛рдореА рдЙрддреНрдкрдиреНрди рдЧрд░реНрдЫреМрдВ Secretрдирд┐рдореНрди рдЖрджреЗрд╢ рдкреНрд░рдпреЛрдЧ рдЧрд░реЗрд░ред

PROMETHEUS_ADD_CONFIG=$(cat prometheus-additional.yaml | base64)
cat << EOF | kubectl --namespace=monitoring apply -f -
apiVersion: v1
kind: Secret
metadata:
  name: additional-scrape-configs
type: Opaque
data:
  prometheus-additional.yaml: $PROMETHEUS_ADD_CONFIG
EOF

рд╕рдВрдХреЗрдд additional-scrape-configs рдкреНрд░реЛрдореЗрдерд┐рдпрд╕ рдЕрдкрд░реЗрдЯрд░ рдХреЛ рд▓рд╛рдЧреА рдкреНрд░рдпреЛрдЧ рдЧрд░реА additionalScrapeConfigs.

kubectl --namespace=monitoring edit prometheuses k8s
...
spec:
  additionalScrapeConfigs:
    key: prometheus-additional.yaml
    name: additional-scrape-configs

рд╣рд╛рдореА рдкреНрд░реЛрдореЗрдерд┐рдпрд╕ рд╡реЗрдм рдЗрдиреНрдЯрд░рдлреЗрд╕рдорд╛ рдЬрд╛рдиреНрдЫреМрдВ рд░ рдореЗрдЯреНрд░рд┐рдХреНрд╕ рд░ рд▓рдХреНрд╖реНрдпрд╣рд░реВ рдЬрд╛рдБрдЪ рдЧрд░реНрдЫреМрдВред

kubectl --namespace=monitoring port-forward svc/prometheus-k8s 9090:9090

рдкреНрд░реЛрдореЗрдерд┐рдпрд╕: рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рдорд╛рд░реНрдлрдд HTTP рдирд┐рдЧрд░рд╛рдиреА

рдкреНрд░реЛрдореЗрдерд┐рдпрд╕: рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рдорд╛рд░реНрдлрдд HTTP рдирд┐рдЧрд░рд╛рдиреА

рд╣рд╛рдореА рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕рдХреЛ рдореЗрдЯреНрд░рд┐рдХреНрд╕ рд░ рд▓рдХреНрд╖реНрдпрд╣рд░реВ рджреЗрдЦреНрдЫреМрдВред

рд╕реВрдЪрдирд╛рд╣рд░реВрдХрд╛ рд▓рд╛рдЧрд┐ рдирд┐рдпрдорд╣рд░реВ рдердкреНрджреИ (рд╕реВрдЪрдирд╛)

рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХрд░реНрддрд╛рдмрд╛рдЯ рд╕реВрдЪрдирд╛рд╣рд░реВ рдкреНрд░рд╛рдкреНрдд рдЧрд░реНрди, рд╣рд╛рдореА Prometheus рдЕрдкрд░реЗрдЯрд░рдорд╛ рдирд┐рдпрдорд╣рд░реВ рдердкреНрдиреЗрдЫреМрдВред

kubectl --namespace=monitoring edit prometheusrules prometheus-k8s-rules
...
  - name: blackbox-exporter
    rules:
    - alert: ProbeFailed
      expr: probe_success == 0
      for: 5m
      labels:
        severity: error
      annotations:
        summary: "Probe failed (instance {{ $labels.instance }})"
        description: "Probe failedn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: SlowProbe
      expr: avg_over_time(probe_duration_seconds[1m]) > 1
      for: 5m
      labels:
        severity: warning
      annotations:
        summary: "Slow probe (instance {{ $labels.instance }})"
        description: "Blackbox probe took more than 1s to completen  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: HttpStatusCode
      expr: probe_http_status_code <= 199 OR probe_http_status_code >= 400
      for: 5m
      labels:
        severity: error
      annotations:
        summary: "HTTP Status Code (instance {{ $labels.instance }})"
        description: "HTTP status code is not 200-399n  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: SslCertificateWillExpireSoon
      expr: probe_ssl_earliest_cert_expiry - time() < 86400 * 30
      for: 5m
      labels:
        severity: warning
      annotations:
        summary: "SSL certificate will expire soon (instance {{ $labels.instance }})"
        description: "SSL certificate expires in 30 daysn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: SslCertificateHasExpired
      expr: probe_ssl_earliest_cert_expiry - time()  <= 0
      for: 5m
      labels:
        severity: error
      annotations:
        summary: "SSL certificate has expired (instance {{ $labels.instance }})"
        description: "SSL certificate has expired alreadyn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: HttpSlowRequests
      expr: avg_over_time(probe_http_duration_seconds[1m]) > 1
      for: 5m
      labels:
        severity: warning
      annotations:
        summary: "HTTP slow requests (instance {{ $labels.instance }})"
        description: "HTTP request took more than 1sn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: SlowPing
      expr: avg_over_time(probe_icmp_duration_seconds[1m]) > 1
      for: 5m
      labels:
        severity: warning
      annotations:
        summary: "Slow ping (instance {{ $labels.instance }})"
        description: "Blackbox ping took more than 1sn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"

рдкреНрд░реЛрдорд┐рдерд┐рдпрд╕ рд╡реЗрдм рдЗрдиреНрдЯрд░рдлреЗрд╕рдорд╛, рд╕реНрдерд┐рддрд┐ => рдирд┐рдпрдорд╣рд░реВрдорд╛ рдЬрд╛рдиреБрд╣реЛрд╕реН рд░ рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕-рдирд┐рд░реНрдпрд╛рддрдХрд░реНрддрд╛рдХреЛ рд▓рд╛рдЧрд┐ рд╕рддрд░реНрдХ рдирд┐рдпрдорд╣рд░реВ рдлреЗрд▓рд╛ рдкрд╛рд░реНрдиреБрд╣реЛрд╕реНред

рдкреНрд░реЛрдореЗрдерд┐рдпрд╕: рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рдорд╛рд░реНрдлрдд HTTP рдирд┐рдЧрд░рд╛рдиреА

Kubernetes API рд╕рд░реНрднрд░ SSL рдкреНрд░рдорд╛рдгрдкрддреНрд░ рд╕рдорд╛рдкреНрддрд┐ рд╕реВрдЪрдирд╛рд╣рд░реВ рдХрдиреНрдлрд┐рдЧрд░ рдЧрд░реНрджреИ

Kubernetes API рд╕рд░реНрднрд░ SSL рдкреНрд░рдорд╛рдгрдкрддреНрд░ рдореНрдпрд╛рдж рд╕рдорд╛рдкреНрддрд┐ рдЕрдиреБрдЧрдорди рдХрдиреНрдлрд┐рдЧрд░ рдЧрд░реМрдВред рдпрд╕рд▓реЗ рд╣рдкреНрддрд╛рдорд╛ рдПрдХ рдкрдЯрдХ рд╕реВрдЪрдирд╛рд╣рд░реВ рдкрдард╛рдЙрдиреЗрдЫред

Kubernetes API рд╕рд░реНрднрд░ рдкреНрд░рдорд╛рдгреАрдХрд░рдгрдХреЛ рд▓рд╛рдЧрд┐ рдмреНрд▓реНрдпрд╛рдХрдмрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рдореЛрдбреНрдпреБрд▓ рдердкреНрджреИред

kubectl --namespace=monitoring edit configmap prometheus-blackbox-exporter
...
      kube-api:
        http:
          method: GET
          no_follow_redirects: false
          preferred_ip_protocol: ip4
          tls_config:
            insecure_skip_verify: false
            ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
          bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
          valid_http_versions:
          - HTTP/1.1
          - HTTP/2
          valid_status_codes: []
        prober: http
        timeout: 5s

рдкреНрд░реЛрдореЗрдерд┐рдпрд╕ рд╕реНрдХреНрд░реНрдпрд╛рдк рдХрдиреНрдлрд┐рдЧрд░реЗрд╕рди рдердкреНрджреИ

- job_name: 'kube-api-blackbox'
  metrics_path: /probe
  params:
    module: [kube-api]
  static_configs:
   - targets:
      - https://kubernetes.default.svc/api
  relabel_configs:
   - source_labels: [__address__]
     target_label: __param_target
   - source_labels: [__param_target]
     target_label: instance
   - target_label: __address__
     replacement: prometheus-blackbox-exporter:9115 # The blackbox exporter.

рдкреНрд░реЛрдореЗрдерд┐рдпрд╕ рдЧреЛрдкреНрдп рдкреНрд░рдпреЛрдЧ рдЧрд░реНрджреИ

PROMETHEUS_ADD_CONFIG=$(cat prometheus-additional.yaml | base64)
cat << EOF | kubectl --namespace=monitoring apply -f -
apiVersion: v1
kind: Secret
metadata:
  name: additional-scrape-configs
type: Opaque
data:
  prometheus-additional.yaml: $PROMETHEUS_ADD_CONFIG
EOF

рдЕрд▓рд░реНрдЯ рдирд┐рдпрдорд╣рд░реВ рдердкреНрджреИ

kubectl --namespace=monitoring edit prometheusrules prometheus-k8s-rules
...
  - name: k8s-api-server-cert-expiry
    rules:
    - alert: K8sAPIServerSSLCertExpiringAfterThreeMonths
      expr: probe_ssl_earliest_cert_expiry{job="kube-api-blackbox"} - time() < 86400 * 90 
      for: 1w
      labels:
        severity: warning
      annotations:
        summary: "Kubernetes API Server SSL certificate will expire after three months (instance {{ $labels.instance }})"
        description: "Kubernetes API Server SSL certificate expires in 90 daysn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"

рдЙрдкрдпреЛрдЧреА рд▓рд┐рдЩреНрдХрд╣рд░реВ

рдбрдХрд░рдорд╛ рдирд┐рдЧрд░рд╛рдиреА рд░ рд▓рдЧрд┐рдЩ

рд╕реНрд░реЛрдд: www.habr.com