Prometheus: Giám sát HTTP thông qua trình xuất Blackbox

Chào mọi người. Vào tháng XNUMX OTUS ra mắt hội thảo về giám sát và ghi nhật ký, cả cơ sở hạ tầng và ứng dụng sử dụng Zabbix, Prometheus, Grafana và ELK. Về vấn đề này, theo truyền thống, chúng tôi chia sẻ tài liệu hữu ích về chủ đề này.

Nhà xuất khẩu hộp đen cho Prometheus cho phép bạn triển khai giám sát các dịch vụ bên ngoài thông qua HTTP, HTTPS, DNS, TCP, ICMP. Trong bài viết này, tôi sẽ hướng dẫn bạn cách thiết lập giám sát HTTP/HTTPS bằng trình xuất Blackbox. Chúng tôi sẽ ra mắt trình xuất Blackbox trong Kubernetes.

Môi trường

Chúng tôi sẽ cần những điều sau đây:

  • Kubernetes
  • Nhà điều hành Prometheus

Cấu hình hộp đen của nhà xuất khẩu

Định cấu hình Blackbox thông qua ConfigMap để cài đặt http mô-đun giám sát dịch vụ web.

apiVersion: v1
kind: ConfigMap
metadata:
  name: prometheus-blackbox-exporter
  labels:
    app: prometheus-blackbox-exporter
data:
  blackbox.yaml: |
    modules:
      http_2xx:
        http:
          no_follow_redirects: false
          preferred_ip_protocol: ip4
          valid_http_versions:
          - HTTP/1.1
          - HTTP/2
          valid_status_codes: []
        prober: http
        timeout: 5s

Mô-đun http_2xx được sử dụng để kiểm tra xem dịch vụ web có trả về mã trạng thái HTTP 2xx hay không. Cấu hình trình xuất hộp đen được mô tả chi tiết hơn trong tài liệu.

Triển khai trình xuất hộp đen vào cụm Kubernetes

Mô tả Deployment и Service để triển khai trong Kubernetes.

---
kind: Service
apiVersion: v1
metadata:
  name: prometheus-blackbox-exporter
  labels:
    app: prometheus-blackbox-exporter
spec:
  type: ClusterIP
  ports:
    - name: http
      port: 9115
      protocol: TCP
  selector:
    app: prometheus-blackbox-exporter

---
apiVersion: apps/v1
kind: Deployment
metadata:
  name: prometheus-blackbox-exporter
  labels:
    app: prometheus-blackbox-exporter
spec:
  replicas: 1
  selector:
    matchLabels:
      app: prometheus-blackbox-exporter
  template:
    metadata:
      labels:
        app: prometheus-blackbox-exporter
    spec:
      restartPolicy: Always
      containers:
        - name: blackbox-exporter
          image: "prom/blackbox-exporter:v0.15.1"
          imagePullPolicy: IfNotPresent
          securityContext:
            readOnlyRootFilesystem: true
            runAsNonRoot: true
            runAsUser: 1000
          args:
            - "--config.file=/config/blackbox.yaml"
          resources:
            {}
          ports:
            - containerPort: 9115
              name: http
          livenessProbe:
            httpGet:
              path: /health
              port: http
          readinessProbe:
            httpGet:
              path: /health
              port: http
          volumeMounts:
            - mountPath: /config
              name: config
        - name: configmap-reload
          image: "jimmidyson/configmap-reload:v0.2.2"
          imagePullPolicy: "IfNotPresent"
          securityContext:
            runAsNonRoot: true
            runAsUser: 65534
          args:
            - --volume-dir=/etc/config
            - --webhook-url=http://localhost:9115/-/reload
          resources:
            {}
          volumeMounts:
            - mountPath: /etc/config
              name: config
              readOnly: true
      volumes:
        - name: config
          configMap:
            name: prometheus-blackbox-exporter

Trình xuất hộp đen có thể được triển khai bằng lệnh sau. Không gian tên monitoring đề cập đến Nhà điều hành Prometheus.

kubectl --namespace=monitoring apply -f blackbox-exporter.yaml

Đảm bảo tất cả các dịch vụ đang chạy bằng lệnh sau:

kubectl --namespace=monitoring get all --selector=app=prometheus-blackbox-exporter

Kiểm tra hộp đen

Bạn có thể truy cập giao diện web của nhà xuất khẩu Blackbox bằng cách sử dụng port-forward:

kubectl --namespace=monitoring port-forward svc/prometheus-blackbox-exporter 9115:9115

Kết nối với giao diện web của nhà xuất khẩu Blackbox thông qua trình duyệt web tại localhost: 9115.

Prometheus: Giám sát HTTP thông qua trình xuất Blackbox

Nếu bạn đến địa chỉ http://localhost:9115/probe?module=http_2xx&target=https://www.google.com, bạn sẽ thấy kết quả kiểm tra URL được chỉ định (https://www.google.com).

Prometheus: Giám sát HTTP thông qua trình xuất Blackbox

Giá trị số liệu probe_success bằng 1 nghĩa là kiểm tra thành công. Giá trị 0 cho biết có lỗi.

Thiết lập Prometheus

Sau khi triển khai trình xuất BlackBox, chúng tôi định cấu hình Prometheus trong prometheus-additional.yaml.

- job_name: 'kube-api-blackbox'
  scrape_interval: 1w
  metrics_path: /probe
  params:
    module: [http_2xx]
  static_configs:
   - targets:
      - https://www.google.com
      - http://www.example.com
      - https://prometheus.io
  relabel_configs:
   - source_labels: [__address__]
     target_label: __param_target
   - source_labels: [__param_target]
     target_label: instance
   - target_label: __address__
     replacement: prometheus-blackbox-exporter:9115 # The blackbox exporter.

Chúng tôi tạo ra Secretsử dụng lệnh sau.

PROMETHEUS_ADD_CONFIG=$(cat prometheus-additional.yaml | base64)
cat << EOF | kubectl --namespace=monitoring apply -f -
apiVersion: v1
kind: Secret
metadata:
  name: additional-scrape-configs
type: Opaque
data:
  prometheus-additional.yaml: $PROMETHEUS_ADD_CONFIG
EOF

Chỉ định additional-scrape-configs dành cho Người vận hành Prometheus bằng cách sử dụng additionalScrapeConfigs.

kubectl --namespace=monitoring edit prometheuses k8s
...
spec:
  additionalScrapeConfigs:
    key: prometheus-additional.yaml
    name: additional-scrape-configs

Chúng tôi truy cập giao diện web Prometheus và kiểm tra các số liệu và mục tiêu.

kubectl --namespace=monitoring port-forward svc/prometheus-k8s 9090:9090

Prometheus: Giám sát HTTP thông qua trình xuất Blackbox

Prometheus: Giám sát HTTP thông qua trình xuất Blackbox

Chúng tôi thấy các số liệu và mục tiêu của Blackbox.

Thêm quy tắc cho thông báo (cảnh báo)

Để nhận thông báo từ nhà xuất khẩu Blackbox, chúng tôi sẽ thêm các quy tắc cho Prometheus Operator.

kubectl --namespace=monitoring edit prometheusrules prometheus-k8s-rules
...
  - name: blackbox-exporter
    rules:
    - alert: ProbeFailed
      expr: probe_success == 0
      for: 5m
      labels:
        severity: error
      annotations:
        summary: "Probe failed (instance {{ $labels.instance }})"
        description: "Probe failedn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: SlowProbe
      expr: avg_over_time(probe_duration_seconds[1m]) > 1
      for: 5m
      labels:
        severity: warning
      annotations:
        summary: "Slow probe (instance {{ $labels.instance }})"
        description: "Blackbox probe took more than 1s to completen  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: HttpStatusCode
      expr: probe_http_status_code <= 199 OR probe_http_status_code >= 400
      for: 5m
      labels:
        severity: error
      annotations:
        summary: "HTTP Status Code (instance {{ $labels.instance }})"
        description: "HTTP status code is not 200-399n  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: SslCertificateWillExpireSoon
      expr: probe_ssl_earliest_cert_expiry - time() < 86400 * 30
      for: 5m
      labels:
        severity: warning
      annotations:
        summary: "SSL certificate will expire soon (instance {{ $labels.instance }})"
        description: "SSL certificate expires in 30 daysn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: SslCertificateHasExpired
      expr: probe_ssl_earliest_cert_expiry - time()  <= 0
      for: 5m
      labels:
        severity: error
      annotations:
        summary: "SSL certificate has expired (instance {{ $labels.instance }})"
        description: "SSL certificate has expired alreadyn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: HttpSlowRequests
      expr: avg_over_time(probe_http_duration_seconds[1m]) > 1
      for: 5m
      labels:
        severity: warning
      annotations:
        summary: "HTTP slow requests (instance {{ $labels.instance }})"
        description: "HTTP request took more than 1sn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: SlowPing
      expr: avg_over_time(probe_icmp_duration_seconds[1m]) > 1
      for: 5m
      labels:
        severity: warning
      annotations:
        summary: "Slow ping (instance {{ $labels.instance }})"
        description: "Blackbox ping took more than 1sn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"

Trong giao diện web Prometheus, đi tới Trạng thái => Quy tắc và tìm quy tắc cảnh báo cho blackbox-exporter.

Prometheus: Giám sát HTTP thông qua trình xuất Blackbox

Định cấu hình Thông báo hết hạn chứng chỉ SSL của máy chủ Kubernetes API

Hãy cấu hình giám sát hết hạn chứng chỉ SSL Kubernetes API Server. Nó sẽ gửi thông báo mỗi tuần một lần.

Thêm mô-đun xuất khẩu Blackbox cho Xác thực máy chủ API Kubernetes.

kubectl --namespace=monitoring edit configmap prometheus-blackbox-exporter
...
      kube-api:
        http:
          method: GET
          no_follow_redirects: false
          preferred_ip_protocol: ip4
          tls_config:
            insecure_skip_verify: false
            ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
          bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
          valid_http_versions:
          - HTTP/1.1
          - HTTP/2
          valid_status_codes: []
        prober: http
        timeout: 5s

Thêm cấu hình cạo Prometheus

- job_name: 'kube-api-blackbox'
  metrics_path: /probe
  params:
    module: [kube-api]
  static_configs:
   - targets:
      - https://kubernetes.default.svc/api
  relabel_configs:
   - source_labels: [__address__]
     target_label: __param_target
   - source_labels: [__param_target]
     target_label: instance
   - target_label: __address__
     replacement: prometheus-blackbox-exporter:9115 # The blackbox exporter.

Sử dụng bí mật Prometheus

PROMETHEUS_ADD_CONFIG=$(cat prometheus-additional.yaml | base64)
cat << EOF | kubectl --namespace=monitoring apply -f -
apiVersion: v1
kind: Secret
metadata:
  name: additional-scrape-configs
type: Opaque
data:
  prometheus-additional.yaml: $PROMETHEUS_ADD_CONFIG
EOF

Thêm quy tắc cảnh báo

kubectl --namespace=monitoring edit prometheusrules prometheus-k8s-rules
...
  - name: k8s-api-server-cert-expiry
    rules:
    - alert: K8sAPIServerSSLCertExpiringAfterThreeMonths
      expr: probe_ssl_earliest_cert_expiry{job="kube-api-blackbox"} - time() < 86400 * 90 
      for: 1w
      labels:
        severity: warning
      annotations:
        summary: "Kubernetes API Server SSL certificate will expire after three months (instance {{ $labels.instance }})"
        description: "Kubernetes API Server SSL certificate expires in 90 daysn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"

Liên kết hữu ích

Giám sát và đăng nhập Docker

Nguồn: www.habr.com