Prometheus: Мониторинги HTTP тавассути содиркунандаи Blackbox

Салом ба ҳама. Дар моҳи май OTUS оғоз меёбад семинар оид ба мониторинг ва бақайдгирӣ, ҳам инфрасохтор ва ҳам барномаҳо бо истифода аз Zabbix, Prometheus, Grafana ва ELK. Ба ин муносибат мо чун анъана дар мавзуъ материалхои муфидро мубодила мекунем.

содиркунандаи сиёҳ барои Prometheus ба шумо имкон медиҳад, ки мониторинги хидматҳои беруна тавассути HTTP, HTTPS, DNS, TCP, ICMP амалӣ карда шавад. Дар ин мақола, ман ба шумо нишон медиҳам, ки чӣ гуна мониторинги HTTP/HTTPS бо истифода аз содиркунандаи Blackbox танзим карда шавад. Мо содиркунандаи Blackbox-ро дар Кубернетес оғоз мекунем.

Муҳити зист

Мо ба инҳо ниёз дорем:

  • Кубернитель
  • Оператор Prometheus

Конфигуратсияи қуттии сиёҳи содиркунанда

Танзимоти Blackbox тавассути ConfigMap барои танзимот http модули мониторинги хидматҳои веб.

apiVersion: v1
kind: ConfigMap
metadata:
  name: prometheus-blackbox-exporter
  labels:
    app: prometheus-blackbox-exporter
data:
  blackbox.yaml: |
    modules:
      http_2xx:
        http:
          no_follow_redirects: false
          preferred_ip_protocol: ip4
          valid_http_versions:
          - HTTP/1.1
          - HTTP/2
          valid_status_codes: []
        prober: http
        timeout: 5s

Модул http_2xx барои тафтиш кардани он, ки хидмати веб рамзи ҳолати HTTP 2xx-ро бармегардонад, истифода мешавад. Конфигуратсияи содиркунандаи қуттии сиёҳ дар муфассалтар тавсиф шудааст хуччатхо.

Ҷойгир кардани як содиркунандаи қуттии сиёҳ ба кластери Kubernetes

Тавсиф кунед Deployment и Service барои ҷойгиркунӣ дар Кубернетес.

---
kind: Service
apiVersion: v1
metadata:
  name: prometheus-blackbox-exporter
  labels:
    app: prometheus-blackbox-exporter
spec:
  type: ClusterIP
  ports:
    - name: http
      port: 9115
      protocol: TCP
  selector:
    app: prometheus-blackbox-exporter

---
apiVersion: apps/v1
kind: Deployment
metadata:
  name: prometheus-blackbox-exporter
  labels:
    app: prometheus-blackbox-exporter
spec:
  replicas: 1
  selector:
    matchLabels:
      app: prometheus-blackbox-exporter
  template:
    metadata:
      labels:
        app: prometheus-blackbox-exporter
    spec:
      restartPolicy: Always
      containers:
        - name: blackbox-exporter
          image: "prom/blackbox-exporter:v0.15.1"
          imagePullPolicy: IfNotPresent
          securityContext:
            readOnlyRootFilesystem: true
            runAsNonRoot: true
            runAsUser: 1000
          args:
            - "--config.file=/config/blackbox.yaml"
          resources:
            {}
          ports:
            - containerPort: 9115
              name: http
          livenessProbe:
            httpGet:
              path: /health
              port: http
          readinessProbe:
            httpGet:
              path: /health
              port: http
          volumeMounts:
            - mountPath: /config
              name: config
        - name: configmap-reload
          image: "jimmidyson/configmap-reload:v0.2.2"
          imagePullPolicy: "IfNotPresent"
          securityContext:
            runAsNonRoot: true
            runAsUser: 65534
          args:
            - --volume-dir=/etc/config
            - --webhook-url=http://localhost:9115/-/reload
          resources:
            {}
          volumeMounts:
            - mountPath: /etc/config
              name: config
              readOnly: true
      volumes:
        - name: config
          configMap:
            name: prometheus-blackbox-exporter

Экспортгари Blackbox метавонад бо истифода аз фармони зерин ҷойгир карда шавад. Фазои ном monitoring ба оператори Prometheus ишора мекунад.

kubectl --namespace=monitoring apply -f blackbox-exporter.yaml

Боварӣ ҳосил кунед, ки ҳама хидматҳо бо фармони зерин кор мекунанд:

kubectl --namespace=monitoring get all --selector=app=prometheus-blackbox-exporter

Санҷиши қуттии сиёҳ

Шумо метавонед бо истифода аз интерфейси веби содиркунандаи Blackbox дастрасӣ пайдо кунед port-forward:

kubectl --namespace=monitoring port-forward svc/prometheus-blackbox-exporter 9115:9115

Ба интерфейси веби содиркунандаи Blackbox тавассути браузери веб дар localhost: 9115.

Prometheus: Мониторинги HTTP тавассути содиркунандаи Blackbox

Агар ба адрес равед http://localhost:9115/probe?module=http_2xx&target=https://www.google.com, шумо натиҷаи тафтиши URL-и муайяншударо хоҳед дид (https://www.google.com).

Prometheus: Мониторинги HTTP тавассути содиркунандаи Blackbox

Арзиши метрикӣ probe_success баробар ба 1 маънои санҷиши муваффақро дорад. Қимати 0 хатогиро нишон медиҳад.

Насб кардани Prometheus

Пас аз ҷойгиркунии содиркунандаи BlackBox, мо Prometheus-ро дар prometheus-additional.yaml.

- job_name: 'kube-api-blackbox'
  scrape_interval: 1w
  metrics_path: /probe
  params:
    module: [http_2xx]
  static_configs:
   - targets:
      - https://www.google.com
      - http://www.example.com
      - https://prometheus.io
  relabel_configs:
   - source_labels: [__address__]
     target_label: __param_target
   - source_labels: [__param_target]
     target_label: instance
   - target_label: __address__
     replacement: prometheus-blackbox-exporter:9115 # The blackbox exporter.

Мо тавлид мекунем Secretбо истифода аз фармони зерин.

PROMETHEUS_ADD_CONFIG=$(cat prometheus-additional.yaml | base64)
cat << EOF | kubectl --namespace=monitoring apply -f -
apiVersion: v1
kind: Secret
metadata:
  name: additional-scrape-configs
type: Opaque
data:
  prometheus-additional.yaml: $PROMETHEUS_ADD_CONFIG
EOF

Нишон диҳед additional-scrape-configs барои Prometheus Operator истифода additionalScrapeConfigs.

kubectl --namespace=monitoring edit prometheuses k8s
...
spec:
  additionalScrapeConfigs:
    key: prometheus-additional.yaml
    name: additional-scrape-configs

Мо ба интерфейси веб Prometheus меравем ва ченакҳо ва ҳадафҳоро тафтиш мекунем.

kubectl --namespace=monitoring port-forward svc/prometheus-k8s 9090:9090

Prometheus: Мониторинги HTTP тавассути содиркунандаи Blackbox

Prometheus: Мониторинги HTTP тавассути содиркунандаи Blackbox

Мо ченакҳо ва ҳадафҳои Blackbox-ро мебинем.

Илова кардани қоидаҳо барои огоҳиҳо (огоҳӣ)

Барои гирифтани огоҳиномаҳо аз содиркунандаи Blackbox, мо ба Prometheus Operator қоидаҳо илова мекунем.

kubectl --namespace=monitoring edit prometheusrules prometheus-k8s-rules
...
  - name: blackbox-exporter
    rules:
    - alert: ProbeFailed
      expr: probe_success == 0
      for: 5m
      labels:
        severity: error
      annotations:
        summary: "Probe failed (instance {{ $labels.instance }})"
        description: "Probe failedn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: SlowProbe
      expr: avg_over_time(probe_duration_seconds[1m]) > 1
      for: 5m
      labels:
        severity: warning
      annotations:
        summary: "Slow probe (instance {{ $labels.instance }})"
        description: "Blackbox probe took more than 1s to completen  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: HttpStatusCode
      expr: probe_http_status_code <= 199 OR probe_http_status_code >= 400
      for: 5m
      labels:
        severity: error
      annotations:
        summary: "HTTP Status Code (instance {{ $labels.instance }})"
        description: "HTTP status code is not 200-399n  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: SslCertificateWillExpireSoon
      expr: probe_ssl_earliest_cert_expiry - time() < 86400 * 30
      for: 5m
      labels:
        severity: warning
      annotations:
        summary: "SSL certificate will expire soon (instance {{ $labels.instance }})"
        description: "SSL certificate expires in 30 daysn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: SslCertificateHasExpired
      expr: probe_ssl_earliest_cert_expiry - time()  <= 0
      for: 5m
      labels:
        severity: error
      annotations:
        summary: "SSL certificate has expired (instance {{ $labels.instance }})"
        description: "SSL certificate has expired alreadyn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: HttpSlowRequests
      expr: avg_over_time(probe_http_duration_seconds[1m]) > 1
      for: 5m
      labels:
        severity: warning
      annotations:
        summary: "HTTP slow requests (instance {{ $labels.instance }})"
        description: "HTTP request took more than 1sn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: SlowPing
      expr: avg_over_time(probe_icmp_duration_seconds[1m]) > 1
      for: 5m
      labels:
        severity: warning
      annotations:
        summary: "Slow ping (instance {{ $labels.instance }})"
        description: "Blackbox ping took more than 1sn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"

Дар веб-интерфейси Prometheus, ба Статус => Қоидаҳо гузаред ва қоидаҳои ҳушдорро барои сиёҳ-экспортёр пайдо кунед.

Prometheus: Мониторинги HTTP тавассути содиркунандаи Blackbox

Танзими огоҳиҳои ба охир расидани сертификати Kubernetes API Server SSL

Биёед мониторинги ба охир расидани мӯҳлати сертификати Kubernetes API Server SSL-ро танзим кунем. Он дар як ҳафта як маротиба огоҳинома мефиристад.

Илова кардани модули содиркунандаи Blackbox барои Authentication Server Kubernetes API.

kubectl --namespace=monitoring edit configmap prometheus-blackbox-exporter
...
      kube-api:
        http:
          method: GET
          no_follow_redirects: false
          preferred_ip_protocol: ip4
          tls_config:
            insecure_skip_verify: false
            ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
          bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
          valid_http_versions:
          - HTTP/1.1
          - HTTP/2
          valid_status_codes: []
        prober: http
        timeout: 5s

Илова кардани конфигуратсияи scrape Prometheus

- job_name: 'kube-api-blackbox'
  metrics_path: /probe
  params:
    module: [kube-api]
  static_configs:
   - targets:
      - https://kubernetes.default.svc/api
  relabel_configs:
   - source_labels: [__address__]
     target_label: __param_target
   - source_labels: [__param_target]
     target_label: instance
   - target_label: __address__
     replacement: prometheus-blackbox-exporter:9115 # The blackbox exporter.

Истифодаи сирри Prometheus

PROMETHEUS_ADD_CONFIG=$(cat prometheus-additional.yaml | base64)
cat << EOF | kubectl --namespace=monitoring apply -f -
apiVersion: v1
kind: Secret
metadata:
  name: additional-scrape-configs
type: Opaque
data:
  prometheus-additional.yaml: $PROMETHEUS_ADD_CONFIG
EOF

Илова кардани қоидаҳои огоҳӣ

kubectl --namespace=monitoring edit prometheusrules prometheus-k8s-rules
...
  - name: k8s-api-server-cert-expiry
    rules:
    - alert: K8sAPIServerSSLCertExpiringAfterThreeMonths
      expr: probe_ssl_earliest_cert_expiry{job="kube-api-blackbox"} - time() < 86400 * 90 
      for: 1w
      labels:
        severity: warning
      annotations:
        summary: "Kubernetes API Server SSL certificate will expire after three months (instance {{ $labels.instance }})"
        description: "Kubernetes API Server SSL certificate expires in 90 daysn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"

Пайвандҳои муфид

Мониторинг ва воридшавӣ дар Docker

Манбаъ: will.com