Prometheus: د بلیک باکس صادرونکي له لارې HTTP څارنه

سلام و ټولو ته. د می په میاشت کې OTUS پیل کیږي د څارنې او ننوتلو ورکشاپ، دواړه زیربناوې او غوښتنلیکونه د Zabbix، Prometheus، Grafana او ELK په کارولو سره. په دې اړه، موږ په دودیز ډول د موضوع په اړه ګټور مواد شریکوو.

د بلیک باکس صادرونکی د Prometheus لپاره تاسو ته اجازه درکوي د HTTP، HTTPS، DNS، TCP، ICMP له لارې د بهرنیو خدماتو څارنه پلي کړئ. پدې مقاله کې ، زه به تاسو ته وښیم چې څنګه د بلیک باکس صادرونکي په کارولو سره د HTTP/HTTPS نظارت تنظیم کړئ. موږ به په کبرنیټس کې د بلیک باکس صادرونکی پیل کړو.

چاپیریال

موږ به لاندې ته اړتیا ولرو:

  • کوبنیټس
  • د پرومیتیوس آپریټر

د صادرونکي بلیک باکس ترتیب

د بلیک باکس له لارې تنظیم کول ConfigMap د ترتیباتو لپاره http د ویب خدماتو نظارت ماډل.

apiVersion: v1
kind: ConfigMap
metadata:
  name: prometheus-blackbox-exporter
  labels:
    app: prometheus-blackbox-exporter
data:
  blackbox.yaml: |
    modules:
      http_2xx:
        http:
          no_follow_redirects: false
          preferred_ip_protocol: ip4
          valid_http_versions:
          - HTTP/1.1
          - HTTP/2
          valid_status_codes: []
        prober: http
        timeout: 5s

انډول http_2xx د چک کولو لپاره کارول کیږي چې ویب خدمت د HTTP 2xx حالت کوډ بیرته راولي. د بلیک باکس صادرونکي تشکیلات په ډیر تفصیل سره تشریح شوي اسناد.

د کبرنیټس کلستر ته د بلیک باکس صادرونکي ځای په ځای کول

بیان کړئ Deployment и Service په Kubernetes کې د ځای پرځای کولو لپاره.

---
kind: Service
apiVersion: v1
metadata:
  name: prometheus-blackbox-exporter
  labels:
    app: prometheus-blackbox-exporter
spec:
  type: ClusterIP
  ports:
    - name: http
      port: 9115
      protocol: TCP
  selector:
    app: prometheus-blackbox-exporter

---
apiVersion: apps/v1
kind: Deployment
metadata:
  name: prometheus-blackbox-exporter
  labels:
    app: prometheus-blackbox-exporter
spec:
  replicas: 1
  selector:
    matchLabels:
      app: prometheus-blackbox-exporter
  template:
    metadata:
      labels:
        app: prometheus-blackbox-exporter
    spec:
      restartPolicy: Always
      containers:
        - name: blackbox-exporter
          image: "prom/blackbox-exporter:v0.15.1"
          imagePullPolicy: IfNotPresent
          securityContext:
            readOnlyRootFilesystem: true
            runAsNonRoot: true
            runAsUser: 1000
          args:
            - "--config.file=/config/blackbox.yaml"
          resources:
            {}
          ports:
            - containerPort: 9115
              name: http
          livenessProbe:
            httpGet:
              path: /health
              port: http
          readinessProbe:
            httpGet:
              path: /health
              port: http
          volumeMounts:
            - mountPath: /config
              name: config
        - name: configmap-reload
          image: "jimmidyson/configmap-reload:v0.2.2"
          imagePullPolicy: "IfNotPresent"
          securityContext:
            runAsNonRoot: true
            runAsUser: 65534
          args:
            - --volume-dir=/etc/config
            - --webhook-url=http://localhost:9115/-/reload
          resources:
            {}
          volumeMounts:
            - mountPath: /etc/config
              name: config
              readOnly: true
      volumes:
        - name: config
          configMap:
            name: prometheus-blackbox-exporter

د بلیک باکس صادرونکی د لاندې کمانډ په کارولو سره ځای په ځای کیدی شي. نوم ځای monitoring د پرومیتیوس آپریټر ته اشاره کوي.

kubectl --namespace=monitoring apply -f blackbox-exporter.yaml

ډاډ ترلاسه کړئ چې ټول خدمتونه د لاندې کمانډ په کارولو سره روان دي:

kubectl --namespace=monitoring get all --selector=app=prometheus-blackbox-exporter

د تور بکس چک

تاسو کولی شئ په کارولو سره د بلیک باکس صادرونکي ویب انٹرفیس ته لاسرسی ومومئ port-forward:

kubectl --namespace=monitoring port-forward svc/prometheus-blackbox-exporter 9115:9115

د ویب براوزر له لارې د بلیک باکس صادرونکي ویب انٹرفیس سره وصل شئ ځایی لوسټ9115.

Prometheus: د بلیک باکس صادرونکي له لارې HTTP څارنه

که تاسو پته ته لاړ شئ http://localhost:9115/probe?module=http_2xx&target=https://www.google.com، تاسو به د ټاکل شوي URL چک کولو پایله وګورئ (https://www.google.com).

Prometheus: د بلیک باکس صادرونکي له لارې HTTP څارنه

میټریک ارزښت probe_success د 1 سره مساوي معنی لري بریالي چک. د 0 ارزښت یوه تېروتنه په ګوته کوي.

د پرومیتیوس تنظیم کول

د بلیک باکس صادرونکي له مینځه وړلو وروسته ، موږ پرومیټیوس تنظیم کوو prometheus-additional.yaml.

- job_name: 'kube-api-blackbox'
  scrape_interval: 1w
  metrics_path: /probe
  params:
    module: [http_2xx]
  static_configs:
   - targets:
      - https://www.google.com
      - http://www.example.com
      - https://prometheus.io
  relabel_configs:
   - source_labels: [__address__]
     target_label: __param_target
   - source_labels: [__param_target]
     target_label: instance
   - target_label: __address__
     replacement: prometheus-blackbox-exporter:9115 # The blackbox exporter.

موږ تولید کوو Secretد لاندې کمانډ په کارولو سره.

PROMETHEUS_ADD_CONFIG=$(cat prometheus-additional.yaml | base64)
cat << EOF | kubectl --namespace=monitoring apply -f -
apiVersion: v1
kind: Secret
metadata:
  name: additional-scrape-configs
type: Opaque
data:
  prometheus-additional.yaml: $PROMETHEUS_ADD_CONFIG
EOF

موږ اشاره کوو additional-scrape-configs د پرومیتیوس آپریټر کارولو لپاره additionalScrapeConfigs.

kubectl --namespace=monitoring edit prometheuses k8s
...
spec:
  additionalScrapeConfigs:
    key: prometheus-additional.yaml
    name: additional-scrape-configs

موږ د پرومیتیس ویب انٹرفیس ته ځو او میټریکونه او اهداف چیک کوو.

kubectl --namespace=monitoring port-forward svc/prometheus-k8s 9090:9090

Prometheus: د بلیک باکس صادرونکي له لارې HTTP څارنه

Prometheus: د بلیک باکس صادرونکي له لارې HTTP څارنه

موږ د بلیک باکس میټریکونه او اهداف ګورو.

د خبرتیاو لپاره قواعد اضافه کول (خبرتیا)

د بلیک باکس صادرونکي څخه خبرتیا ترلاسه کولو لپاره، موږ به د پرومیټیوس آپریټر ته قواعد اضافه کړو.

kubectl --namespace=monitoring edit prometheusrules prometheus-k8s-rules
...
  - name: blackbox-exporter
    rules:
    - alert: ProbeFailed
      expr: probe_success == 0
      for: 5m
      labels:
        severity: error
      annotations:
        summary: "Probe failed (instance {{ $labels.instance }})"
        description: "Probe failedn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: SlowProbe
      expr: avg_over_time(probe_duration_seconds[1m]) > 1
      for: 5m
      labels:
        severity: warning
      annotations:
        summary: "Slow probe (instance {{ $labels.instance }})"
        description: "Blackbox probe took more than 1s to completen  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: HttpStatusCode
      expr: probe_http_status_code <= 199 OR probe_http_status_code >= 400
      for: 5m
      labels:
        severity: error
      annotations:
        summary: "HTTP Status Code (instance {{ $labels.instance }})"
        description: "HTTP status code is not 200-399n  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: SslCertificateWillExpireSoon
      expr: probe_ssl_earliest_cert_expiry - time() < 86400 * 30
      for: 5m
      labels:
        severity: warning
      annotations:
        summary: "SSL certificate will expire soon (instance {{ $labels.instance }})"
        description: "SSL certificate expires in 30 daysn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: SslCertificateHasExpired
      expr: probe_ssl_earliest_cert_expiry - time()  <= 0
      for: 5m
      labels:
        severity: error
      annotations:
        summary: "SSL certificate has expired (instance {{ $labels.instance }})"
        description: "SSL certificate has expired alreadyn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: HttpSlowRequests
      expr: avg_over_time(probe_http_duration_seconds[1m]) > 1
      for: 5m
      labels:
        severity: warning
      annotations:
        summary: "HTTP slow requests (instance {{ $labels.instance }})"
        description: "HTTP request took more than 1sn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"
    - alert: SlowPing
      expr: avg_over_time(probe_icmp_duration_seconds[1m]) > 1
      for: 5m
      labels:
        severity: warning
      annotations:
        summary: "Slow ping (instance {{ $labels.instance }})"
        description: "Blackbox ping took more than 1sn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"

د پرومیټیوس ویب انٹرفیس کې، وضعیت => قواعد ته لاړ شئ او د بلیک باکس صادرونکي لپاره د خبرتیا قواعد ومومئ.

Prometheus: د بلیک باکس صادرونکي له لارې HTTP څارنه

د Kubernetes API سرور SSL سند د ختمیدو خبرتیاو تنظیم کول

راځئ چې د Kubernetes API سرور SSL سند د ختمیدو نظارت تنظیم کړو. دا به په اونۍ کې یو ځل خبرتیاوې واستوي.

د Kubernetes API سرور تصدیق لپاره د بلیک باکس صادرونکي ماډل اضافه کول.

kubectl --namespace=monitoring edit configmap prometheus-blackbox-exporter
...
      kube-api:
        http:
          method: GET
          no_follow_redirects: false
          preferred_ip_protocol: ip4
          tls_config:
            insecure_skip_verify: false
            ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
          bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
          valid_http_versions:
          - HTTP/1.1
          - HTTP/2
          valid_status_codes: []
        prober: http
        timeout: 5s

د پرومیتیوس سکریپ ترتیب اضافه کول

- job_name: 'kube-api-blackbox'
  metrics_path: /probe
  params:
    module: [kube-api]
  static_configs:
   - targets:
      - https://kubernetes.default.svc/api
  relabel_configs:
   - source_labels: [__address__]
     target_label: __param_target
   - source_labels: [__param_target]
     target_label: instance
   - target_label: __address__
     replacement: prometheus-blackbox-exporter:9115 # The blackbox exporter.

د Prometheus راز کارول

PROMETHEUS_ADD_CONFIG=$(cat prometheus-additional.yaml | base64)
cat << EOF | kubectl --namespace=monitoring apply -f -
apiVersion: v1
kind: Secret
metadata:
  name: additional-scrape-configs
type: Opaque
data:
  prometheus-additional.yaml: $PROMETHEUS_ADD_CONFIG
EOF

د خبرتیا قواعد اضافه کول

kubectl --namespace=monitoring edit prometheusrules prometheus-k8s-rules
...
  - name: k8s-api-server-cert-expiry
    rules:
    - alert: K8sAPIServerSSLCertExpiringAfterThreeMonths
      expr: probe_ssl_earliest_cert_expiry{job="kube-api-blackbox"} - time() < 86400 * 90 
      for: 1w
      labels:
        severity: warning
      annotations:
        summary: "Kubernetes API Server SSL certificate will expire after three months (instance {{ $labels.instance }})"
        description: "Kubernetes API Server SSL certificate expires in 90 daysn  VALUE = {{ $value }}n  LABELS: {{ $labels }}"

ګټور لینکونه

په ډاکر کې څارنه او ننوتل

سرچینه: www.habr.com