Grafana нээлттэй эх сурвалжийн OnCall ослын хариу арга хэмжээ авах систем

Графана мэдээллийн дүрслэл платформ болон Prometheus хяналтын системийг хөгжүүлдэг Grafana Labs нь ослыг шийдвэрлэх, дүн шинжилгээ хийхэд багуудын хамтын ажиллагааг идэвхжүүлэх зорилготой OnCall ослын хариу арга хэмжээний системийн нээлттэй эх сурвалжийг зарлалаа. OnCall-ийг өмнө нь өмчийн бүтээгдэхүүн болгон нийлүүлж байсан бөгөөд Grafana Amixr Inc-ийг худалдаж авсны нэг хэсэг болгон худалдаж авсан. өнгөрсөн жил. Төслийн код нь Python дээр бичигдсэн бөгөөд AGPLv3 лицензийн дагуу нээлттэй.

Энэхүү систем нь янз бүрийн хяналтын системээс гажуудал, үйл явдлын талаарх мэдээллийг цуглуулж, дараа нь өгөгдлийг автоматаар бүлэглэх, хариуцах бүлгүүдэд мэдэгдэл илгээх, асуудлын шийдлийн статусыг хянах боломжийг олгодог. Grafana, Prometheus, AlertManager, Zabbix хяналтын системтэй нэгтгэх нь дэмжигддэг. Хяналтын системээс хүлээн авсан мэдээллээс жижиг, ач холбогдолгүй үйл явдлуудыг шүүж, давхардлыг нэгтгэж, хүний ​​оролцоогүйгээр шийдвэрлэх боломжтой асуудлуудыг арилгадаг.

Илүүдэл мэдээллийн дуу чимээг арилгасан чухал үйл явдлуудыг мэдэгдэл илгээх дэд систем рүү илгээдэг бөгөөд энэ нь тодорхойлсон ангиллын асуудлыг шийдвэрлэх үүрэгтэй ажилчдыг тодорхойлж, тэдний ажлын хуваарь, ажил эрхлэлтийн зэргийг харгалзан мэдэгдэл илгээдэг (хуанли төлөвлөгчийн өгөгдлийг үнэлдэг). Янз бүрийн ажилчдын хооронд гарсан зөрчлийг сэлгэх, онцгой чухал эсвэл шийдэгдээгүй асуудлуудыг багийн бусад гишүүд эсвэл дээд түвшний ажилтнуудад хүргэхийг дэмждэг.

Grafana нээлттэй эх сурвалжийн OnCall ослын хариу арга хэмжээ авах систем

Үйл явдлын ноцтой байдлаас хамааран мэдэгдлийг утасны дуудлага, SMS, цахим шуудангаар илгээх, хуваарьт календарь дээр үйл явдал үүсгэх, Slack болон Telegram шуурхай мессенжерээр дамжуулан илгээх боломжтой. Үүний зэрэгцээ, Slack-д автоматаар сувгуудыг үүсгэж, бие даасан ажилчид болон бүхэл бүтэн баг автоматаар холбогдсон тохиолдлыг шийдвэрлэхтэй холбоотой асуудлуудыг хэлэлцэх боломжтой.

Систем нь өргөтгөх, тохируулах уян хатан сонголтуудыг өгдөг (жишээлбэл, та өөрийн сонголтод нийцүүлэн үйл явдлын бүлэглэл, чиглүүлэлт хийх, мэдэгдэл хүргэх дүрэм, сувгийг тодорхойлох боломжтой). API болон Terraform-ийн дэмжлэгийг гадны системтэй нэгтгэх зорилгоор хангадаг. Үйл ажиллагааг вэб интерфэйсээр удирддаг.

Grafana нээлттэй эх сурвалжийн OnCall ослын хариу арга хэмжээ авах систем


Эх сурвалж: opennet.ru

сэтгэгдэл нэмэх