Grafana Open-Code OnCall Incident Response System

Grafana Labs-ը, որը մշակում է Grafana տվյալների վիզուալիզացիայի հարթակը և Prometheus մոնիտորինգի համակարգը, հայտարարեց OnCall միջադեպերի արձագանքման համակարգի բաց կոդով, որը նախատեսված է ապահովելու, որ թիմերը միասին աշխատեն միջադեպերը վերացնելու և վերլուծելու համար: OnCall-ը նախկինում առաքվում էր որպես սեփականության արտադրանք և ձեռք էր բերվել Grafana-ի կողմից՝ Amixr Inc. անցած տարի. Ծրագրի կոդը գրված է Python-ով և բաց է AGPLv3 լիցենզիայի ներքո:

Համակարգը թույլ է տալիս հավաքել տեղեկատվություն մոնիտորինգի տարբեր համակարգերից անոմալիաների և իրադարձությունների մասին, այնուհետև ավտոմատ կերպով խմբավորել տվյալները, ուղարկել ծանուցումներ պատասխանատու խմբերին և հետևել խնդրի լուծման կարգավիճակին: Աջակցվում է Grafana, Prometheus, AlertManager և Zabbix մոնիտորինգի համակարգերի հետ ինտեգրումը: Մանր և աննշան իրադարձությունները զտվում են մոնիտորինգի համակարգերից ստացված տեղեկատվությունից, կրկնօրինակները համախմբվում են և բացառվում են խնդիրները, որոնք հնարավոր է լուծել առանց մարդու միջամտության:

Ավելորդ տեղեկատվական աղմուկից մաքրված նշանակալի իրադարձություններն ուղարկվում են ծանուցումների ուղարկման ենթահամակարգ, որը նույնականացնում է աշխատողներին, ովքեր պատասխանատու են խնդիրների հայտնաբերված կատեգորիաների լուծման համար և ուղարկում ծանուցումներ՝ հաշվի առնելով նրանց աշխատանքային գրաֆիկը և զբաղվածության աստիճանը (գնահատվում են ժամանակացույցի տվյալները): Աջակցվում է տարբեր աշխատակիցների միջև միջադեպերի կապակցման ռոտացիան և առանձնապես կարևոր կամ չլուծված խնդիրների սրումը թիմի այլ անդամներին կամ ավելի բարձր մակարդակի աշխատակիցներին:

Grafana Open-Code OnCall Incident Response System

Կախված միջադեպի ծանրությունից՝ ծանուցումները կարող են ուղարկվել հեռախոսազանգերի, SMS-ների, էլ. Միևնույն ժամանակ Slack-ը կարող է ավտոմատ կերպով ստեղծել ալիքներ՝ միջադեպի լուծման հետ կապված հարցերի քննարկման համար, որոնց ավտոմատ կերպով միացված են ինչպես առանձին աշխատակիցներ, այնպես էլ ամբողջ թիմեր։

Համակարգն ապահովում է ընդլայնման և հարմարեցման ճկուն տարբերակներ (օրինակ, դուք կարող եք հարմարեցնել իրադարձությունների խմբավորումը և ուղղորդումը ձեր նախասիրություններին համապատասխան, սահմանել կանոններ և ալիքներ ծանուցումների առաքման համար): Արտաքին համակարգերի հետ ինտեգրվելու համար տրամադրվում է API և Terraform աջակցություն: Աշխատանքի կառավարումն իրականացվում է վեբ-ինտերֆեյսի միջոցով:

Grafana Open-Code OnCall Incident Response System


Source: opennet.ru

Добавить комментарий