PublikÄcijÄs par HabrĆ© es jau rakstÄ«ju par savu pieredzi partnerattiecÄ«bu veidoÅ”anÄ ar savu komandu (
PaÅ”laik vadu jaunuzÅÄmumu MONQ Digital lab, kurÄ es un mana komanda izstrÄdÄjam produktu korporatÄ«vÄs IT atbalsta un darbÄ«bas procesu automatizÄÅ”anai. IeieÅ”ana tirgÅ« nav viegls uzdevums, un mÄs sÄkÄm ar nelielu mÄjasdarbu, izgÄjÄm cauri tirgus ekspertiem, mÅ«su partneriem un veicÄm tirgus segmentÄciju. Galvenais jautÄjums bija saprast "kuru sÄpes mÄs varam vislabÄk izÄrstÄt?"
Bankas iekļuva TOP 3 segmentos. Un, protams, pirmie sarakstÄ bija Tinkoff un Sberbank. Kad viesojÄmies pie banku tirgus ekspertiem, viÅi teica: ieviesiet tur savu produktu, un ceļŔ uz banku tirgu bÅ«s atvÄrts. MÄÄ£inÄjÄm iekļūt gan tur, gan tur, taÄu SberbankÄ mÅ«s gaidÄ«ja neveiksme, un Tinkoff puiÅ”i izrÄdÄ«jÄs daudz atvÄrtÄki produktÄ«vai komunikÄcijai ar Krievijas startupiem (varbÅ«t tÄpÄc, ka Sber tolaik
Ar darbÄ«bas un uzraudzÄ«bas jautÄjumiem nodarbojamies jau daudzus gadus, tagad savu produktu ievieÅ”am valsts sektorÄ, apdroÅ”inÄÅ”anÄ, bankÄs, telekomunikÄciju kompÄnijÄs, viena realizÄcija bija ar aviokompÄniju (pirms projekta pat neveicÄm domÄju, ka aviÄcija bija tik no IT atkarÄ«ga nozare, un tagad mÄs patieÅ”Äm ceram, neskatoties uz COVID, ka uzÅÄmums parÄdÄ«sies un pacelsies).
MÅ«su ražotais produkts pieder uzÅÄmuma programmatÅ«ras segmentam AIOps (mÄkslÄ«gais intelekts IT operÄcijÄm jeb ITOps). TÄdu sistÄmu ievieÅ”anas galvenie mÄrÄ·i, kÄ procesa brieduma lÄ«menis uzÅÄmumÄ paaugstinÄs:
- DzÄsiet ugunsgrÄkus: identificÄjiet kļūmes, attÄ«riet brÄ«dinÄjumu straumi no gruveÅ”iem, nododiet atbildÄ«gos uzdevumus un incidentus;
- PaaugstinÄt IT servisa efektivitÄti: samazinÄt incidentu risinÄÅ”anas laiku, norÄdÄ«t kļūmju cÄloÅus, palielinÄt IT statusa caurskatÄmÄ«bu;
- PaaugstinÄt biznesa efektivitÄti: samazinÄt roku darba apjomu, samazinÄt riskus, palielinÄt klientu lojalitÄti.
MÅ«su pieredze liecina, ka bankÄm ir Å”Ädas "sÄpes" ar monitoringu, kas ir kopÄ«gas ar visÄm lielajÄm IT infrastruktÅ«rÄm:
- ākas zina, koā: ir daudz tehnisko nodaļu, gandrÄ«z katram ir vismaz viena uzraudzÄ«bas sistÄma, un lielÄkajai daļai ir vairÄk nekÄ viena;
- BrÄ«dinÄjumu āmoskÄ«tu barsā: katra sistÄma Ä£enerÄ simtus un ar tiem bombardÄ visus atbildÄ«gos (dažreiz arÄ« starp nodaļÄm). Ir grÅ«ti pastÄvÄ«gi saglabÄt kontroles fokusu uz katru paziÅojumu, to steidzamÄ«ba un nozÄ«me ir izlÄ«dzinÄta lielÄ skaita dÄļ;
- lielÄs bankas ā sektora lÄ«deri vÄlas ne tikai nepÄrtraukti uzraudzÄ«t savas sistÄmas, zinÄt, kur ir atteices, bet arÄ« Ä«sto AI burvÄ«bu ā likt sistÄmÄm paÅ”pÄrraudzÄ«t, paÅ”prognozÄt un paÅ”labot.
Kad ieradÄmies uz pirmo tikÅ”anos Tinkoff, mums uzreiz teica, ka viÅiem nav nekÄdu problÄmu ar uzraudzÄ«bu un nekas nesÄp, un galvenais jautÄjums bija: "Ko mÄs varam piedÄvÄt tiem, kam jau klÄjas labi?"
Saruna bija gara, pÄrrunÄjÄm, kÄ tiek veidoti viÅu mikropakalpojumi, kÄ strÄdÄ nodaļas, kuras infrastruktÅ«ras problÄmas ir jÅ«tÄ«gÄkas, kuras mazÄk jÅ«tÄ«gas lietotÄjiem, kur ir āaklÄs zonasā, kÄdi ir to mÄrÄ·i un SLA.
Starp citu, bankas SLA ir patieÅ”Äm iespaidÄ«gi. PiemÄram, 1. prioritÄtes tÄ«kla pieejamÄ«bas incidenta atrisinÄÅ”ana var aizÅemt tikai dažas minÅ«tes. Kļūdu un dÄ«kstÄves izmaksas Å”eit, protams, ir iespaidÄ«gas.
RezultÄtÄ mÄs noteicÄm vairÄkas sadarbÄ«bas jomas:
- pirmais posms ir jumta uzraudzÄ«ba, lai palielinÄtu incidentu atrisinÄÅ”anas Ätrumu
- otrais posms ir procesu automatizÄcija, lai samazinÄtu riskus un samazinÄtu IT nodaļas mÄrogoÅ”anas izmaksas.
VairÄkus ābaltos plankumusā brÄ«dinÄjumu koÅ”Äs krÄsÄs varÄja iekrÄsot, tikai apstrÄdÄjot informÄciju no vairÄkÄm uzraudzÄ«bas sistÄmÄm, jo āānebija iespÄjams tieÅ”i Åemt metriku, kÄ arÄ« bija nepiecieÅ”ams centralizÄt datus no dažÄdÄm uzraudzÄ«bas sistÄmÄm āvienÄ ekrÄnÄā. lai saprastu kopÄjo ainu par notiekoÅ”o. āLietussargiā ir piemÄroti Å”im uzdevumam, un mÄs toreiz izpildÄ«jÄm Ŕīs prasÄ«bas.
Ä»oti svarÄ«ga lieta, mÅ«suprÄt, attiecÄ«bÄs ar klientiem ir godÄ«gums. PÄc pirmÄs sarunas un licences izmaksu aprÄÄ·inÄÅ”anas tika teikts, ka, tÄ kÄ izmaksas ir tik zemas, iespÄjams, ir vÄrts iegÄdÄties licenci uzreiz (salÄ«dzinot ar Dynatrace Klyuch-Astrom no raksta par zaļo banku, mÅ«su licence maksÄ nevis treÅ”daļu miljarda, bet 12 tÅ«kstoÅ”us rubļu mÄnesÄ« par 1 gigabaitu, Sberam tas izmaksÄtu vairÄkas reizes lÄtÄk). Bet mÄs viÅiem uzreiz pastÄstÄ«jÄm, kas mums ir un kas mums nav. VarbÅ«t tirdzniecÄ«bas pÄrstÄvis no liela integratora varÄtu teikt: āJÄ, mÄs varam visu, protams, iegÄdÄjieties mÅ«su licenciā, taÄu mÄs nolÄmÄm visas savas kartÄ«tes nolikt uz galda. PalaiÅ”anas brÄ«dÄ« mÅ«su kastÄ nebija integrÄcijas ar Prometheus, un drÄ«zumÄ tika izlaista jauna versija ar automatizÄcijas apakÅ”sistÄmu, taÄu mÄs to vÄl neesam nosÅ«tÄ«juÅ”i klientiem.
SÄkÄs pilotprojekts, tika noteiktas tÄ robežas un mums tika doti 2 mÄneÅ”i. Galvenie uzdevumi bija:
- sagatavot jaunu platformas versiju un izvietot to bankas infrastruktÅ«rÄ
- savienot 2 uzraudzÄ«bas sistÄmas (Zabbix un Prometheus);
- nosÅ«tÄ«t paziÅojumus atbildÄ«gajiem Slack un ar SMS palÄ«dzÄ«bu;
- palaist automÄtiskÄs dziedinÄÅ”anas skriptus.
Pilotprojekta pirmais mÄnesis pagÄja, gatavojot jaunu platformas versiju superÄtrÄ režīmÄ pilotprojekta vajadzÄ«bÄm. JaunÄ versija nekavÄjoties ietver integrÄciju ar Prometheus un automÄtisko dziedinÄÅ”anu. Pateicoties mÅ«su izstrÄdes komandai, viÅi vairÄkas naktis negulÄja, bet izpildÄ«ja to, ko solÄ«ja, nenokavÄjot termiÅus citÄm iepriekÅ” uzÅemtajÄm saistÄ«bÄm.
IzmÄÄ£inÄjuma iestatÄ«Å”anas laikÄ mÄs saskÄrÄmies ar jaunu problÄmu, kas varÄja slÄgt projektu pirms termiÅa: lai nosÅ«tÄ«tu brÄ«dinÄjumus tÅ«lÄ«tÄjiem ziÅojumapmaiÅas lÄ«dzekļiem un ar Ä«sziÅÄm, mums bija nepiecieÅ”ami ienÄkoÅ”ie un izejoÅ”ie savienojumi ar Microsoft Azure serveriem (tolaik izmantojÄm Å”o platformu lai nosÅ«tÄ«tu brÄ«dinÄjumus Slack) un ÄrÄjÄ sÅ«tÄ«Å”anas pakalpojuma SMS. TaÄu Å”ajÄ projektÄ Ä«paÅ”a uzmanÄ«ba tika pievÄrsta droŔībai. SaskaÅÄ ar bankas politiku Å”Ädas ācaurÄ«tesā nekÄdÄ gadÄ«jumÄ nedrÄ«kstÄja atvÄrties. Visam bija jÄdarbojas no slÄgta cikla. Mums tika piedÄvÄts izmantot mÅ«su paÅ”u iekÅ”Äjo pakalpojumu API, kas sÅ«ta brÄ«dinÄjumus Slack un ar SMS palÄ«dzÄ«bu, taÄu mums nebija iespÄjas pieslÄgt Å”Ädus pakalpojumus no kastes.
DebaÅ”u vakars ar izstrÄdes komandu beidzÄs ar veiksmÄ«gu risinÄjuma meklÄÅ”anu. RakÅÄjoties pa atpalicÄ«bu, atradÄm vienu uzdevumu, kuram nekad nepietika laika un prioritÄtes ā izveidot spraudÅu sistÄmu, lai ievieÅ”anas komandas vai klients paÅ”i varÄtu rakstÄ«t papildinÄjumus, paplaÅ”inot platformas iespÄjas.
TaÄu mums bija palicis tieÅ”i mÄnesis, kura laikÄ bija jÄinstalÄ viss, jÄkonfigurÄ un jÄievieto automatizÄcija.
PÄc mÅ«su galvenÄ arhitekta Sergeja teiktÄ, spraudÅu sistÄmas ievieÅ”ana prasa vismaz mÄnesi.
Mums nebija laika...
Bija tikai viens risinÄjums - aiziet pie klienta un izstÄstÄ«t visu kÄ ir. KopÄ pÄrrunÄjiet termiÅa maiÅu. Un tas strÄdÄja. Mums tika dotas papildu 2 nedÄļas. ViÅiem bija arÄ« savi termiÅi un iekÅ”Äjie pienÄkumi uzrÄdÄ«t rezultÄtus, bet viÅiem bija 2 rezerves nedÄļas. BeigÄs visu nolikÄm uz lÄ«nijas. Sajukt nebija iespÄjams. GodÄ«gums un partnerÄ«bas pieeja atkal atmaksÄjÄs.
IzmÄÄ£inÄjuma rezultÄtÄ tika iegÅ«ti vairÄki svarÄ«gi tehniskie rezultÄti un secinÄjumi:
MÄs pÄrbaudÄ«jÄm jauno brÄ«dinÄjumu apstrÄdes funkcionalitÄti
IzvietotÄ sistÄma sÄka pareizi saÅemt brÄ«dinÄjumus no Prometheus un grupÄt tos. BrÄ«dinÄjumi par problÄmu no Prometheus klienta lidoja ik pÄc 30 sekundÄm (grupÄÅ”ana pÄc laika nav iespÄjota), un mÄs domÄjÄm, vai bÅ«tu iespÄjams tos grupÄt paÅ”Ä ālietussargÄā. IzrÄdÄ«jÄs, ka tas ir iespÄjams ā brÄ«dinÄjumu apstrÄdes iestatÄ«Å”ana platformÄ tiek realizÄta ar skriptu. Tas ļauj Ä«stenot gandrÄ«z jebkuru loÄ£iku to apstrÄdei. MÄs jau esam platformÄ ieviesuÅ”i standarta loÄ£iku veidÅu veidÄ - ja nevÄlaties izdomÄt kaut ko savu, varat izmantot gatavu.
"SintÄtiskÄ sprÅ«da" saskarne. BrÄ«dinÄjumu apstrÄdes iestatÄ«Å”ana no pievienotajÄm uzraudzÄ«bas sistÄmÄm
KonstruÄja sistÄmas āveselÄ«basā stÄvokli
Pamatojoties uz brÄ«dinÄjumiem, tika izveidoti uzraudzÄ«bas notikumi, kas ietekmÄja konfigurÄcijas vienÄ«bu (CU) stÄvokli. MÄs ievieÅ”am resursu-pakalpojuma modeli (RSM), kurÄ var izmantot vai nu iekÅ”Äjo CMDB, vai pieslÄgt ÄrÄjo - pilotprojekta laikÄ klients nav pieslÄdzis savu CMDB.
Interfeiss darbam ar resursa-pakalpojuma modeli. Pilots RSM.
Nu, patiesÄ«bÄ klientam beidzot ir viens uzraudzÄ«bas ekrÄns, kurÄ ir redzami notikumi no dažÄdÄm sistÄmÄm. PaÅ”laik ar ālietussarguā ir savienotas divas sistÄmas - Zabbix un Prometheus, kÄ arÄ« paÅ”as platformas iekÅ”ÄjÄ uzraudzÄ«bas sistÄma.
Analytics saskarne. Viens uzraudzÄ«bas ekrÄns.
UzsÄkta procesu automatizÄcija
Notikumu pÄrraudzÄ«ba izraisÄ«ja iepriekÅ” konfigurÄtu darbÄ«bu palaiÅ”anu - brÄ«dinÄjumu sÅ«tÄ«Å”anu, skriptu palaiÅ”anu, incidentu reÄ£istrÄÅ”anu/bagÄtinÄÅ”anu - pÄdÄjÄ netika izmÄÄ£inÄta ar Å”o konkrÄto klientu, jo pilotprojektÄ nebija integrÄcijas ar apkalpoÅ”anas dienestu.
DarbÄ«bas iestatÄ«jumu saskarne. NosÅ«tiet brÄ«dinÄjumus uz Slack un restartÄjiet serveri.
PaplaÅ”inÄta produkta funkcionalitÄte
Apspriežot automatizÄcijas skriptus, klients lÅ«dza bash atbalstu un saskarni, kurÄ Å”os skriptus varÄtu Ärti konfigurÄt. JaunajÄ versijÄ ir paveikts nedaudz vairÄk (iespÄja rakstÄ«t pilnvÄrtÄ«gas loÄ£iskÄs konstrukcijas Lua ar atbalstu cURL, SSH un SNMP) un ieviesta funkcionalitÄte, kas ļauj pÄrvaldÄ«t skripta dzÄ«ves ciklu (izveidot, rediÄ£Ät, versiju kontroli , dzÄst un arhivÄt).
Interfeiss darbam ar automÄtiskÄs dziedinÄÅ”anas skriptiem. Servera atsÄknÄÅ”anas skripts, izmantojot SSH.
Galvenie secinÄjumi
Pilota laikÄ tika izveidoti arÄ« lietotÄju stÄsti, kas uzlabo paÅ”reizÄjo funkcionalitÄti un palielina vÄrtÄ«bu klientam, Å”eit ir daži no tiem:
- ieviest iespÄju pÄrsÅ«tÄ«t mainÄ«gos tieÅ”i no brÄ«dinÄjuma uz automÄtiskÄs dziedinÄÅ”anas skriptu;
- pievienojiet platformai autorizÄciju, izmantojot Active Directory.
Un mÄs saÅÄmÄm vÄl globÄlÄkus izaicinÄjumus - āuzbÅ«vÄtā produktu ar citÄm iespÄjÄm:
- automÄtiska resursu un pakalpojumu modeļa izveide, pamatojoties uz ML, nevis noteikumiem un aÄ£entiem (iespÄjams, Å”obrÄ«d tas ir galvenais izaicinÄjums);
- atbalsts papildu skriptu un loÄ£ikas valodÄm (un tas bÅ«s JavaScript).
PÄc manÄm domÄm, vissvarÄ«gÄkÄ lietaÅ is pilots parÄda divas lietas:
- PartnerattiecÄ«bas ar klientu ir efektivitÄtes atslÄga, kad efektÄ«va komunikÄcija tiek veidota uz godÄ«guma un atklÄtÄ«bas pamata, un klients kļūst par daļu no komandas, kas Ä«sÄ laikÄ sasniedz nozÄ«mÄ«gus rezultÄtus.
- NekÄdÄ gadÄ«jumÄ nav nepiecieÅ”ams āpielÄgotā un veidot ākruÄ·usā - tikai sistÄmas risinÄjumus. LabÄk ir pavadÄ«t nedaudz vairÄk laika, bet izveidot sistÄmas risinÄjumu, ko izmantos citi klienti. Starp citu, tas notika, spraudÅu sistÄma un atkarÄ«bas no Azure likvidÄÅ”ana sniedza papildu vÄrtÄ«bu citiem klientiem (sveicinÄti, FederÄlais likums 152).
Avots: www.habr.com