AtgÄdinÄsim, ka Elastic Stack pamatÄ ir nerelÄciju Elasticsearch datubÄze, Kibana tÄ«mekļa saskarne un datu savÄcÄji un apstrÄdÄtÄji (slavenÄkie Logstash, dažÄdi Beats, APM un citi). Viens no jaukajiem papildinÄjumiem visam uzskaitÄ«tajam produktu kopumam ir datu analÄ«ze, izmantojot maŔīnmÄcÄ«Å”anÄs algoritmus. RakstÄ mÄs saprotam, kas ir Å”ie algoritmi. LÅ«dzu zem kaÄ·a.
MaŔīnmÄcÄ«ba ir apmaksÄta koplietoÅ”anas programmatÅ«ras Elastic Stack funkcija un ir iekļauta X-Pack. Lai sÄktu to lietot, pÄc instalÄÅ”anas vienkÄrÅ”i aktivizÄjiet 30 dienu izmÄÄ£inÄjuma versiju. PÄc izmÄÄ£inÄjuma perioda beigÄm varat pieprasÄ«t atbalstu, lai to pagarinÄtu, vai iegÄdÄties abonementu. AbonÄÅ”anas maksa tiek aprÄÄ·inÄta nevis pamatojoties uz datu apjomu, bet gan uz izmantoto mezglu skaitu. NÄ, datu apjoms, protams, ietekmÄ nepiecieÅ”amo mezglu skaitu, tomÄr Ŕī pieeja licencÄÅ”anai ir humÄnÄka attiecÄ«bÄ pret uzÅÄmuma budžetu. Ja nav nepiecieÅ”ama augsta produktivitÄte, varat ietaupÄ«t naudu.
ML elastÄ«gajÄ kaudzÄ ir rakstÄ«ts C++ valodÄ un darbojas Ärpus JVM, kurÄ darbojas pats Elasticsearch. Tas ir, process (starp citu, to sauc par automÄtisko noteikÅ”anu) patÄrÄ visu, ko JVM neaprÄ«. DemonstrÄcijas stendÄ tas nav tik svarÄ«gi, taÄu ražoÅ”anas vidÄ ir svarÄ«gi pieŔķirt atseviŔķus mezglus ML uzdevumiem.
MaŔīnmÄcÄ«Å”anÄs algoritmus iedala divÄs kategorijÄs
Lai veiktu analÄ«zi, maŔīnmÄcÄ«Å”anÄs algoritms izmanto Elasticsearch indeksos saglabÄtos datus. Varat izveidot analÄ«zes uzdevumus gan no Kibana saskarnes, gan caur API. Ja to darÄt, izmantojot Kibana, dažas lietas jums nav jÄzina. PiemÄram, papildu indeksi, ko algoritms izmanto savas darbÄ«bas laikÄ.
AnalÄ«zes procesÄ izmantotie papildu indeksi.ml-state ā informÄcija par statistikas modeļiem (analÄ«zes iestatÄ«jumiem);
.ml-anomalies-* ā ML algoritmu rezultÄti;
.ml-notifications ā paziÅojumu iestatÄ«jumi, kuru pamatÄ ir analÄ«zes rezultÄti.
Datu struktÅ«ra Elasticsearch datubÄzÄ sastÄv no indeksiem un tajos saglabÄtajiem dokumentiem. SalÄ«dzinot ar relÄciju datu bÄzi, indeksu var salÄ«dzinÄt ar datu bÄzes shÄmu, bet dokumentu ar ierakstu tabulÄ. Å is salÄ«dzinÄjums ir nosacÄ«ts un paredzÄts, lai vienkÄrÅ”otu turpmÄkÄ materiÄla izpratni tiem, kas par Elasticsearch ir tikai dzirdÄjuÅ”i.
TÄ pati funkcionalitÄte ir pieejama, izmantojot API, kas tÄ«mekļa saskarnÄ, tÄpÄc skaidrÄ«bas un jÄdzienu izpratnes labad mÄs parÄdÄ«sim, kÄ to konfigurÄt, izmantojot Kibana. KreisajÄ pusÄ esoÅ”ajÄ izvÄlnÄ ir sadaļa MaŔīnmÄcÄ«Å”anÄs, kurÄ varat izveidot jaunu darbu. Kibana saskarnÄ tas izskatÄs kÄ attÄlÄ zemÄk. Tagad mÄs analizÄsim katru uzdevumu veidu un parÄdÄ«sim analÄ«zes veidus, kurus Å”eit var izveidot.
Single Metric ā viena metrikas analÄ«ze, Multi Metric ā divu vai vairÄku metrikas analÄ«ze. Abos gadÄ«jumos katrs rÄdÄ«tÄjs tiek analizÄts izolÄtÄ vidÄ, t.i. algoritms neÅem vÄrÄ paralÄli analizÄto metrikas uzvedÄ«bu, kÄ tas varÄtu Ŕķist Multi Metric gadÄ«jumÄ. Lai veiktu aprÄÄ·inus, Åemot vÄrÄ dažÄdu metriku korelÄciju, varat izmantot populÄcijas analÄ«zi. Un Advanced precÄ«zi noregulÄ algoritmus ar papildu opcijÄm noteiktiem uzdevumiem.
Viena metrika
IzmaiÅu analÄ«ze vienÄ metrikÄ ir vienkÄrÅ”ÄkÄ lieta, ko Å”eit var izdarÄ«t. PÄc noklikŔķinÄÅ”anas uz Izveidot darbu algoritms meklÄs anomÄlijas.
Å ajÄ jomÄ Kopsavilkums jÅ«s varat izvÄlÄties pieeju anomÄliju meklÄÅ”anai. PiemÄram, kad Min vÄrtÄ«bas, kas ir zemÄkas par tipiskÄm vÄrtÄ«bÄm, tiks uzskatÄ«tas par anomÄlÄm. Äst Maks., Augsts vidÄjais, zems, vidÄjais, atŔķirÄ«gs un citi. Visu funkciju aprakstus var atrast
Å ajÄ jomÄ Lauks norÄda ciparu lauku dokumentÄ, kurÄ mÄs veiksim analÄ«zi.
Å ajÄ jomÄ
SavÄkto datu ilgums ir galvenais, kas ietekmÄ analÄ«zes efektivitÄti. AnalÄ«zes laikÄ algoritms identificÄ atkÄrtoÅ”anÄs intervÄlus, aprÄÄ·ina ticamÄ«bas intervÄlus (bÄzes) un identificÄ anomÄlijas - netipiskas novirzes no metrikas ierastÄs uzvedÄ«bas. Tikai piemÄram:
Pamatlīnijas ar nelielu datu daļu:
Ja algoritmam ir no kÄ mÄcÄ«ties, bÄzes lÄ«nija izskatÄs Å”Ädi:
PÄc uzdevuma uzsÄkÅ”anas algoritms nosaka anomÄlas novirzes no normas un sarindo tÄs pÄc anomÄlijas iespÄjamÄ«bas (iekavÄs norÄdÄ«ta atbilstoÅ”Äs etiÄ·etes krÄsa):
BrÄ«dinÄjums (zils): mazÄks par 25
Nepilngadīgas (dzeltenas): 25-50
Major (oranžs): 50-75
Kritiskais (sarkans): 75-100
ZemÄk esoÅ”ajÄ diagrammÄ ir parÄdÄ«ts atrasto anomÄliju piemÄrs.
Å eit var redzÄt skaitli 94, kas norÄda uz anomÄlijas iespÄjamÄ«bu. Ir skaidrs, ka, tÄ kÄ vÄrtÄ«ba ir tuvu 100, tas nozÄ«mÄ, ka mums ir anomÄlija. KolonnÄ zem diagrammas ir parÄdÄ«ta pejoratÄ«vi mazÄ varbÅ«tÄ«ba ā 0.000063634% no metrikas vÄrtÄ«bas.
Papildus anomÄliju meklÄÅ”anai varat palaist prognozÄÅ”anu KibanÄ. Tas tiek darÄ«ts vienkÄrÅ”i un no tÄ paÅ”a skata ar anomÄlijÄm - poga Prognoze augÅ”ÄjÄ labajÄ stÅ«rÄ«.
Prognoze tiek sastÄdÄ«ta maksimÄli 8 nedÄļas iepriekÅ”. Pat ja jÅ«s patieÅ”Äm vÄlaties, tas vairs nav iespÄjams pÄc dizaina.
DažÄs situÄcijÄs prognoze bÅ«s ļoti noderÄ«ga, piemÄram, uzraugot lietotÄju slodzi uz infrastruktÅ«ru.
Daudzmetriska
PÄriesim pie nÄkamÄs ML funkcijas elastÄ«gajÄ kaudzÄ«tÄ ā vairÄku metriku analÄ«zi vienÄ partijÄ. Bet tas nenozÄ«mÄ, ka tiks analizÄta vienas metrikas atkarÄ«ba no citas. Tas ir tÄds pats kÄ viena metrika, taÄu vienÄ ekrÄnÄ ir vairÄkas metrikas, lai Ärti salÄ«dzinÄtu viena no tÄm ietekmi uz otru. MÄs runÄsim par vienas metrikas atkarÄ«bas no cita analÄ«zi sadaÄ¼Ä IedzÄ«votÄji.
PÄc noklikŔķinÄÅ”anas uz kvadrÄta ar Multi Metric, parÄdÄ«sies logs ar iestatÄ«jumiem. ApskatÄ«sim tos sÄ«kÄk.
Vispirms jums ir jÄatlasa lauki analÄ«zei un tajos datu apkopoÅ”anai. ApkopoÅ”anas opcijas Å”eit ir tÄdas paÅ”as kÄ vienai metrikai (Maks., Augsts vidÄjais, zems, vidÄjais, atŔķirÄ«gs un citi). TurklÄt, ja vÄlaties, dati tiek sadalÄ«ti vienÄ no laukiem (lauks Datu sadalÄ«Å”ana). PiemÄrÄ mÄs to izdarÄ«jÄm pÄc lauka OriginAirportID. Å
emiet vÄrÄ, ka metrikas diagramma labajÄ pusÄ tagad tiek parÄdÄ«ta kÄ vairÄkas diagrammas.
Lauks GalvenÄs jomas (ietekmÄtÄji) tieÅ”i ietekmÄ konstatÄtÄs anomÄlijas. PÄc noklusÄjuma Å”eit vienmÄr bÅ«s vismaz viena vÄrtÄ«ba, un jÅ«s varat pievienot papildu vÄrtÄ«bas. Algoritms Åems vÄrÄ Å”o lauku ietekmi, analizÄjot un parÄdÄ«s āietekmÄ«gÄkÄsā vÄrtÄ«bas.
PÄc palaiÅ”anas Kibana saskarnÄ parÄdÄ«sies kaut kas lÄ«dzÄ«gs Å”im.
Å is ir tÄ sauktais anomÄliju siltuma karte katrai lauka vÄrtÄ«bai OriginAirportID, ko mÄs norÄdÄ«jÄm Datu sadalÄ«Å”ana. TÄpat kÄ ar vienu metriku, krÄsa norÄda patoloÄ£iskas novirzes lÄ«meni. LÄ«dzÄ«gu analÄ«zi ir Ärti veikt, piemÄram, darbstacijÄs, lai izsekotu tÄs, kurÄm ir aizdomÄ«gi liels autorizÄciju skaits utt. MÄs jau rakstÄ«jÄm
Zem siltuma kartes ir anomÄliju saraksts, no kurÄm katra varat pÄrslÄgties uz vienas metrikas skatu detalizÄtai analÄ«zei.
IedzÄ«votÄji
Lai meklÄtu anomÄlijas starp dažÄdu metriku korelÄcijÄm, elastÄ«gajai kaudzei ir specializÄta populÄcijas analÄ«ze. Ar tÄs palÄ«dzÄ«bu jÅ«s varat meklÄt anomÄlas servera veiktspÄjas vÄrtÄ«bas salÄ«dzinÄjumÄ ar citÄm, kad, piemÄram, palielinÄs pieprasÄ«jumu skaits mÄrÄ·a sistÄmai.
Å ajÄ ilustrÄcijÄ lauks PopulÄcija norÄda vÄrtÄ«bu, uz kuru attieksies analizÄtÄ metrika. Å ajÄ gadÄ«jumÄ tas ir procesa nosaukums. RezultÄtÄ mÄs redzÄsim, kÄ katra procesa procesora slodze ietekmÄja viens otru.
LÅ«dzu, Åemiet vÄrÄ, ka analizÄto datu diagramma atŔķiras no gadÄ«jumiem, kad tiek izmantota viena metrika un vairÄku metrika. Tas tika veikts KibanÄ, lai uzlabotu analizÄto datu vÄrtÄ«bu sadalÄ«juma uztveri.
Diagramma parÄda, ka process darbojÄs neparasti uzsvars (starp citu, Ä£enerÄ Ä«paÅ”a utilÄ«ta) serverÄ« poipu, kurÅ” ietekmÄja (vai izrÄdÄ«jÄs ietekmÄtÄjs) Ŕīs anomÄlijas raÅ”anos.
uzlabots
AnalÄ«ze ar precizÄÅ”anu. Izmantojot papildu analÄ«zi, programmÄ Kibana tiek parÄdÄ«ti papildu iestatÄ«jumi. PÄc noklikŔķinÄÅ”anas uz elementa Papildu izveides izvÄlnÄ tiek parÄdÄ«ts Å”is logs ar cilnÄm. Tab darba detaļas MÄs to izlaidÄm ar nolÅ«ku, ir pamata iestatÄ«jumi, kas nav tieÅ”i saistÄ«ti ar analÄ«zes iestatÄ«Å”anu.
Š kopsavilkuma_skaita_lauka_nosaukums PÄc izvÄles varat norÄdÄ«t lauka nosaukumu no dokumentiem, kuros ir apkopotas vÄrtÄ«bas. Å ajÄ piemÄrÄ notikumu skaits minÅ«tÄ. IN
Å eit ir papildu iestatÄ«jumu bloks anomÄliju detektora konfigurÄÅ”anai konkrÄtam uzdevumam. MÄs plÄnojam apspriest konkrÄtus lietoÅ”anas gadÄ«jumus (Ä«paÅ”i droŔības) turpmÄkajos rakstos. PiemÄram,
Å ajÄ jomÄ funkcija Varat atlasÄ«t konkrÄtu funkciju, lai meklÄtu anomÄlijas. IzÅemot rets, ir vÄl pÄris interesantas funkcijas -
Š lauka_nosaukums norÄda dokumenta lauku, kurÄ tiks veikta analÄ«ze. PÄc_lauka_nosaukuma var izmantot, lai atdalÄ«tu analÄ«zes rezultÄtus katrai atseviŔķai Å”eit norÄdÄ«tÄ dokumenta lauka vÄrtÄ«bai. Ja jÅ«s aizpildÄt virs_lauka_nosaukums jÅ«s saÅemat populÄcijas analÄ«zi, par kuru mÄs runÄjÄm iepriekÅ”. Ja norÄdÄt vÄrtÄ«bu partition_field_name, tad Å”im dokumenta laukam katrai vÄrtÄ«bai tiks aprÄÄ·inÄtas atseviŔķas bÄzes lÄ«nijas (vÄrtÄ«ba var bÅ«t, piemÄram, servera vai servera procesa nosaukums). IN izslÄgt_bieži var izvÄlÄties visi vai neviens, kas nozÄ«mÄs bieži sastopamo dokumenta lauku vÄrtÄ«bu izslÄgÅ”anu (vai iekļauÅ”anu).
Å ajÄ rakstÄ mÄs centÄmies sniegt pÄc iespÄjas Ä«su priekÅ”statu par maŔīnmÄcÄ«Å”anÄs iespÄjÄm elastÄ«gajÄ kaudzÄ«tÄ; aizkulisÄs joprojÄm ir palicis daudz detaļu. PastÄstiet komentÄros, kÄdus gadÄ«jumus jums izdevÄs atrisinÄt, izmantojot Elastic Stack, un kÄdiem uzdevumiem jÅ«s to izmantojat. Lai sazinÄtos ar mums, varat izmantot personÄ«gÄs ziÅas HabrĆ© vai
Avots: www.habr.com