MÅ«su komandai patÄ«k eksperimenti. Katrs Slurms nav statisks iepriekÅ”Äjo atkÄrtojums, bet gan pÄrdomas par pieredzi un pÄreja no labÄ uz labÄku. Bet ar
Ja Ä«sumÄ ieskicÄjam intensÄ«vajÄ kursÄ paveikto: āBÅ«vÄjam, laužam, remontÄjam,
mÄs mÄcÄmies." SRE ir maz vÄrta tikai teorijÄ - tikai prakse, reÄli risinÄjumi, reÄlas problÄmas.
DalÄ«bnieki tika sadalÄ«ti komandÄs, lai enerÄ£isks sacensÄ«bu gars neļautu nevienam aizmigt vai palaist āAngry Birdsā uz iPhone, sekojot Dmitrija AnatoļjeviÄa piemÄram.
ProblÄmas, kļūmes, kļūdas un uzdevumus dalÄ«bniekiem nodroÅ”inÄja Äetri mentori. Ivans Kruglovs, galvenais vietnes Booking.com izstrÄdÄtÄjs (NÄ«derlande). Bens Tailers, galvenais vietnes Booking.com izstrÄdÄtÄjs (ASV). Eduards Medvedevs, Tungsten Labs (VÄcija) CTO. JevgeÅijs Varavva, Google galvenais izstrÄdÄtÄjs (Sanfrancisko).
TurklÄt dalÄ«bnieki tiek sadalÄ«ti komandÄs un sacenÅ”as savÄ starpÄ. Interesanti?
Ivans, Bens, Eduards un JevgeÅijs pirms sacensÄ«bu sÄkuma skatÄs uz nabaga Slurm SRE dalÄ«bniekiem ar laipniem ļeÅiniskiem aci.
MÄs esam savÄjie, mÄs veidosim jaunu pasauli...
Ir filmu biļeÅ”u apkopotÄja vietne. Incidentus izdomÄ mentori iepriekÅ” izstrÄdÄtÄ scenÄrijÄ (lai gan neviens neizslÄdz Ä«paÅ”i izsmalcinÄtu un mÄnÄ«gu improvizÄciju), vietnes darbÄ«bu raksturo dažÄdi metrika. ProblÄmas var bÅ«t ļoti dažÄdas: biļetes uz Mulenrūžas teÄtri netiek ielÄdÄtas datu bÄzÄ; filmu un izrÄžu plakÄti datu bÄzÄ tiek ielÄdÄti vairÄk nekÄ 10 sekundÄs; atseviŔķas filmas apraksts sasalst; 0,1% pasÅ«tÄ«jumu jau ir rezervÄti; Ik pa laikam maksÄjumu apstrÄdes sistÄma uz minÅ«ti vai divÄm avarÄ. Un daudzas, daudzas, daudzas nepatÄ«kamas lietas, kas var piemeklÄt Slurm SRE dalÄ«bnieku viÅa Ä«stajÄ darbÄ.
MÄs esam gatavi izturÄt jebko...un visus.
MÅ«su ilgi cietusÄ« vietne sastÄv no vairÄkiem mikropakalpojumiem. TÄs uzdevums ir apkopot datus par izrÄdÄm, cenÄm un pieejamajÄm sÄdvietÄm no visiem kinoteÄtriem, tas parÄda filmu sludinÄjumus, ļauj izvÄlÄties kinoteÄtri, izrÄdi, zÄli un vietu, rezervÄt un apmaksÄt biļetes. KopumÄ viss, par ko skatÄ«tÄjs var tikai sapÅot. TaÄu lietotÄjam pat nav aizdomas, kÄda titÄniska cÄ«Åa par vietnes stabilitÄti un pieejamÄ«bu notiek iekÅ”Ä.
IntensÄ«vajai vietnei mÄs Ä£enerÄjÄm SLO, SLI, SLA rÄdÄ«tÄjus, izstrÄdÄjÄm arhitektÅ«ru un infrastruktÅ«ru, izvietojÄm vietni, iestatÄ«jÄm uzraudzÄ«bu un brÄ«dinÄjumus. Un mÄs ejam prom.
SLO, SLI, SLA
SLI - servisa lÄ«meÅa rÄdÄ«tÄji. SLO ir pakalpojuma lÄ«meÅa mÄrÄ·i. SLA - pakalpojumu lÄ«meÅa lÄ«gumi.
SLA ir ITIL metodoloÄ£ijas termins, kas apzÄ«mÄ formÄlu vienoÅ”anos starp pakalpojuma klientu un tÄ piegÄdÄtÄju, kas satur pakalpojuma aprakstu, puÅ”u tiesÄ«bas un pienÄkumus un, pats galvenais, saskaÅoto kvalitÄtes lÄ«meni Ŕī pakalpojuma sniegÅ”anai. apkalpoÅ”ana.
SLO ir pakalpojuma lÄ«meÅa mÄrÄ·is: pakalpojuma lÄ«meÅa mÄrÄ·a vÄrtÄ«ba vai vÄrtÄ«bu diapazons, ko mÄra VDI. ParastÄ SLO vÄrtÄ«ba ir āSLI ā¤ Targetā vai āLower Limit ā¤ SLI ā¤ Upper Limitā.
VDI ir pakalpojuma lÄ«meÅa rÄdÄ«tÄjs ā rÅ«pÄ«gi definÄts sniegtÄ pakalpojuma lÄ«meÅa viena aspekta kvantitatÄ«vais rÄdÄ«tÄjs. LielÄkajai daļai pakalpojumu galvenais SLI tiek uzskatÄ«ts par pieprasÄ«juma latentumu ā cik ilgs laiks nepiecieÅ”ams, lai atgrieztu atbildi uz pieprasÄ«jumu. Citas izplatÄ«tas SLI ietver kļūdu lÄ«meni, kas bieži izteikts kÄ daļa no visiem saÅemtajiem pieprasÄ«jumiem, un sistÄmas caurlaidspÄja, ko parasti mÄra pieprasÄ«jumos sekundÄ.
Vispirms mÄs salauzÄ«sim lidmaŔīnas, un tad meitenes, un tad meitenes...
IekÅ”Äjie un ÄrÄjie faktori sÄka āsabojÄtā SLO jau no pirmajÄm minÅ«tÄm. Viss krita uz administratoru galvÄm ā izstrÄdÄtÄju kļūdas, infrastruktÅ«ras kļūmes, apmeklÄtÄju pieplÅ«dums un DDoS uzbrukumi. Viss, kas pasliktina SLO.
"- CienÄ«jamie dalÄ«bnieki, es steidzos jÅ«s iepriecinÄt, pirmais, kas jums neizdodas, ir... viss!"
Pa ceļam runÄtÄji apsprieda stabilitÄti, kļūdu budžetu, testÄÅ”anas praksi, pÄrtraukumu pÄrvaldÄ«bu un darbÄ«bas slodzi.
MÄs neesam dedzinÄtÄji, mÄs neesam galdnieki ...
Tad dalÄ«bnieki sÄka kÄrtot lietas ā galvenais ir saprast, ko paÄ·ert vispirms.
"- Kungs, es nekad neesmu redzÄjis, ka tas Å”Ädi saplÄ«st, Å”ÄdÄ formÄ un tÄdÄ stÄvoklÄ«!"
TÄtad notika negadÄ«jums. MaksÄjumu apstrÄdes pakalpojums nedarbojas. KÄ rÄ«koties, lai pÄc iespÄjas Ä«sÄkÄ laikÄ atjaunotu funkcionalitÄti?
Eksperti, sirsnÄ«gi skatoties uz dalÄ«bniekiem, gatavo vÄl vienu triku.
Katra brigÄde organizÄ negadÄ«juma likvidÄÅ”anas grupas darbu - iesaista kolÄÄ£us, informÄ interesentus (ieinteresÄtÄs puses). TajÄ paÅ”Ä laikÄ tiek noteiktas prioritÄtes. TÄdÄ veidÄ dalÄ«bnieki trenÄjÄs strÄdÄt zem spiediena ÄrkÄrtÄ«gi ierobežotÄ laika apstÄkļos.
"Kas par Å”ausmÄm ir iznÄcis?!"
Izelpojiet... un pabeidziet vingrinÄjumu
KopÄ ar runÄtÄjiem pÄc katras problÄmas atrisinÄÅ”anas un vietnes Ä«slaicÄ«gas stabilizÄÅ”anas komanda pÄtÄ«ja incidentus no SRE viedokļa. MÄs detalizÄti analizÄjÄm problÄmas - raÅ”anÄs cÄloÅus, likvidÄÅ”anas gaitu. PÄc tam gan pa komandÄm, gan kolektÄ«vi pieÅÄmÄm lÄmumus, kÄ tos turpmÄk novÄrst: kÄ uzlabot uzraudzÄ«bu, kÄ gudri mainÄ«t arhitektÅ«ru, kÄ pielÄgot pieeju attÄ«stÄ«bai un darbÄ«bai, kÄ koriÄ£Ät normatÄ«vos aktus. RunÄtÄji demonstrÄja pÄcnÄves diriÄ£ÄÅ”anas praksi.
āKurÅ” gan vÄl grib mokas! - Es!"
Komandu panÄkumi tika stingri un skaidri fiksÄti elektroniskajÄ tablo.
Par pirmajÄm vietÄm - bonuss no ieinteresÄtajÄm pusÄm.
Avots: www.habr.com