VebinÄram ir vÄjÅ” audio, tÄpÄc mÄs izveidojÄm stenogrammu.
Mani sauc Medvedevs Eduards. Å odien es runÄÅ”u par to, kas ir SRE, kÄ parÄdÄ«jÄs SRE, kÄdi ir SRE inženieru darba kritÄriji, nedaudz par uzticamÄ«bas kritÄrijiem, nedaudz par tÄ uzraudzÄ«bu. MÄs iesim pÄri, jo stundas laikÄ neko daudz nevar pateikt, bet es jums iedoÅ”u materiÄlus papildu izskatÄ«Å”anai, un mÄs visi gaidÄm jÅ«s plkst.
Vispirms parunÄsim par to, kas ir SRE ā vietnes uzticamÄ«bas inženierija. Un kÄ tas parÄdÄ«jÄs kÄ atseviŔķa pozÄ«cija, kÄ atseviŔķs virziens. Viss sÄkÄs ar to, ka tradicionÄlajÄs attÄ«stÄ«bas aprindÄs Dev un Ops ir divas pilnÄ«gi atŔķirÄ«gas komandas, parasti ar diviem pilnÄ«gi atŔķirÄ«giem mÄrÄ·iem. IzstrÄdes komandas mÄrÄ·is ir ieviest jaunas funkcijas un apmierinÄt uzÅÄmuma vajadzÄ«bas. Ops komandas mÄrÄ·is ir pÄrliecinÄties, ka viss darbojas un nekas neplÄ«st. AcÄ«mredzot Å”ie mÄrÄ·i ir tieÅ”Ä pretrunÄ viens otram: lai viss darbotos un nekas nesabojÄtos, pÄc iespÄjas mazÄk izvÄrsiet jaunas funkcijas. Å Ä« iemesla dÄļ ir daudz iekÅ”Äju konfliktu, ko mÄÄ£ina atrisinÄt metodoloÄ£ija, ko tagad sauc par DevOps.
ProblÄma ir tÄ, ka mums nav skaidras DevOps definÄ«cijas un skaidras DevOps ievieÅ”anas. Es runÄju konferencÄ JekaterinburgÄ pirms 2 gadiem, un lÄ«dz Å”im DevOps sadaļa sÄkÄs ar ziÅojumu āKas ir DevOpsā. 2017. gadÄ devops ir gandrÄ«z 10 gadus vecs, bet mÄs joprojÄm strÄ«damies par to, kas tas ir. Un Ŕī ir ļoti dÄ«vaina situÄcija, ko Google mÄÄ£inÄja atrisinÄt pirms dažiem gadiem.
2016. gadÄ Google izlaida grÄmatu āVietnes uzticamÄ«bas inženierijaā. Un patiesÄ«bÄ tieÅ”i ar Å”o grÄmatu sÄkÄs SRE kustÄ«ba. SRE ir Ä«paÅ”a iespÄja DevOps paradigmas ievieÅ”anai konkrÄtÄ uzÅÄmumÄ. SRE inženieri izvirzÄ«ja sev mÄrÄ·i nodroÅ”inÄt sistÄmu uzticamu darbÄ«bu. Tie galvenokÄrt tiek Åemti no izstrÄdÄtÄjiem, dažreiz no administratoriem ar spÄcÄ«gu izstrÄdes pieredzi. Un viÅi dara to, ko agrÄk darÄ«ja sistÄmu administratori, bet spÄcÄ«ga pieredze izstrÄdÄ un zinÄÅ”anas par sistÄmu no koda viedokļa noved pie tÄ, ka Å”ie cilvÄki nav tendÄti uz ikdienas administratÄ«vo darbu, bet gan ir tendÄti uz automatizÄciju.
IzrÄdÄs, ka DevOps paradigma SRE komandÄs tiek Ä«stenota ar to, ka ir SRE inženieri, kas risina strukturÄlÄs problÄmas. LÅ«k, tas pats savienojums starp Dev un Ops, par ko cilvÄki runÄ jau 8 gadus. SRE loma ir lÄ«dzÄ«ga arhitekta lomai, jo iesÄcÄji nekļūst par SRE. CilvÄkiem savas karjeras sÄkumÄ vÄl nav pieredzes un nepiecieÅ”amo zinÄÅ”anu plaÅ”uma. TÄ kÄ SRE ir nepiecieÅ”amas ļoti sarežģītas zinÄÅ”anas par to, kas un kad tieÅ”i var noiet greizi. TÄpÄc Å”eit, kÄ likums, ir nepiecieÅ”ama sava veida pieredze gan uzÅÄmumÄ, gan Ärpus tÄ.
ViÅi jautÄ, vai tiks aprakstÄ«ta atŔķirÄ«ba starp SRE un devops. ViÅa tikko tika aprakstÄ«ta. Var runÄt par SRE vietu organizÄcijÄ. AtŔķirÄ«bÄ no Ŕīs klasiskÄs DevOps pieejas, kur Ops joprojÄm ir atseviŔķa nodaļa, SRE ir daļa no izstrÄdes komandas. ViÅi ir iesaistÄ«ti produktu izstrÄdÄ. Ir pat pieeja, kurÄ SRE ir loma, kas pÄriet no viena izstrÄdÄtÄja uz otru. ViÅi piedalÄs kodu pÄrskatÄ«Å”anÄ tÄpat kÄ, piemÄram, UX dizaineri, paÅ”i izstrÄdÄtÄji, dažreiz produktu vadÄ«tÄji. SRE darbojas tajÄ paÅ”Ä lÄ«menÄ«. Mums tie ir jÄapstiprina, mums tie ir jÄpÄrskata, lai par katru izvietoÅ”anu SRE teiktu: āLabi, Ŕī izvietoÅ”ana, Å”is produkts negatÄ«vi neietekmÄs uzticamÄ«bu. Un, ja tÄ notiek, tad dažÄs pieÅemamÄs robežÄs. Par to arÄ« runÄsim.
AttiecÄ«gi SRE ir veto tiesÄ«bas uz koda izmaiÅÄm. Un vispÄr tas arÄ« noved pie kaut kÄda neliela konflikta, ja SRE tiek ieviests nepareizi. TajÄ paÅ”Ä grÄmatÄ par vietnes uzticamÄ«bas inženieriju daudzas daļas, pat vairÄk nekÄ viena, stÄsta, kÄ izvairÄ«ties no Å”iem konfliktiem.
ViÅi jautÄ, kÄ SRE ir saistÄ«ts ar informÄcijas droŔību. SRE nav tieÅ”i iesaistÄ«ts informÄcijas droŔībÄ. BÅ«tÄ«bÄ lielos uzÅÄmumos to dara privÄtpersonas, testÄtÄji, analÄ«tiÄ·i. TaÄu SRE arÄ« mijiedarbojas ar tiem tÄdÄ nozÄ«mÄ, ka dažas darbÄ«bas, dažas saistÄ«bas, dažas izvietoÅ”anas, kas ietekmÄ droŔību, var ietekmÄt arÄ« produkta pieejamÄ«bu. TÄpÄc SRE kopumÄ mijiedarbojas ar jebkurÄm komandÄm, tostarp droŔības komandÄm, tostarp analÄ«tiÄ·iem. TÄpÄc SRE galvenokÄrt ir nepiecieÅ”ami, kad tie mÄÄ£ina ieviest DevOps, taÄu tajÄ paÅ”Ä laikÄ izstrÄdÄtÄju slogs kļūst pÄrÄk liels. Tas ir, pati izstrÄdes komanda vairs nevar tikt galÄ ar to, ka tagad viÅiem ir jÄatbild arÄ« par Ops. Un ir atseviŔķa loma. Å Ä« loma ir paredzÄta budžetÄ. Dažreiz Ŕī loma tiek noteikta komandas lielumÄ, parÄdÄs atseviŔķs cilvÄks, dažreiz par to kļūst kÄds no izstrÄdÄtÄjiem. TÄ komandÄ parÄdÄs pirmais SRE.
SistÄmas sarežģītÄ«ba, ko ietekmÄ SRE, sarežģītÄ«ba, kas ietekmÄ darbÄ«bas uzticamÄ«bu, var bÅ«t nepiecieÅ”ama vai nejauÅ”a. NepiecieÅ”amÄ sarežģītÄ«ba ir tad, ja produkta sarežģītÄ«ba palielinÄs tiktÄl, cik nepiecieÅ”ams jaunÄm produkta Ä«paŔībÄm. GadÄ«juma sarežģītÄ«ba ir tad, kad sistÄmas sarežģītÄ«ba palielinÄs, bet produkta iezÄ«me un biznesa prasÄ«bas to tieÅ”i neietekmÄ. IzrÄdÄs, ka vai nu izstrÄdÄtÄjs kaut kur kļūdÄ«jies, vai arÄ« algoritms nav optimÄls, vai arÄ« tiek ieviestas kÄdas papildus intereses, kas lieki palielina produkta sarežģītÄ«bu. Labam SRE vienmÄr vajadzÄtu izvairÄ«ties no Ŕīs situÄcijas. Tas nozÄ«mÄ, ka ir jÄbloÄ·Ä ikviena apÅemÅ”anÄs, jebkura izvietoÅ”ana, jebkurÅ” izvilkÅ”anas pieprasÄ«jums, kas palielina sarežģītÄ«bu nejauÅ”u papildinÄjumu dÄļ.
JautÄjums ir, kÄpÄc komandÄ vienkÄrÅ”i nenoalgot inženieri, sistÄmas administratoru ar daudzÄm zinÄÅ”anÄm. Mums saka, ka izstrÄdÄtÄjs inženiera lomÄ nav labÄkais personÄla komplektÄÅ”anas risinÄjums. IzstrÄdÄtÄjs inženiera lomÄ ne vienmÄr ir labÄkais personÄla komplektÄÅ”anas risinÄjums, taÄu Å”eit ir runa par to, ka izstrÄdÄtÄjam, kurÅ” nodarbojas ar Ops, ir nedaudz vairÄk vÄlmes pÄc automatizÄcijas, viÅam ir nedaudz vairÄk zinÄÅ”anu un prasmju kopuma, lai to ieviestu. Ŕī automatizÄcija. Un attiecÄ«gi mÄs samazinÄm ne tikai laiku dažÄm specifiskÄm operÄcijÄm, ne tikai rutÄ«nu, bet arÄ« tÄdus svarÄ«gus biznesa parametrus kÄ MTTR (Mean Time To Recovery, recovery time). TÄdÄjÄdi, un mÄs arÄ« par to runÄsim nedaudz vÄlÄk, mÄs ietaupÄm naudu organizÄcijai.
Tagad parunÄsim par SRE darba kritÄrijiem. Un vispirms par uzticamÄ«bu. Mazajos uzÅÄmumos un startup bieži gadÄs, ka cilvÄki pieÅem, ka, ja pakalpojums ir uzrakstÄ«ts labi, ja produkts ir uzrakstÄ«ts labi un pareizi, tas darbosies, tas neplÄ«sÄ«s. Tas arÄ« viss, mÄs rakstÄm labu kodu, tÄpÄc nav ko lauzt. Kods ir ļoti vienkÄrÅ”s, nav ko lauzt. Tie ir apmÄram tie paÅ”i cilvÄki, kuri saka, ka mums nav vajadzÄ«gi testi, jo, lÅ«k, Ŕīs ir trÄ«s VPI metodes, kÄpÄc gan uztraukties?
Tas viss, protams, ir nepareizi. Un Å”ie cilvÄki ļoti bieži tiek sÄpinÄti ar Å”Äda veida kodeksu praksÄ, jo lietas sabojÄjas. Lietas dažreiz salÅ«zt visneparedzamÄkajos veidos. Dažreiz cilvÄki saka nÄ, tas nekad nenotiks. Un tas joprojÄm notiek. Notiek diezgan bieži. Un tÄpÄc neviens nekad netiecas uz 100% pieejamÄ«bu, jo 100% pieejamÄ«ba nekad nenotiek. TÄ ir norma. Un tÄpÄc mÄs vienmÄr runÄjam par deviÅiem, kad runÄjam par pakalpojumu pieejamÄ«bu. 2 deviÅi, 3 deviÅi, 4 deviÅi, 5 deviÅi. Ja mÄs to pÄrvÄrÅ”am dÄ«kstÄves laikÄ, tad, piemÄram, 5 deviÅi ir nedaudz vairÄk par 5 minÅ«tÄm dÄ«kstÄves gadÄ, 2 deviÅi ir 3,5 dÄ«kstÄves dienas.
Bet ir acÄ«mredzams, ka kÄdÄ brÄ«dÄ« POI un ieguldÄ«jumu atdeve samazinÄs. PÄrejot no diviem deviÅiem uz trim deviÅiem, tiek samazinÄts dÄ«kstÄves laiks par vairÄk nekÄ 3 dienÄm. PÄrejot no Äetriem deviÅiem uz piecÄm, dÄ«kstÄves laiks tiek samazinÄts par 47 minÅ«tÄm gadÄ. Un izrÄdÄs, ka biznesam tas var nebÅ«t kritiski. Un vispÄr nepiecieÅ”amÄ uzticamÄ«ba nav tehniska problÄma, pirmkÄrt, tÄ ir biznesa problÄma, tÄ ir produkta problÄma. KÄds dÄ«kstÄves lÄ«menis ir pieÅemams produkta lietotÄjiem, ko viÅi sagaida, cik viÅi maksÄ, piemÄram, cik daudz naudas viÅi zaudÄ, cik daudz naudas zaudÄ sistÄma.
Å eit svarÄ«gs jautÄjums ir, kÄda ir atlikuÅ”o komponentu uzticamÄ«ba. Jo starpÄ«ba starp 4 un 5 devÄ«tniekiem nebÅ«s redzama viedtÄlrunÄ« ar 2 devÄ«tnieku uzticamÄ«bu. Aptuveni runÄjot, ja jÅ«su servisÄ 10 reizes gadÄ kaut kas saplÄ«st viedtÄlrunÄ«, visticamÄk, 8 reizes bojÄjums noticis OS pusÄ. LietotÄjs pie tÄ ir pieradis un nepievÄrsÄ«s uzmanÄ«bu vÄl vienu reizi gadÄ. Ir nepiecieÅ”ams korelÄt uzticamÄ«bas palielinÄÅ”anas un peļÅas palielinÄÅ”anas cenu.
Tikai grÄmatÄ par SRE ir labs piemÄrs, kÄ palielinÄt lÄ«dz 4 deviÅiem no 3 deviÅiem. IzrÄdÄs, ka pieejamÄ«bas pieaugums ir nedaudz mazÄks par 0,1%. Un, ja pakalpojuma ieÅÄmumi ir USD 1 miljons gadÄ, ieÅÄmumu pieaugums ir USD 900. Ja pieejamÄ«bas palielinÄÅ”ana par deviÅÄm mums izmaksÄ mazÄk nekÄ 900 USD gadÄ, palielinÄjums ir finansiÄli saprÄtÄ«gs. Ja tas maksÄ vairÄk par 900 USD gadÄ, tam vairs nav jÄgas, jo ieÅÄmumu pieaugums vienkÄrÅ”i nekompensÄ darbaspÄka izmaksas un resursu izmaksas. Un mums pietiks ar 3 deviÅiem.
Å is, protams, ir vienkÄrÅ”ots piemÄrs, kur visi pieprasÄ«jumi ir vienÄdi. Un pÄriet no 3 deviÅiem uz 4 deviÅiem ir pietiekami vienkÄrÅ”i, bet tajÄ paÅ”Ä laikÄ, piemÄram, pÄrejot no 2 deviÅiem uz 3, tas jau ir 9 tÅ«kstoÅ”u dolÄru ietaupÄ«jums, tam var bÅ«t finansiÄla jÄga. Protams, patiesÄ«bÄ reÄ£istrÄcijas pieprasÄ«juma neveiksme ir sliktÄka nekÄ lapas nerÄdÄ«Å”ana, pieprasÄ«jumiem ir atŔķirÄ«gs svars. ViÅiem var bÅ«t pilnÄ«gi atŔķirÄ«gs kritÄrijs no biznesa viedokļa, taÄu, kÄ likums, ja mÄs nerunÄjam par dažiem konkrÄtiem pakalpojumiem, tas ir diezgan uzticams tuvinÄjums.
SaÅÄmÄm jautÄjumu, vai VNÄŖ ir viens no koordinatoriem, izvÄloties dienesta arhitektonisko risinÄjumu. Tas ir pieÅemami no integrÄcijas esoÅ”ajÄ infrastruktÅ«rÄ, lai nezaudÄtu tÄs stabilitÄti. JÄ, SRE, tÄpat kÄ pull pieprasÄ«jumi, apÅemÅ”anÄs, izlaidumi ietekmÄ arhitektÅ«ru, jaunu servisu ievieÅ”anu, mikropakalpojumus, jaunu risinÄjumu ievieÅ”anu. KÄpÄc es iepriekÅ” teicu, ka ir vajadzÄ«ga pieredze, vajadzÄ«ga kvalifikÄcija. Faktiski SRE ir viena no bloÄ·ÄjoÅ”ajÄm balsÄ«m jebkurÄ arhitektÅ«ras un programmatÅ«ras risinÄjumÄ. AttiecÄ«gi SRE kÄ inženierim, pirmkÄrt, ir ne tikai jÄsaprot, bet arÄ« jÄsaprot, kÄ daži konkrÄti lÄmumi ietekmÄs uzticamÄ«bu, stabilitÄti, un jÄsaprot, kÄ tas ir saistÄ«ts ar biznesa vajadzÄ«bÄm un no kÄda viedokļa tas var bÅ«t pieļaujams, un ar ko tÄ nav.
TÄpÄc tagad ir pienÄcis laiks runÄt par uzticamÄ«bas kritÄrijiem, kas SRE tradicionÄli tiek definÄti kÄ SLA (Service Level Agreement). VisticamÄk pazÄ«stams termins. SLI (servisa lÄ«meÅa indikators). SLO (Service Level Objective). Pakalpojuma lÄ«meÅa lÄ«gums, iespÄjams, ir nozÄ«mÄ«gs termins, it Ä«paÅ”i, ja esat strÄdÄjis ar tÄ«kliem, pakalpojumu sniedzÄjiem un mitinÄÅ”anu. Å Ä« ir vispÄrÄ«ga vienoÅ”anÄs, kas apraksta visa jÅ«su pakalpojuma darbÄ«bu, sodus, dažus sodus par kļūdÄm, metriku, kritÄrijus. Un SLI ir pats pieejamÄ«bas rÄdÄ«tÄjs. Tas ir, kas var bÅ«t SLI: servisa reakcijas laiks, kļūdu skaits procentos. Tas varÄtu bÅ«t joslas platums, ja mÄs runÄjam par kÄda veida failu mitinÄÅ”anu. Ja runÄjam par atpazÄ«Å”anas algoritmiem, rÄdÄ«tÄjs var bÅ«t pat, piemÄram, atbildes pareizÄ«ba. SLO (Service Level Objective) ir attiecÄ«gi SLI indikatora, tÄ vÄrtÄ«bas un perioda kombinÄcija.
PieÅemsim, ka SLA varÄtu bÅ«t Å”Äds. Pakalpojums ir pieejams 99,95% laika visa gada garumÄ. Vai arÄ« 99 kritiskÄ tehniskÄ atbalsta biļetes tiks slÄgtas 3 stundu laikÄ ceturksnÄ«. Vai arÄ« uz 85% vaicÄjumu katru mÄnesi tiks atbildÄts 1,5 sekunžu laikÄ. Tas ir, mÄs pakÄpeniski sÄkam saprast, ka kļūdas un neveiksmes ir diezgan normÄla parÄdÄ«ba. TÄ ir pieÅemama situÄcija, mÄs to plÄnojam, zinÄmÄ mÄrÄ pat ar to rÄÄ·inÄmies. Tas ir, SRE veido sistÄmas, kas var kļūdÄ«ties, kurÄm normÄli jÄreaÄ£Ä uz kļūdÄm un kurÄm tÄs ir jÄÅem vÄrÄ. Un, ja iespÄjams, viÅiem vajadzÄtu rÄ«koties ar kļūdÄm tÄ, lai lietotÄjs tÄs vai nu nepamanÄ«tu, vai arÄ« tÄs pamanÄ«tu, bet ir kaut kÄds risinÄjums, lai viss nesabruktu pilnÄ«bÄ.
PiemÄram, ja augÅ”upielÄdÄjat videoklipu pakalpojumÄ YouTube un YouTube nevar to uzreiz konvertÄt, ja videoklips ir pÄrÄk liels, ja formÄts nav optimÄls, pieprasÄ«jums, protams, neizdosies ar taimautu, YouTube nerÄdÄ«s 502. kļūda, YouTube teiks: āMÄs visu izveidojÄm, jÅ«su video tiek apstrÄdÄts. Tas bÅ«s gatavs apmÄram 10 minÅ«tÄs." Å is ir graciozÄs degradÄcijas princips, kas ir pazÄ«stams, piemÄram, no priekÅ”gala izstrÄdes, ja kÄdreiz esat to darÄ«jis.
NÄkamie termini, par kuriem mÄs runÄsim un kuri ir ļoti svarÄ«gi, lai strÄdÄtu ar uzticamÄ«bu, ar kļūdÄm, ar cerÄ«bÄm, ir MTBF un MTTR. MTBF ir vidÄjais laiks starp neveiksmÄm. MTTR vidÄjais atveseļoÅ”anÄs laiks, vidÄjais laiks lÄ«dz atveseļoÅ”anai. Tas ir, cik daudz laika ir pagÄjis no brīža, kad kļūda tika atklÄta, no brīža, kad kļūda parÄdÄ«jÄs, lÄ«dz brÄ«dim, kad pakalpojums tika pilnÄ«bÄ atjaunots normÄlÄ režīmÄ. MTBF galvenokÄrt nosaka darbs pie koda kvalitÄtes. Tas ir, fakts, ka SRE var pateikt "nÄ". Un vajag visas komandas izpratni, ka tad, kad SRE saka "nÄ", viÅÅ” to saka nevis tÄpÄc, ka ir kaitÄ«gs, nevis tÄpÄc, ka ir slikts, bet tÄpÄc, ka citÄdi cietÄ«s visi.
Atkal ir daudz rakstu, daudz metožu, daudz veidu, pat tajÄ paÅ”Ä grÄmatÄ, uz kuru es tik bieži atsaucos, kÄ pÄrliecinÄties, ka citi izstrÄdÄtÄji nesÄk ienÄ«st SRE. No otras puses, MTTR ir darbs pie jÅ«su SLO (pakalpojuma lÄ«meÅa mÄrÄ·a). Un tÄ galvenokÄrt ir automatizÄcija. TÄ kÄ, piemÄram, mÅ«su SLO darbÄ«bas laiks ir 4 deviÅi ceturksnÄ«. Tas nozÄ«mÄ, ka 3 mÄneÅ”u laikÄ varam pieļaut 13 minÅ«Å”u dÄ«kstÄvi. Un izrÄdÄs, ka mÅ«su MTTR nevar bÅ«t ilgÄks par 13 minÅ«tÄm. Ja mÄs Åemam 13 minÅ«tes, lai reaÄ£Ätu uz vismaz 1 dÄ«kstÄvi, tas nozÄ«mÄ, ka mÄs jau esam iztÄrÄjuÅ”i visu ceturkÅ”Åa budžetu. MÄs laužam SLO. 13 minÅ«tes, lai reaÄ£Ätu un novÄrstu avÄriju, ir daudz maŔīnai, bet ļoti Ä«ss cilvÄkam. Jo lÄ«dz brÄ«dim, kad cilvÄks saÅem brÄ«dinÄjumu, kamÄr viÅÅ” nereaÄ£Ä, kamÄr viÅÅ” nesaprot kļūdu, tas jau ir vairÄkas minÅ«tes. KamÄr cilvÄks nesapratÄ«s, kÄ to salabot, ko tieÅ”i labot, ko darÄ«t, tad Ŕīs ir vÄl dažas minÅ«tes. Un patiesÄ«bÄ, pat ja jums vienkÄrÅ”i ir jÄrestartÄ serveris, kÄ izrÄdÄs, vai jÄpaaugstina jauns mezgls, tad manuÄli MTTR jau ir apmÄram 7-8 minÅ«tes. AutomatizÄjot procesu, MTTR ļoti bieži sasniedz sekundi, dažreiz milisekundes. Google parasti runÄ par milisekundÄm, bet patiesÄ«bÄ, protams, viss nav tik labi.
IdeÄlÄ gadÄ«jumÄ SRE vajadzÄtu gandrÄ«z pilnÄ«bÄ automatizÄt savu darbu, jo tas tieÅ”i ietekmÄ MTTR, tÄ rÄdÄ«tÄjus, visa pakalpojuma SLO un attiecÄ«gi arÄ« biznesa peļÅu. Ja laiks tiek pÄrsniegts, mums tiek jautÄts, vai SRE ir vainÄ«gs. Par laimi, neviens nav vainÄ«gs. Un Ŕī ir atseviŔķa kultÅ«ra, ko sauc par balmeless postmortem, par kuru mÄs Å”odien nerunÄsim, bet mÄs to analizÄsim vietnÄ Slurm. Å Ä« ir ļoti interesanta tÄma, par kuru var runÄt daudz. Rupji runÄjot, ja tiek pÄrsniegts atvÄlÄtais laiks ceturksnÄ«, tad vainÄ«gi ir pa druskai visi, kas nozÄ«mÄ, ka vainot visus nav produktÄ«vi, tÄ vietÄ, varbÅ«t nevainosim nevienu, bet labosim situÄciju un strÄdÄsim ar to, kas ir. PÄc manas pieredzes Ŕī pieeja lielÄkajai daļai komandu ir nedaudz sveÅ”a, it Ä«paÅ”i KrievijÄ, taÄu tai ir jÄga un tÄ darbojas ļoti labi. TÄpÄc es ieteikÅ”u raksta un literatÅ«ras beigÄs, ko varat izlasÄ«t par Å”o tÄmu. Vai arÄ« nÄc uz Slurm SRE.
Ä»auj man paskaidrot. Ja ceturkÅ”Åa SLO laiks ir pÄrsniegts, ja dÄ«kstÄve bija nevis 13 minÅ«tes, bet 15, kas pie tÄ var bÅ«t vainÄ«gs? Protams, SRE var bÅ«t vainÄ«gs, jo tas nepÄrprotami izdarÄ«ja sliktu apÅemÅ”anos vai izvietoÅ”anu. Pie tÄ var bÅ«t vainÄ«gs datu centra administrators, jo viÅÅ”, iespÄjams, veicis kÄdu neplÄnotu apkopi. Ja pie tÄ vainojams datu centra administrators, tad arÄ« Ops cilvÄks, vienojoties par SLO, nav aprÄÄ·inÄjis uzturlÄ«dzekļus. Pie tÄ ir vainÄ«gs vadÄ«tÄjs, tehniskais direktors vai kÄds, kurÅ” parakstÄ«ja datu centra lÄ«gumu un nav pievÄrsis uzmanÄ«bu tam, ka datu centra SLA nav paredzÄts nepiecieÅ”amajai dÄ«kstÄvei. AttiecÄ«gi visi pamazÄm Å”ajÄ situÄcijÄ ir vainÄ«gi. Un tas nozÄ«mÄ, ka Å”ajÄ situÄcijÄ nav jÄgas nevienu vainot. Bet, protams, tas ir jÄlabo. TÄpÄc ir pÄcnÄves gadÄ«jumi. Un, ja jÅ«s lasÄt, piemÄram, GitHub postmortems, un tas vienmÄr ir ļoti interesants, mazs un negaidÄ«ts stÄsts katrÄ konkrÄtajÄ gadÄ«jumÄ, jÅ«s varat aizstÄt to, ka neviens nekad nesaka, ka vainÄ«gs ir Å”is konkrÄtais cilvÄks. Vaina vienmÄr tiek novelta uz konkrÄtiem nepilnÄ«giem procesiem.
PÄriesim pie nÄkamÄ jautÄjuma. AutomatizÄcija. Kad es runÄju par automatizÄciju citos kontekstos, es bieži atsaucos uz tabulu, kurÄ ir norÄdÄ«ts, cik ilgi varat strÄdÄt pie uzdevuma automatizÄÅ”anas, neprasot tÄ automatizÄÅ”anai vairÄk laika, nekÄ faktiski saglabÄjat. Ir aizÄ·erÅ”anÄs. ÄÄ·is ir tÄds, ka SRE automatizÄjot uzdevumu, tie ne tikai ietaupa laiku, bet arÄ« ietaupa naudu, jo automatizÄcija tieÅ”i ietekmÄ MTTR. Tie ietaupa, tÄ teikt, darbinieku un izstrÄdÄtÄju morÄli, kas arÄ« ir izsmeļams resurss. Tie samazina rutÄ«nu. Un tas viss pozitÄ«vi ietekmÄ darbu un lÄ«dz ar to arÄ« biznesu, pat ja Ŕķiet, ka laika izmaksu ziÅÄ automatizÄcijai nav jÄgas.
Faktiski tÄ notiek gandrÄ«z vienmÄr, un ir ļoti maz gadÄ«jumu, kad nav vÄrts kaut ko automatizÄt SRE lomÄ. TÄlÄk mÄs runÄsim par to, ko sauc par kļūdu budžetu, par kļūdu budžetu. Faktiski izrÄdÄs, ka, ja jums veicas ievÄrojami labÄk par sev iestatÄ«to SLO, arÄ« tas nav Ä«paÅ”i labi. Tas ir diezgan slikti, jo SLO darbojas ne tikai kÄ apakÅ”ÄjÄ robeža, bet arÄ« kÄ aptuvenÄ augÅ”ÄjÄ robeža. Kad jÅ«s uzstÄdÄt sev 99% pieejamÄ«bas SLO un patiesÄ«bÄ jums ir 99,99%, izrÄdÄs, ka jums ir vieta eksperimentiem, kas biznesam nemaz nekaitÄs, jo jÅ«s pats to visu esat noteicis, un jÅ«s esat Å”o vietu neizmanto. Jums ir budžets kļūdÄm, kas jÅ«su gadÄ«jumÄ netiek izlietots.
Ko mÄs ar to darÄm? MÄs to izmantojam burtiski visam. TestÄÅ”anai ražoÅ”anas apstÄkļos, jaunu funkciju ievieÅ”anai, kas var ietekmÄt veiktspÄju, laidieniem, apkopei, plÄnotÄm dÄ«kstÄvÄm. SpÄkÄ arÄ« apgrieztais noteikums: ja budžets ir izsmelts, neko jaunu laist nevaram, jo āāpretÄjÄ gadÄ«jumÄ pÄrsniegsim SLO. Budžets jau ir izsmelts, mÄs esam kaut ko atbrÄ«vojuÅ”i, ja tas negatÄ«vi ietekmÄ veiktspÄju, tas ir, ja tas nav kaut kÄds labojums, kas pats par sevi tieÅ”i palielina SLO, tad mÄs pÄrsniedzam budžetu, un tÄ ir slikta situÄcija. , ir nepiecieÅ”ama analÄ«ze, pÄcnÄves un, iespÄjams, daži procesa labojumi.
Tas ir, izrÄdÄs, ka, ja pats pakalpojums nedarbojas labi, un SLO tiek iztÄrÄts un budžets tiek tÄrÄts nevis eksperimentiem, nevis kaut kÄdiem izlaidumiem, bet gan paÅ”am, tad interesantu labojumu vietÄ funkcijas, nevis interesantus izdevumus. TÄ vietÄ, lai nodarbotos ar radoÅ”iem darbiem, jums bÅ«s jÄveic stulbi labojumi, lai budžets atkal bÅ«tu kÄrtÄ«bÄ, vai jÄrediÄ£Ä SLO, un arÄ« tas ir process, kam nevajadzÄtu notikt pÄrÄk bieži.
TÄpÄc izrÄdÄs, ka situÄcijÄ, kad mums ir lielÄks budžets kļūdÄm, interesÄjas visi: gan SRE, gan izstrÄdÄtÄji. IzstrÄdÄtÄjiem liels budžets kļūdu novÄrÅ”anai nozÄ«mÄ, ka jÅ«s varat nodarboties ar izlaidumiem, testiem, eksperimentiem. AttiecÄ«bÄ uz SRE budžets kļūdÄm un Ŕī budžeta ievadÄ«Å”ana nozÄ«mÄ, ka viÅi tieÅ”i labi veic savu darbu. Un tas ietekmÄ sava veida kopÄ«ga darba motivÄciju. Ja klausÄ«sities savus SRE kÄ izstrÄdÄtÄjus, jums bÅ«s vairÄk vietas labam darbam un daudz mazÄk rutÄ«nas.
IzrÄdÄs, ka eksperimenti ražoÅ”anÄ ir diezgan svarÄ«ga un gandrÄ«z neatÅemama SRE sastÄvdaļa lielÄs komandÄs. Un to parasti sauc par haosa inženieriju, kas nÄk no Netflix komandas, kas izlaida utilÄ«tu ar nosaukumu Chaos Monkey.
Chaos Monkey izveido savienojumu ar CI/CD cauruļvadu un nejauÅ”i avarÄ serveri ražoÅ”anas procesÄ. Atkal SRE struktÅ«rÄ mÄs runÄjam par to, ka nolaists serveris pats par sevi nav slikts, tas ir sagaidÄms. Un, ja tas ir budžeta ietvaros, tas ir pieÅemami un nekaitÄ biznesam. Protams, Netflix ir pietiekami daudz lieku serveru, pietiekami daudz replikÄcijas, lai to visu varÄtu salabot, un lai lietotÄjs kopumÄ to pat nepamana, un vÄl jo vairÄk neviens neatstÄj vienu serveri par kÄdu budžetu.
Netflix savulaik bija vesels Å”Ädu utilÄ«tu komplekts, no kuriem viens, Chaos Gorilla, pilnÄ«bÄ atspÄjo vienu no Amazon pieejamÄ«bas zonÄm. Un Å”Ädas lietas labi palÄ«dz identificÄt, pirmkÄrt, slÄptÄs atkarÄ«bas, kad nav lÄ«dz galam skaidrs, kas ko ietekmÄ, kas no kÄ ir atkarÄ«gs. Un tas, ja strÄdÄjat ar mikropakalpojumu un dokumentÄcija nav pilnÄ«gi perfekta, tas jums var bÅ«t pazÄ«stams. Un atkal, tas palÄ«dz noÄ·ert kļūdas kodÄ, ko nevarat uztvert inscenÄÅ”anas laikÄ, jo jebkura inscenÄÅ”ana nav precÄ«za simulÄcija, jo atŔķiras slodzes skala, slodzes modelis ir atŔķirÄ«gs, aprÄ«kojums ir arÄ«, lielÄkÄ daļa iespÄjams, cits. MaksimÄlÄs slodzes var bÅ«t arÄ« negaidÄ«tas un neparedzamas. Un Å”Äda testÄÅ”ana, kas atkal nepÄrsniedz budžetu, ļoti labi palÄ«dz infrastruktÅ«rÄ noÄ·ert kļūdas, kuras inscenÄjums, autotesti un CI/CD konveijeri nekad neuzÄ·ers. Un, kamÄr tas viss ir iekļauts jÅ«su budžetÄ, nav nozÄ«mes tam, ka jÅ«su pakalpojums ir krities, lai gan tas varÄtu Ŕķist ļoti biedÄjoÅ”i, serveris ir avarÄjis, kÄds murgs. NÄ, tas ir normÄli, tas ir labi, tas palÄ«dz noÄ·ert kļūdas. Ja jums ir budžets, varat to iztÄrÄt.
J: KÄdu literatÅ«ru es varu ieteikt? Saraksts ir beigÄs. LiteratÅ«ras ir daudz, es ieteikÅ”u dažus ziÅojumus. KÄ tas darbojas, un vai SRE darbojas uzÅÄmumos bez sava programmatÅ«ras produkta vai ar minimÄlu attÄ«stÄ«bu. PiemÄram, uzÅÄmumÄ, kurÄ galvenÄ darbÄ«ba nav programmatÅ«ra. UzÅÄmumÄ, kur galvenÄ darbÄ«ba nav programmatÅ«ra, SRE darbojas tieÅ”i tÄpat kÄ visur citur, jo uzÅÄmumÄ arÄ« ir jÄizmanto, pat ja nav izstrÄdÄti, programmatÅ«ras produkti, jÄizlaiž atjauninÄjumi, jÄmaina infrastruktÅ«ra, jums ir jÄaug, jums ir jÄmÄro. Un SRE palÄ«dz identificÄt un paredzÄt iespÄjamÄs problÄmas Å”ajos procesos un kontrolÄt tÄs pÄc izaugsmes sÄkuma un biznesa vajadzÄ«bu izmaiÅÄm. Jo absolÅ«ti nav nepiecieÅ”ams iesaistÄ«ties programmatÅ«ras izstrÄdÄ, lai bÅ«tu SRE, ja jums ir vismaz daži serveri un jums tiek gaidÄ«ta vismaz izaugsme.
Tas pats attiecas uz maziem projektiem, mazÄm organizÄcijÄm, jo āālieliem uzÅÄmumiem ir budžets un vieta eksperimentiem. Bet tajÄ paÅ”Ä laikÄ visus Å”os eksperimentu augļus var izmantot jebkur, tas ir, SRE, protams, parÄdÄ«jÄs Google, Netflix un Dropbox. Bet tajÄ paÅ”Ä laikÄ mazie uzÅÄmumi un jaunuzÅÄmumi jau var lasÄ«t saÄ«sinÄtus materiÄlus, lasÄ«t grÄmatas un skatÄ«ties atskaites. ViÅi sÄk par to dzirdÄt biežÄk, skatÄs konkrÄtus piemÄrus, manuprÄt, tas ir labi, tas tieÅ”Äm var noderÄt, mums arÄ« vajag Å”o, tas ir lieliski.
Tas ir, viss galvenais darbs pie Å”o procesu standartizÄcijas jau ir paveikts jÅ«su vietÄ. Viss, kas jums jÄdara, ir konkrÄti definÄt SRE lomu jÅ«su uzÅÄmumÄ un sÄkt reÄli Ä«stenot visas Ŕīs prakses, kuras, atkal, jau ir aprakstÄ«tas. Tas ir, no maziem uzÅÄmumiem noderÄ«giem principiem, Ŕī vienmÄr ir SLA, SLI, SLO definÄ«cija. Ja neesat saistÄ«ts ar programmatÅ«ru, tad tie bÅ«s iekÅ”Äjie SLA un iekÅ”Äjie SLO, iekÅ”Äjais budžets kļūdÄm. Tas gandrÄ«z vienmÄr noved pie kÄdÄm interesantÄm diskusijÄm komandÄ un uzÅÄmuma iekÅ”ienÄ, jo var izrÄdÄ«ties, ka infrastruktÅ«rai, kaut kÄdai ideÄlu procesu organizÄcijai, ideÄlam cauruļvadam tÄrÄjat daudz vairÄk nekÄ nepiecieÅ”ams. Un Å”ie 4 deviÅi, kas jums ir IT nodaļÄ, jums tagad nav Ä«sti vajadzÄ«gi. Bet tajÄ paÅ”Ä laikÄ bija iespÄja tÄrÄt laiku, tÄrÄt budžetu kļūdÄm kaut kam citam.
AttiecÄ«gi uzraudzÄ«ba un monitoringa organizÄÅ”ana ir noderÄ«ga jebkura lieluma uzÅÄmumam. Un vispÄr Å”Äds domÄÅ”anas veids, kur kļūdas ir kaut kas pieÅemams, kur ir budžets, kur MÄrÄ·i pastÄv, atkal noder jebkura izmÄra uzÅÄmumam, sÄkot no 3 cilvÄku startapa.
PÄdÄjÄ no tehniskajÄm niansÄm, par kurÄm jÄrunÄ, ir monitorings. Jo, ja mÄs runÄjam par SLA, SLI, SLO, mÄs nevaram saprast, nekontrolÄjot, vai mÄs iekļaujamies budžetÄ, vai mÄs ievÄrojam savus mÄrÄ·us un kÄ mÄs ietekmÄjam galÄ«go SLA. Daudzas reizes esmu novÄrojis, ka uzraudzÄ«ba notiek Å”Ädi: ir kÄda vÄrtÄ«ba, piemÄram, pieprasÄ«juma laiks serverim, vidÄjais laiks vai pieprasÄ«jumu skaits datu bÄzei. ViÅam ir standarts, ko nosaka inženieris. Ja metrika atŔķiras no normas, tad pienÄk e-pasts. Tas viss, kÄ likums, ir absolÅ«ti bezjÄdzÄ«gi, jo tas rada tÄdu brÄ«dinÄjumu pÄrpilnÄ«bu, ziÅojumu pÄrpilnÄ«bu no uzraudzÄ«bas, kad personai, pirmkÄrt, tie katru reizi ir jÄinterpretÄ, tas ir, jÄnosaka, vai metrikas vÄrtÄ«ba nozÄ«mÄ. nepiecieÅ”amÄ«ba veikt kÄdu darbÄ«bu. Un, otrkÄrt, viÅÅ” vienkÄrÅ”i pÄrstÄj pamanÄ«t visus Å”os brÄ«dinÄjumus, kad bÅ«tÄ«bÄ no viÅa nav jÄveic nekÄdas darbÄ«bas. Tas ir labs uzraudzÄ«bas noteikums, un pats pirmais noteikums, kad tiek ieviests SRE, ir tÄds, ka paziÅojums jÄiesniedz tikai tad, kad ir nepiecieÅ”ama darbÄ«ba.
Standarta gadÄ«jumÄ ir 3 notikumu lÄ«meÅi. Ir brÄ«dinÄjumi, ir biļetes, ir žurnÄli. BrÄ«dinÄjumi ir jebkas, kas prasa tÅ«lÄ«tÄju darbÄ«bu. Tas ir, viss ir salÅ«zis, jums tas ir jÄsalabo tÅ«lÄ«t. Biļetes ir tas, kas prasa novÄlotu darbÄ«bu. JÄ, jums kaut kas jÄdara, jums kaut kas jÄdara manuÄli, automatizÄcija neizdevÄs, bet jums tas nav jÄdara tuvÄkajÄs minÅ«tÄs. ŽurnÄli ir jebkas, kas neprasa nekÄdas darbÄ«bas, un vispÄr, ja viss iet labi, neviens tos nekad nelasÄ«s. ŽurnÄlus vajadzÄs palasÄ«t tikai tad, kad retrospektÄ«vi atklÄjÄs, ka kÄdu laiku kaut kas salÅ«za, mÄs par to nezinÄjÄm. Vai arÄ« jums ir jÄveic daži pÄtÄ«jumi. Bet kopumÄ viss, kas neprasa nekÄdas darbÄ«bas, nonÄk baļķos.
KÄ blakusefekts tam visam, ja esam identificÄjuÅ”i, kuri notikumi prasa darbÄ«bas, un esam labi aprakstÄ«juÅ”i, kÄdÄm Ŕīm darbÄ«bÄm jÄbÅ«t, tas nozÄ«mÄ, ka darbÄ«bu var automatizÄt. Tas ir, kas notiek. MÄs izejam no modrÄ«bas. PÄriesim pie darbÄ«bas. MÄs ejam uz Ŕīs darbÄ«bas aprakstu. Un tad mÄs pÄrejam pie automatizÄcijas. Tas ir, jebkura automatizÄcija sÄkas ar reakciju uz notikumu.
No monitoringa mÄs pÄrejam pie termina, ko sauc par novÄrojamÄ«bu. Ap Å”o vÄrdu pÄdÄjos gados ir bijusi arÄ« neliela ažiotÄža. Un tikai daži cilvÄki saprot, ko tas nozÄ«mÄ Ärpus konteksta. Bet galvenais ir tas, ka novÄrojamÄ«ba ir sistÄmas caurskatÄmÄ«bas rÄdÄ«tÄjs. Ja kaut kas nogÄja greizi, cik Ätri var noteikt, kas tieÅ”i nogÄja greizi un kÄds bija sistÄmas stÄvoklis tajÄ brÄ«dÄ«. No koda viedokļa: kura funkcija neizdevÄs, kurÅ” pakalpojums neizdevÄs. KÄds bija, piemÄram, iekÅ”Äjo mainÄ«go, konfigurÄcijas stÄvoklis. No infrastruktÅ«ras viedokļa tas ir, kurÄ pieejamÄ«bas zonÄ radÄs kļūme, un, ja jums ir kÄda veida Kubernetes, tad kurÄ podÄ radÄs kļūme, kÄds bija pod stÄvokļa. Un attiecÄ«gi novÄrojamÄ«bai ir tieÅ”a saistÄ«ba ar MTTR. Jo augstÄka pakalpojuma NovÄrojamÄ«ba, jo vieglÄk ir identificÄt kļūdu, vieglÄk novÄrst kļūdu, vieglÄk automatizÄt kļūdu, jo zemÄks MTTR.
Ja atkal pÄrejam pie mazajiem uzÅÄmumiem, viÅi ļoti bieži arÄ« tagad jautÄ, ko darÄ«t ar kolektÄ«va lielumu un vai mazÄ kolektÄ«vÄ ir nepiecieÅ”ams algot atseviŔķu VNÄŖ. Par to jau tika runÄts nedaudz agrÄk. Startup vai, piemÄram, komandas attÄ«stÄ«bas pirmajos posmos tas nemaz nav nepiecieÅ”ams, jo SRE var padarÄ«t par pÄrejas lomu. Un tas nedaudz atdzÄ«vinÄs komandu, jo ir vismaz kaut kÄda dažÄdÄ«ba. Un plus tas sagatavos cilvÄkus tam, ka lÄ«dz ar izaugsmi kopumÄ SRE pienÄkumi ļoti bÅ«tiski mainÄ«sies. Ja pieÅem darbÄ cilvÄku, tad viÅam, protams, ir zinÄmas cerÄ«bas. Un Ŕīs cerÄ«bas laika gaitÄ nemainÄ«sies, bet prasÄ«bas mainÄ«sies ļoti daudz. TÄpÄc sÄkotnÄjÄ posmÄ ir diezgan grÅ«ti pieÅemt darbÄ SRE. AudzÄt paÅ”am ir daudz vieglÄk. Bet par to ir vÄrts padomÄt.
VienÄ«gais izÅÄmums, iespÄjams, ir gadÄ«jumi, kad ir ļoti stingras un skaidri noteiktas izaugsmes prasÄ«bas. Tas ir, starta gadÄ«jumÄ tas var bÅ«t kÄds investoru spiediens, kaut kÄda izaugsmes prognoze vairÄkas reizes vienlaikus. Tad SRE pieÅemÅ”ana darbÄ bÅ«tÄ«bÄ ir attaisnojama, jo to var attaisnot. Mums ir prasÄ«bas izaugsmei, vajag cilvÄku, kurÅ” atbildÄs par to, ka ar tÄdu izaugsmi nekas nesalÅ«zÄ«s.
VÄl viens jautÄjums. Ko darÄ«t, ja vairÄkas reizes izstrÄdÄtÄji izgriež funkciju, kas iztur testus, bet pÄrtrauc ražoÅ”anu, ielÄdÄ bÄzi, pÄrtrauc citas funkcijas, kÄdu procesu ieviest. AttiecÄ«gi Å”ajÄ gadÄ«jumÄ tiek ieviests budžets kļūdÄm. Un daži pakalpojumi, dažas funkcijas jau tiek pÄrbaudÄ«tas ražoÅ”anÄ. Tas var bÅ«t kanÄrijputniÅÅ”, kad tikai neliels lietotÄju skaits, bet jau ražoÅ”anÄ tiek izvietota funkcija, bet jau ar cerÄ«bu, ka, ja kaut kas saplÄ«st, piemÄram, pusprocentam no visiem lietotÄjiem, tas joprojÄm atbilst budžets kļūdÄm. AttiecÄ«gi, jÄ, bÅ«s kļūda, dažiem lietotÄjiem viss salÅ«zÄ«s, bet mÄs jau teicÄm, ka tas ir normÄli.
Bija jautÄjums par SRE rÄ«kiem. Tas ir, vai ir kaut kas Ä«paÅ”s, ko SRE izmantotu, ko visi citi neizmantotu? PatiesÄ«bÄ ir dažas ļoti specializÄtas utilÄ«tas, ir programmatÅ«ra, kas, piemÄram, simulÄ slodzes vai veic kanÄrijas A/B testÄÅ”anu. Bet bÅ«tÄ«bÄ SRE rÄ«ki ir tas, ko jÅ«su izstrÄdÄtÄji jau izmanto. TÄ kÄ SRE tieÅ”i mijiedarbojas ar izstrÄdes komandu. Un, ja jums ir dažÄdi rÄ«ki, izrÄdÄs, ka sinhronizÄcija prasa laiku. ÄŖpaÅ”i, ja SRE strÄdÄ lielÄs komandÄs, lielos uzÅÄmumos, kur var bÅ«t vairÄkas komandas, Å”eit ļoti noderÄs uzÅÄmuma mÄroga standartizÄcija, jo, ja 50 komandas izmanto 50 dažÄdus utilÄ«tus, tas nozÄ«mÄ, ka SRE tÄs visas ir jÄzina. Un tas, protams, nekad nenotiks. Un darba kvalitÄte, kontroles kvalitÄte vismaz daļai kolektÄ«vu ievÄrojami samazinÄsies.
MÅ«su vebinÄrs tuvojas noslÄgumam. Man izdevÄs jums pastÄstÄ«t dažas pamata lietas. Protams, stundas laikÄ par SRE neko nevar izstÄstÄ«t un saprast. Bet es ceru, ka man izdevÄs nodot Å”o domÄÅ”anas veidu, galvenos galvenos punktus. Un tad, ja ir interese, var iedziļinÄties tÄmÄ, studÄt paÅ”i, un paskatÄ«ties, kÄ to Ä«steno citi cilvÄki, citos uzÅÄmumos. Un attiecÄ«gi februÄra sÄkumÄ nÄc pie mums Slurm SRE.
Slurm SRE ir trÄ«s dienu intensÄ«vs kurss, kurÄ tiks runÄts par to, par ko es tagad runÄju, bet daudz dziļÄk, ar reÄliem gadÄ«jumiem, ar praksi visa intensÄ«vÄ ir vÄrsta uz praktisko darbu. CilvÄki tiks sadalÄ«ti komandÄs. JÅ«s visi strÄdÄsit pie reÄliem gadÄ«jumiem. AttiecÄ«gi mums ir vietnes Booking.com instruktori Ivans Kruglovs un Bens Tailers. Mums ir brÄ«niŔķīgs JevgeÅijs Barabass no Google no Sanfrancisko. Un es tev arÄ« kaut ko pastÄstÄ«Å”u. TÄpÄc noteikti apmeklÄjiet mÅ«s.
TÄtad, bibliogrÄfija. Ir atsauces uz SRE.
VÄl 2 saites par haosa inženierijas principiem:
Interesants raksts:
Paldies, ka visu Å”o laiku mani klausÄ«jÄties. Ceru, ka kaut ko uzzinÄjÄt. Es ceru, ka jums ir pietiekami daudz materiÄlu, lai uzzinÄtu vÄl vairÄk. Un tiekamies. Cerams februÄrÄ«.
VebinÄru vadÄ«ja Eduards Medvedevs.
PS: tiem, kam patÄ«k lasÄ«t, Eduards iedeva atsauÄu sarakstu. Tie, kas dod priekÅ”roku saprast praksÄ, laipni aicinÄti
Avots: www.habr.com