Notera. transl.Vi Àr glada att kunna dela översÀttningen av ett fantastiskt material frÄn Adrian Hornsby, Senior Technology Evangelist pÄ AWS. Enkelt uttryckt förklarar han vikten av experiment utformade för att mildra konsekvenserna av fel i IT-system. Har du förmodligen redan hört talas om Chaos Monkey (eller ens anvÀnt liknande lösningar)? Idag genomförs metoder för att skapa sÄdana verktyg och deras implementering i ett bredare sammanhang inom ramen för en aktivitet som kallas chaos engineering. LÀs mer om det i den hÀr artikeln.

âMen bakom all denna skönhet döljer sig kaos och galenskap.â â Tanner Walling
BrandmÀnDessa vÀlutbildade yrkesmÀn riskerar sina liv varje dag nÀr de bekÀmpar brÀnder. Visste du att innan du kan bli brandman mÄste du utbilda dig i minst 600 timmar? Och det Àr bara början. BrandmÀn rapporteras utbilda sig upp till 80 % av sin tid pÄ jobbet.
Varför?
NÀr en brandman bekÀmpar en riktig brand behöver hen lÀmplig utrustning. intuitionFör att utveckla det mÄste man öva timme efter timme, dag efter dag. Som man brukar sÀga, övning ger fÀrdighet.
"De tycks penetrera sjÀlva eldens vÀsen; likt lÄgans Dr. Phil."
Notera. transl.Phillip Calvin "Phil" McGraw Àr en amerikansk psykolog, författare och programledare för det populÀra tv-programmet Dr. Phil, dÀr programledaren erbjuder sina deltagare lösningar pÄ deras problem.
Det var en gÄng i Seattle
I början av 2000 -talet , som hade en position pÄ Amazon med den officiella titeln MÀstare i katastrofen, skapade och ledde GameDay-programmet. Det baserades pÄ hans erfarenhet som brandman. GameDay utformades för att testa, utbilda och förbereda olika Amazon-system, programvara och personer för potentiella krissituationer.
Precis som brandmÀn utvecklar intuition för att bekÀmpa brÀnder, skulle Jesse hjÀlpa sitt team att utveckla intuition för att hantera storskaliga katastrofala hÀndelser.

"GameDay: Skapa motstÄndskraft genom förstörelse" - Jesse Robbins
utformades för att förbÀttra motstÄndskraften hos Amazons detaljhandelssajt genom att avsiktligt introducera buggar i kritiska system.
GameDay började med en serie företagsomfattande tillkĂ€nnagivanden om att en övning planerades â ibland en storskalig sĂ„dan, som att stĂ€nga ner ett helt datacenter. Detaljerna om det planerade avbrottet var minimala, och teamet fick flera mĂ„nader pĂ„ sig att förbereda sig. HuvudmĂ„let med övningen var att testa om personalen kunde hantera en lokal kris och snabbt lösa dess konsekvenser.
Under dessa övningar anvĂ€ndes specialverktyg och processer som övervakning, varningar och nödsamtal för att analysera och identifiera fel i incidenthanteringsprocedurer. Det visade sig att GameDay Ă€r mycket bra pĂ„ att identifiera klassiska arkitekturproblem. Ibland var det ocksĂ„ möjligt att hitta sĂ„ kallade "dolda defekter" â problem som manifesterade sig pĂ„ grund av incidentens detaljer. Till exempel misslyckades incidenthanteringssystem som var avgörande för Ă„terstĂ€llningsprocessen pĂ„ grund av ovĂ€ntade biverkningar orsakade av ett konstgjort problem.
Allt eftersom företaget vÀxte utökades GameDays teoretiska explosionsradie. SÄ smÄningom avbröts övningarna eftersom den potentiella skadan för företaget om saker och ting gick fel var för stor. Sedan dess har programmet urartat till en serie isolerade, icke-affÀrspÄverkande experiment för att utbilda personal i krishantering. Jag kommer inte att gÄ in pÄ detaljerna om experimenten i den hÀr artikeln, men jag kommer att göra det i framtiden. Under tiden vill jag diskutera en viktig idé bakom GameDay: tillförlitlighetsteknik. (motstÄndskraftsteknik), Àven kÀnd som kaosteknik ().
Apornas uppgÄng
Du har sÀkert hört talas om Netflix, leverantören av onlinevideoinnehÄll. Netflix började flytta frÄn sitt lokala datacenter till AWS Cloud i augusti 2008. Flytten föranleddes av en större databaskorruption som försenade DVD-leveranser med tre dagar (ja, Netflix började med att skicka filmer via vanlig post). Flytten till molnet drevs av behovet av att hantera mycket högre streamingbelastningar, samt en önskan att gÄ ifrÄn en monolitisk arkitektur och mot mikrotjÀnster som enkelt kunde skalas beroende pÄ antalet anvÀndare och storleken pÄ teknikteamet. StreamingtjÀnstens front-end flyttade först till AWS, mellan 2010 och 2011, följt av företagets IT och allt annat. Netflix lokala datacenter stÀngdes 2016. Företaget mÀter tillgÀnglighet som antalet lyckade försök att starta en film dividerat med det totala antalet, snarare Àn som en enkel jÀmförelse av drifttid och driftstopp, och strÀvar efter att uppnÄ 0,9999 i varje region kvartalsvis (det lyckas ofta). Netflix globala arkitektur strÀcker sig över tre AWS-regioner, sÄ om det finns ett problem i en region kan företaget omdirigera anvÀndare till andra.
Jag ska upprepa ett av mina favoritcitat:
"Misslyckanden Àr oundvikliga; sÄ smÄningom kommer alla system att kollapsa." - Werner Vogels
Visst, fel i distribuerade system, sĂ€rskilt i stor skala, Ă€r oundvikliga Ă€ven i molnet. Men AWS-molnet och dess redundansprimitiver â i synnerhet, , som den bygger pĂ„, gör det möjligt för vem som helst att utforma mycket tillförlitliga tjĂ€nster.
AnvÀnda principerna för redundans (redundans) och gradvis minskning av funktionalitet (graciös förnedring)Netflix , utan att pÄverka slutanvÀndarna.
Netflix har haft de mest rigorösa arkitekturprinciperna frĂ„n början. En av de första applikationerna de driftsatte pĂ„ AWS var deras â för att stödja automatisk skalning av tillstĂ„ndslösa mikrotjĂ€nster. Med andra ord kan vilken instans som helst stoppas och ersĂ€ttas automatiskt utan tillstĂ„ndsförlust. Chaos Monkey ser till att ingen bryter mot denna princip.
Notera. transl.Förresten, det finns en analog till Kubernetes som heter , vars utveckling verkar ha upphört i mars i Är.
Netflix har ytterligare en regel som krÀver att varje tjÀnst ska vara distribuerad över tre tillgÀnglighetszoner. Den mÄste fortsÀtta att fungera om bara tvÄ av dem Àr tillgÀngliga. För att sÀkerstÀlla att denna regel följs, inaktiverar tillgÀnglighetszoner. PÄ en mer global skala kapabla att stÀnga ner en hel AWS-region för att bekrÀfta att alla Netflix-anvÀndare kan betjÀnas frÄn vilken som helst av de tre regionerna. Och de kör dessa storskaliga tester med nÄgra veckors mellanrum i produktionen för att sÀkerstÀlla att ingenting slinker mellan stolarna.
Slutligen har Netflix ocksÄ utvecklat mer riktade för att identifiera problem med mikrotjÀnster och lagringsarkitektur. Du kan lÀra dig mer om dessa tekniker i boken Chaos Engineering, som jag rekommenderar till alla som Àr intresserade av detta Àmne.
"Genom att regelbundet genomföra experiment som simulerar regionala avbrott kunde vi tidigt identifiera olika systemiska svagheter och ÄtgÀrda dem."
Idag, principerna för kaosteknik de har följande definition:
"Kaosteknik Àr ett tillvÀgagÄngssÀtt som innebÀr att man experimenterar med ett produktionssystem för att sÀkerstÀlla att det kan motstÄ olika störningar som kan uppstÄ under drift."
Men i hans , tillÀgnad kaosteknik, , den tidigare skaparen av Netflix molnarkitektur som hjÀlpte företaget att gÄ över till en molnbaserad infrastruktur, har en alternativ definition av kaosteknik som jag anser vara mer korrekt och vÀletablerad:
"Kaosteknik Àr ett experiment för att mildra effekterna av misslyckanden."
Vi vet att fel intrÀffar hela tiden. Med rÀtt respons bör de inte pÄverka slutanvÀndarna. HuvudmÄlet med kaosteknik Àr att upptÀcka problem som inte ÄtgÀrdas ordentligt.
NödvÀndiga förutsÀttningar för att skapa kaos
Innan du börjar med kaosteknik, se till att du har gjort allt arbete som krÀvs för att sÀkerstÀlla motstÄndskraft pÄ alla nivÄer i organisationen. Att bygga motstÄndskraftiga system handlar inte bara om programvara. Det börjar vid infrastruktur, gÀller för nÀtverk och data, pÄverkar strukturen tillÀmpningar, och tÀcker slutligen mÀnniskor och kulturJag har skrivit mycket om resiliensmodeller och misslyckanden tidigare (, , О ) och jag kommer inte att fokusera pÄ detta nu, men jag kan inte klara mig utan en liten pÄminnelse.

NÄgra obligatoriska element innan man introducerar kaos i ett system (listan Àr inte uttömmande)
Steg av kaosteknik
Det Àr viktigt att förstÄ kÀrnan i kaosteknik INTE handlar om att slÀppa lös apor och lÄta dem krossa saker utan nÄgot syfte. Tanken bakom denna disciplin Àr att bryta sönder vissa delar av ett system i en kontrollerad miljö genom vÀl utformade experiment för att se om din applikation kan motstÄ turbulenta förhÄllanden.
För att göra detta mÄste du följa en tydligt definierad, formaliserad process, som visas i figuren nedan, som tar dig frÄn att förstÄ ditt systems stationÀra tillstÄnd till att formulera en hypotes, testa den och slutligen analysera erfarenheterna frÄn experimentet och förbÀttra systemets stabilitet.

Steg av kaosteknik
1. Stabilt tillstÄnd
En av de viktigaste delarna av kaosteknik Àr att förstÄ systemets beteende under normala förhÄllanden.
Varför? Det Àr enkelt: efter att ha introducerat ett artificiellt fel mÄste du se till att systemet har ÄtergÄtt till ett vÀl studerat stabilt tillstÄnd och att experimentet inte lÀngre stör dess normala beteende.
Nyckeln hÀr Àr att inte fokusera pÄ systemets interna attribut (processor, minne, etc.), utan pÄ de mÀtbara utsignaler som kopplar prestanda till anvÀndarupplevelse. För att dessa utsignaler ska vara stabila bör systemets observerbara beteende ha ett förutsÀgbart mönster, men förÀndras avsevÀrt nÀr ett fel uppstÄr i systemet.
Med tanke pÄ , som föreslagits ovan av Adrian Cockcroft, förÀndras detta stabila tillstÄnd nÀr ett utom kontroll fel orsakar ett ovÀntat problem och signalerar att kaosexperimentet bör avbrytas.
Som ett exempel pÄ stabila tillstÄnd kan man ta Amazon. Företaget anvÀnder ordervolym som ett av sina stationÀra mÀtvÀrden, och det av goda skÀl. à r 2007 beskrev Greg Linden, tidigare pÄ Amazon, hur han experimenterade med metoden. försökte sakta ner laddningstiden för webbplatsens sidor i steg om 100 ms och fann att Àven mindre förseningar resulterade i en betydande minskning av intÀkterna. För varje 100 ms ökning av laddningstiden minskade antalet bestÀllningar (och dÀrmed försÀljningen) med 1 %. Det Àr dÀrför antalet bestÀllningar Àr en bra kandidat för ett steady-state-mÄtt.
Netflix, Ă„ andra sidan, anvĂ€nder ett serversidesmĂ„tt relaterat till nĂ€r en video börjar spelas â antalet gĂ„nger spelaren klickar pĂ„ "play"-knappen. De lade mĂ€rke till ett mönster i beteendet hos SPS-mĂ„ttet (starter per sekund) och dess betydande fluktuationer vid systemfel. MĂ„ttet kallades "Netflix Pulse" ().
Amazons Orders och Netflix Pulse Àr utmÀrkta barometrar för stabilitet eftersom de kombinerar anvÀndarupplevelse och operativa mÀtvÀrden till ett enda, mÀtbart och mycket förutsÀgbart mÄtt.
MÀt, mÀt och mÀt igen
Det sÀger sig sjÀlvt att om du inte kan fÄnga systemstatistik korrekt, kommer du inte att kunna övervaka (eller ens upptÀcka) förÀndringar i stationÀrt tillstÄnd. Var sÀrskilt uppmÀrksam pÄ att fÄnga alla parametrar/statistik, frÄn nÀtverk, hÄrdvara, applikation och mÀnniskor. Rita dessa mÀtningar, Àven om de inte förÀndras över tid. Du kommer att bli förvÄnad över att upptÀcka korrelationer du inte visste fanns.
"Gör det sÄ enkelt som möjligt för ingenjörer att fÄ tillgÄng till data som de kan berÀkna eller grafiskt se pÄ."
2. Hypotes
Efter att ha behandlat det stabila tillstÄndet kan vi gÄ vidare till att formulera en hypotes.

- Vad hÀnder om rekommendationsmotorn stannar?
- Vad hÀnder om lastbalanseraren gÄr ner?
- Vad hÀnder om cachningen misslyckas?
- Vad hÀnder om latensen ökar med 300 ms?
- Vad hÀnder om masterbasen faller?
Naturligtvis bör du bara vÀlja en hypotes och inte komplicera den i onödan. Börja i liten skala. Jag gillar att börja med personalhypotesen. Har du hört talas om bussfaktor ()Bussfaktorn Àr ett mÄtt pÄ risken i samband med att kunskapen Àr ojÀmnt fördelad mellan teammedlemmarna. Den lÄter dig berÀkna det minsta antalet teammedlemmar, efter vilka projektet plötsligt kommer att avbrytas pÄ grund av bristande kunskap eller erfarenhet.
MÄnga företag har tekniska experter vars plötsliga försvinnande ("att bli pÄkörd av en buss") skulle ha en förödande effekt pÄ bÄde projektet och teamet. Identifiera dessa personer och genomför kaosexperiment med dem: till exempel ta bort deras datorer och skicka hem dem i en dag, och observera sedan de (ofta kaotiska) resultaten.
Gör problemet gemensamt för alla!
Attrahera hela laget att utveckla en hypotes. LÄt alla delta i brainstormingen: produktÀgaren, teknisk chef, backend- och frontend-utvecklare, designers, arkitekter etc. Alla som pÄ nÄgot sÀtt Àr kopplade till produkten.
Be först alla att skriva ner svaret pĂ„ frĂ„gan âTĂ€nk omâŠ?â pĂ„ ett papper. Du kommer att se att i de flesta fall har alla sitt eget svar, och du kommer att inse att en del av teamet inte alls har tĂ€nkt pĂ„ det hĂ€r problemet tidigare.
Stanna hĂ€r och diskutera varför teammedlemmar har olika uppfattningar om hur produkten kommer att bete sig i fallet âTĂ€nk omâŠ?â. GĂ„ tillbaka till produktspecifikationerna och se till att alla har en klar uppfattning om vad som kan hĂ€nda.
Ta den tidigare nÀmnda Amazon-butiken som exempel. TÀnk om tjÀnsten Handla efter kategori slutade laddas pÄ startsidan?

Ska jag returnera ett 404-fel? Ska jag ladda sidan och lÀmna tomt utrymme som i skÀrmdumpen nedan?

Ăr det vĂ€rt att offra viss funktionalitet och till exempel lĂ„ta sidan expandera och dölja felet?

Och det Àr bara pÄ grÀnssnittssidan. Vad ska hÀnda i backend? Ska aviseringar skickas? Ska den felande tjÀnsten fortsÀtta att ta emot förfrÄgningar varje gÄng anvÀndaren laddar startsidan, eller ska backend stÀnga av den helt?
Slutligen, formulera inte en hypotes som du vet kommer att misslyckas! Experimentera med delar av systemet som du tror Ă€r stabila â det Ă€r ju hela poĂ€ngen med att experimentera.
3. Utforma och genomföra ett experiment
- VĂ€lj en hypotes;
- Definiera experimentets omfattning;
- Identifiera de relaterade mÀtvÀrden som kommer att mÀtas;
- Meddela organisationen.
Idag mĂ„nga mĂ€nniskor, liksom webbplatsen , driver idĂ©n om kaosteknik i produktionen. Ăven om detta borde vara slutmĂ„let, tycker de flesta organisationer att det hĂ€r tillvĂ€gagĂ„ngssĂ€ttet Ă€r skrĂ€mmande, sĂ„ det Ă€r inte rĂ€tt stĂ€lle att börja.
För mig handlar kaosteknik inte bara om att ha förstört olika delar av produktionssystem. Det Ă€r en resa. En upptĂ€cktsresa som följer med att ha förstört system i en kontrollerad miljö â vilken miljö som helst, vare sig det Ă€r lokal utveckling, beta, staging eller produktion. Att bryta igenom vĂ€l utformade experiment för att bygga förtroende för din applikations förmĂ„ga att motstĂ„ turbulenta förhĂ„llanden.Bygga upp sjĂ€lvförtroende" Ă€r en viktig punkt hĂ€r eftersom det Ă€r en föregĂ„ngare till de kulturella förĂ€ndringar som krĂ€vs för att framgĂ„ngsrikt implementera kaosteknik och tillförlitlighetspraxis i ditt företag.
Ărligt talat lĂ€r sig de flesta team mycket genom att knĂ€cka saker Ă€ven i en icke-produktionsmiljö. Testa bara. docker stop database i den lokala miljön och se om du kan hantera problemet utan konsekvenser. Chansen Ă€r stor att du inte kan det.

Stoppa en databas - exempel
Börja i liten skala och bygg gradvis upp förtroendet inom ditt team och din organisation. Du kommer att fÄ höra att "riktig produktionstrafik Àr det enda sÀttet att pÄ ett tillförlitligt sÀtt fÄnga upp systembeteende." Lyssna, le och fortsÀtt göra det du gör, lÄngsamt. Det vÀrsta du kan göra Àr att tillÀmpa kaosteknik pÄ produktionen och misslyckas kapitalt. Efter det kommer ingen att lita pÄ dig, och du kommer att tvingas glömma "kaosaporna" för alltid.
FörtjÀna förtroende först. Visa organisationen och dina kollegor att du vet vad du gör. Bli brandman och lÀr dig sÄ mycket om brand som möjligt innan du gÄr vidare till brandutbildning i realtid. FörtjÀna din trovÀrdighet. Kom ihÄg. berÀttelsen om sköldpaddan och harenDen lÄngsamme och tÄlmodige vinner alltid loppet.
En av de viktigaste sakerna att komma ihÄg nÀr man experimenterar Àr att förstÄ potentialen förstörelsens radie frÄn det misslyckande du introducerar och dess minimering. StÀll dig sjÀlv följande frÄgor:
- Hur mÄnga kunder kommer experimentet att pÄverka?
- Vilken funktionalitet kommer att pÄverkas?
- Vilka platser kommer att pÄverkas?
TÀnk pÄ en "kill switch", eller ett sÀtt att omedelbart avbryta experimentet och ÄtergÄ till ett stabilt tillstÄnd sÄ snabbt som möjligt. Jag gillar att köra experiment med hjÀlp av vad jag kallar "canary"-distributioner. Denna teknik minskar risken för misslyckanden nÀr nya versioner av en applikation lanseras i produktion genom att gradvis rulla ut Àndringar till en liten delmÀngd av anvÀndare och sedan lÄngsamt rulla ut dem till hela infrastrukturen och alla anvÀndare. Jag Àlskar canary-distributioner helt enkelt för att de uppfyller principen om , och sjÀlva experimentet Àr ganska lÀtt att stoppa.

Ett exempel pÄ en DNS-baserad canary-utrullning för kaosexperiment
Var försiktig med experiment som Àndrar applikationens tillstÄnd (cache eller databas) eller som inte kan ÄterstÀllas (enkelt eller alls).
Intressant nog berÀttade Adrian Cockcroft för mig att en av anledningarna till att Netflix började anvÀnda NoSQL-databaser var att de inte har ett schema för Àndringar eller ÄterstÀllningar, sÄ det Àr mycket enklare att stegvis uppdatera eller ÄtgÀrda enskilda dataposter (dvs. de Àr mer kaosteknikvÀnliga).
4. Observera och lÀr
För att lĂ€ra sig nya saker och övervaka experimentets framsteg Ă€r det nödvĂ€ndigt att kunna övervaka systemets mĂ€tvĂ€rden. Som tidigare nĂ€mnts, var noga med alla möjliga mĂ€tvĂ€rden och parametrar! Kvantifiera sedan resultaten och tajma alltid â alltid! â de första tecknen pĂ„ ett problem. Jag har haft mĂ„nga fall i min historia dĂ€r varningssystem misslyckades och de första att rapportera problemet var kunder pĂ„ Twitter⊠tro mig, du vill inte hamna i den situationen, sĂ„ anvĂ€nd kaosexperiment för att testa dina övervaknings- och varningssystem ocksĂ„.
- Dags för upptÀckt?
- Tid före avisering och start av aktiva ÄtgÀrder?
- Tid före offentligt tillkÀnnagivande?
- Tid till delvis funktionsförlust?
- Hur lÀnge varar sjÀlvlÀkningsperioden?
- Dags för hel eller delvis ÄterhÀmtning?
- Hur lÄng tid tar det innan krisen Àr över och en ÄtergÄng till ett stabilt tillstÄnd?
Kom ihÄg att det inte finns nÄgon enskild isolerad orsak till misslyckanden. Stora katastrofer Àr alltid resultatet av flera smÄ misslyckanden som ackumuleras och leder till en större kris.
Genomför en detaljerad analys (obduktion) av resultaten frÄn varje experiment!
PÄ AWS Àr vi noggranna med att analysera de fel vi stöter pÄ och förstÄ grundorsakerna för att förhindra liknande problem i framtiden. Alla resultat frÄn experimentet sammanstÀlls i ett dokument som kallas felkorrigering (Correction-of-Errors, COE). COE lÄter oss lÀra av vÄra misstag, oavsett om de Àr brister i teknik, process eller till och med organisation. Vi anvÀnder denna mekanism för att eliminera grundorsakerna till fel och kontinuerligt förbÀttra oss.
Nyckeln till framgÄng i denna process Àr öppenhet och transparens kring vad som gick fel. En av de viktigaste principerna för att skriva en bra COE Àr att vara opartisk och undvika att namnge specifika personer. Detta Àr ofta svÄrt i en miljö som inte belönar sÄdant beteende och inte tolererar möjligheten till misslyckande. Amazon anvÀnder en samling "ledarskapsprinciper" () för att uppmuntra sÄdant beteende - till exempel, sjÀlvkritik, analytiskt förhÄllningssÀtt, engagemang för högsta standard och ansvarstagande Àr viktiga komponenter i COE-processen och operativ excellens i allmÀnhet.
COE-rapporten har fem huvudavsnitt:
- Vad hÀnde (kronologisk ordning)?
- Vilken pÄverkan hade kunderna?
- Varför uppstod felet? ()
- Vad lÀrde vi oss?
- Hur kan man förhindra detta i framtiden?
Dessa frÄgor Àr svÄrare att besvara Àn de kan verka vid första anblicken, eftersom du mÄste se till att varje oklar/okÀnd punkt undersöks noggrant.
För att göra COE till en fullfjÀdrad process genomför vi löpande granskningar i form av veckomöten med obligatoriska granskningar av operativa mÀtvÀrden. Dessutom genomför tekniska chefer veckovisa mÀtvÀrden med all AWS-personal.
5. Korrigera och förbÀttra!
Den viktigaste lÀrdomen hÀr Àr prioritera att ÄtgÀrda problem som identifierats under kaosexperiment framför att utveckla nya funktionerInvolvera den högsta ledningen i denna process och ingjut i dem idén att det Àr mycket viktigare att ÄtgÀrda befintliga problem Àn att utveckla ny funktionalitet.
Jag anvÀnde en gÄng ett kaosexperiment för att hjÀlpa en kund att identifiera kritiska stabilitetsproblem, men pÄtryckningar frÄn sÀljföretaget ledde till att lösningen nedgraderades till en ny funktion som var "kritisk" för kunderna. TvÄ veckor senare tvingade ett 16 timmar lÄngt avbrott företaget att ÄtgÀrda samma problem som vi hade identifierat i kaosexperimentet. Bara det att förlusterna var mycket högre.
Fördelar med kaosteknik
Det finns mÄnga fördelar. Jag kommer att lyfta fram tvÄ, enligt min mening de viktigaste:
För det första hjÀlper kaosteknik till att avslöja okÀnda problem i systemet och ÄtgÀrda dem innan de leder till ett produktionsfel, sÀg klockan 3 pÄ morgonen pÄ en söndag. Det vill sÀga, det ökar motstÄndskraften mot störningar och i sjÀlva verket sömnkvaliteten.
För det andra producerar effektivt genomförda kaosexperiment alltid mer omfattande förĂ€ndringar (frĂ€mst kulturella) Ă€n förvĂ€ntat. Den kanske viktigaste av dessa Ă€r den naturliga utvecklingen till "oskyldig" (icke-klandrande) kultur, nĂ€r frĂ„gan âVarför gjorde ni det?â blir âHur kan vi undvika detta i framtiden?â Resultatet Ă€r ett lyckligare, effektivare, mer engagerat och mer framgĂ„ngsrikt team. Och det Ă€r underbart!
Detta avslutar den första delen. Jag hoppas att du gillade den. LÀmna gÀrna en recension, dela dina Äsikter eller klappa bara hÀnderna. I nÀsta del kommer jag att titta pÄ verktyg och metoder för att introducera fel i system. Tills dess - hej dÄ!
För er som Àr ivriga att lÀsa den andra delen, hÀr Àr mitt föredrag om kaosteknik pÄ NDC i Oslo. I det pratar jag om mÄnga av mina favoritverktyg:

PS frÄn översÀttaren
Den andra delen av artikeln pĂ„ engelska och vi kommer Ă€ven att översĂ€tta det om vi ser tillrĂ€ckligt intresse frĂ„n Habr-lĂ€sare för detta material â motsvarande kommentarer till artikeln Ă€r vĂ€lkomna!
LÀs Àven pÄ vÄr blogg:
- «";
- «";
- «".
KĂ€lla: will.com
