Metodu tal-KAŻ: monitoraġġ uman

Metodu tal-KAŻ: monitoraġġ uman
Dziiiiin! Qiegħed it-3 ta’ filgħodu, qed ikollok ħolma mill-isbaħ, u f’daqqa waħda hemm sejħa. Int fuq xogħol din il-ġimgħa, u jidher li ġrat xi ħaġa. Is-sistema awtomatizzata ssejjaħ biex issir taf x'inhu ħażin. Dan huwa aspett importanti tal-ġestjoni tas-sistemi tal-kompjuter moderni, iżda ejja nħarsu lejn kif in-notifiki jsiru aħjar għan-nies.

Kun familjari mal-filosofija tal-monitoraġġ, imwielda fuq diversi għexieren ta 'snin ta' dmirijieti fi timijiet ta 'monitoraġġ differenti. Hija kienet influwenzata ħafna mill-bibbja reali minn Rob Evashchuk Il-Filosofija Tiegħi dwar l-Allert (My Notify Philosophy) inkluż fil-ktieb dwar Google SRE, u ktieb ta’ John Alspaugh Konsiderazzjonijiet għad-Disinn ta' Twissija (Noti dwar it-twaqqif ta' twissijiet).

Kelly Dunn, Arijit Mukheryi и Maxim Petazzoni — grazzi għall-għajnuna tiegħek fl-editjar tal-post.

X'inhu CASE?

Iddeċidejt li noħroġ b'abbrevjazzjoni sabiħa bħal Il-metodu USE ta' Brendan Gregg jew Il-metodu RED ta' Tom Wilkie. Insejħilha Metodu CASE. Huwa jiddeskrivi erba' punti li għandhom jagħtu attenzjoni meta jaħdmu b'monitoraġġ awtomatiku:

Jekk tuża CASE, tittratta n-notifiki b'indifferenza tajba u ma tqajjimx lin-nies bil-lejl. Il-monitoraġġ għandu jiġi vvalutat regolarment għall-utilità u l-effettività. Meta persuna tirċievi n-notifika, ikollha mudelli mentali aħjar u aktar kunfidenza.

Biex tiftakar aktar faċli, immaġina li għandek bżonn KAŻ [jiġifieri każ, raġuni - nota tat-traduttur] biex tiġġustifika kull allert. :nuċċalijiet tax-xemx:

U għaliex dan kollu?

Li tkun fuq ix-xogħol jista’ jkun ta’ uġigħ. Għal ħafna raġunijiet. U CASE mhux se jeliminahom kollha. Iżda magħha, tqum bil-lejl għal notifiki aħjar. Dan il-metodu jkopri diversi proċessi organizzattivi li jgħinu wkoll f'din il-kwistjoni.

Is-sbuħija tal-metodi RED u USE hija li bl-għajnuna tagħhom mhux biss nafu kif naħdmu, iżda wkoll nitkellmu l-istess lingwa ma’ xulxin. It-tama tiegħi hija li l-metodu CASE jagħmilha aktar faċli biex jiġu diskussi notifiki li jipproteġu s-sistemi tagħna iżda jżommu lill-kollegi tagħna okkupati.

Il-punt hu li għandek bżonn toħloq kultura fl-organizzazzjoni tiegħek fejn in-notifiki jiġu ttrattati b'indifferenza b'saħħitha. In-notifiki jistgħu jinħolqu għal skop speċifiku, iżda mhuwiex fatt li mhux se jitilfu l-valur aktar tard. Għaliex waqqafna din in-notifika? Kemm ilu ilu ġew riveduti l-kriterji tagħha? B'CASE, dawn il-mistoqsijiet jistgħu jiġu mwieġba.

Context-Heavy - rabta tal-kuntest

It-3 am mhuwiex l-aħjar ħin biex taqra messaġġi li fihom ħafna kliem intelliġenti. Biex tirrispondi b'mod effettiv, għandek bżonn informazzjoni. Idealment, din għandha tkun informazzjoni dwar kwistjoni speċifika, li għaliha l-kuntest huwa immedjatament ċar, u n-notifiki għandhom jiġu kkonfigurati sabiex dan ikun possibbli. Dan huwa "osservazzjoni" u "orjentazzjoni" minn Loop OODA. Mhix tal-mistħija li tqatta 'ħin fuq din is-setup, minħabba li tfixkel kontinwament persuna hija saħansitra aktar għalja. Ejja nirrispettaw lil xulxin.

Metodu tal-KAŻ: monitoraġġ uman
Il-problemi għandhom ħafna sorsi. Speċjalment ghosts.

Kif nista' ngħin lill-uffiċjal tal-kariga? L-ewwel ħaġa li jara l-uffiċjal tad-dmir hija notifika, għalhekk jibni l-ipoteżi kollha fuq il-bażi tagħha. Imbagħad iħares lejn l-istruzzjonijiet u d-dashboards, iżda dejjem hemm dejta dwar notifika speċifika, u mhux biss informazzjoni ġenerali? Alspaugh jagħti parir "taħseb dwar kif tista' tinterpreta jew tirrispondi għan-notifika" (slide 29)1. Notifika tajba hija ffukata fuq il-persuna fuq ix-xogħol, mhux biss ikkonfigurat minn limitu.

Għalhekk hawn xi ideat dwar kif jista' jittejjeb il-kuntest tan-notifika:

  • Uri lill-utent xi ħaġa utli u maħluqa apposta, u mhux biss struzzjonijiet ordinarji jew dashboard. Preċedentement, il-ġuvini u jien użajna dashboards investigattivi kkonfigurati għal notifiki speċifiċi. Dan jgħin jekk il-problema tkun magħrufa, iżda se jħawdu biss lil oħrajn. Irridu nsibu bilanċ hawnhekk.
  • Għidilna dwar l-istorja tan-notifika: hija ġdida? Taħdem spiss? Huwa staġjonali?
  • Uri bidliet riċenti fl-istat tas-sistema. Inbidel xi ħaġa reċentement? (Pereżempju, skjerament jew abilitazzjoni/diżattivazzjoni tal-funzjonalità.)
  • Uri r-relazzjonijiet u ipprovdi informazzjoni għall-mudell mentali: id-dipendenzi tas-sistema għandhom ikunu viżibbli b'mod ċar, preferibbilment b'indikazzjoni tal-funzjonalità.
  • Qabbad malajr lill-utent mat-tim: jistgħu jaraw inċidenti li għaddejjin jew jistgħu jsibu min ieħor fil-kumpanija rċieva notifika? Programm ġestjoni tal-inċidenti attivat?

Idealment, programm ta' ġestjoni tal-inċidenti jipprovdi pariri dwar kif jista' jittejjeb il-kuntest tan-notifika tal-investigazzjonijiet tal-inċidenti. Dejjem hemm xi ħaġa li taħdem fuqha!

Azzjonibbli - valur prattiku

L-uffiċjal tad-dmir għandu jagħmel xi ħaġa bi tweġiba għan-notifika? Jekk m'għandek bżonn tagħmel xejn jew mhux ċar x'għandek tagħmel, għaliex qajjtu? Trid tevita notifiki li jdejqu lil dawk li jkunu qed jaħdmu u li ma jeħtiġux azzjoni.

Ara l-post fuq imgur.com

X'irrid nagħmel? Xi trid?

Fil-passat, meta s-sistemi kienu sempliċi u t-timijiet kienu żgħar, waqqafna monitoraġġ biss biex nibqgħu fuq kollox. Notifika li t-tagħbija fuq il-borġ żdiedet tagħtina kuntest jekk sussegwentement is-servizz ma jaħdimx ħażin. Fuq skala kbira, notifiki bħal dawn se joħolqu biss konfużjoni minħabba li s-sistemi tagħna dejjem qed joperaw fi stat ta’ degradazzjoni ta’ severità li tvarja. Dan malajr iwassal għal għeja minn notifiki u, ovvjament, għal telf ta 'sensittività. Għalhekk, l-uffiċjal tad-dmir jinjora jew saħansitra jiffiltra tali notifiki u mhux dejjem jirrispondi għalihom kif meħtieġ. Taqax f'din in-nassa! Twaqqafx in-notifiki kollha wara xulxin u mbagħad ibgħathom bl-email f'xi folder forsaken.

Hawn kif jidher avviż b'valur prattiku:

  • Notifika teħtieġ azzjoni aktar milli sempliċement tirrapporta aħbarijiet.
  • Din l-azzjoni hija diffiċli jew riskjuża biex tiġi awtomatizzata. Jekk azzjoni tista 'tiġi awtomatizzata, imbagħad awtomatizzaha, waqqaf il-pestar lin-nies!
  • L-avviż fih rakkomandazzjonijiet urġenti fil-formola ftehimiet dwar il-livell tas-servizz (SLA) jew mira tal-ħin ta' rkupru (RTO). L-uffiċjal tad-dover jista 'mbagħad jattiva l-programm ta' ġestjoni tal-inċidenti tal-organizzazzjoni.

Irrid niċċara: Mhux qed ngħid li n-notifiki għandhom jiġu biss għall-SLOs (għanijiet fil-livell tas-servizz) l-aktar importanti għall-API. Il-monitoraġġ tal-SLO huwa kontinwament frammentat u maqsum u jeħtieġ l-istess approċċ għas-servizzi kollha. Huwa ċar li tkun qed issegwi l-aktar SLOs importanti għall-klijenti li jħallsuk. Iżda l-SLOs tal-infrastruttura, bħal databases, jeħtieġ ukoll li jiġu mmonitorjati. Dalwaqt ikollok tittratta mal-klijenti interni u tappoġġjahom. U hekk ad infinitum.

Ibbażat fuq is-sintomi - enfasi fuq is-sintomi

Kemm jekk tixtieq jew le, qed taħdem f'sistema distribwita (Kavaj)2. Bħala riżultat, tuża tattiċi differenti biex tiżola s-servizzi u tipproteġihom mill-falliment (Trainor et al.)3. U filwaqt li ġbir twil ta 'żibel jew mistoqsija ta' database waqfa tindika problemi, m'hemmx għalfejn tgħaġġel biex tirranġahom jekk l-utenti ma jkollhomx problemi fil-futur qarib.

Dawn huma sinjali importanti u jista 'jkollhom valur prattiku, iżda jekk ma jiddisturbawx lill-utenti, allura mhuwiex urġenti biżżejjed li tfixkel lill-attendant. Notifiki bbażati fuq il-kawżi huma snapshots tal-mudelli mentali tagħna dwar ħsara fis-sistema. Huwa aħjar li ssegwi sintomi importanti milli tipprova telenka l-kawżi kollha possibbli ta 'falliment.

Biex tagħmel in-notifiki sinifikanti, iffoka fuq indikaturi tal-prestazzjoni, importanti għall-utenti. Evashchuk isejjaħ dan "monitoraġġ għall-utenti." Ftakar li din il-filosofija trid tiġi applikata fl-organizzazzjoni kollha. Jekk servizz ikollu problemi urġenti xi mkien fil-fond fl-infrastruttura, it-tim xieraq jieħu ħsiebhom. Il-protezzjoni tas-sistemi minn fallimenti bħal dawn hija kwistjoni kompletament separata (Trainer et al., taqsima dwar strateġiji biex jitnaqqsu d-dipendenzi kritiċi)3.

Is-sintomi mhumiex daqshekk varjabbli

Richard Cook ifakkarna li s-sistemi kumplessi huma mimlija difetti, nuqqasijiet u problemi4. Li tipprova telenka r-raġunijiet kollha possibbli hija kompitu Sisyphean. Inti tipprova tiddeskrivi l-problemi, iżda jinbidlu l-ħin kollu. Cindy Sridharan temmen li "is-sistemi m'għandhomx għalfejn ikunu f'kundizzjoni perfetta kull sekonda" u huwa aħjar li tuża approċċ aktar uman ("Osservabbiltà tas-Sistemi distribwiti" (“Monitoraġġ ta’ Sistemi distribwiti”), 7)5.

Evita notifiki wara inċident

Tipikament, notifiki għall-kawżi huma kkonfigurati biex jikkoreġu l-inċidenti. U dawn in-notifiki limitati dwar il-fatt ta 'dak li ġara joħolqu sens falz ta' sigurtà, għaliex is-sistema kull darba toħroġ b'modi ġodda biex tkisser.

Tkunx imqarraq minn avviżi ta 'kawża. Aħjar taħseb:

  • Għaliex in-notifika bbażata fuq is-sintomi ma nnotatx il-problema?
  • Ikun utli li jittejjeb il-kuntest għall-utent?
  • Kif jistgħu jitjiebu l-għodod ta' monitoraġġ biex issir dijanjosi aktar malajr, aktar milli jakkumulaw notifiki dwar dak li ġara?

Għodod ta 'monitoraġġ għad-dijanjosi se jgħinu biss jekk taħseb minnhom bħala mod kif timxi minn sintomu għal soluzzjoni. Mingħajr dan il-feedback, inti sempliċiment tkun bbumbardjat b'notifiki tard u mapep dwar fallimenti tal-passat—u mhux kelma dwar dawk futuri. Din hija opportunità kbira għal organizzazzjoni biex timxi mid-difiża għall-attakk. U l-iżviluppaturi u l-maniġers tal-prodotti se jkollhom l-istess aspettattivi u miri ċari. Il-każ - KAZ (:wink:) - huwa ċar għal kull notifika.

Notifiki bbażati fuq ir-raġuni huma tollerabbli bil-moderazzjoni

Xi drabi s-sistema tagħna tħallilna ftit għażla f'termini ta' notifiki bbażati fuq il-kawża. U xi drabi dawk li jkunu qed jaħdmu jifhmu perfettament li sintomu żgur iwassal għal falliment, u għalhekk fih valur prattiku. Forsi m'intix ċert x'inhu għaddej u qed twaqqaf notifiki biex tkun fuq in-naħa sigura. Nisperaw li din l-azzjoni hija temporanja sakemm inkunu nistgħu nibdlu s-sistema biex insolvu l-kwistjoni tal-prestazzjoni.
Żomm il-komponenti l-oħra ta' CASE f'moħħok meta tittratta dawn is-sitwazzjonijiet. Sempliċement għax huwa temporanju ma jfissirx li tista 'tieqaf taħseb b'rasek.

Evalwat - evalwazzjoni

Kwalunkwe tibdil fis-sistema (kodiċi ġdid, infrastruttura ġdida, xi ħaġa ġdida) tespandi l-firxa ta 'fallimenti (Cook, 3).4 Din in-notifika għadha qed taħdem kif mistenni? Mudelli mentali ċari u attwali ta 'sistemi u esperjenza li jirrispondu għal xi notifiki ta' appoġġ approċċ preventiv - dawn huma l-karatteristiċi ewlenin organizzazzjoni orjentata lejn it-tagħlim. Id-difetti fis-sistemi qed jevolvu kontinwament, u rridu nlaħqu magħhom.

Għandek bżonn tevalwa kontinwament il-kwalità ta' kull notifika biex tiżgura li taħdem kif mistenni. Għeżież mexxejja! Ikun ħafna aktar faċli għat-timijiet tiegħek jekk tgħinhom jistabbilixxu dan il-proċess! Hawn huma xi ideat ta’ valutazzjoni:

  • Użu inġinerija tal-kaos, ġranet tal-logħob jew metodi oħra ta' ttestjar ta' notifika. It-tim jista 'jagħmel dan hu stess mingħajr ma jkollu għalfejn joqgħod fuq sistema ta' ġestjoni ta 'inċidenti tqal!
  • Inkorpora l-ġbir tan-notifiki kollha relatati mal-inċidenti fil-programm tal-ġestjoni tal-inċidenti tiegħek. Immarka utli, ta' ħsara, mhux xieraq, mhux ċar, eċċ. Użahom bħala feedback.
  • In-notifiki t-tajba jiġu attivati ​​b'mod mhux frekwenti u jiġu ttestjati bir-reqqa. Kun żgur li l-links kollha jaħdmu, ippuntaw lejn il-kuntest it-tajjeb, eċċ.
  • Jekk notifika qatt ma tispara jew tispara spiss wisq, hemm xi ħaġa ħażina fiha. Waħħalha jew neħħiha. Oqgħod attent minn passività jew attività eċċessiva!
  • Issettja timestamps tan-notifika bid-dati tal-iskadenza. Jekk id-data ta' skadenza tkun skadiet, evalwa n-notifika billi tuża l-metodu CASE u aġġorna t-timbru taż-żmien. Eżatt bħall-ikel, iċċekkja d-data ta 'skadenza regolarment.
  • Issimplifika l-proċess tat-titjib tan-notifiki. Uża l-monitoraġġ bħala kodiċi u aħżen in-notifiki f'repożitorju Git. It-talbiet tal-ġbid jgħinu biex jimpenjaw it-tim u jagħtuk storja tan-notifiki tal-passat. U ma tibqax tibża' tibdel in-notifiki jew titlob permess mingħand dawk responsabbli għalihom.
  • Stabbilixxi rispons għan-notifiki, anki jekk huwa sempliċi formola Google, sabiex l-uffiċjali tad-dmir jimmarkaw in-notifiki bħala inutli jew intrużivi. Inkorpora link jew sejħa għall-azzjoni fin-notifika nnifisha u irrevedi l-feedback tiegħek regolarment.
  • Stabbilixxi regola fit-tim - ħalli dawk li jkunu qed jaħdmu biex jissimplifikaw id-dmir meta jkun hemm ftit xogħol. Jalla kollox warajk ikun ftit aħjar milli kien qabel.

Konklużjoni

Nemmen li l-metodu CASE jgħin lill-iżviluppaturi u lill-organizzazzjonijiet jiddiskutu l-istabbiliment u l-bgħit ta’ notifiki awtomatizzati. Żviluppatur wieħed jista 'jibda jivvaluta n-notifiki billi juża l-metodu CASE, u mbagħad l-organizzazzjoni kollha se tingħaqad ma' żviluppaturi oħra, ġestjoni, u programmi ta 'ġestjoni ta' inċidenti biex iżommu n-notifiki f'forma tajba. Dan ma jeħtieġ l-ebda għodda speċjali jew proċessi kumplessi.

L-industrija kollha trid taħseb dwar il-fattur uman waqt ix-xogħol mingħajr ma tissagrifika s-servizz tal-klijent tal-ogħla livell. Dawn l-għodod u l-prattiki kollha jistgħu u għandhom jittejbu. Nispera li l-metodu CASE jgħin f'dan.

Igawdu notifiki mtejba!
Metodu tal-KAŻ: monitoraġġ uman

Sors: www.habr.com

Żid kumment