Nodau Lefel Gwasanaeth - Profiad Google (cyfieithiad o bennod llyfr Google SRE)

Nodau Lefel Gwasanaeth - Profiad Google (cyfieithiad o bennod llyfr Google SRE)

Mae SRE (Peirianneg Dibynadwyedd Safle) yn ddull o sicrhau bod prosiectau gwe ar gael. Fe'i hystyrir yn fframwaith ar gyfer DevOps ac mae'n sôn am sut i sicrhau llwyddiant wrth gymhwyso arferion DevOps. Cyfieithiad yn yr erthygl hon Pennod 4 Amcanion Lefel Gwasanaeth llyfrau Peirianneg Dibynadwyedd Safle oddi wrth Google. Paratoais y cyfieithiad hwn fy hun a dibynnais ar fy mhrofiad fy hun o ddeall prosesau monitro. Yn y sianel telegram monitorim_it и post olaf ar Habré Cyhoeddais hefyd gyfieithiad o Bennod 6 o'r un llyfr am nodau lefel gwasanaeth.

Cyfieithiad gan gath. Mwynhewch ddarllen!

Mae'n amhosib rheoli gwasanaeth os nad oes dealltwriaeth o'r dangosyddion sydd o bwys mewn gwirionedd a sut i'w mesur a'u gwerthuso. I'r perwyl hwn, rydym yn diffinio ac yn darparu lefel benodol o wasanaeth i'n defnyddwyr, ni waeth a ydynt yn defnyddio un o'n APIs mewnol neu gynnyrch cyhoeddus.

Rydym yn defnyddio ein greddf, ein profiad, a'n dealltwriaeth o awydd defnyddwyr i ddeall Dangosyddion Lefel Gwasanaeth (SLI), Amcanion Lefel Gwasanaeth (SLOs), a Chytundebau Lefel Gwasanaeth (CLG). Mae'r dimensiynau hyn yn disgrifio'r prif fetrigau yr ydym am eu monitro ac y byddwn yn ymateb iddynt os na allwn ddarparu'r ansawdd disgwyliedig o wasanaeth. Yn y pen draw, mae dewis y metrigau cywir yn helpu i arwain y camau cywir os aiff rhywbeth o'i le, a hefyd yn rhoi hyder i'r tîm ARhPh yn iechyd y gwasanaeth.

Mae'r bennod hon yn disgrifio'r dull a ddefnyddiwn i frwydro yn erbyn problemau modelu metrig, dethol metrig, a dadansoddi metrig. Bydd y rhan fwyaf o'r esboniadau heb enghreifftiau, felly byddwn yn defnyddio'r gwasanaeth Shakespeare a ddisgrifir yn ei enghraifft weithredu (chwilio am weithiau Shakespeare) i ddangos y prif bwyntiau.

Terminoleg lefel gwasanaeth

Mae'n debyg bod llawer o ddarllenwyr yn gyfarwydd â'r cysyniad o CLG, ond mae'r termau SLI ac SLO yn haeddu diffiniad gofalus oherwydd yn gyffredinol mae'r term CLG wedi'i orlwytho ac mae iddo nifer o ystyron yn dibynnu ar y cyd-destun. Er eglurder, rydym am wahanu'r gwerthoedd hyn.

Dangosyddion

Mae'r SLI yn ddangosydd lefel gwasanaeth—mesur meintiol wedi'i ddiffinio'n ofalus o un agwedd ar lefel y gwasanaeth a ddarperir.

Ar gyfer y rhan fwyaf o wasanaethau, ystyrir mai’r SLI allweddol yw hwyrni ceisiadau – faint o amser y mae’n ei gymryd i ddychwelyd ymateb i gais. Mae SLIs cyffredin eraill yn cynnwys cyfradd gwallau, a fynegir yn aml fel ffracsiwn o'r holl geisiadau a dderbyniwyd, a thrwybwn system, a fesurir fel arfer mewn ceisiadau yr eiliad. Caiff mesuriadau eu hagregu'n aml: cesglir data crai yn gyntaf ac yna caiff ei drawsnewid yn gyfradd newid, cymedr, neu ganradd.

Yn ddelfrydol, mae SLI yn mesur lefel diddordeb y gwasanaeth yn uniongyrchol, ond weithiau dim ond metrig cysylltiedig sydd ar gael i'w fesur oherwydd bod yr un gwreiddiol yn anodd ei gael neu ei ddehongli. Er enghraifft, mae hwyrni ochr y cleient yn aml yn fetrig mwy priodol, ond mae yna adegau pan mai dim ond ar y gweinydd y gellir mesur hwyrni.

Math arall o SLI sy'n bwysig i SREs yw argaeledd, neu'r cyfnod o amser y gellir defnyddio gwasanaeth. Fe'i diffinnir yn aml fel cyfradd y ceisiadau llwyddiannus, a elwir weithiau'n gynnyrch. (Mae oes—y tebygolrwydd y bydd data’n cael ei gadw am gyfnod estynedig—hefyd yn bwysig ar gyfer systemau storio data.) Er nad yw argaeledd 100% yn bosibl, mae argaeledd yn agos at 100% yn aml yn gyraeddadwy; mynegir gwerthoedd argaeledd fel nifer y "naw" » canran argaeledd. Er enghraifft, efallai y bydd argaeledd 99% a 99,999% yn cael ei labelu fel "2 naw" a "5 naw". Nod argaeledd presennol Google Compute Engine yw "tri naw a hanner" neu 99,95%.

Amcanion

Amcan lefel gwasanaeth yw SLO: gwerth targed neu ystod o werthoedd ar gyfer lefel gwasanaeth a fesurir gan yr SLI. Gwerth arferol ar gyfer SLO yw “SLI ≤ Target” neu “Terfyn Isaf ≤ SLI ≤ Terfyn Uchaf”. Er enghraifft, efallai y byddwn yn penderfynu y byddwn yn dychwelyd canlyniadau chwiliad Shakespeare yn “gyflym” trwy osod yr SLO i hwyrni ymholiad chwilio cyfartalog o lai na 100 milieiliad.

Mae dewis yr SLO cywir yn broses gymhleth. Yn gyntaf, ni allwch bob amser ddewis gwerth penodol. Ar gyfer ceisiadau HTTP allanol sy'n dod i mewn i'ch gwasanaeth, mae'r metrig Ymholiad Fesul Eiliad (QPS) yn cael ei bennu'n bennaf gan awydd eich defnyddwyr i ymweld â'ch gwasanaeth, ac ni allwch osod SLO ar gyfer hynny.

Ar y llaw arall, gallwch ddweud eich bod am i'r hwyrni cyfartalog ar gyfer pob cais fod yn llai na 100 milieiliad. Efallai y bydd gosod nod o'r fath yn eich gorfodi i ysgrifennu'ch blaen blaen gyda hwyrni isel neu brynu offer sy'n darparu hwyrni o'r fath. (Mae 100 milieiliad yn amlwg yn rhif mympwyol, ond mae'n well cael niferoedd hwyrni hyd yn oed yn is. Mae tystiolaeth i awgrymu bod cyflymderau cyflym yn well na chyflymder araf, a bod hwyrni wrth brosesu ceisiadau defnyddwyr uwchlaw gwerthoedd penodol mewn gwirionedd yn gorfodi pobl i gadw draw o'ch gwasanaeth.)

Unwaith eto, mae hyn yn fwy amwys nag y gallai ymddangos ar yr olwg gyntaf: ni ddylech eithrio QPS yn llwyr o'r cyfrifiad. Y ffaith yw bod QPS a hwyrni yn perthyn yn gryf i'w gilydd: mae QPS uwch yn aml yn arwain at hwyrni uwch, ac mae gwasanaethau fel arfer yn profi gostyngiad sydyn mewn perfformiad pan fyddant yn cyrraedd trothwy llwyth penodol.

Mae dewis a chyhoeddi SLO yn gosod disgwyliadau defnyddwyr ynghylch sut y bydd y gwasanaeth yn gweithio. Gall y strategaeth hon leihau cwynion di-sail yn erbyn perchennog y gwasanaeth, megis perfformiad araf. Heb SLO penodol, mae defnyddwyr yn aml yn creu eu disgwyliadau eu hunain o ran perfformiad dymunol, ac efallai nad oes ganddynt unrhyw beth i'w wneud â barn y bobl sy'n dylunio a rheoli'r gwasanaeth. Gall y sefyllfa hon arwain at ddisgwyliadau chwyddedig gan y gwasanaeth, pan fydd defnyddwyr yn credu ar gam y bydd y gwasanaeth yn fwy hygyrch nag ydyw mewn gwirionedd, ac yn achosi drwgdybiaeth pan fydd defnyddwyr yn credu bod y system yn llai dibynadwy nag ydyw mewn gwirionedd.

Cytundebau

Mae cytundeb lefel gwasanaeth yn gontract penodol neu ymhlyg gyda'ch defnyddwyr sy'n cynnwys canlyniadau bodloni (neu beidio â bodloni) yr SLOs sydd ynddynt. Mae'n haws adnabod canlyniadau pan fyddant yn ariannol - gostyngiad neu ddirwy - ond gallant fod ar ffurfiau eraill. Ffordd hawdd o siarad am y gwahaniaeth rhwng SLOs a SLAs yw gofyn “beth sy’n digwydd os na chaiff yr SLOs eu bodloni?” Os nad oes unrhyw ganlyniadau clir, rydych bron yn sicr yn edrych ar SLO.

Fel arfer nid yw'r SRE yn ymwneud â chreu CLGau oherwydd bod CLGau yn gysylltiedig yn agos â phenderfyniadau busnes a chynnyrch. Fodd bynnag, mae'r ARhPh yn ymwneud â helpu i liniaru canlyniadau SCY aflwyddiannus. Gallant hefyd helpu i bennu'r SLI: Yn amlwg, rhaid bod ffordd wrthrychol o fesur yr SLO yn y cytundeb neu bydd anghytundeb.

Mae Google Search yn enghraifft o wasanaeth pwysig nad oes ganddo CLG cyhoeddus: rydym am i bawb ddefnyddio Search mor effeithlon â phosibl, ond nid ydym wedi llofnodi contract gyda'r byd. Fodd bynnag, mae canlyniadau o hyd os nad oes chwiliad ar gael - mae diffyg argaeledd yn arwain at ostyngiad yn ein henw da yn ogystal â llai o refeniw hysbysebu. Mae gan lawer o wasanaethau Google eraill, megis Google for Work, gytundebau lefel gwasanaeth penodol gyda defnyddwyr. Ni waeth a oes gan wasanaeth penodol CLG, mae'n bwysig diffinio'r SLI a'r SLO a'u defnyddio i reoli'r gwasanaeth.

Cymaint o theori - nawr i brofi.

Dangosyddion yn ymarferol

O ystyried ein bod wedi dod i’r casgliad ei bod yn bwysig dewis metrigau priodol i fesur lefel gwasanaeth, sut ydych chi’n gwybod yn awr pa fetrigau sy’n bwysig i wasanaeth neu system?

Beth ydych chi a'ch defnyddwyr yn poeni amdano?

Nid oes angen i chi ddefnyddio pob metrig fel SLI y gallwch ei olrhain mewn system fonitro; Bydd deall yr hyn y mae defnyddwyr ei eisiau o system yn eich helpu i ddewis sawl metrig. Mae dewis gormod o ddangosyddion yn ei gwneud hi'n anodd canolbwyntio ar ddangosyddion pwysig, tra gall dewis nifer fach adael darnau mawr o'ch system heb oruchwyliaeth. Rydym fel arfer yn defnyddio nifer o ddangosyddion allweddol i werthuso a deall iechyd system.

Yn gyffredinol, gellir rhannu gwasanaethau yn sawl rhan o ran SLI sy’n berthnasol iddynt:

  • Systemau pen blaen personol, fel y rhyngwynebau chwilio ar gyfer gwasanaeth Shakespeare o'n hesiampl. Rhaid iddynt fod ar gael, heb unrhyw oedi a bod â lled band digonol. Yn unol â hynny, gellir gofyn cwestiynau: a allwn ni ymateb i'r cais? Pa mor hir gymerodd hi i ymateb i’r cais? Faint o geisiadau y gellir eu prosesu?
  • Systemau storio. Maent yn gwerthfawrogi hwyrni ymateb isel, argaeledd a gwydnwch. Cwestiynau cysylltiedig: Pa mor hir mae'n ei gymryd i ddarllen neu ysgrifennu data? A allwn gael mynediad at y data ar gais? A yw'r data ar gael pan fydd ei angen arnom? Gweler Pennod 26 Cywirdeb Data: Yr Hyn yr ydych yn ei Ddarllen Yw'r Hyn a Ysgrifennwch i gael trafodaeth fanwl ar y materion hyn.
  • Mae systemau data mawr fel piblinellau prosesu data yn dibynnu ar fewnbwn a hwyrni prosesu ymholiadau. Cwestiynau cysylltiedig: Faint o ddata sy'n cael ei brosesu? Pa mor hir mae'n ei gymryd i ddata deithio o dderbyn cais i gyhoeddi ymateb? (Efallai y bydd oedi mewn rhai rhannau o'r system hefyd mewn rhai camau.)

Casgliad o ddangosyddion

Mae llawer o ddangosyddion lefel gwasanaeth yn cael eu casglu'n fwyaf naturiol ar ochr y gweinydd, gan ddefnyddio system fonitro fel Borgmon (gweler isod). Pennod 10 Rhybuddion Ymarfer yn Seiliedig ar Ddata Cyfres Amser) neu Prometheus, neu yn syml yn dadansoddi'r logiau o bryd i'w gilydd, gan nodi ymatebion HTTP â statws 500. Fodd bynnag, dylai rhai systemau fod â chasgliad metrigau ochr y cleient, gan y gall diffyg monitro ochr y cleient arwain at golli nifer o broblemau sy'n effeithio defnyddwyr, ond nid ydynt yn effeithio ar fetrigau ochr y gweinydd. Er enghraifft, gall canolbwyntio ar hwyrni ymateb ôl-wyneb ein cymhwysiad prawf chwilio Shakespeare arwain at hwyrni ar ochr y defnyddiwr oherwydd materion JavaScript: yn yr achos hwn, mae mesur faint o amser y mae'n ei gymryd i'r porwr brosesu'r dudalen yn fetrig gwell.

Cydgasglu

Er mwyn symlrwydd a rhwyddineb defnydd, rydym yn aml yn agregu mesuriadau amrwd. Rhaid gwneud hyn yn ofalus.

Mae rhai metrigau'n ymddangos yn syml, fel ceisiadau yr eiliad, ond mae hyd yn oed y mesuriad hwn sy'n ymddangos yn syml yn ymhlyg yn agregu data dros amser. A yw'r mesuriad a dderbynnir yn benodol unwaith yr eiliad neu a yw'r mesuriad wedi'i gyfartaleddu dros nifer y ceisiadau y funud? Gall yr opsiwn olaf guddio nifer llawer uwch ar unwaith o geisiadau sydd ond yn para ychydig eiliadau. Ystyriwch system sy'n gwasanaethu 200 cais yr eiliad gydag eilrifau a 0 weddill yr amser. Nid yw cysonyn ar ffurf gwerth cyfartalog o 100 cais yr eiliad a dwywaith y llwyth ar unwaith yr un peth. Yn yr un modd, gall cyfartaleddau cudd ymholiadau ymddangos yn ddeniadol, ond mae'n cuddio manylion pwysig: mae'n bosibl y bydd y rhan fwyaf o ymholiadau'n gyflym, ond bydd llawer o ymholiadau'n araf.

Mae'r rhan fwyaf o'r dangosyddion yn cael eu hystyried yn well fel dosraniadau yn hytrach na chyfartaleddau. Er enghraifft, ar gyfer hwyrni SLI, bydd rhai ceisiadau'n cael eu prosesu'n gyflym, tra bydd rhai bob amser yn cymryd mwy o amser, weithiau'n llawer hirach. Gall cyfartaledd syml guddio'r oedi hir hyn. Mae'r ffigur yn dangos enghraifft: er bod cais nodweddiadol yn cymryd tua 50 ms i'w gyflwyno, mae 5% o geisiadau 20 gwaith yn arafach! Nid yw monitro a rhybuddio yn seiliedig ar hwyrni cyfartalog yn unig yn dangos newidiadau mewn ymddygiad trwy gydol y dydd, pan mewn gwirionedd mae newidiadau amlwg yn amser prosesu rhai ceisiadau (llinell uchaf).

Nodau Lefel Gwasanaeth - Profiad Google (cyfieithiad o bennod llyfr Google SRE)
50, 85, 95, a 99 cuddni system canraddol. Mae echel Y mewn fformat logarithmig.

Mae defnyddio canraddau ar gyfer dangosyddion yn eich galluogi i weld siâp y dosbarthiad a'i nodweddion: mae lefel canradd uchel, fel 99 neu 99,9, yn dangos y gwerth gwaethaf, tra bod y canradd 50 (a elwir hefyd yn ganolrif) yn dangos y cyflwr mwyaf cyffredin o y metrig. Po fwyaf yw'r gwasgariad amser ymateb, y mwyaf y bydd ceisiadau hirdymor yn effeithio ar brofiad y defnyddiwr. Mae'r effaith yn cael ei wella o dan lwyth uchel ac ym mhresenoldeb ciwiau. Mae ymchwil profiad defnyddwyr wedi dangos bod yn well gan bobl yn gyffredinol system arafach gydag amrywiant amser ymateb uchel, felly mae rhai timau ARhPh yn canolbwyntio ar sgoriau canradd uchel yn unig, ar y sail, os yw ymddygiad metrig ar y canradd 99,9 yn dda, ni fydd y rhan fwyaf o ddefnyddwyr yn cael problemau. .

Nodyn ar wallau ystadegol

Yn gyffredinol, mae'n well gennym weithio gyda chanraddau yn hytrach na chymedr (cymedr rhifyddol) set o werthoedd. Mae hyn yn ein galluogi i ystyried gwerthoedd mwy gwasgaredig, sydd yn aml â nodweddion sylweddol wahanol (a mwy diddorol) na'r cyfartaledd. Oherwydd natur artiffisial systemau cyfrifiadurol, mae gwerthoedd metrig yn aml yn gwyro, er enghraifft, ni all unrhyw gais dderbyn ymateb mewn llai na 0 ms, ac mae terfyn amser o 1000 ms yn golygu na ellir cael ymatebion llwyddiannus gyda gwerthoedd mwy na'r terfyn amser. O ganlyniad, ni allwn dderbyn y gall y cymedr a’r canolrif fod yr un fath neu’n agos at ei gilydd!

Heb brofion blaenorol, ac oni bai bod rhai rhagdybiaethau a brasamcanion safonol yn bodoli, rydym yn ofalus i beidio â dod i'r casgliad bod ein data yn cael eu dosbarthu fel arfer. Os nad yw'r dosbarthiad yn ôl y disgwyl, efallai y bydd y broses awtomeiddio sy'n datrys y broblem (er enghraifft, pan fydd yn gweld allgleifion, mae'n ailgychwyn y gweinydd gyda hwyrni prosesu ceisiadau uchel) yn ei wneud yn rhy aml neu ddim yn ddigon aml (y ddau ddim yn da iawn).

Safoni dangosyddion

Rydym yn argymell safoni'r nodweddion cyffredinol ar gyfer SLI fel nad oes rhaid i chi ddyfalu amdanynt bob tro. Gall unrhyw nodwedd sy’n bodloni patrymau safonol gael ei heithrio o fanyleb SLI unigol, er enghraifft:

  • Cyfnodau agregu: “dros 1 munud ar gyfartaledd”
  • Ardaloedd agregu: “Pob tasg yn y clwstwr”
  • Pa mor aml y cymerir mesuriadau: “Bob 10 eiliad”
  • Pa geisiadau sy'n cael eu cynnwys: "HTTP GET o swyddi monitro blwch du"
  • Sut y ceir y data: "Diolch i'n monitro a fesurwyd ar y gweinydd"
  • Cudd mynediad data: "Amser i beit olaf"

Er mwyn arbed ymdrech, crëwch set o dempledi SLI y gellir eu hailddefnyddio ar gyfer pob metrig cyffredin; maent hefyd yn ei gwneud yn haws i bawb ddeall beth mae SLI penodol yn ei olygu.

Nodau yn ymarferol

Dechreuwch trwy feddwl am (neu ddarganfod!) yr hyn y mae eich defnyddwyr yn poeni amdano, nid yr hyn y gallwch ei fesur. Yn aml, mae'r hyn sy'n bwysig i'ch defnyddwyr yn anodd neu'n amhosibl ei fesur, felly byddwch chi'n dod yn agosach at eu hanghenion. Fodd bynnag, os ydych chi'n dechrau gyda'r hyn sy'n hawdd ei fesur, byddwch chi'n cael SLOs llai defnyddiol yn y pen draw. O ganlyniad, rydym weithiau wedi canfod bod nodi nodau dymunol i ddechrau ac yna gweithio gyda dangosyddion penodol yn gweithio'n well na dewis dangosyddion ac yna cyflawni'r nodau.

Diffiniwch eich nodau

Er mwyn sicrhau'r eglurder mwyaf posibl, dylid diffinio sut y caiff SLOs eu mesur a'r amodau y maent yn ddilys oddi tanynt. Er enghraifft, gallem ddweud y canlynol (mae'r ail linell yr un peth â'r gyntaf, ond mae'n defnyddio'r rhagosodiadau SLI):

  • Bydd 99% (cyfartaledd dros 1 munud) o alwadau Get RPC yn cael eu cwblhau mewn llai na 100ms (wedi'i fesur ar draws yr holl weinyddion backend).
  • Bydd 99% o alwadau Get RPC yn cael eu cwblhau mewn llai na 100ms.

Os yw siâp y cromliniau perfformiad yn bwysig, gallwch nodi sawl SLO:

  • Cwblhawyd 90% o alwadau Get RPC mewn llai nag 1 ms.
  • Cwblhawyd 99% o alwadau Get RPC mewn llai nag 10 ms.
  • Cwblhawyd 99.9% o alwadau Get RPC mewn llai nag 100 ms.

Os yw eich defnyddwyr yn cynhyrchu llwythi gwaith heterogenaidd: prosesu swmp (y mae trwybwn yn bwysig ar ei gyfer) a phrosesu rhyngweithiol (y mae hwyrni yn bwysig ar ei gyfer), efallai y byddai'n werth diffinio nodau ar wahân ar gyfer pob dosbarth llwyth:

  • Mae angen trwybwn ar 95% o geisiadau cwsmeriaid. Gosodwch gyfrif y galwadau RPC a gyflawnwyd <1 s.
  • Mae 99% o gleientiaid yn poeni am yr hwyrni. Gosodwch y cyfrif o alwadau RPC gyda thraffig <1 KB a rhedeg <10 ms.

Mae'n afrealistig ac yn annymunol i fynnu bod SLOs yn cael eu bodloni 100% o'r amser: gall hyn leihau cyflymder cyflwyno ymarferoldeb a defnydd newydd, a bydd angen atebion drud. Yn lle hynny, mae'n well caniatáu cyllideb gwall - canran yr amser segur system a ganiateir - a monitro'r gwerth hwn yn ddyddiol neu'n wythnosol. Efallai y bydd uwch reolwyr eisiau gwerthusiadau misol neu chwarterol. (Yn syml, SLO yw'r gyllideb gwallau i'w chymharu ag SLO arall.)

Gellir cymharu canran y troseddau SLO â'r gyllideb gwallau (gweler Pennod 3 a'r adran "Cymhelliant ar gyfer Cyllidebau Gwall"), gyda'r gwerth gwahaniaeth yn cael ei ddefnyddio fel mewnbwn i'r broses sy'n penderfynu pryd i ddefnyddio datganiadau newydd.

Dewis gwerthoedd targed

Nid yw dewis gwerthoedd cynllunio (SLOs) yn weithgaredd technegol yn unig oherwydd y buddiannau cynnyrch a busnes y mae'n rhaid eu hadlewyrchu yn yr SLIs, SLOs (ac o bosibl CLGau) a ddewiswyd. Yn yr un modd, efallai y bydd angen cyfnewid gwybodaeth am faterion yn ymwneud â staffio, amser i'r farchnad, argaeledd offer, ac ariannu. Dylai ARhPh fod yn rhan o'r sgwrs hon a helpu i ddeall risgiau a hyfywedd gwahanol opsiynau. Rydym wedi llunio ychydig o gwestiynau a allai helpu i sicrhau trafodaeth fwy cynhyrchiol:

Peidiwch â dewis nod yn seiliedig ar berfformiad cyfredol.
Er bod deall cryfderau a therfynau system yn bwysig, gall addasu metrigau heb resymu eich rhwystro rhag cynnal y system: bydd angen ymdrechion arwrol i gyflawni nodau na ellir eu cyflawni heb ailgynllunio sylweddol.

Cadwch hi'n syml
Gall cyfrifiadau SLI cymhleth guddio newidiadau ym mherfformiad y system a'i gwneud yn anoddach dod o hyd i achos y broblem.

Osgoi absoliwt
Er ei bod yn demtasiwn cael system sy'n gallu delio â llwyth sy'n tyfu am gyfnod amhenodol heb fod yn fwy hwyr, mae'r gofyniad hwn yn afrealistig. Mae'n debygol y bydd angen llawer o amser i ddylunio ac adeiladu system sy'n ymdrin â delfrydau o'r fath, yn ddrud i'w gweithredu, a bydd yn rhy dda ar gyfer disgwyliadau defnyddwyr a fyddai'n gwneud ag unrhyw beth llai.

Defnyddiwch gyn lleied o SLOs â phosibl
Dewiswch nifer digonol o SLOs i sicrhau ymdriniaeth dda o briodoleddau system. Diogelu'r SLOs a ddewiswch: Os na allwch chi byth ennill dadl am flaenoriaethau trwy nodi SLO penodol, mae'n debyg nad yw'n werth ystyried yr SLO hwnnw. Fodd bynnag, nid yw holl briodoleddau'r system yn addas ar gyfer SLOs: mae'n anodd cyfrifo lefel hyfrydwch y defnyddiwr gan ddefnyddio SLOs.

Peidiwch â mynd ar ôl perffeithrwydd
Gallwch chi bob amser fireinio diffiniadau a nodau SLOs dros amser wrth i chi ddysgu mwy am ymddygiad y system dan lwyth. Mae'n well dechrau gyda nod symudol y byddwch chi'n ei fireinio dros amser na dewis nod rhy gaeth y mae'n rhaid ei ymlacio pan fyddwch chi'n gweld ei fod yn anghyraeddadwy.

Gall a dylai SLOs fod yn sbardun allweddol wrth flaenoriaethu gwaith ar gyfer SREs a datblygwyr cynnyrch oherwydd eu bod yn adlewyrchu pryder i ddefnyddwyr. Mae SLO da yn arf gorfodi defnyddiol ar gyfer tîm datblygu. Ond gall SLO sydd wedi'i ddylunio'n wael arwain at waith gwastraffus os yw'r tîm yn gwneud ymdrechion arwrol i gyflawni SLO rhy ymosodol, neu gynnyrch gwael os yw'r SLO yn rhy isel. Mae SLO yn lifer pwerus, defnyddiwch ef yn ddoeth.

Rheolwch eich mesuriadau

Mae SLI ac SLO yn elfennau allweddol a ddefnyddir i reoli systemau:

  • Monitro a mesur systemau SLI.
  • Cymharwch SLI i SLO a phenderfynwch a oes angen gweithredu.
  • Os oes angen gweithredu, nodwch beth sydd angen digwydd i gyflawni'r nod.
  • Cwblhewch y weithred hon.

Er enghraifft, os yw cam 2 yn dangos bod y cais yn amseru ac y bydd yn torri'r SLO mewn ychydig oriau os na wneir unrhyw beth, gallai cam 3 olygu profi'r ddamcaniaeth bod y gweinyddwyr yn rhwym i CPU ac y bydd ychwanegu mwy o weinyddion yn dosbarthu'r llwyth . Heb SLO, ni fyddech yn gwybod os (na phryd) i weithredu.

Gosod SLO - yna bydd disgwyliadau defnyddwyr yn cael eu gosod
Mae cyhoeddi SLO yn gosod disgwyliadau defnyddwyr ar gyfer ymddygiad system. Mae defnyddwyr (a darpar ddefnyddwyr) yn aml eisiau gwybod beth i'w ddisgwyl gan wasanaeth er mwyn deall a yw'n addas i'w ddefnyddio. Er enghraifft, efallai y bydd pobl sydd am ddefnyddio gwefan rhannu lluniau am osgoi defnyddio gwasanaeth sy’n addo hirhoedledd a chost isel yn gyfnewid am ychydig llai o argaeledd, er y gallai’r un gwasanaeth fod yn ddelfrydol ar gyfer system rheoli cofnodion archif.

I osod disgwyliadau realistig ar gyfer eich defnyddwyr, defnyddiwch un neu'r ddau o'r tactegau canlynol:

  • Cynnal ymyl diogelwch. Defnyddiwch SLO mewnol llymach na'r hyn a hysbysebir i ddefnyddwyr. Bydd hyn yn rhoi'r cyfle i chi ymateb i broblemau cyn iddynt ddod yn weladwy yn allanol. Mae byffer SLO hefyd yn caniatáu ichi gael ymyl diogelwch wrth osod datganiadau sy'n effeithio ar berfformiad y system a sicrhau bod y system yn hawdd i'w chynnal heb orfod rhwystro defnyddwyr ag amser segur.
  • Peidiwch â mynd y tu hwnt i ddisgwyliadau defnyddwyr. Mae defnyddwyr yn seiliedig ar yr hyn rydych chi'n ei gynnig, nid yr hyn rydych chi'n ei ddweud. Os yw perfformiad gwirioneddol eich gwasanaeth yn llawer gwell na'r SLO a nodwyd, bydd defnyddwyr yn dibynnu ar y perfformiad presennol. Gallwch osgoi gorddibyniaeth trwy gau'r system yn fwriadol neu gyfyngu ar berfformiad o dan lwythi ysgafn.

Mae deall pa mor dda y mae system yn bodloni disgwyliadau yn helpu i benderfynu a ddylid buddsoddi i gyflymu'r system a'i gwneud yn fwy hygyrch a gwydn. Fel arall, os yw gwasanaeth yn perfformio'n rhy dda, dylid treulio rhywfaint o amser staff ar flaenoriaethau eraill, megis talu dyled dechnegol, ychwanegu nodweddion newydd, neu gyflwyno cynhyrchion newydd.

Cytundebau yn ymarferol

Mae creu CLG yn ei gwneud yn ofynnol i dimau busnes a chyfreithiol ddiffinio'r canlyniadau a'r cosbau am ei dorri. Rôl yr ARhPh yw eu helpu i ddeall yr heriau tebygol o ran bodloni'r SLOs a gynhwysir yn y CLG. Mae'r rhan fwyaf o'r argymhellion ar gyfer creu SLO hefyd yn berthnasol i CLGau. Mae'n ddoeth bod yn geidwadol yn yr hyn rydych chi'n ei addo i ddefnyddwyr oherwydd po fwyaf sydd gennych chi, y mwyaf anodd yw hi i newid neu ddileu CLGau sy'n ymddangos yn afresymol neu'n anodd eu bodloni.

Diolch am ddarllen y cyfieithiad hyd y diwedd. Tanysgrifiwch i'm sianel telegram am fonitro monitorim_it и blog ar Canolig.

Ffynhonnell: hab.com

Ychwanegu sylw