Við borðum fílinn í pörtum. Heilsueftirlitsáætlun umsóknar með dæmum

Halló allir!

Fyrirtækið okkar stundar hugbúnaðarþróun og tækniaðstoð í kjölfarið. Tækniaðstoð krefst ekki bara lagfæringar á villum, heldur eftirlits með frammistöðu forrita okkar.

Til dæmis, ef ein af þjónustunum hefur hrunið, þá þarftu að skrá þetta vandamál sjálfkrafa og byrja að leysa það, og ekki bíða eftir að óánægðir notendur hafi samband við tækniaðstoð.

Við erum með lítið fyrirtæki, við höfum ekki fjármagn til að rannsaka og viðhalda flóknum lausnum til að fylgjast með forritum, við þurftum að finna einfalda og skilvirka lausn.

Við borðum fílinn í pörtum. Heilsueftirlitsáætlun umsóknar með dæmum

Eftirlitsstefna

Það er ekki auðvelt að athuga virkni forrits; þetta verkefni er ekki léttvægt, það má jafnvel segja skapandi. Það er sérstaklega erfitt að sannreyna flókið fjöltenglakerfi.

Hvernig geturðu borðað fíl? Aðeins í pörtum! Við notum þessa aðferð til að fylgjast með forritum.

Kjarninn í eftirlitsstefnu okkar:

Skiptu forritinu þínu niður í íhluti.
Búðu til stjórnathuganir fyrir hvern íhlut.

Íhlutur telst starfhæfur ef allar eftirlitsathuganir hans eru gerðar án villna. Forrit telst hollt ef allir þættir þess eru virkir.

Þannig er hægt að tákna hvaða kerfi sem er sem tré af íhlutum. Flókin íhlutir eru sundurliðaðir í einfaldari. Einfaldir íhlutir hafa ávísanir.

Við borðum fílinn í pörtum. Heilsueftirlitsáætlun umsóknar með dæmum

Viðmið er ekki ætlað að framkvæma virknipróf, þau eru ekki einingapróf. Eftirlitseftirlit ætti að athuga hvernig íhlutinn líður á núverandi augnabliki í tíma, hvort það séu öll nauðsynleg úrræði fyrir virkni hans og hvort það séu einhver vandamál.

Það eru engin kraftaverk; flestar athuganir þurfa að þróast sjálfstætt. En ekki vera hræddur, því í flestum tilfellum tekur eitt athugun 5-10 línur af kóða, en þú getur innleitt hvaða rökfræði sem er og þú munt greinilega skilja hvernig ávísunin virkar.

Eftirlitskerfi

Segjum að við skiptum forritinu í íhluti, komum upp og innleiddum athuganir fyrir hvern íhlut, en hvað á að gera við niðurstöður þessara athugana? Hvernig vitum við hvort einhver athugun mistókst?

Við munum þurfa eftirlitskerfi. Hún mun sinna eftirfarandi verkefnum:

  • Fáðu prófunarniðurstöður og notaðu þær til að ákvarða stöðu íhluta.
    Sjónrænt lítur þetta út eins og að auðkenna íhlutatréð. Virkir íhlutir verða grænir, erfiðir íhlutir verða rauðir.
  • Framkvæma almennar athuganir úr kassanum.
    Eftirlitskerfið getur framkvæmt nokkrar athuganir sjálft. Af hverju að finna upp hjólið aftur, við skulum nota þau. Til dæmis geturðu athugað hvort vefsíða sé að opnast eða þjónninn sé að smella.
  • Sendu tilkynningar um vandamál til hagsmunaaðila.
  • Sjónræn vöktunargögn, útvegun skýrslna, línurit og tölfræði.

Stutt lýsing á ASMO kerfinu

Það er best að útskýra með dæmi. Skoðum hvernig eftirlit með frammistöðu ASMO kerfisins er skipulagt.

ASMO er sjálfvirkt veðurfræðilegt stuðningskerfi. Kerfið hjálpar sérfræðingum í vegaþjónustu að skilja hvar og hvenær nauðsynlegt er að meðhöndla veginn með hálkuefni. Kerfið safnar gögnum frá vegaeftirlitsstöðum. Vegeftirlitsstaður er staður á veginum þar sem búnaður er settur upp: veðurstöð, myndbandsupptökuvél o.s.frv. Til að spá fyrir um hættulegar aðstæður fær kerfið veðurspár frá utanaðkomandi aðilum.

Við borðum fílinn í pörtum. Heilsueftirlitsáætlun umsóknar með dæmum

Svo, samsetning kerfisins er nokkuð dæmigerð: vefsíða, umboðsmaður, búnaður. Byrjum að fylgjast með.

Að brjóta kerfið niður í íhluti

Eftirfarandi íhluti má greina í ASMO kerfinu:

1. Persónulegur reikningur
Þetta er vefforrit. Að minnsta kosti þarftu að athuga hvort forritið sé aðgengilegt á netinu.

2. Gagnagrunnur
Gagnagrunnurinn geymir gögn sem eru mikilvæg fyrir skýrslugerð og þú verður að tryggja að afrit af gagnagrunni séu búin til með góðum árangri.

3. Þjónn
Með netþjóni er átt við vélbúnaðinn sem forrit keyra á. Það er nauðsynlegt að athuga stöðu HDD, vinnsluminni, CPU.

4. Umboðsmaður
Þetta er Windows þjónusta sem framkvæmir mörg mismunandi verkefni á áætlun. Að minnsta kosti þarftu að athuga hvort þjónustan sé í gangi.

5. Verkefni umboðsmanns
Það er ekki nóg að vita að umboðsmaður er að vinna. Umboðsmaður getur unnið, en ekki sinnt þeim verkefnum sem honum eru úthlutað. Við skulum skipta umboðshlutanum í verkefni og athuga hvort hvert umboðsverkefni virkar vel.

6. Vegaeftirlitsstaðir (ílát allra MPC)
Það eru margir vegastjórnarpunktar, svo við skulum sameina alla MPC í einum íhlut. Þetta mun gera það þægilegra að lesa vöktunargögn. Þegar staða „ASMO kerfis“ íhlutans er skoðuð verður strax ljóst hvar vandamálin eru: í forritum, vélbúnaði eða í hámarksstýringarkerfinu.

7. Vegaeftirlitsstaður (ein hámarksmörk)
Við munum líta á þennan íhlut sem nothæfan ef öll tæki á þessum MPC eru nothæf.

8. Tæki
Þetta er myndbandsupptökuvél eða veðurstöð sem er sett upp við hámarksstyrkleikamörk. Nauðsynlegt er að athuga hvort tækið virki rétt.

Í vöktunarkerfinu mun íhlutatréð líta svona út:

Við borðum fílinn í pörtum. Heilsueftirlitsáætlun umsóknar með dæmum

Vöktun vefforrita

Þannig að við höfum skipt kerfinu í íhluti, nú þurfum við að koma með athuganir fyrir hvern þátt.

Til að fylgjast með vefforriti notum við eftirfarandi athuganir:

1. Athugaðu opnun aðalsíðunnar
Þessi athugun er framkvæmd af eftirlitskerfinu. Til að framkvæma það, tilgreinum við heimilisfang síðunnar, væntanlegt svarbrot og hámarks framkvæmdartíma beiðni.

2. Athugaðu greiðslufrest lénsins
Mjög mikilvæg athugun. Þegar lén er ógreitt geta notendur ekki opnað síðuna. Það getur tekið nokkra daga að leysa vandamálið vegna þess að... DNS-breytingum er ekki beitt strax.

3. Athugaðu SSL vottorðið
Nú á dögum nota næstum allar vefsíður https samskiptareglur fyrir aðgang. Til að samskiptareglan virki rétt þarftu gilt SSL vottorð.

Hér að neðan er „Persónulegur reikningur“ hluti í eftirlitskerfinu:

Við borðum fílinn í pörtum. Heilsueftirlitsáætlun umsóknar með dæmum

Allar athuganir hér að ofan munu virka fyrir flest forrit og þurfa enga kóðun. Þetta er mjög flott því þú getur byrjað að fylgjast með hvaða vefforriti sem er á 5 mínútum. Hér að neðan eru frekari athuganir sem hægt er að framkvæma fyrir vefforrit, en útfærsla þeirra er flóknari og forritssértækari, svo við munum ekki fjalla um þær í þessari grein.

Hvað annað geturðu athugað?

Til að fylgjast betur með vefforritinu þínu geturðu framkvæmt eftirfarandi athuganir:

  • Fjöldi JavaScript villna á tímabili
  • Fjöldi villna á vefforritahlið (bakenda) fyrir tímabilið
  • Fjöldi misheppnaðra svara vefforrita (svarkóði 404, 500, osfrv.)
  • Meðalframkvæmdartími fyrirspurnar

Eftirlit með Windows þjónustu (umboðsmaður)

Í ASMO kerfinu gegnir umboðsmaðurinn hlutverki verkefnaáætlunar, sem framkvæmir áætluð verkefni í bakgrunni.

Ef öllum verkefnum umboðsmanns er lokið með góðum árangri, virkar umboðsmaðurinn rétt. Það kemur í ljós að til að fylgjast með umboðsmanni þarf að fylgjast með verkefnum hans. Þess vegna skiptum við „umboðsmanni“ hlutanum í verkefni. Fyrir hvert verkefni munum við búa til sérstakan hluta í vöktunarkerfinu, þar sem „umboðsmaður“ hluti verður „foreldri“.

Við skiptum umboðshlutanum í undirhluta (verkefni):

Við borðum fílinn í pörtum. Heilsueftirlitsáætlun umsóknar með dæmum

Þannig að við höfum skipt niður flóknum þætti í nokkra einfalda. Nú þurfum við að koma með ávísanir fyrir hvern einfaldan þátt. Vinsamlegast athugaðu að foreldri hluti "Agent" mun ekki hafa neinar athuganir, vegna þess að eftirlitskerfið mun reikna stöðu sína sjálfstætt út frá stöðu undirhluta þess. Með öðrum orðum, ef öll verkefni eru unnin með góðum árangri, þá er umboðsmaðurinn í gangi.

Það eru meira en hundrað verkefni í ASMO kerfinu, er virkilega nauðsynlegt að koma með einstaka ávísanir fyrir hvert verkefni? Að sjálfsögðu verður eftirlitið betra ef við komum upp og innleiðum okkar eigin sérstaka athuganir fyrir hvert umboðsmannsverkefni, en í flestum tilfellum er nóg að nota alhliða athuganir.

ASMO kerfið notar eingöngu alhliða athuganir fyrir verkefni og það er nóg til að fylgjast með frammistöðu kerfisins.

Athugar framfarir
Einfaldasta og áhrifaríkasta eftirlitið er framkvæmdathugunin. Athugunin staðfestir að verkefninu sé lokið án villna. Öll verkefni hafa þetta ávísun.

Staðfestingarreiknirit

Eftir hverja framkvæmd verks þarftu að senda niðurstöðu SUCCESS athugunarinnar til eftirlitskerfisins ef framkvæmd verksins tókst, eða VILLU ef framkvæmdinni lauk með villu.

Þessi athugun getur greint eftirfarandi vandamál:

  1. Verkefnið keyrir en mistekst með villu.
  2. Verkefnið er hætt að keyra, til dæmis hefur það frosið.

Við skulum skoða nánar hvernig þessi vandamál eru leyst.

Mál 1 - Verkefnið keyrir en mistekst með villu
Hér að neðan má sjá dæmi þar sem verkefnið er í gangi en mistekst á milli 14:00 og 16:00.

Við borðum fílinn í pörtum. Heilsueftirlitsáætlun umsóknar með dæmum

Myndin sýnir að þegar verkefni mistekst er strax sent merki til vöktunarkerfisins og staða samsvarandi athugunar í vöktunarkerfinu verður viðvörun.

Vinsamlegast athugaðu að í vöktunarkerfinu fer staða íhlutans eftir sannprófunarstöðu. Viðvörunarstaða ávísunarinnar mun breyta öllum íhlutum á hærra stigi í viðvörun, sjá myndina hér að neðan.

Við borðum fílinn í pörtum. Heilsueftirlitsáætlun umsóknar með dæmum

Vandamál 2 - Verkið hætti að keyra (fryst)
Hvernig mun eftirlitskerfið skilja að verkefni er fast?

Niðurstaða athugunar hefur gildistíma, til dæmis 1 klst. Ef klukkutími líður og engin ný prófunarniðurstaða kemur mun eftirlitskerfið stilla prófunarstöðuna á viðvörun.

Við borðum fílinn í pörtum. Heilsueftirlitsáætlun umsóknar með dæmum

Á myndinni hér að ofan var slökkt á ljósunum klukkan 14:00. Klukkan 15:00 mun eftirlitskerfið greina að prófunarniðurstaðan (frá kl. 14:00) er rotin, því Tíminn sem skiptir máli er útrunninn (ein klukkustund), en engin ný niðurstaða kemur og mun skipta ávísuninni yfir í viðvörunarstöðu.

Klukkan 16:00 voru ljósin kveikt aftur, forritið mun klára verkefnið og senda framkvæmdarniðurstöðuna til eftirlitskerfisins, prófunarstaðan mun aftur verða árangursrík.

Hvaða eftirlitstíma ætti ég að nota?

Tíminn sem skiptir máli verður að vera lengri en framkvæmdartímabilið. Ég mæli með að stilla gildistímann 2-3 sinnum lengri en framkvæmdartímabilið. Þetta er nauðsynlegt til að forðast að fá rangar tilkynningar þegar til dæmis verkefni tók lengri tíma en venjulega eða einhver endurhlaði forritið.

Athugar framfarir

ASMO kerfið er með „Load Forecast“ verkefni, sem reynir að hlaða niður nýrri spá frá utanaðkomandi aðilum einu sinni á klukkustund. Ekki er vitað nákvæmlega hvenær ný spá birtist í ytra kerfinu en vitað er að þetta gerist 2 sinnum á dag. Það kemur í ljós að ef það er engin ný spá í nokkra klukkutíma þá er þetta eðlilegt, en ef það er engin ný spá í meira en sólarhring þá hefur eitthvað bilað einhvers staðar. Til dæmis gæti gagnasniðið í ytra spákerfi breyst og þess vegna mun ASMO ekki sjá nýja spáútgáfu.

Staðfestingarreiknirit

Verkefnið sendir niðurstöðu SUCCESS-athugunarinnar til vöktunarkerfisins þegar það tekst að ná framvindu (halar niður nýrri veðurspá). Ef engin framvinda er eða villa kemur upp þá er ekkert sent í eftirlitskerfið.

Ávísunin verður að hafa þannig vægi að á þessum tíma sé tryggt að hún fái nýjar framfarir.

Við borðum fílinn í pörtum. Heilsueftirlitsáætlun umsóknar með dæmum

Vinsamlegast athugaðu að við munum læra um vandamálið með töf, vegna þess að eftirlitskerfið bíður þar til gildistími síðustu skannaniðurstöður rennur út. Því þarf ekki að gera gildistíma ávísunarinnar of langan.

Gagnagrunnseftirlit

Til að stjórna gagnagrunninum í ASMO kerfinu gerum við eftirfarandi athuganir:

  1. Staðfestir öryggisafrit
  2. Athugar laust diskpláss

Staðfestir öryggisafrit
Í flestum forritum er mikilvægt að hafa uppfærða öryggisafrit af gagnagrunni þannig að ef miðlarinn bilar geturðu sett forritið á nýjan netþjón.

ASMO býr til afrit einu sinni í viku og sendir það í geymslu. Þegar þessu ferli er lokið með góðum árangri er niðurstaða árangursathugunarinnar send til eftirlitskerfisins. Niðurstaða staðfestingar gildir í 9 daga. Þeir. Til að stjórna gerð afrita er „framvinduathugun“ vélbúnaðurinn, sem við ræddum hér að ofan, notaður.

Athugar laust diskpláss
Ef það er ekki nóg laust pláss á disknum mun gagnagrunnurinn ekki geta virkað sem skyldi og því er mikilvægt að stjórna magni laust pláss.

Það er þægilegt að nota mælikvarða til að athuga tölulegar breytur.

Mælikvarði er töluleg breyta, gildi hennar er sent til vöktunarkerfisins. Vöktunarkerfið athugar þröskuldsgildin og reiknar út stöðuna.

Hér að neðan er mynd af því hvernig „Database“ íhluturinn lítur út í vöktunarkerfinu:

Við borðum fílinn í pörtum. Heilsueftirlitsáætlun umsóknar með dæmum

Vöktun netþjóna

Til að fylgjast með þjóninum notum við eftirfarandi athuganir og mælikvarða:

1. Laust diskpláss
Ef plássið klárast mun forritið ekki geta virkað. Við notum 2 þröskuldsgildi: fyrsta stigið er VIÐVÖRUN, annað stigið er ALARM.

2. Meðalgildi vinnsluminni í prósentum á klukkustund
Við notum tímameðaltal vegna þess að... við höfum ekki áhuga á sjaldgæfum kynþáttum.

3. Meðal CPU prósenta á klukkustund
Við notum tímameðaltal vegna þess að... við höfum ekki áhuga á sjaldgæfum kynþáttum.

4. Ping athuga
Athugar hvort þjónninn sé á netinu. Vöktunarkerfið getur framkvæmt þessa athugun; það er engin þörf á að skrifa kóða.

Hér að neðan er mynd af því hvernig „Server“ íhluturinn lítur út í eftirlitskerfinu:

Við borðum fílinn í pörtum. Heilsueftirlitsáætlun umsóknar með dæmum

Eftirlit með búnaði

Ég skal segja þér hvernig gögnin eru fengin. Fyrir hvern vegstjórnarpunkt (MPC) er verkefni í verkefnaáætluninni, til dæmis „Könnun MPC M2 km 200“. Verkefnið fær gögn frá öllum MPC tækjum á 30 mínútna fresti.

Samskiptarásarvandamál
Stærstur hluti búnaðarins er staðsettur utan borgarinnar, GSM net er notað fyrir gagnaflutning sem virkar ekki stöðugt (það er net, eða það er ekki).

Vegna tíðra netbilana leit í fyrstu svona út að athuga MPC könnunina í eftirliti:

Við borðum fílinn í pörtum. Heilsueftirlitsáætlun umsóknar með dæmum

Það kom í ljós að þetta var ekki virkur kostur, vegna þess að það voru margar rangar tilkynningar um vandamál. Þá var ákveðið að nota „framvinduathugun“ fyrir hvert tæki, þ.e. Aðeins árangursmerkið er sent til eftirlitskerfisins þegar tækið er spurt án villu. Mikilvægistíminn var stilltur á 5 klst.

Við borðum fílinn í pörtum. Heilsueftirlitsáætlun umsóknar með dæmum

Nú sendir vöktun aðeins tilkynningar um vandamál þegar ekki er hægt að skoða tækið í meira en 5 klukkustundir. Með miklum líkum eru þetta ekki falskar viðvaranir, heldur raunveruleg vandamál.

Hér að neðan er mynd af því hvernig búnaðurinn lítur út í eftirlitskerfinu:

Við borðum fílinn í pörtum. Heilsueftirlitsáætlun umsóknar með dæmum

Mikilvægt!
Þegar GSM netið hættir að virka eru öll MDC tæki ekki könnuð. Til að fækka tölvupósti frá vöktunarkerfinu gerast verkfræðingar okkar áskrifendur að tilkynningum um vandamál íhluta með gerðinni „MPC“ frekar en „Tæki“. Þetta gerir þér kleift að fá eina tilkynningu fyrir hvert MPC, frekar en að fá sérstaka tilkynningu fyrir hvert tæki.

Loka ASMO eftirlitskerfi

Við skulum setja allt saman og sjá hvers konar eftirlitskerfi við höfum.

Við borðum fílinn í pörtum. Heilsueftirlitsáætlun umsóknar með dæmum

Ályktun

Við skulum draga saman.
Hvað gaf eftirlit með frammistöðu ASMO okkur?

1. Tími til að útrýma galla hefur styttst
Við höfum áður heyrt um galla frá notendum, en ekki allir notendur tilkynna um galla. Það kom fyrir að við fréttum af bilun í kerfishluta viku eftir að hann birtist. Nú tilkynnir eftirlitskerfið okkur um vandamál um leið og vandamál uppgötvast.

2. Stöðugleiki kerfisins hefur aukist
Þar sem byrjað var að útrýma göllum fyrr fór kerfið í heild sinni að virka mun stöðugra.

3. Að fækka símtölum til tækniaðstoðar
Mörg vandamál eru nú lagfærð áður en notendur vita af þeim. Notendur fóru sjaldnar að hafa samband við tækniaðstoð. Allt þetta hefur góð áhrif á orðspor okkar.

4. Auka tryggð viðskiptavina og notenda
Viðskiptavinurinn tók eftir jákvæðum breytingum á stöðugleika kerfisins. Notendur lenda í færri vandamálum við notkun kerfisins.

5. Dragðu úr kostnaði við tæknilega aðstoð
Við höfum hætt að framkvæma allar handvirkar athuganir. Nú eru allar athuganir sjálfvirkar. Áður lærðum við um vandamál frá notendum, það var oft erfitt að skilja hvaða vandamál notandinn var að tala um. Nú eru flest vandamál tilkynnt af vöktunarkerfinu, tilkynningar innihalda tæknigögn sem gera alltaf ljóst hvað fór úrskeiðis og hvar.

Mikilvægt!
Þú getur ekki sett upp eftirlitskerfið á sama netþjóni og forritin þín keyra. Ef þjónninn fer niður munu forrit hætta að virka og það mun enginn láta vita af því.

Vöktunarkerfið verður að keyra á sérstökum netþjóni í öðru gagnaveri.

Ef þú vilt ekki nota sérstakan netþjón í nýju gagnaveri geturðu notað skýjaeftirlitskerfi. Fyrirtækið okkar notar Zidium skýjaeftirlitskerfið, en þú getur notað hvaða annað vöktunarkerfi sem er. Kostnaður við skýjaeftirlitskerfi er lægri en að leigja nýjan netþjón.

Tillögur:

  1. Brjóttu niður forrit og kerfi í formi tré af íhlutum í eins nákvæmum smáatriðum og mögulegt er, þannig að það verður þægilegt að skilja hvar og hvað er bilað og eftirlitið verður fullkomnari.
  2. Notaðu próf til að athuga virkni íhluta. Það er betra að nota margar einfaldar athuganir en eina flókna.
  3. Stilltu mæligildi við hlið vöktunarkerfisins, frekar en að skrifa þá í kóða. Þetta mun bjarga þér frá því að þurfa að endursafna, endurstilla eða endurræsa forritið.
  4. Fyrir sérsniðnar athuganir, notaðu tímamörk um mikilvægi til að forðast að fá rangar tilkynningar vegna þess að sum athugun tók aðeins lengri tíma en venjulega.
  5. Reyndu að láta íhlutina í vöktunarkerfinu verða rauðir aðeins þegar það er örugglega vandamál. Ef þeir verða rauðir fyrir ekki neitt, þá hættir þú að fylgjast með tilkynningum eftirlitskerfisins, merking þess glatast.

Ef þú ert ekki að nota eftirlitskerfi ennþá, byrjaðu! Það er ekki eins erfitt og það virðist. Fáðu spark út úr því að horfa á græna hráefnistréð sem þú ræktaðir sjálfur.

Gangi þér vel.

Heimild: www.habr.com

Bæta við athugasemd