Å is ir pirmais raksts rakstu sÄrijÄ āKÄ kontrolÄt tÄ«kla infrastruktÅ«ruā. Visu sÄrijas rakstu saturu un saites var atrast
PilnÄ«bÄ pieļauju, ka ir pietiekami daudz uzÅÄmumu, kur vienas stundas vai pat vienas dienas tÄ«kla dÄ«kstÄve nav kritiska. DiemžÄl vai par laimi man nebija iespÄjas strÄdÄt Å”ÄdÄs vietÄs. Bet, protams, tÄ«kli ir dažÄdi, prasÄ«bas ir dažÄdas, pieejas ir atŔķirÄ«gas, un tomÄr vienÄ vai otrÄ veidÄ zemÄk esoÅ”ais saraksts daudzos gadÄ«jumos patieÅ”Äm bÅ«s ājÄdaraā.
TÄtad, sÄkotnÄjie nosacÄ«jumi.
JÅ«s atrodaties jaunÄ darbÄ, esat saÅÄmis paaugstinÄjumu vai esat nolÄmis no jauna paskatÄ«ties uz saviem pienÄkumiem. UzÅÄmuma tÄ«kls ir jÅ«su atbildÄ«bas joma. Jums tas daudzÄjÄdÄ ziÅÄ ir izaicinÄjums un jaunums, kas zinÄmÄ mÄrÄ attaisno Ŕī raksta mentoringa toni :). Bet es ceru, ka raksts var bÅ«t noderÄ«gs arÄ« jebkuram tÄ«kla inženierim.
JÅ«su pirmais stratÄÄ£iskais mÄrÄ·is ir iemÄcÄ«ties pretoties entropijai un uzturÄt sniegto pakalpojumu lÄ«meni.
Daudzas no tÄlÄk aprakstÄ«tajÄm problÄmÄm var atrisinÄt ar dažÄdiem lÄ«dzekļiem. TehniskÄs realizÄcijas tÄmu apzinÄti neceļu, jo... principÄ bieži vien nav tik svarÄ«gi, kÄ tu to vai citu problÄmu atrisinÄji, bet svarÄ«gi ir tas, kÄ tu to lieto un vai vispÄr lieto. PiemÄram, jÅ«su profesionÄli izveidotÄ uzraudzÄ«bas sistÄma ir maz noderÄ«ga, ja jÅ«s uz to neskatÄties un nereaÄ£Äjat uz brÄ«dinÄjumiem.
ŠŠ±Š¾ŃŃŠ“Š¾Š²Š°Š½ŠøŠµ
Vispirms jums ir jÄsaprot, kur ir lielÄkie riski.
Atkal, tas var bÅ«t savÄdÄk. Es pieļauju, ka kaut kur, piemÄram, tie bÅ«s droŔības jautÄjumi, un kaut kur jautÄjumi, kas saistÄ«ti ar pakalpojuma nepÄrtrauktÄ«bu, un kaut kur, iespÄjams, vÄl kaut kas. KÄpÄc ne?
PieÅemsim, lai bÅ«tu skaidrs, ka tÄ joprojÄm ir pakalpojuma nepÄrtrauktÄ«ba (tÄ tas bija visos uzÅÄmumos, kuros es strÄdÄju).
Tad jums jÄsÄk ar aprÄ«kojumu. Å eit ir saraksts ar tÄmÄm, kurÄm jÄpievÄrÅ” uzmanÄ«ba:
- iekÄrtu klasifikÄcija pÄc kritiskuma pakÄpes
- kritisko iekÄrtu dublÄÅ”ana
- atbalsts, licences
Jums ir jÄpÄrdomÄ iespÄjamie kļūmju scenÄriji, jo Ä«paÅ”i, ja aprÄ«kojums ir jÅ«su kritiskuma klasifikÄcijas augÅ”galÄ. Parasti dubultproblÄmu iespÄjamÄ«ba tiek atstÄta novÄrtÄ, pretÄjÄ gadÄ«jumÄ jÅ«su risinÄjums un atbalsts var kļūt nepamatoti dÄrgs, taÄu patiesi kritisku tÄ«kla elementu gadÄ«jumÄ, kuru atteice varÄtu bÅ«tiski ietekmÄt biznesu, par to ir jÄpadomÄ.
PiemÄrs
PieÅemsim, ka mÄs runÄjam par saknes slÄdzi datu centrÄ.
TÄ kÄ mÄs vienojÄmies, ka pakalpojumu nepÄrtrauktÄ«ba ir vissvarÄ«gÄkais kritÄrijs, ir saprÄtÄ«gi nodroÅ”inÄt Ŕī aprÄ«kojuma ākarstoā dublÄÅ”anu (redundanci). Bet tas vÄl nav viss. Jums arÄ« jÄizlemj, cik ilgi, ja saplÄ«st pirmais slÄdzis, ir pieļaujams dzÄ«vot tikai ar vienu atlikuÅ”o slÄdzi, jo pastÄv risks, ka arÄ« tas saplÄ«sÄ«s.
SvarÄ«gs! Jums nav paÅ”am jÄizlemj Å”is jautÄjums. Jums jÄapraksta riski, iespÄjamie risinÄjumi un izmaksas vadÄ«bai vai uzÅÄmuma vadÄ«bai. ViÅiem ir jÄpieÅem lÄmumi.
TÄtad, ja tika nolemts, ka, Åemot vÄrÄ nelielo dubultas atteices iespÄjamÄ«bu, principÄ ir pieļaujams strÄdÄt 4 stundas uz viena slÄdža, tad varat vienkÄrÅ”i Åemt atbilstoÅ”u atbalstu (saskaÅÄ ar kuru iekÄrta tiks nomainÄ«ta 4 laikÄ stundas).
Bet pastÄv risks, ka viÅi nepiegÄdÄs. DiemžÄl reiz esam nonÄkuÅ”i Å”ÄdÄ situÄcijÄ. Äetru stundu vietÄ tehnika ceļoja nedÄļu!!!
TÄpÄc arÄ« Å”is risks ir jÄapspriež un, iespÄjams, pareizÄk bÅ«s iegÄdÄties citu slÄdzi (treÅ”o) un glabÄt to rezerves daļu iepakojumÄ (āaukstÄā rezerves kopija) vai izmantot laboratorijas vajadzÄ«bÄm.
SvarÄ«gs! Izveidojiet izklÄjlapu par visu jÅ«su atbalstu ar derÄ«guma termiÅiem un pievienojiet to savam kalendÄram, lai vismaz mÄnesi iepriekÅ” saÅemtu e-pasta ziÅojumu par to, ka jums vajadzÄtu sÄkt uztraukties par atbalsta atjaunoÅ”anu.
Jums netiks piedots, ja aizmirsÄ«sit atjaunot atbalstu un nÄkamajÄ dienÄ pÄc tÄ beigÄm jÅ«su aparatÅ«ra pÄrtrÅ«ks.
ÄrkÄrtas darbs
NeatkarÄ«gi no tÄ, kas notiek jÅ«su tÄ«klÄ, ideÄlÄ gadÄ«jumÄ jums vajadzÄtu saglabÄt piekļuvi tÄ«kla aprÄ«kojumam.
SvarÄ«gs! Jums ir jÄbÅ«t konsoles piekļuvei visam aprÄ«kojumam, un Ŕī piekļuve nedrÄ«kst bÅ«t atkarÄ«ga no lietotÄja datu tÄ«kla stÄvokļa.
Jums vajadzÄtu arÄ« iepriekÅ” paredzÄt iespÄjamos negatÄ«vos scenÄrijus un dokumentÄt nepiecieÅ”amÄs darbÄ«bas. Å Ä« dokumenta pieejamÄ«ba ir arÄ« ļoti svarÄ«ga, tÄpÄc tas ir ne tikai jÄpublicÄ nodaļas koplietojamÄ resursÄ, bet arÄ« jÄsaglabÄ lokÄli inženieru datoros.
Tur jÄbÅ«t
- informÄcija, kas nepiecieÅ”ama, lai atvÄrtu biļeti ar pÄrdevÄja vai integratora atbalstu
- informÄcija par to, kÄ nokļūt lÄ«dz jebkuram aprÄ«kojumam (konsole, vadÄ«ba)
Protams, tajÄ var bÅ«t arÄ« jebkÄda cita noderÄ«ga informÄcija, piemÄram, dažÄdu iekÄrtu jauninÄÅ”anas procedÅ«ras apraksts un noderÄ«gas diagnostikas komandas.
FiliÄles
Tagad jums ir jÄnovÄrtÄ riski, kas saistÄ«ti ar partneriem. Parasti Å”is
- Interneta pakalpojumu sniedzÄji un trafika apmaiÅas punkti (IX)
- sakaru kanÄlu nodroÅ”inÄtÄji
KÄdus jautÄjumus sev vajadzÄtu uzdot? TÄpat kÄ ar aprÄ«kojumu, ir jÄÅem vÄrÄ dažÄdi avÄrijas scenÄriji. PiemÄram, interneta pakalpojumu sniedzÄjiem tas varÄtu bÅ«t kaut kas lÄ«dzÄ«gs:
- kas notiek, ja interneta pakalpojumu sniedzÄjs X kÄda iemesla dÄļ pÄrtrauc sniegt jums pakalpojumu?
- Vai citiem pakalpojumu sniedzÄjiem jums bÅ«s pietiekami daudz joslas platuma?
- Cik labs savienojums saglabÄsies?
- Cik neatkarÄ«gi ir jÅ«su interneta pakalpojumu sniedzÄji un vai kÄda no tiem nopietns pÄrtraukums radÄ«s problÄmas ar citiem?
- cik daudz optisko ieeju jÅ«su datu centrÄ?
- kas notiks, ja viena no ieejÄm tiks pilnÄ«bÄ iznÄ«cinÄta?
Kas attiecas uz ievadiem, manÄ praksÄ divos dažÄdos uzÅÄmumos, divos dažÄdos datu centros, ekskavators iznÄ«cinÄja akas un tikai par brÄ«numu mÅ«su optika netika ietekmÄta. Tas nav tik rets gadÄ«jums.
Un, protams, jums ir ne tikai jÄuzdod Å”ie jautÄjumi, bet, atkal, ar vadÄ«bas atbalstu, jÄsniedz pieÅemams risinÄjums jebkurÄ situÄcijÄ.
DublÄjums
NÄkamÄ prioritÄte var bÅ«t aprÄ«kojuma konfigurÄciju dublÄÅ”ana. JebkurÄ gadÄ«jumÄ tas ir ļoti svarÄ«gs punkts. Es neuzskaitÄ«Å”u tos gadÄ«jumus, kad varat pazaudÄt konfigurÄciju, labÄk ir regulÄri dublÄt un nedomÄt par to. TurklÄt regulÄras dublÄjumkopijas var bÅ«t ļoti noderÄ«gas izmaiÅu uzraudzÄ«bÄ.
SvarÄ«gs! Veiciet dublÄjumus katru dienu. Tas nav tik liels datu apjoms, ko ietaupÄ«t. No rÄ«ta dežurÄjoÅ”ajam inženierim (vai jums) jÄsaÅem atskaite no sistÄmas, kurÄ skaidri norÄdÄ«ts, vai dublÄÅ”ana bija veiksmÄ«ga vai nÄ, un, ja dublÄÅ”ana bija neveiksmÄ«ga, problÄma ir jÄatrisina vai jÄizveido biļete ( skatiet tÄ«kla nodaļas procesus).
Programmatūras versijas
JautÄjums par to, vai ir vÄrts jauninÄt iekÄrtas programmatÅ«ru, nav tik viennozÄ«mÄ«gs. No vienas puses, vecÄs versijas ir zinÄmas kļūdas un ievainojamÄ«bas, bet, no otras puses, jauna programmatÅ«ra, pirmkÄrt, ne vienmÄr ir nesÄpÄ«ga jauninÄÅ”anas procedÅ«ra, otrkÄrt, jaunas kļūdas un ievainojamÄ«bas.
Å eit jums jÄatrod labÄkais risinÄjums. Daži acÄ«mredzami ieteikumi
- instalÄjiet tikai stabilas versijas
- TomÄr jums nevajadzÄtu izmantot ļoti vecÄs programmatÅ«ras versijas
- izveidojiet zÄ«mi ar informÄciju par to, kur atrodas kÄda programmatÅ«ra
- periodiski izlasiet ziÅojumus par programmatÅ«ras versiju ievainojamÄ«bÄm un kļūdÄm, un kritisku problÄmu gadÄ«jumÄ jums vajadzÄtu padomÄt par jauninÄÅ”anu
Å ajÄ posmÄ, ja jums ir konsoles piekļuve aprÄ«kojumam, informÄcija par atbalstu un jauninÄÅ”anas procedÅ«ras apraksts, jÅ«s principÄ esat gatavs Å”im solim. IdeÄls variants ir tad, ja jums ir laboratorijas aprÄ«kojums, kurÄ varat pÄrbaudÄ«t visu procedÅ«ru, bet diemžÄl tas nenotiek bieži.
Kritiska aprÄ«kojuma gadÄ«jumÄ varat sazinÄties ar pÄrdevÄja atbalsta dienestu un lÅ«gt palÄ«dzÄ«bu jauninÄÅ”anÄ.
BiļeÅ”u sistÄma
Tagad jÅ«s varat skatÄ«ties apkÄrt. Jums ir jÄizveido procesi mijiedarbÄ«bai ar citÄm nodaļÄm un departamentÄ.
Tas var nebÅ«t nepiecieÅ”ams (piemÄram, ja jÅ«su uzÅÄmums ir mazs), taÄu ļoti ieteiktu darbu organizÄt tÄ, lai visi ÄrÄjie un iekÅ”Äjie uzdevumi izietu caur biļeÅ”u sistÄmu.
BiļeÅ”u sistÄma bÅ«tÄ«bÄ ir jÅ«su saskarne iekÅ”Äjai un ÄrÄjai saziÅai, un jums Ŕī saskarne ir jÄapraksta pietiekami detalizÄti.
Å emsim piemÄru par svarÄ«gu un kopÄ«gu piekļuves atvÄrÅ”anas uzdevumu. Es aprakstÄ«Å”u algoritmu, kas vienÄ no uzÅÄmumiem darbojÄs lieliski.
PiemÄrs
SÄksim ar to, ka bieži piekļuves klienti savas vÄlmes formulÄ tÄ«kla inženierim nesaprotamÄ valodÄ, proti, aplikÄcijas valodÄ, piemÄram, ādod man pieeju 1Cā.
TÄpÄc mÄs nekad neesam pieÅÄmuÅ”i pieprasÄ«jumus tieÅ”i no Å”Ädiem lietotÄjiem.
Un tÄ bija pirmÄ prasÄ«ba
- piekļuves pieprasÄ«jumiem jÄnÄk no tehniskajiem departamentiem (mÅ«su gadÄ«jumÄ tie bija unix, logi, palÄ«dzÄ«bas dienesta inženieri)
Otra prasÄ«ba ir tÄda
- Å”ai piekļuvei ir jÄbÅ«t reÄ£istrÄtai (tehniskajai nodaļai, no kuras mÄs saÅÄmÄm Å”o pieprasÄ«jumu), un pÄc pieprasÄ«juma mÄs saÅemam saiti uz Å”o reÄ£istrÄto piekļuvi
Å Ä« pieprasÄ«juma formai ir jÄbÅ«t mums saprotamai, t.i.
- pieprasÄ«jumÄ ir jÄbÅ«t informÄcijai par to, kuram apakÅ”tÄ«klam un kuram apakÅ”tÄ«klam jÄbÅ«t atvÄrtam, kÄ arÄ« protokolam un (tcp/udp gadÄ«jumÄ) portiem.
Tur arÄ« tas bÅ«tu jÄnorÄda
- apraksts par to, kÄpÄc Ŕī piekļuve ir atvÄrta
- pagaidu vai pastÄvÄ«gs (ja pagaidu, lÄ«dz kuram datumam)
Un ļoti svarÄ«gs punkts ir apstiprinÄjumi
- no tÄs nodaļas vadÄ«tÄja, kura uzsÄka piekļuvi (piemÄram, grÄmatvedÄ«ba)
- no tehniskÄs nodaļas vadÄ«tÄja, no kurienes Å”is pieprasÄ«jums tika nosÅ«tÄ«ts tÄ«kla nodaļai (piemÄram, palÄ«dzÄ«bas dienestam)
Å ajÄ gadÄ«jumÄ Å”Ä«s piekļuves āÄ«paÅ”nieksā tiek uzskatÄ«ts par tÄs nodaļas vadÄ«tÄju, kura uzsÄka piekļuvi (uzskaiti mÅ«su piemÄrÄ), un viÅÅ” ir atbildÄ«gs par to, lai lapa ar reÄ£istrÄtu piekļuvi Å”ai nodaļai bÅ«tu atjauninÄta. .
MežizstrÄde
Tas ir kaut kas tÄds, kurÄ var noslÄ«kt. Bet, ja vÄlaties Ä«stenot proaktÄ«vu pieeju, jums jÄiemÄcÄs rÄ«koties ar Å”o datu plÅ«du.
Šeit ir daži praktiski ieteikumi:
- jums ir jÄpÄrskata žurnÄli katru dienu
- plÄnotas pÄrskatÄ«Å”anas (nevis ÄrkÄrtas situÄcijas) gadÄ«jumÄ varat ierobežot sevi lÄ«dz 0, 1, 2 smaguma pakÄpei un pievienot atlasÄ«tus modeļus no citiem lÄ«meÅiem, ja uzskatÄt to par nepiecieÅ”amu.
- uzrakstiet skriptu, kas parsÄ Å¾urnÄlus un ignorÄ tos žurnÄlus, kuru modeļus pievienojÄt ignorÄÅ”anas sarakstam
Å Ä« pieeja ļaus jums laika gaitÄ izveidot ignorÄjamo žurnÄlu sarakstu, kas jums nav interesanti, un atstÄt tikai tos, kurus jÅ«s patieÅ”Äm uzskatÄt par svarÄ«giem.
Mums tas lieliski darbojÄs.
Uzraudzība
Nereti uzÅÄmumam trÅ«kst uzraudzÄ«bas sistÄmas. Varat, piemÄram, paļauties uz žurnÄliem, taÄu iekÄrta var vienkÄrÅ”i ānomirtā, nepaspÄjot neko āpateiktā, vai arÄ« udp syslog protokola pakete var tikt pazaudÄta un nesanÄk. KopumÄ, protams, aktÄ«va uzraudzÄ«ba ir svarÄ«ga un nepiecieÅ”ama.
Divi populÄrÄkie piemÄri manÄ praksÄ:
- sakaru kanÄlu, kritisko saiÅ”u noslodzes uzraudzÄ«ba (piemÄram, pieslÄgÅ”anÄs pakalpojumu sniedzÄjiem). Tie ļauj proaktÄ«vi saskatÄ«t iespÄjamo pakalpojuma degradÄcijas problÄmu trafika zuduma dÄļ un attiecÄ«gi izvairÄ«ties no tÄs.
- diagrammas, kuru pamatÄ ir NetFlow. Tie atvieglo trafika anomÄliju atraÅ”anu un ir ļoti noderÄ«gi, lai atklÄtu dažus vienkÄrÅ”us, bet nozÄ«mÄ«gus hakeru uzbrukumu veidus.
SvarÄ«gs! Iestatiet SMS paziÅojumus par vissvarÄ«gÄkajiem notikumiem. Tas attiecas gan uz uzraudzÄ«bu, gan reÄ£istrÄÅ”anu. Ja nav dežūras maiÅas, tad sms jÄpienÄk arÄ« Ärpus darba laika.
PÄrdomÄjiet procesu tÄ, lai nepamodinÄtu visus inženierus. Mums par to dežurÄja inženieris.
Mainiet kontroli
ManuprÄt, nav nepiecieÅ”ams kontrolÄt visas izmaiÅas. Bet jebkurÄ gadÄ«jumÄ jums vajadzÄtu bÅ«t iespÄjai, ja nepiecieÅ”ams, viegli atrast, kurÅ” un kÄpÄc ir veicis noteiktas izmaiÅas tÄ«klÄ.
Daži padomi:
- izmantojiet biļeÅ”u sistÄmu, lai detalizÄti aprakstÄ«tu, kas ar Å”o biļeti tika darÄ«ts, piemÄram, kopÄjot lietoto konfigurÄciju biļetÄ
- izmantot komentÄÅ”anas iespÄjas tÄ«kla iekÄrtÄs (piemÄram, veikt komentÄrus vietnÄ Juniper). JÅ«s varat pierakstÄ«t biļetes numuru
- izmantojiet konfigurÄcijas dublÄjumu diff
Varat to Ä«stenot kÄ procesu, katru dienu pÄrskatot visas biļetes, lai konstatÄtu izmaiÅas.
Procesi
Jums ir jÄformalizÄ un jÄapraksta procesi savÄ komandÄ. Ja esat sasniedzis Å”o punktu, jÅ«su komandÄ jau vajadzÄtu darboties vismaz Å”Ädiem procesiem:
Ikdienas procesi:
- darbs ar biļetÄm
- darbs ar baļķiem
- mainīt kontroli
- ikdienas Äeku lapa
IkgadÄjie procesi:
- garantiju pagarinÄÅ”ana, licences
Asinhronie procesi:
- reaÄ£ÄÅ”ana uz dažÄdÄm ÄrkÄrtas situÄcijÄm
PirmÄs daļas noslÄgums
Vai esat ievÄrojuÅ”i, ka tas viss vÄl nav par tÄ«kla konfigurÄciju, ne par dizainu, ne par tÄ«kla protokoliem, ne par marÅ”rutÄÅ”anu, ne par droŔību... Tas ir kaut kas apkÄrt. Bet tie, lai arÄ« varbÅ«t garlaicÄ«gi, protams, ir ļoti svarÄ«gi tÄ«kla nodaļas darba elementi.
PagaidÄm, kÄ redzat, jÅ«s savÄ tÄ«klÄ neko neesat uzlabojis. Ja bija droŔības ievainojamÄ«bas, tad tÄs palika, ja bija slikts dizains, tad palika. LÄ«dz brÄ«dim, kad esat pielietojis savas tÄ«kla inženiera prasmes un zinÄÅ”anas, kurÄm, visticamÄk, esat iztÄrÄjis daudz laika, pūļu un dažreiz arÄ« naudas. Bet vispirms jums ir jÄizveido (vai jÄnostiprina) pamats un pÄc tam jÄsÄk bÅ«vÄt.
TÄlÄk norÄdÄ«tajÄs daļÄs bÅ«s norÄdÄ«ts, kÄ atrast un novÄrst kļūdas un pÄc tam uzlabot infrastruktÅ«ru.
Protams, jums nav jÄdara viss pÄc kÄrtas. Laiks var bÅ«t kritisks. Dariet to paralÄli, ja resursi atļauj.
Un svarÄ«gs papildinÄjums. Sazinieties, jautÄjiet, konsultÄjieties ar savu komandu. Galu galÄ viÅi ir tie, kas to visu atbalsta un dara.
Avots: www.habr.com