Kā pārņemt kontroli pār savu tīkla infrastruktūru. Pirmā nodaļa. Turiet

Å is ir pirmais raksts rakstu sērijā ā€œKā kontrolēt tÄ«kla infrastruktÅ«ruā€. Visu sērijas rakstu saturu un saites var atrast Å”eit.

PilnÄ«bā pieļauju, ka ir pietiekami daudz uzņēmumu, kur vienas stundas vai pat vienas dienas tÄ«kla dÄ«kstāve nav kritiska. Diemžēl vai par laimi man nebija iespējas strādāt Ŕādās vietās. Bet, protams, tÄ«kli ir dažādi, prasÄ«bas ir dažādas, pieejas ir atŔķirÄ«gas, un tomēr vienā vai otrā veidā zemāk esoÅ”ais saraksts daudzos gadÄ«jumos patieŔām bÅ«s ā€œjādaraā€.

Tātad, sākotnējie nosacījumi.

JÅ«s atrodaties jaunā darbā, esat saņēmis paaugstinājumu vai esat nolēmis no jauna paskatÄ«ties uz saviem pienākumiem. Uzņēmuma tÄ«kls ir jÅ«su atbildÄ«bas joma. Jums tas daudzējādā ziņā ir izaicinājums un jaunums, kas zināmā mērā attaisno Ŕī raksta mentoringa toni :). Bet es ceru, ka raksts var bÅ«t noderÄ«gs arÄ« jebkuram tÄ«kla inženierim.

Jūsu pirmais stratēģiskais mērķis ir iemācīties pretoties entropijai un uzturēt sniegto pakalpojumu līmeni.

Daudzas no tālāk aprakstītajām problēmām var atrisināt ar dažādiem līdzekļiem. Tehniskās realizācijas tēmu apzināti neceļu, jo... principā bieži vien nav tik svarīgi, kā tu to vai citu problēmu atrisināji, bet svarīgi ir tas, kā tu to lieto un vai vispār lieto. Piemēram, jūsu profesionāli izveidotā uzraudzības sistēma ir maz noderīga, ja jūs uz to neskatāties un nereaģējat uz brīdinājumiem.

ŠžŠ±Š¾Ń€ŃƒŠ“Š¾Š²Š°Š½ŠøŠµ

Vispirms jums ir jāsaprot, kur ir lielākie riski.

Atkal, tas var bÅ«t savādāk. Es pieļauju, ka kaut kur, piemēram, tie bÅ«s droŔības jautājumi, un kaut kur jautājumi, kas saistÄ«ti ar pakalpojuma nepārtrauktÄ«bu, un kaut kur, iespējams, vēl kaut kas. Kāpēc ne?

Pieņemsim, lai būtu skaidrs, ka tā joprojām ir pakalpojuma nepārtrauktība (tā tas bija visos uzņēmumos, kuros es strādāju).

Tad jums jāsāk ar aprÄ«kojumu. Å eit ir saraksts ar tēmām, kurām jāpievērÅ” uzmanÄ«ba:

  • iekārtu klasifikācija pēc kritiskuma pakāpes
  • kritisko iekārtu dublÄ“Å”ana
  • atbalsts, licences

Jums ir jāpārdomā iespējamie kļūmju scenāriji, jo Ä«paÅ”i, ja aprÄ«kojums ir jÅ«su kritiskuma klasifikācijas augÅ”galā. Parasti dubultproblēmu iespējamÄ«ba tiek atstāta novārtā, pretējā gadÄ«jumā jÅ«su risinājums un atbalsts var kļūt nepamatoti dārgs, taču patiesi kritisku tÄ«kla elementu gadÄ«jumā, kuru atteice varētu bÅ«tiski ietekmēt biznesu, par to ir jāpadomā.

Piemērs

Pieņemsim, ka mēs runājam par saknes slēdzi datu centrā.

Tā kā mēs vienojāmies, ka pakalpojumu nepārtrauktÄ«ba ir vissvarÄ«gākais kritērijs, ir saprātÄ«gi nodroÅ”ināt Ŕī aprÄ«kojuma ā€œkarstoā€ dublÄ“Å”anu (redundanci). Bet tas vēl nav viss. Jums arÄ« jāizlemj, cik ilgi, ja saplÄ«st pirmais slēdzis, ir pieļaujams dzÄ«vot tikai ar vienu atlikuÅ”o slēdzi, jo pastāv risks, ka arÄ« tas saplÄ«sÄ«s.

SvarÄ«gs! Jums nav paÅ”am jāizlemj Å”is jautājums. Jums jāapraksta riski, iespējamie risinājumi un izmaksas vadÄ«bai vai uzņēmuma vadÄ«bai. Viņiem ir jāpieņem lēmumi.

Tātad, ja tika nolemts, ka, ņemot vērā nelielo dubultas atteices iespējamÄ«bu, principā ir pieļaujams strādāt 4 stundas uz viena slēdža, tad varat vienkārÅ”i ņemt atbilstoÅ”u atbalstu (saskaņā ar kuru iekārta tiks nomainÄ«ta 4 laikā stundas).

Bet pastāv risks, ka viņi nepiegādās. Diemžēl reiz esam nonākuÅ”i Ŕādā situācijā. Četru stundu vietā tehnika ceļoja nedēļu!!!

Tāpēc arÄ« Å”is risks ir jāapspriež un, iespējams, pareizāk bÅ«s iegādāties citu slēdzi (treÅ”o) un glabāt to rezerves daļu iepakojumā (ā€œaukstāā€ rezerves kopija) vai izmantot laboratorijas vajadzÄ«bām.

SvarÄ«gs! Izveidojiet izklājlapu par visu jÅ«su atbalstu ar derÄ«guma termiņiem un pievienojiet to savam kalendāram, lai vismaz mēnesi iepriekÅ” saņemtu e-pasta ziņojumu par to, ka jums vajadzētu sākt uztraukties par atbalsta atjaunoÅ”anu.

Jums netiks piedots, ja aizmirsīsit atjaunot atbalstu un nākamajā dienā pēc tā beigām jūsu aparatūra pārtrūks.

Ārkārtas darbs

Neatkarīgi no tā, kas notiek jūsu tīklā, ideālā gadījumā jums vajadzētu saglabāt piekļuvi tīkla aprīkojumam.

Svarīgs! Jums ir jābūt konsoles piekļuvei visam aprīkojumam, un Ŕī piekļuve nedrīkst būt atkarīga no lietotāja datu tīkla stāvokļa.

Jums vajadzētu arÄ« iepriekÅ” paredzēt iespējamos negatÄ«vos scenārijus un dokumentēt nepiecieÅ”amās darbÄ«bas. Å Ä« dokumenta pieejamÄ«ba ir arÄ« ļoti svarÄ«ga, tāpēc tas ir ne tikai jāpublicē nodaļas koplietojamā resursā, bet arÄ« jāsaglabā lokāli inženieru datoros.

Tur jābūt

  • informācija, kas nepiecieÅ”ama, lai atvērtu biļeti ar pārdevēja vai integratora atbalstu
  • informācija par to, kā nokļūt lÄ«dz jebkuram aprÄ«kojumam (konsole, vadÄ«ba)

Protams, tajā var bÅ«t arÄ« jebkāda cita noderÄ«ga informācija, piemēram, dažādu iekārtu jaunināŔanas procedÅ«ras apraksts un noderÄ«gas diagnostikas komandas.

Filiāles

Tagad jums ir jānovērtē riski, kas saistÄ«ti ar partneriem. Parasti Å”is

  • Interneta pakalpojumu sniedzēji un trafika apmaiņas punkti (IX)
  • sakaru kanālu nodroÅ”inātāji

Kādus jautājumus sev vajadzētu uzdot? Tāpat kā ar aprīkojumu, ir jāņem vērā dažādi avārijas scenāriji. Piemēram, interneta pakalpojumu sniedzējiem tas varētu būt kaut kas līdzīgs:

  • kas notiek, ja interneta pakalpojumu sniedzējs X kāda iemesla dēļ pārtrauc sniegt jums pakalpojumu?
  • Vai citiem pakalpojumu sniedzējiem jums bÅ«s pietiekami daudz joslas platuma?
  • Cik labs savienojums saglabāsies?
  • Cik neatkarÄ«gi ir jÅ«su interneta pakalpojumu sniedzēji un vai kāda no tiem nopietns pārtraukums radÄ«s problēmas ar citiem?
  • cik daudz optisko ieeju jÅ«su datu centrā?
  • kas notiks, ja viena no ieejām tiks pilnÄ«bā iznÄ«cināta?

Kas attiecas uz ievadiem, manā praksē divos dažādos uzņēmumos, divos dažādos datu centros, ekskavators iznīcināja akas un tikai par brīnumu mūsu optika netika ietekmēta. Tas nav tik rets gadījums.

Un, protams, jums ir ne tikai jāuzdod Å”ie jautājumi, bet, atkal, ar vadÄ«bas atbalstu, jāsniedz pieņemams risinājums jebkurā situācijā.

Dublējums

Nākamā prioritāte var bÅ«t aprÄ«kojuma konfigurāciju dublÄ“Å”ana. Jebkurā gadÄ«jumā tas ir ļoti svarÄ«gs punkts. Es neuzskaitÄ«Å”u tos gadÄ«jumus, kad varat pazaudēt konfigurāciju, labāk ir regulāri dublēt un nedomāt par to. Turklāt regulāras dublējumkopijas var bÅ«t ļoti noderÄ«gas izmaiņu uzraudzÄ«bā.

SvarÄ«gs! Veiciet dublējumus katru dienu. Tas nav tik liels datu apjoms, ko ietaupÄ«t. No rÄ«ta dežurējoÅ”ajam inženierim (vai jums) jāsaņem atskaite no sistēmas, kurā skaidri norādÄ«ts, vai dublÄ“Å”ana bija veiksmÄ«ga vai nē, un, ja dublÄ“Å”ana bija neveiksmÄ«ga, problēma ir jāatrisina vai jāizveido biļete ( skatiet tÄ«kla nodaļas procesus).

Programmatūras versijas

Jautājums par to, vai ir vērts jaunināt iekārtas programmatÅ«ru, nav tik viennozÄ«mÄ«gs. No vienas puses, vecās versijas ir zināmas kļūdas un ievainojamÄ«bas, bet, no otras puses, jauna programmatÅ«ra, pirmkārt, ne vienmēr ir nesāpÄ«ga jaunināŔanas procedÅ«ra, otrkārt, jaunas kļūdas un ievainojamÄ«bas.

Šeit jums jāatrod labākais risinājums. Daži acīmredzami ieteikumi

  • instalējiet tikai stabilas versijas
  • Tomēr jums nevajadzētu izmantot ļoti vecās programmatÅ«ras versijas
  • izveidojiet zÄ«mi ar informāciju par to, kur atrodas kāda programmatÅ«ra
  • periodiski izlasiet ziņojumus par programmatÅ«ras versiju ievainojamÄ«bām un kļūdām, un kritisku problēmu gadÄ«jumā jums vajadzētu padomāt par jaunināŔanu

Å ajā posmā, ja jums ir konsoles piekļuve aprÄ«kojumam, informācija par atbalstu un jaunināŔanas procedÅ«ras apraksts, jÅ«s principā esat gatavs Å”im solim. Ideāls variants ir tad, ja jums ir laboratorijas aprÄ«kojums, kurā varat pārbaudÄ«t visu procedÅ«ru, bet diemžēl tas nenotiek bieži.

Kritiska aprÄ«kojuma gadÄ«jumā varat sazināties ar pārdevēja atbalsta dienestu un lÅ«gt palÄ«dzÄ«bu jaunināŔanā.

BiļeÅ”u sistēma

Tagad jūs varat skatīties apkārt. Jums ir jāizveido procesi mijiedarbībai ar citām nodaļām un departamentā.

Tas var nebÅ«t nepiecieÅ”ams (piemēram, ja jÅ«su uzņēmums ir mazs), taču ļoti ieteiktu darbu organizēt tā, lai visi ārējie un iekŔējie uzdevumi izietu caur biļeÅ”u sistēmu.

BiļeÅ”u sistēma bÅ«tÄ«bā ir jÅ«su saskarne iekŔējai un ārējai saziņai, un jums Ŕī saskarne ir jāapraksta pietiekami detalizēti.

Ņemsim piemēru par svarÄ«gu un kopÄ«gu piekļuves atvērÅ”anas uzdevumu. Es aprakstÄ«Å”u algoritmu, kas vienā no uzņēmumiem darbojās lieliski.

Piemērs

Sāksim ar to, ka bieži piekļuves klienti savas vēlmes formulē tÄ«kla inženierim nesaprotamā valodā, proti, aplikācijas valodā, piemēram, ā€œdod man pieeju 1Cā€.

Tāpēc mēs nekad neesam pieņēmuÅ”i pieprasÄ«jumus tieÅ”i no Ŕādiem lietotājiem.
Un tā bija pirmā prasība

  • piekļuves pieprasÄ«jumiem jānāk no tehniskajiem departamentiem (mÅ«su gadÄ«jumā tie bija unix, logi, palÄ«dzÄ«bas dienesta inženieri)

Otra prasība ir tāda

  • Å”ai piekļuvei ir jābÅ«t reÄ£istrētai (tehniskajai nodaļai, no kuras mēs saņēmām Å”o pieprasÄ«jumu), un pēc pieprasÄ«juma mēs saņemam saiti uz Å”o reÄ£istrēto piekļuvi

Šī pieprasījuma formai ir jābūt mums saprotamai, t.i.

  • pieprasÄ«jumā ir jābÅ«t informācijai par to, kuram apakÅ”tÄ«klam un kuram apakÅ”tÄ«klam jābÅ«t atvērtam, kā arÄ« protokolam un (tcp/udp gadÄ«jumā) portiem.

Tur arī tas būtu jānorāda

  • apraksts par to, kāpēc Ŕī piekļuve ir atvērta
  • pagaidu vai pastāvÄ«gs (ja pagaidu, lÄ«dz kuram datumam)

Un ļoti svarīgs punkts ir apstiprinājumi

  • no tās nodaļas vadÄ«tāja, kura uzsāka piekļuvi (piemēram, grāmatvedÄ«ba)
  • no tehniskās nodaļas vadÄ«tāja, no kurienes Å”is pieprasÄ«jums tika nosÅ«tÄ«ts tÄ«kla nodaļai (piemēram, palÄ«dzÄ«bas dienestam)

Å ajā gadÄ«jumā Ŕīs piekļuves ā€œÄ«paÅ”nieksā€ tiek uzskatÄ«ts par tās nodaļas vadÄ«tāju, kura uzsāka piekļuvi (uzskaiti mÅ«su piemērā), un viņŔ ir atbildÄ«gs par to, lai lapa ar reÄ£istrētu piekļuvi Å”ai nodaļai bÅ«tu atjaunināta. .

Mežizstrāde

Tas ir kaut kas tāds, kurā var noslÄ«kt. Bet, ja vēlaties Ä«stenot proaktÄ«vu pieeju, jums jāiemācās rÄ«koties ar Å”o datu plÅ«du.

Šeit ir daži praktiski ieteikumi:

  • jums ir jāpārskata žurnāli katru dienu
  • plānotas pārskatÄ«Å”anas (nevis ārkārtas situācijas) gadÄ«jumā varat ierobežot sevi lÄ«dz 0, 1, 2 smaguma pakāpei un pievienot atlasÄ«tus modeļus no citiem lÄ«meņiem, ja uzskatāt to par nepiecieÅ”amu.
  • uzrakstiet skriptu, kas parsē žurnālus un ignorē tos žurnālus, kuru modeļus pievienojāt ignorÄ“Å”anas sarakstam

Å Ä« pieeja ļaus jums laika gaitā izveidot ignorējamo žurnālu sarakstu, kas jums nav interesanti, un atstāt tikai tos, kurus jÅ«s patieŔām uzskatāt par svarÄ«giem.
Mums tas lieliski darbojās.

Uzraudzība

Nereti uzņēmumam trÅ«kst uzraudzÄ«bas sistēmas. Varat, piemēram, paļauties uz žurnāliem, taču iekārta var vienkārÅ”i ā€œnomirtā€, nepaspējot neko ā€œpateiktā€, vai arÄ« udp syslog protokola pakete var tikt pazaudēta un nesanāk. Kopumā, protams, aktÄ«va uzraudzÄ«ba ir svarÄ«ga un nepiecieÅ”ama.

Divi populārākie piemēri manā praksē:

  • sakaru kanālu, kritisko saiÅ”u noslodzes uzraudzÄ«ba (piemēram, pieslēgÅ”anās pakalpojumu sniedzējiem). Tie ļauj proaktÄ«vi saskatÄ«t iespējamo pakalpojuma degradācijas problēmu trafika zuduma dēļ un attiecÄ«gi izvairÄ«ties no tās.
  • diagrammas, kuru pamatā ir NetFlow. Tie atvieglo trafika anomāliju atraÅ”anu un ir ļoti noderÄ«gi, lai atklātu dažus vienkārÅ”us, bet nozÄ«mÄ«gus hakeru uzbrukumu veidus.

SvarÄ«gs! Iestatiet SMS paziņojumus par vissvarÄ«gākajiem notikumiem. Tas attiecas gan uz uzraudzÄ«bu, gan reÄ£istrÄ“Å”anu. Ja nav dežūras maiņas, tad sms jāpienāk arÄ« ārpus darba laika.

Pārdomājiet procesu tā, lai nepamodinātu visus inženierus. Mums par to dežurēja inženieris.

Mainiet kontroli

Manuprāt, nav nepiecieÅ”ams kontrolēt visas izmaiņas. Bet jebkurā gadÄ«jumā jums vajadzētu bÅ«t iespējai, ja nepiecieÅ”ams, viegli atrast, kurÅ” un kāpēc ir veicis noteiktas izmaiņas tÄ«klā.

Daži padomi:

  • izmantojiet biļeÅ”u sistēmu, lai detalizēti aprakstÄ«tu, kas ar Å”o biļeti tika darÄ«ts, piemēram, kopējot lietoto konfigurāciju biļetē
  • izmantot komentÄ“Å”anas iespējas tÄ«kla iekārtās (piemēram, veikt komentārus vietnē Juniper). JÅ«s varat pierakstÄ«t biļetes numuru
  • izmantojiet konfigurācijas dublējumu diff

Varat to īstenot kā procesu, katru dienu pārskatot visas biļetes, lai konstatētu izmaiņas.

Procesi

Jums ir jāformalizē un jāapraksta procesi savā komandā. Ja esat sasniedzis Å”o punktu, jÅ«su komandā jau vajadzētu darboties vismaz Ŕādiem procesiem:

Ikdienas procesi:

  • darbs ar biļetēm
  • darbs ar baļķiem
  • mainÄ«t kontroli
  • ikdienas čeku lapa

Ikgadējie procesi:

  • garantiju pagarināŔana, licences

Asinhronie procesi:

  • reaģēŔana uz dažādām ārkārtas situācijām

Pirmās daļas noslēgums

Vai esat ievērojuÅ”i, ka tas viss vēl nav par tÄ«kla konfigurāciju, ne par dizainu, ne par tÄ«kla protokoliem, ne par marÅ”rutÄ“Å”anu, ne par droŔību... Tas ir kaut kas apkārt. Bet tie, lai arÄ« varbÅ«t garlaicÄ«gi, protams, ir ļoti svarÄ«gi tÄ«kla nodaļas darba elementi.

Pagaidām, kā redzat, jÅ«s savā tÄ«klā neko neesat uzlabojis. Ja bija droŔības ievainojamÄ«bas, tad tās palika, ja bija slikts dizains, tad palika. LÄ«dz brÄ«dim, kad esat pielietojis savas tÄ«kla inženiera prasmes un zināŔanas, kurām, visticamāk, esat iztērējis daudz laika, pūļu un dažreiz arÄ« naudas. Bet vispirms jums ir jāizveido (vai jānostiprina) pamats un pēc tam jāsāk bÅ«vēt.

Tālāk norādītajās daļās būs norādīts, kā atrast un novērst kļūdas un pēc tam uzlabot infrastruktūru.

Protams, jums nav jādara viss pēc kārtas. Laiks var būt kritisks. Dariet to paralēli, ja resursi atļauj.

Un svarīgs papildinājums. Sazinieties, jautājiet, konsultējieties ar savu komandu. Galu galā viņi ir tie, kas to visu atbalsta un dara.

Avots: www.habr.com

Pievieno komentāru