Тармактык инфраструктураңызды кантип көзөмөлдөө керек. Биринчи бөлүм. кармап туруңуз

Бул макала "Тармактык инфраструктураңызды кантип көзөмөлдөө керек" деген макалалар сериясынын биринчиси. Сериядагы бардык макалалардын мазмунун жана шилтемелерди тапса болот бул жерде.

Тармактын бир саат же бир күн токтоп калуусу критикалык мааниге ээ болбогон компаниялардын жетиштүү саны бар экенин толук моюнга алам. Тилекке каршыбы, бактыбызгабы, андай жерлерде иштегенге мүмкүнчүлүгүм болгон жок. Бирок, албетте, тармактар ​​ар башка, талаптар ар башка, мамилелер ар башка, бирок, тигил же бул түрдө, төмөнкү тизме көп учурларда иш жүзүндө "керектүү" болуп калат.

Ошентип, баштапкы шарттар.

Сиз жаңы жумуштасыз, кызматыңыз жогоруладыңыз же өз милдеттериңизди жаңыча кароону чечтиңиз. Компания тармагы - бул сиздин жоопкерчилик чөйрөңүз. Сиз үчүн бул көп жагынан кыйынчылык жана жаңы нерсе, бул макаланын насаатчылык үнүн бир аз актайт :). Бирок, мен макала да ар бир тармак инженери үчүн пайдалуу болушу мүмкүн деп үмүттөнөм.

Сиздин биринчи стратегиялык максатыңыз - энтропияга каршы турууга жана көрсөтүлгөн кызматтын деңгээлин сактоого үйрөнүү.

Төмөндө сүрөттөлгөн көйгөйлөрдүн көбүн ар кандай жолдор менен чечсе болот. Мен техникалык ишке ашыруу темасын атайылап көтөрбөйм, анткени... Негизи, бул же тигил маселени кантип чечкениңиз анчалык деле маанилүү эмес, бирок эң негизгиси сиз аны кантип колдоносуз жана дегеле колдоносузбу. Мисалы, сиздин профессионалдуу түрдө курулган мониторинг тутумуңуздун пайдасы жок, эгерде сиз аны карабасаңыз жана эскертүүлөргө жооп бербесеңиз.

жабдуулар

Адегенде эң чоң коркунучтар кайда экенин түшүнүшүңүз керек.

Дагы, ар кандай болушу мүмкүн. Мен мойнума алам, мисалы, бул коопсуздук маселелери, ал эми бир жерде кызматтын үзгүлтүксүздүгүнө байланыштуу маселелер, жана дагы бир жерде, балким, башка нерсе. Эмне үчүн жок?

Келгиле, ачык айтуу үчүн, бул дагы эле кызматтын үзгүлтүксүздүгү (мен иштеген бардык компанияларда ушундай болгон) деп коёлу.

Андан кийин жабдуулар менен баштоо керек. Бул жерде көңүл бура турган темалардын тизмеси:

  • критикалык даражасы боюнча жабдууларды классификациялоо
  • маанилүү жабдуулардын резервдик көчүрмөсү
  • колдоо, лицензиялар

Мүмкүн болгон мүчүлүштүктөрдүн сценарийлери, өзгөчө критикалык классификацияңыздын башында турган жабдуулар менен ойлонушуңуз керек. Адатта, эки эселенген көйгөйлөрдүн пайда болушуна көңүл бурулбайт, антпесе сиздин чечимиңиз жана колдооңуз негизсиз кымбат болуп калышы мүмкүн, бирок чындап эле критикалык тармак элементтери болгон учурда, алардын иштебей калышы бизнеске олуттуу таасирин тийгизиши мүмкүн, бул жөнүндө ойлонушуңуз керек.

мисал

Келгиле, биз маалымат борборундагы тамыр которуштуруу жөнүндө айтып жатабыз дейли.

Биз кызматтын үзгүлтүксүздүгү эң маанилүү критерий экендигине макулдук бергендиктен, бул жабдуунун “ысык” резервдик көчүрмөсүн (артыкчылыкты) камсыз кылуу акылга сыярлык. Бирок бул баары эмес. Ошондой эле, биринчи которгуч бузулуп калса, канча убакытка чейин бир гана калган которгуч менен жашоо сизге алгылыктуубу, анткени ал да бузулуп калуу коркунучу бар экенин чечишиңиз керек.

Маанилүү! Бул маселени өзүңүз чечишиңиз керек эмес. Сиз тобокелдиктерди, мүмкүн болгон чечимдерди жана башкаруу же компанияны башкаруу үчүн чыгымдарды сүрөттөп беришиңиз керек. Алар чечим кабыл алышы керек.

Ошентип, эгерде эки жолу иштебей калуу ыктымалдыгын эске алуу менен, бир өчүргүчтө 4 саат иштөө, негизинен, алгылыктуу деп чечим кабыл алынса, анда сиз жөн гана тиешелүү колдоону ала аласыз (ага ылайык, жабдуулар 4 сааттын ичинде алмаштырылат). саат).

Бирок алар жеткирбей калуу коркунучу бар. Тилекке каршы, бир жолу ушундай абалга туш болгонбуз. Терт сааттын ордуна техника бир жума жол журду!!!

Ошондуктан, бул тобокелдикти да талкуулоо керек жана, балким, башка өчүргүчтү (үчүнчүсүн) сатып алып, аны запастык бөлүктөрдүн пакетинде («муздак» резервдик) сактоо же лабораториялык максатта колдонуу туурараак болот.

Маанилүү! Колдооңузду жаңыртуу жөнүндө тынчсыздана башташыңыз керек болгон электрондук катты жок дегенде бир ай мурун алуу үчүн, жарактуулук мөөнөтү менен бардык колдоолоруңуздун электрондук жадыбалын түзүңүз жана аны календарыңызга кошуңуз.

Колдооңузду жаңыртууну унутуп калсаңыз жана ал аппараттык камсыздооңуз үзгүлтүккө учураган күндүн эртеси кечирилбейсиз.

Шашылыш иш

Тармагыңызда эмне болсо да, эң жакшысы сиз тармактык жабдыктарыңызга кирүү мүмкүнчүлүгүн сакташыңыз керек.

Маанилүү! Сизде бардык жабдууларга консол мүмкүнчүлүгү болушу керек жана бул кирүү колдонуучунун маалымат тармагынын ден соолугуна көз каранды болбошу керек.

Ошондой эле алдын ала мүмкүн болгон терс сценарийлерди алдын ала билип, зарыл болгон аракеттерди документтештирүү керек. Бул документтин болушу да өтө маанилүү, ошондуктан ал бөлүмдүн жалпы ресурсуна жайгаштырылбастан, инженерлердин компьютерлеринде жергиликтүү түрдө сакталышы керек.

Болушу керек

  • сатуучу же интегратордун колдоосу менен билетти ачуу үчүн зарыл болгон маалымат
  • кандайдыр бир жабдууларга кантип алуу керектиги жөнүндө маалымат (консол, башкаруу)

Албетте, ал ошондой эле ар кандай башка пайдалуу маалыматты камтышы мүмкүн, мисалы, ар кандай жабдууларды жана пайдалуу диагностикалык буйруктарды жаңыртуу жол-жобосунун сүрөттөлүшү.

өнөктөштөр

Эми сиз өнөктөштөр менен байланышкан тобокелдиктерди баалоо керек. Адатта бул

  • Интернет-провайдерлер жана трафик алмашуу пункттары (IX)
  • байланыш каналынын провайдерлери

Өзүңүзгө кандай суроолорду беришиңиз керек? Жабдуулар сыяктуу эле, өзгөчө кырдаалдардын ар кандай сценарийлери каралышы керек. Мисалы, Интернет-провайдерлер үчүн, ал төмөнкүдөй болушу мүмкүн:

  • Интернет провайдери X кандайдыр бир себептерден улам сизге кызмат көрсөтүүнү токтотсо эмне болот?
  • Башка провайдерлерде сиз үчүн өткөрүү жөндөмдүүлүгү жетиштүүбү?
  • Байланыш канчалык жакшы болот?
  • Сиздин интернет-провайдерлериңиз канчалык көз карандысыз жана алардын биринин олуттуу иштен чыгышы башкаларга көйгөй жаратабы?
  • маалымат борборуңузга канча оптикалык киргизүү бар?
  • кирүүлөрдүн бири толугу менен жок кылынса эмне болот?

Киргизүүлөргө келсек, менин практикамда эки башка компанияда, эки башка маалымат борборлорунда экскаватор скважиналарды талкалап, бир гана керемет менен биздин оптикага таасир эткен жок. Бул мындай сейрек учур эмес.

Анан, албетте, бул суроолорду берүү үчүн гана эмес, керек, бирок, дагы бир жолу, жетекчиликтин колдоосу менен, ар кандай кырдаалда алгылыктуу чечим менен камсыз кылуу үчүн.

Камдык көчүрмө

Кийинки артыкчылык жабдуулардын конфигурацияларынын резервдик көчүрмөсү болушу мүмкүн. Кандай болгон күндө да бул абдан маанилүү жагдай. Мен конфигурацияны жоготуп алган учурларды санабайм, бул жөнүндө ойлонбостон, үзгүлтүксүз резервдик көчүрмөлөрдү жасоо керек. Мындан тышкары, үзгүлтүксүз камдык көчүрмөлөрү өзгөрүүлөргө мониторинг жүргүзүү үчүн абдан пайдалуу болушу мүмкүн.

Маанилүү! Камдык көчүрмөлөрдү күн сайын жасаңыз. Бул үнөмдөө үчүн мындай чоң маалымат эмес. Эртең менен нөөмөттөгү инженер (же сиз) системадан отчет алышы керек, анда резервдик көчүрүү ийгиликтүү болгонбу же жокпу так көрсөтүлгөн, ал эми резервдик көчүрүү ийгиликсиз болсо, көйгөй чечилиши керек же билет түзүлүшү керек ( тармак бөлүмүнүн процесстерин караңыз).

Программанын версиялары

Жабдуулардын программалык камсыздоосун жаңыртуу керекпи же жокпу деген суроо анчалык так эмес. Бир жагынан алганда, эски версиялар белгилүү мүчүлүштүктөр жана алсыздыктар, бирок экинчи жагынан, жаңы программалык камсыздоо, биринчиден, дайыма эле оорутпай жаңыртуу процедурасы эмес, экинчиден, жаңы мүчүлүштүктөр жана алсыздыктар.

Бул жерде сиз эң жакшы вариантты табышыңыз керек. Бир нече ачык сунуштар

  • туруктуу версияларын гана орнотуңуз
  • Ошентсе да, сиз программалык камсыздоонун өтө эски версияларында жашабашыңыз керек
  • кээ бир программалык камсыздоо жайгашкан жер жөнүндө маалымат менен белги жаса
  • программалык камсыздоонун версияларындагы кемчиликтер жана мүчүлүштүктөр жөнүндө отчетторду мезгил-мезгили менен окуп туруңуз жана олуттуу көйгөйлөр пайда болгон учурда, сиз жаңылоо жөнүндө ойлонушуңуз керек.

Бул этапта, консолдук жабдууларга, колдоо жөнүндө маалыматка жана жаңыртуу процедурасынын сыпаттамасына ээ болуу менен, сиз, негизинен, бул кадамга даярсыз. Идеалдуу вариант - бул сизде бүт процедураны текшере турган лабораториялык жабдуулар бар, бирок, тилекке каршы, бул көп учурда боло бербейт.

Критикалык жабдуулар болгон учурда, сиз жаңыртууга жардам берүү өтүнүчү менен сатуучунун колдоосуна кайрылсаңыз болот.

Билет системасы

Эми сен айланаңды карасаң болот. Башка бөлүмдөр менен жана бөлүмдүн ичинде өз ара аракеттенүү процесстерин түзүшүңүз керек.

Бул зарыл эмес болушу мүмкүн (мисалы, сиздин компанияңыз кичинекей болсо), бирок мен ишти бардык тышкы жана ички тапшырмалар билет системасы аркылуу өтө тургандай уюштурууну сунуштайм.

Билет системасы ички жана тышкы байланыштар үчүн сиздин интерфейсиңиз болуп саналат жана сиз бул интерфейсти жетиштүү деталдуу сүрөттөп беришиңиз керек.

Мүмкүнчүлүктү ачуу боюнча маанилүү жана жалпы милдетти мисалга алалы. Мен компаниялардын биринде кемчиликсиз иштеген алгоритмди сүрөттөп берем.

мисал

Келгиле, кирүү мүмкүнчүлүгүн кардарлар көп учурда тармактык инженерге түшүнүксүз тилде, тактап айтканда, тиркеменин тилинде, мисалы, "мага 1Сге кирүүгө мүмкүнчүлүк бергиле" деп формулировкалай турганынан баштайлы.

Ошондуктан, биз эч качан мындай колдонуучулардын түздөн-түз суроо-талаптарын кабыл алган эмеспиз.
Жана бул биринчи талап эле

  • жетүү үчүн суроо-талаптар техникалык бөлүмдөрдөн келиши керек (биздин учурда бул Unix, терезелер, жардам кызматынын инженерлери болгон)

Экинчи талап – бул

  • бул кирүү кирүүгө тийиш (биз бул өтүнүчтү алган техникалык бөлүм тарабынан) жана суроо-талап катары биз бул катталган кирүү шилтемесин алабыз

Бул суроо-талаптын формасы бизге түшүнүктүү болушу керек, б.а.

  • суроо-талап кайсы ички тармакка жана кайсы тармакка кирүү ачык болушу керектиги жөнүндө маалыматты, ошондой эле протоколду жана (tcp/udp учурда) портторду камтууга тийиш.

Ал жерде да көрсөтүлүшү керек

  • бул кирүү эмне үчүн ачылгандыгынын сүрөттөлүшү
  • убактылуу же туруктуу (убактылуу болсо, кайсы күнгө чейин)

Жана абдан маанилүү жагдай - бул бекитүү

  • кирүү демилгесин көтөргөн бөлүмдүн жетекчисинен (мисалы, бухгалтерия)
  • техникалык бөлүмдүн начальнигинен, бул суроо тармак бөлүмүнө келип түшкөн (мисалы, жардам кызматы)

Бул учурда, бул кирүү мүмкүнчүлүгүнүн "ээси" кирүүнү демилгелеген бөлүмдүн жетекчиси болуп эсептелет (биздин мисалда эсепке алуу) жана ал бул бөлүм үчүн катталган кирүү мүмкүнчүлүгү бар барактын жаңыртылган бойдон калышын камсыздоо үчүн жооптуу болот. .

Каттоо

Бул сиз чөгүп кете турган нерсе. Бирок, эгерде сиз проактивдүү ыкманы ишке ашырууну кааласаңыз, анда бул маалымат топоносу менен кантип күрөшүүнү үйрөнүшүңүз керек.

Бул жерде кээ бир практикалык сунуштар бар:

  • күн сайын журналдарды карап чыгуу керек
  • пландаштырылган кароодо (өзгөчө кырдаал эмес), сиз өзүңүздү 0, 1, 2 оордук даражалары менен чектеп, зарыл деп эсептесеңиз, башка деңгээлден тандалган үлгүлөрдү кошо аласыз.
  • журналдарды талдоочу скрипт жазыңыз жана үлгүлөрү этибарга албоо тизмесине кошкон журналдарды көрмөксөнгө салыңыз

Бул ыкма убакыттын өтүшү менен сиз үчүн кызык эмес журналдардын тизмесин түзүүгө жана сиз чындап маанилүү деп эсептегендерди гана калтырууга мүмкүндүк берет.
Бул биз үчүн абдан жакшы иштеген.

Мониторинг

Компаниянын мониторинг системасынын жоктугу сейрек эмес. Сиз, мисалы, журналдарга таяна аласыз, бирок жабдуулар эч нерсе "айтууга" убакыт жок эле "өлүп" калышы мүмкүн же udp syslog протокол пакети жоголуп, келбей калышы мүмкүн. Жалпысынан алганда, албетте, активдүү мониторинг маанилүү жана зарыл.

Менин практикамдагы эң популярдуу эки мисал:

  • байланыш каналдарынын, маанилүү шилтемелердин жүгүн көзөмөлдөө (мисалы, провайдерлерге туташуу). Алар трафиктин жоголушуна байланыштуу кызматтын деградациясынын потенциалдуу көйгөйүн активдүү көрүүгө жана ошого жараша андан качууга мүмкүндүк берет.
  • NetFlow негизинде графиктер. Алар трафиктеги аномалияларды оңой табууга жардам берет жана хакердик чабуулдардын кээ бир жөнөкөй, бирок олуттуу түрлөрүн аныктоо үчүн абдан пайдалуу.

Маанилүү! Эң маанилүү окуялар үчүн SMS эскертмелерин орнотуңуз. Бул мониторингге да, журналга да тиешелүү. Эгерде сизде нөөмөт жок болсо, анда смс жумуш убактысынан тышкары да келиши керек.

Бардык инженерлерди ойготуп албагыдай кылып процессти ойлонуңуз. Бул боюнча бизде инженер дежурный бар эле.

Башкарууну өзгөртүү

Менимче, бардык өзгөрүүлөрдү көзөмөлдөө зарыл эмес. Бирок, кандай болгон күндө да, керек болсо, тармакта ким жана эмне үчүн кандайдыр бир өзгөрүүлөрдү жасаганын оңой таба аласыз.

Бир нече сунуштар:

  • ошол билетте эмне жасалганын майда-чүйдөсүнө чейин билүү үчүн билет системасын колдонуңуз, мисалы, колдонулган конфигурацияны билетке көчүрүү
  • тармактык жабдуулар боюнча комментарий мүмкүнчүлүктөрүн колдонуу (мисалы, Juniper боюнча комментарий берүү). Билеттин номерин жазып койсонуз болот
  • конфигурацияңыздын камдык көчүрмөлөрүнүн айырмасын колдонуңуз

Сиз муну процесс катары ишке ашырып, бардык билеттерди өзгөртүү үчүн күн сайын карап турсаңыз болот.

жараяндар

Сиз өзүңүздүн командаңыздагы процесстерди формалдаштырып, сүрөттөшүңүз керек. Эгер сиз ушул чекке жеткен болсоңуз, анда сиздин командаңызда жок дегенде төмөнкү процесстер иштеши керек:

Күнүмдүк процесстер:

  • билеттер менен иштөө
  • журналдар менен иштөө
  • башкарууну өзгөртүү
  • күнүмдүк текшерүү барагы

Жылдык процесстер:

  • гарантияларды, лицензияларды узартуу

Асинхрондук процесстер:

  • ар кандай өзгөчө кырдаалдарга жооп берүү

Биринчи бөлүктүн корутундусу

Сиз байкадыңызбы, мунун баары тармактын конфигурациясы жөнүндө эмес, дизайн жөнүндө эмес, тармактык протоколдор жөнүндө эмес, маршрутизация жөнүндө эмес, коопсуздук жөнүндө эмес... Бул айланадагы бир нерсе. Бирок булар, балким, кызыксыз болсо да, албетте, тармактык бөлүмдүн ишинин абдан маанилүү элементтери.

Азырынча, өзүңүз көрүп тургандай, сиз тармакта эч нерсе жакшырта элексиз. Эгер коопсуздук кемчиликтери бар болсо, анда алар начар дизайн болсо, ошол бойдон калды. Тармак инженери катары өз жөндөмүңүздү жана билимиңизди колдонгонго чейин, ага сиз көп убакытты, күч-аракетти жана кээде акчаны сарптагансыз. Бирок, адегенде пайдубалын түзүү (же бекемдөө), андан кийин курууну баштоо керек.

Төмөнкү бөлүктөр каталарды кантип таап, жок кылууну, анан инфраструктураңызды жакшыртууну айтып берет.

Албетте, баарын ырааттуу жасоонун кажети жок. Убакыт критикалык болушу мүмкүн. Ресурстар уруксат берсе, параллелдүү кылыңыз.

Жана маанилүү кошумча. Командаңыз менен баарлашыңыз, сураңыз, кеңешиңиз. Акыры мунун баарын колдоп, жасап жаткандар да ошолор.

Source: www.habr.com

Комментарий кошуу