Сүлжээний дэд бүтцээ хэрхэн хянах вэ. Эхний бүлэг. Барь

Энэ нийтлэл нь "Сүлжээний дэд бүтцээ хэрхэн хянах вэ" цуврал нийтлэлийн эхнийх нь юм. Цуврал дахь бүх нийтлэлийн агуулга, холбоосыг олж болно энд.

Сүлжээний нэг цаг, тэр байтугай нэг өдөр зогсолт хийх нь тийм ч чухал биш хангалттай тооны компаниуд байдаг гэдгийг би бүрэн хүлээн зөвшөөрч байна. Харамсалтай нь ч юм уу, азаар ч тийм газар ажиллах боломж байгаагүй. Гэхдээ мэдээжийн хэрэг сүлжээнүүд нь өөр, шаардлага нь өөр, арга барил нь өөр, гэхдээ нэг хэлбэрээр эсвэл өөр хэлбэрээр доор дурдсан жагсаалт нь олон тохиолдолд "заавал хийх ёстой" зүйл байх болно.

Тиймээс, анхны нөхцөлүүд.

Та шинэ ажилд орсон, албан тушаал ахисан эсвэл үүрэг хариуцлагаа шинээр харахаар шийдсэн. Компанийн сүлжээ бол таны хариуцах салбар юм. Таны хувьд энэ нь олон талаараа сорилт бөгөөд шинэ зүйл бөгөөд энэ нийтлэлийн зөвлөгөөний аяыг зарим талаар зөвтгөж байна :). Гэхдээ энэ нийтлэл нь сүлжээний инженер бүрт хэрэг болно гэж найдаж байна.

Таны хамгийн эхний стратегийн зорилго бол энтропийг эсэргүүцэж, үзүүлж буй үйлчилгээний түвшинг хадгалах явдал юм.

Доор тайлбарласан олон асуудлыг янз бүрийн аргаар шийдэж болно. Техникийн хэрэгжилтийн сэдвийг би санаатайгаар хөндөхгүй, учир нь... Зарчмын хувьд та энэ эсвэл тэр асуудлыг хэрхэн шийдсэн нь тийм ч чухал биш, харин та үүнийг хэрхэн ашиглаж байгаа, үүнийг огт ашиглаж байгаа эсэх нь чухал юм. Жишээлбэл, хэрэв та үүнийг харахгүй, сэрэмжлүүлэгт хариу өгөхгүй бол мэргэжлийн түвшинд барьсан хяналтын систем тань ашиггүй болно.

Тоног төхөөрөмж

Эхлээд та хамгийн том эрсдэл хаана байгааг ойлгох хэрэгтэй.

Дахин хэлэхэд энэ нь өөр байж болно. Хаа нэгтээ, жишээлбэл, эдгээр нь аюулгүй байдлын асуудлууд, хаа нэгтээ үйлчилгээний тасралтгүй байдалтай холбоотой асуудлууд, хаа нэгтээ, магадгүй өөр зүйл байх болно гэдгийг би хүлээн зөвшөөрч байна. Яагаад үгүй ​​гэж?

Үүнийг тодорхой болгохын тулд үйлчилгээний тасралтгүй байдал хэвээр байна гэж бодъё (миний ажиллаж байсан бүх компаниудад ийм байсан).

Дараа нь та тоног төхөөрөмжөөс эхлэх хэрэгтэй. Энд анхаарлаа хандуулах сэдвүүдийн жагсаалт байна:

  • эгзэгтэй байдлын зэрэглэлээр тоног төхөөрөмжийг ангилах
  • чухал тоног төхөөрөмжийн нөөц
  • дэмжлэг, лиценз

Та бүтэлгүйтлийн боломжит хувилбаруудыг, ялангуяа эгзэгтэй байдлын ангиллын дээд хэсэгт байгаа тоног төхөөрөмжийг бодох хэрэгтэй. Ихэвчлэн давхар асуудал үүсэх магадлалыг үл тоомсорлодог, эс тэгвээс таны шийдэл, дэмжлэг үндэслэлгүй үнэтэй болж магадгүй ч сүлжээний үнэхээр чухал элементүүдийн хувьд алдаа нь бизнест ихээхэн нөлөөлж болзошгүй тохиолдолд та энэ талаар бодох хэрэгтэй.

Жишээ нь:

Дата төвд root шилжүүлэгчийн тухай ярьж байна гэж бодъё.

Үйлчилгээний тасралтгүй байдал нь хамгийн чухал шалгуур гэж бид тохиролцсон тул энэ төхөөрөмжийн "халуун" нөөцийг (нөөцийг) хангах нь зүйтэй юм. Гэхдээ энэ нь бүгд биш юм. Та мөн эхний унтраалга эвдэрвэл хэр удаан үлдсэн нэг унтраалгатай амьдрах боломжтой эсэхийг шийдэх хэрэгтэй, учир нь энэ нь бас эвдрэх эрсдэлтэй.

Чухал! Та энэ асуудлыг өөрөө шийдэх шаардлагагүй. Та удирдлага эсвэл компанийн удирдлагад учирч болох эрсдэл, боломжит шийдэл, зардлыг тайлбарлах ёстой. Тэд шийдвэр гаргах ёстой.

Тиймээс, хэрэв давхар эвдрэл гарах магадлал бага байгаа тул нэг унтраалга дээр 4 цаг ажиллах нь зарчмын хувьд зөвшөөрөгдөх боломжтой гэж шийдсэн бол та зохих дэмжлэгийг авч болно (түүний дагуу тоног төхөөрөмжийг 4 цагийн дотор солих болно). цаг).

Гэхдээ тэд хүргэхгүй байх эрсдэлтэй. Харамсалтай нь бид нэг удаа ийм байдалд орсон. Дөрвөн цагийн оронд тоног төхөөрөмж долоо хоног явсан!!!

Тиймээс энэ эрсдэлийг бас хэлэлцэх шаардлагатай бөгөөд магадгүй та өөр унтраалга (гурав дахь) худалдаж аваад сэлбэг хэрэгслийн багцад (хүйтэн нөөц) хадгалах эсвэл лабораторийн зориулалтаар ашиглах нь илүү зөв байх болно.

Чухал! Хугацаа дуусах хугацаатай бүх тусламжийн хүснэгтийг гаргаж, хуанлидаа нэмээрэй, ингэснээр та дэмжлэгээ шинэчлэх талаар санаа зовж эхлэх хэрэгтэй гэсэн имэйлийг дор хаяж нэг сарын өмнө авах болно.

Хэрэв та дэмжлэгээ шинэчлэхээ мартсан бол таны техник хангамж тасалдсаны маргааш уучлагдахгүй.

Яаралтай ажил

Таны сүлжээнд юу ч тохиолдсон бай, та сүлжээний төхөөрөмждөө хандах хандалтыг хадгалах хэрэгтэй.

Чухал! Та бүх төхөөрөмжид консолоор хандах эрхтэй байх ёстой бөгөөд энэ хандалт нь хэрэглэгчийн мэдээллийн сүлжээний эрүүл мэндээс хамаарах ёсгүй.

Та мөн болзошгүй сөрөг хувилбаруудыг урьдчилан харж, шаардлагатай арга хэмжээг баримтжуулах хэрэгтэй. Энэхүү баримт бичгийн бэлэн байдал нь маш чухал тул үүнийг зөвхөн хэлтсийн хуваалцсан эх сурвалжид байршуулахаас гадна инженерүүдийн компьютер дээр дотооддоо хадгалах хэрэгтэй.

Байх ёстой

  • борлуулагч эсвэл интеграторын дэмжлэгтэйгээр тасалбар нээхэд шаардлагатай мэдээлэл
  • ямар ч тоног төхөөрөмжид хэрхэн хүрэх талаарх мэдээлэл (консол, удирдлага)

Мэдээжийн хэрэг, энэ нь бусад хэрэгцээтэй мэдээллийг агуулж болно, жишээлбэл, янз бүрийн тоног төхөөрөмжийг шинэчлэх процедурын тайлбар, ашигтай оношлогооны командууд.

Манай түншүүд

Одоо та түншүүдтэй холбоотой эрсдлийг үнэлэх хэрэгтэй. Ихэвчлэн энэ

  • Интернет үйлчилгээ үзүүлэгч ба траффик солилцох цэгүүд (IX)
  • холбооны сувгийн үйлчилгээ үзүүлэгчид

Та өөрөөсөө ямар асуулт асуух ёстой вэ? Тоног төхөөрөмжийн нэгэн адил онцгой байдлын янз бүрийн хувилбаруудыг авч үзэх шаардлагатай. Жишээлбэл, интернет үйлчилгээ үзүүлэгчдийн хувьд энэ нь дараах байдалтай байж болно.

  • X интернет үйлчилгээ үзүүлэгч ямар нэг шалтгаанаар танд үйлчилгээ үзүүлэхээ больвол яах вэ?
  • Бусад үйлчилгээ үзүүлэгчид танд хангалттай зурвасын өргөнтэй байх уу?
  • Холболт хэр сайн хэвээр байх вэ?
  • Танай интернет үйлчилгээ үзүүлэгчид хэр бие даасан вэ, тэдгээрийн аль нэг нь ноцтой тасалдвал бусадтай холбоотой асуудал гарах уу?
  • Таны дата төвд хэдэн оптик оролт байгаа вэ?
  • Орцуудын аль нэг нь бүрэн устгагдвал юу болох вэ?

Оролтын тухайд гэвэл, миний практикт хоёр өөр компани, хоёр өөр мэдээллийн төвд экскаватор худаг устгасан бөгөөд зөвхөн гайхамшгаар бидний оптик нөлөөлсөнгүй. Энэ нь тийм ч ховор тохиолдол биш юм.

Мэдээжийн хэрэг, та эдгээр асуултуудыг асуухаас гадна удирдлагын дэмжлэгтэйгээр ямар ч нөхцөлд хүлээн зөвшөөрөгдөх шийдлийг өгөх хэрэгтэй.

Нөөц

Дараагийн тэргүүлэх чиглэл нь тоног төхөөрөмжийн тохиргооны нөөцлөлт байж болно. Ямар ч тохиолдолд энэ нь маш чухал цэг юм. Тохиргоогоо алдаж болох тохиолдлуудыг би жагсаахгүй, тогтмол нөөцлөлт хийж, энэ талаар бодохгүй байх нь дээр. Үүнээс гадна байнгын нөөцлөлт нь өөрчлөлтийг хянахад маш их тустай байж болно.

Чухал! Өдөр бүр нөөцлөлт хийх. Энэ нь үүнийг хэмнэх тийм их хэмжээний өгөгдөл биш юм. Өглөө нь жижүүрийн инженер (эсвэл та) системээс нөөц хуулбар амжилттай болсон эсэхийг тодорхой харуулсан тайланг хүлээн авах ёстой бөгөөд хэрэв нөөцлөлт амжилтгүй болвол асуудлыг шийдвэрлэх эсвэл тасалбар үүсгэх шаардлагатай ( сүлжээний хэлтсийн үйл явцыг үзнэ үү).

Програм хангамжийн хувилбарууд

Тоног төхөөрөмжийн программ хангамжийг шинэчлэх нь зүйтэй эсэх нь тийм ч тодорхой биш юм. Нэг талаас, хуучин хувилбарууд нь мэдэгдэж байгаа алдаанууд болон сул талууд байдаг, гэхдээ нөгөө талаас, шинэ програм хангамж нь нэгдүгээрт, үргэлж өвдөлтгүй шинэчлэх процедур биш, хоёрдугаарт, шинэ алдаа, эмзэг байдал юм.

Энд та хамгийн сайн сонголтыг олох хэрэгтэй. Хэд хэдэн тодорхой зөвлөмжүүд

  • зөвхөн тогтвортой хувилбаруудыг суулгана
  • Гэсэн хэдий ч та програм хангамжийн маш хуучин хувилбар дээр амьдрах ёсгүй
  • зарим программ хангамж хаана байрладаг тухай мэдээлэл бүхий тэмдэг тавих
  • Програм хангамжийн хувилбаруудын эмзэг байдал, алдааны талаархи тайланг үе үе уншиж, ноцтой асуудал гарсан тохиолдолд шинэчлэх талаар бодох хэрэгтэй.

Энэ үе шатанд консолоор тоног төхөөрөмж, дэмжлэгийн талаархи мэдээлэл, шинэчлэлтийн журмын тайлбартай бол та зарчмын хувьд энэ алхамд бэлэн байна. Хамгийн тохиромжтой сонголт бол процедурыг бүхэлд нь шалгах боломжтой лабораторийн тоног төхөөрөмжтэй байх явдал юм, гэхдээ харамсалтай нь энэ нь тийм ч их тохиолддоггүй.

Тоног төхөөрөмж чухал тохиолдолд та үйлдвэрлэгчийн дэмжлэгтэй холбогдож шинэчлэлт хийхэд туслах хүсэлт гаргаж болно.

Тасалбарын систем

Одоо та эргэн тойрноо харж болно. Та бусад хэлтэс болон хэлтэс доторх харилцан үйлчлэлийн процессыг бий болгох хэрэгтэй.

Энэ нь шаардлагагүй байж магадгүй (жишээлбэл, танай компани жижиг бол), гэхдээ би бүх гадаад болон дотоод ажлуудыг тасалбарын системээр дамжуулж байхаар ажлыг зохион байгуулахыг зөвлөж байна.

Тасалбарын систем нь үндсэндээ таны дотоод болон гадаад харилцааны интерфейс бөгөөд та энэ интерфейсийг хангалттай нарийвчлан тайлбарлах хэрэгтэй.

Хандалтыг нээх чухал бөгөөд нийтлэг ажлын жишээг авч үзье. Би аль нэгэн компанид төгс ажиллаж байсан алгоритмыг тайлбарлах болно.

Жишээ нь:

Ихэнхдээ хандалт хийдэг үйлчлүүлэгчид өөрсдийн хүслээ сүлжээний инженерүүдэд ойлгомжгүй хэлээр, тухайлбал, програмын хэлээр, жишээлбэл, "надад 1С-д хандах боломжийг олго" гэдгээс эхэлье.

Тиймээс бид хэзээ ч ийм хэрэглэгчдийн хүсэлтийг шууд хүлээж аваагүй.
Тэгээд энэ бол хамгийн эхний шаардлага байсан

  • хандах хүсэлтийг техникийн хэлтсээс ирүүлэх ёстой (бидний тохиолдолд эдгээр нь unix, windows, helpdesk инженерүүд байсан)

Хоёрдахь шаардлага бол тэр

  • Энэ хандалтыг бүртгэсэн байх ёстой (бидний хүсэлтийг хүлээн авсан техникийн хэлтэс) ​​бөгөөд хүсэлтийн дагуу бид энэ нэвтэрсэн хандалтын холбоосыг хүлээн авдаг.

Энэ хүсэлтийн хэлбэр нь бидэнд ойлгомжтой байх ёстой, i.e.

  • Хүсэлт нь аль дэд сүлжээ, аль дэд сүлжээнд хандалт нээлттэй байх ёстой тухай мэдээлэл, түүнчлэн протокол болон (tcp/udp тохиолдолд) портуудыг агуулсан байх ёстой.

Үүнийг мөн тэнд зааж өгөх ёстой

  • яагаад энэ хандалтыг нээсэн тухай тайлбар
  • түр зуурын эсвэл байнгын (түр зуурынх бол хэдэн өдөр хүртэл)

Мөн маш чухал зүйл бол зөвшөөрөл юм

  • хандалтыг эхлүүлсэн хэлтсийн даргаас (жишээлбэл, нягтлан бодох бүртгэл)
  • техникийн хэлтсийн даргаас, энэ хүсэлт сүлжээний хэлтэст ирсэн газраас (жишээлбэл, тусламжийн газар)

Энэ тохиолдолд энэ хандалтын "эзэмшигч" нь хандалтыг эхлүүлсэн хэлтсийн дарга гэж тооцогддог (манай жишээн дээр нягтлан бодох бүртгэл) бөгөөд тэрээр энэ хэлтэст нэвтэрсэн хандалттай хуудсыг шинэчлэгдсэн хэвээр байлгах үүрэгтэй. .

Мод бэлтгэх

Энэ бол таны живж болох зүйл юм. Гэхдээ хэрэв та идэвхтэй хандлагыг хэрэгжүүлэхийг хүсч байвал энэ өгөгдлийн үертэй хэрхэн харьцаж сурах хэрэгтэй.

Энд зарим практик зөвлөмжүүд байна:

  • Та өдөр бүр бүртгэлийг хянаж байх хэрэгтэй
  • Төлөвлөсөн шалгалтын хувьд (ямар нэгэн онцгой нөхцөл байдал биш) та 0, 1, 2-р зэрэглэлээр өөрийгөө хязгаарлаж, шаардлагатай гэж үзвэл бусад түвшний сонгосон хэв маягийг нэмж болно.
  • логуудыг задлан шинжилж, үл тоомсорлох жагсаалтад оруулсан загваруудыг үл тоомсорлодог скрипт бичнэ үү

Энэ арга нь цаг хугацаа өнгөрөхөд танд сонирхолгүй бүртгэлүүдийн жагсаалтыг гаргаж, зөвхөн чухал гэж үзсэн бүртгэлээ үлдээх боломжийг олгоно.
Энэ нь бидний хувьд маш сайн ажилласан.

Хяналт шинжилгээ

Компанийн хувьд хяналтын систем байхгүй байх нь ердийн зүйл биш юм. Жишээлбэл, та лог дээр найдаж болно, гэхдээ төхөөрөмж юу ч хэлэхгүй бол зүгээр л "үхэх" эсвэл udp syslog протоколын пакет алдагдаж, ирэхгүй байж болно. Ер нь мэдээж идэвхтэй хяналт тавих нь чухал бөгөөд зайлшгүй шаардлагатай.

Миний практикт хамгийн алдартай хоёр жишээ:

  • холбооны суваг, чухал холбоосуудын ачааллыг хянах (жишээлбэл, үйлчилгээ үзүүлэгчтэй холбогдох). Эдгээр нь замын хөдөлгөөний алдагдлаас болж үйлчилгээний доройтолд хүргэж болзошгүй асуудлыг идэвхтэй харж, үүнээс зайлсхийх боломжийг танд олгоно.
  • NetFlow дээр суурилсан графикууд. Эдгээр нь замын хөдөлгөөний хэвийн бус байдлыг олоход хялбар болгодог бөгөөд зарим энгийн боловч чухал төрлийн хакерын халдлагыг илрүүлэхэд маш их хэрэгтэй байдаг.

Чухал! Хамгийн чухал үйл явдлын SMS мэдэгдлийг тохируулна уу. Энэ нь хяналт, бүртгэлд хоёуланд нь хамаарна. Хэрэв танд жижүүрийн ээлж байхгүй бол ажлын бус цагаар ч гэсэн SMS ирэх ёстой.

Бүх инженерүүдийг сэрээхгүй байхаар үйл явцыг бодоорой. Энэ талаар манайд жижүүрийн инженер ажиллаж байсан.

Хяналтыг өөрчлөх

Миний бодлоор бүх өөрчлөлтийг хянах шаардлагагүй. Гэхдээ ямар ч тохиолдолд та шаардлагатай бол сүлжээнд хэн, яагаад тодорхой өөрчлөлт хийснийг хялбархан олох боломжтой байх ёстой.

Хэдэн зөвлөгөө:

  • Тасалбарын системийг ашиглан тухайн тасалбар дээр юу хийснийг дэлгэрэнгүй тайлбарлах, жишээлбэл хэрэглэсэн тохиргоог тасалбар руу хуулах гэх мэт
  • сүлжээний төхөөрөмж дээр тайлбар хийх чадварыг ашиглах (жишээ нь, Juniper дээр тайлбар хийх). Та тасалбарын дугаарыг бичиж болно
  • Өөрийнхөө тохиргооны нөөцлөлтийг ашиглана уу

Та үүнийг үйл явц болгон хэрэгжүүлж, бүх тасалбарын өөрчлөлтийг өдөр бүр шалгаж болно.

Үйл явц

Та өөрийн баг дахь үйл явцыг албан ёсны болгож, тайлбарлах ёстой. Хэрэв та энэ цэгт хүрсэн бол танай баг дор хаяж дараах процессуудыг ажиллуулсан байх ёстой.

Өдөр тутмын үйл явц:

  • тасалбартай ажиллах
  • логуудтай ажиллах
  • хяналтыг өөрчлөх
  • өдөр тутмын шалгах хуудас

Жилийн үйл явц:

  • баталгааны хугацааг сунгах, лиценз

Асинхрон процессууд:

  • янз бүрийн онцгой байдлын үед хариу арга хэмжээ авах

Эхний хэсгийн дүгнэлт

Энэ бүхэн нь сүлжээний тохиргоо, дизайн, сүлжээний протокол, чиглүүлэлтийн тухай, аюулгүй байдлын талаар хараахан болоогүй байгааг та анзаарсан уу ... Энэ бол эргэн тойронд байгаа зүйл юм. Гэхдээ эдгээр нь хэдийгээр уйтгартай ч, мэдээжийн хэрэг сүлжээний хэлтсийн ажлын маш чухал элементүүд юм.

Таны харж байгаагаар та сүлжээндээ юу ч сайжруулаагүй байна. Хэрэв аюулгүй байдлын сул тал байсан бол тэдгээр нь хэвээр үлдэнэ, хэрэв муу дизайн байсан бол энэ нь хэвээр үлдэнэ. Та сүлжээний инженерийн хувьд өөрийн ур чадвар, мэдлэгээ ашиглах хүртэл, үүнд та маш их цаг хугацаа, хүчин чармайлт, заримдаа мөнгө зарцуулсан байх магадлалтай. Гэхдээ эхлээд та суурийг бий болгох (эсвэл бэхжүүлэх), дараа нь барилгын ажлыг эхлүүлэх хэрэгтэй.

Дараах хэсгүүд нь алдааг хэрхэн олж, арилгах, дараа нь дэд бүтцээ сайжруулах талаар танд хэлэх болно.

Мэдээжийн хэрэг та бүх зүйлийг дэс дарааллаар хийх шаардлагагүй. Цаг хугацаа эгзэгтэй байж болно. Хэрэв нөөц боломж байвал үүнийг зэрэгцүүлэн хий.

Мөн чухал нэмэлт. Хамт олонтойгоо харилц, асуу, зөвлөлд. Эцсийн дүндээ тэд л энэ бүхнийг дэмжиж, хийж байгаа хүмүүс.

Эх сурвалж: www.habr.com

сэтгэгдэл нэмэх