Үйлдвэрлэлийн бэлэн байдлын хяналтын хуудас

Өгүүллийн орчуулгыг тус курсын оюутнуудад зориулж тусгайлан бэлтгэсэн "DevOps практик ба хэрэгслүүд", өнөөдөр эхэлнэ!

Үйлдвэрлэлийн бэлэн байдлын хяналтын хуудас

Та хэзээ нэгэн цагт шинэ үйлчилгээг үйлдвэрлэлд нэвтрүүлж байсан уу? Эсвэл та ийм үйлчилгээг дэмжихэд оролцож байсан болов уу? Хэрэв тийм бол юу таныг өдөөсөн бэ? Үйлдвэрлэлд юу сайн, юу нь муу вэ? Та шинэ багийн гишүүдийг одоо байгаа үйлчилгээнүүдийг гаргах эсвэл засвар үйлчилгээ хийх талаар хэрхэн сургах вэ?

Ихэнх компаниуд үйлдвэрлэлийн үйл ажиллагааны практикт "Зэрлэг Баруун" хандлагыг хэрэгжүүлдэг. Баг бүр өөрийн хэрэгсэл, шилдэг туршлагыг туршилт, алдаагаар шийддэг. Гэхдээ энэ нь ихэвчлэн төслийн амжилтанд төдийгүй инженерүүдэд нөлөөлдөг.

Туршилт, алдаа нь хуруугаараа хуруугаараа зааж, буруутгах нь түгээмэл байдаг орчинг бүрдүүлдэг. Энэ зан үйлийн ачаар алдаанаасаа суралцаж, дахин давтахгүй байх нь улам бүр хэцүү болдог.

Амжилттай байгууллагууд:

  • үйлдвэрлэлийн удирдамжийн хэрэгцээг ухамсарлах,
  • шилдэг туршлагыг судлах,
  • шинэ систем эсвэл бүрэлдэхүүн хэсгүүдийг боловсруулахдаа үйлдвэрлэлийн бэлэн байдлын асуудлаар ярилцаж эхлэх,
  • үйлдвэрлэлд бэлтгэх дүрмийг дагаж мөрдөхийг баталгаажуулах.

Үйлдвэрлэлд бэлтгэх нь "хянах" үйл явцыг агуулдаг. Хяналт нь хяналтын хуудас эсвэл асуултын багц хэлбэрээр байж болно. Шүүмжийг гараар, автоматаар эсвэл хоёуланг нь хийж болно. Шаардлагуудын статик жагсаалтын оронд та тодорхой хэрэгцээнд тохируулж болох хяналтын хуудасны загваруудыг хийж болно. Ингэснээр инженерүүд шаардлагатай үед мэдлэг, хангалттай уян хатан байдлыг өвлөн авах арга замыг өгч чадна.

Үйлчилгээг үйлдвэрлэхэд бэлэн эсэхийг хэзээ шалгах вэ?

Үйлдвэрлэлийн бэлэн байдлын шалгалтыг зөвхөн суллахаас өмнө төдийгүй өөр үйл ажиллагааны баг эсвэл шинэ ажилтан руу шилжүүлэх үед хийх нь ашигтай байдаг.

Хэзээ шалгах:

  • Та шинэ үйлчилгээг үйлдвэрлэлд нэвтрүүлж байна.
  • Та үйлдвэрлэлийн үйлчилгээний үйл ажиллагааг SRE гэх мэт өөр багт шилжүүлнэ.
  • Та үйлдвэрлэлийн үйлчилгээний үйл ажиллагааг шинэ ажилчдад шилжүүлнэ.
  • Техникийн дэмжлэгийг зохион байгуулах.

Үйлдвэрлэлийн бэлэн байдлын хяналтын хуудас

Хэсэг хугацааны өмнө жишээ болгон би Нийтлэгдсэн үйлдвэрлэлд бэлэн эсэхийг шалгах хяналтын хуудас. Хэдийгээр энэ жагсаалт нь Google Cloud-н хэрэглэгчдээс гаралтай боловч Google Cloud-аас гадуур хэрэг болох бөгөөд хэрэгжих боломжтой.

Дизайн ба хөгжүүлэлт

  • Гадны үйлчилгээнд хандах шаардлагагүй, гадны системийн эвдрэлээс хамааралгүй давтагдах боломжтой бүтээх процессыг хөгжүүлэх.
  • Дизайн болон хөгжүүлэлтийн хугацаанд үйлчилгээнийхээ SLO-г тодорхойлж, тохируулаарай.
  • Таны хамааралтай гадны үйлчилгээ байгаа эсэх талаар хүлээлтийг баримтжуулах.
  • Нэг дэлхийн нөөцөөс хамаарлыг арилгах замаар нэг цэгийн бүтэлгүйтлээс зайлсхий. Нөөц боломжгүй үед нөөцийг хуулбарлах эсвэл нөөцийг ашиглах (жишээлбэл, хатуу кодлогдсон утга).

Тохиргооны удирдлага

  • Статик, жижиг, нууц бус тохиргоог тушаалын мөрийн параметрүүдээр дамжуулж болно. Бусад бүх зүйлийн хувьд тохиргооны хадгалах үйлчилгээг ашиглана уу.
  • Динамик тохиргоо нь тохиргооны үйлчилгээг ашиглах боломжгүй тохиолдолд нөөц тохиргоотой байх ёстой.
  • Хөгжлийн орчны тохиргоо нь үйлдвэрлэлийн тохиргоотой холбоотой байх ёсгүй. Үгүй бол энэ нь хөгжүүлэлтийн орчноос үйлдвэрлэлийн үйлчилгээ рүү нэвтрэхэд хүргэж болзошгүй бөгөөд энэ нь нууцлалын асуудал болон өгөгдөл алдагдахад хүргэж болзошгүй юм.
  • Динамикаар тохируулж болох зүйлийг баримтжуулж, тохиргоог хүргэх систем боломжгүй тохиолдолд буцаах үйлдлийг тайлбарлана уу.

Хувилбарын удирдлага

  • Гаргах үйл явцыг нарийвчлан баримтжуулна уу. Хувилбарууд SLO-д хэрхэн нөлөөлж байгааг тайлбарлана уу (жишээ нь, кэш алдагдсанаас хоцролт түр зуур нэмэгдэх).
  • Баримт бичгийн канарын хувилбарууд.
  • Канарын хувилбарыг хянах төлөвлөгөө боловсруулж, боломжтой бол автомат буцаах механизмыг боловсруул.
  • Буцах үйлдлүүд нь байршуулалттай ижил процессуудыг ашиглах боломжтой эсэхийг шалгаарай.

Ажиглах чадвар

  • SLO-д шаардлагатай хэмжүүрүүдийг цуглуулсан эсэхийг шалгаарай.
  • Үйлчлүүлэгч болон серверийн өгөгдлийг ялгаж чаддаг эсэхээ шалгаарай. Энэ нь эвдрэлийн шалтгааныг олоход чухал юм.
  • Хөдөлмөрийн зардлыг бууруулахын тулд сэрэмжлүүлэг тохируулах. Жишээлбэл, ердийн үйлдлээс үүдэлтэй сэрэмжлүүлгийг арилгах.
  • Хэрэв та Stackdriver ашигладаг бол GCP платформын хэмжүүрүүдийг хяналтын самбартаа оруулна уу. GCP хамаарлын талаар сэрэмжлүүлэг тохируулна уу.
  • Ирж буй ул мөрийг үргэлж үржүүл. Хэдийгээр та мөшгих ажилд оролцдоггүй байсан ч энэ нь доод түвшний үйлчилгээнд үйлдвэрлэлийн асуудлыг дибаг хийх боломжийг олгоно.

Хамгаалалт ба аюулгүй байдал

  • Бүх гадаад холболтууд шифрлэгдсэн эсэхийг шалгаарай.
  • Таны үйлдвэрлэлийн төслүүд зөв IAM тохиргоотой эсэхийг шалгаарай.
  • Виртуал машины жишээнүүдийн бүлгийг тусгаарлахын тулд сүлжээг ашиглана уу.
  • Алсын сүлжээнд найдвартай холбогдохын тулд VPN ашиглана уу.
  • Хэрэглэгчийн өгөгдөлд хандах хандалтыг баримтжуулж, хянах. Хэрэглэгчийн өгөгдөлд хандах бүх хандалтыг шалгаж, бүртгэсэн эсэхийг шалгаарай.
  • Дибаг хийх эцсийн цэгүүдийг ACL-ээр хязгаарласан эсэхийг шалгаарай.
  • Хэрэглэгчийн оруулгыг ариутгах. Хэрэглэгчийн оруулах ачааллын хэмжээг тохируулах.
  • Таны үйлчилгээ хувь хүний ​​​​хэрэглэгчийн ирж буй урсгалыг хааж чадах эсэхийг шалгаарай. Энэ нь бусад хэрэглэгчдэд нөлөөлөхгүйгээр зөрчлийг хаах болно.
  • Олон тооны дотоод үйл ажиллагааг эхлүүлдэг гадаад төгсгөлийн цэгүүдээс зайлсхий.

Хүчин чадлын төлөвлөлт

  • Таны үйлчилгээний цар хүрээг баримтжуул. Жишээ нь: хэрэглэгчдийн тоо, ирж буй ачааны хэмжээ, ирж буй мессежийн тоо.
  • Үйлчилгээнийхээ нөөцийн шаардлагыг баримтжуулна уу. Жишээ нь: тусгай зориулалтын виртуал машины жишээний тоо, Spanner instance-ийн тоо, GPU эсвэл TPU зэрэг тусгай техник хангамж.
  • Баримт бичгийн нөөцийн хязгаарлалт: нөөцийн төрөл, бүс нутаг гэх мэт.
  • Шинэ нөөц бий болгох квотын хязгаарлалтыг баримтжуулах. Жишээлбэл, хэрэв та API-г шинэ жишээ үүсгэхдээ ашигладаг бол GCE API хүсэлтийн тоог хязгаарлах.
  • Гүйцэтгэлийн доройтлыг шинжлэхийн тулд ачааллын туршилтыг авч үзье.

Тэгээд л болоо. Хичээл дээр уулзацгаая!

Эх сурвалж: www.habr.com

сэтгэгдэл нэмэх