"اميد هڪ خراب حڪمت عملي آهي." ماسڪو ۾ SRE شدت، فيبروري 3-5

اسان روس ۾ SRE تي پهرين عملي ڪورس جو اعلان ڪري رهيا آهيون: Slurm SRE.

سختي جي دوران اسين فلمن جي ٽڪيٽن جي وڪرو لاءِ مجموعي ويب سائيٽ ٺاهڻ، ٽوڙڻ، مرمت ڪرڻ ۽ بهتر ڪرڻ ۾ ٽي ڏينهن گذارينداسين.

"اميد هڪ خراب حڪمت عملي آهي." ماسڪو ۾ SRE شدت، فيبروري 3-5

اسان هڪ ٽڪيٽ ايگريگيٽر چونڊيو آهي ڇاڪاڻ ته ان ۾ ڪيترائي ناڪامي جا منظر آهن: سياحن جي آمد ۽ DDoS حملن، ڪيترن ئي نازڪ مائڪرو سروسز مان هڪ جي ناڪامي (اختيار، تحفظات، ادائيگي جي پروسيسنگ)، ڪيترن ئي سئنيما مان هڪ جي دستيابي (ڊيٽا جي تبادلي بابت. دستياب سيٽون ۽ رزرويشنز)، ۽ وڌيڪ فهرست هيٺ.

اسان پنهنجي مجموعي سائيٽ لاءِ اعتماد جي تصور کي ترتيب ڏينداسين، جنهن کي اسين انجنيئرنگ ۾ اڳتي وڌائينداسين، ڊزائن جو تجزيو SRE جي نقطي نظر کان ڪنداسين، ميٽرڪ چونڊيو، انهن جي نگراني قائم ڪنداسين، اڀرندڙ واقعن کي ختم ڪري، واقعن سان ٽيم جي ڪم لاءِ ٽريننگ منعقد ڪنداسين. جنگ جي ويجهو حالتن ۾، هڪ بحث منظم ڪريو.

پروگرام Booking.com ۽ گوگل جي ملازمن طرفان هلائي ٿو.
هن ڀيري ڪو به دور دراز شرڪت نه هوندي: ڪورس ذاتي رابطي ۽ ٽيم ورڪ تي ٺهيل آهي.

ڪٽ جي هيٺان تفصيل

ڳالهائيندڙ

ايوان ڪرگلوف
Booking.com تي پرنسپل ڊولپر (هالينڊ)
2013 ۾ Booking.com ۾ شامل ٿيڻ کان وٺي، هن بنيادي ڍانچي جي منصوبن تي ڪم ڪيو آهي جهڙوڪ ورهايل پيغام پهچائڻ ۽ پروسيسنگ، بگ ڊيٽا ۽ ويب اسٽيڪ، ڳولا.
في الحال اندروني ڪلائوڊ ۽ سروس ميش جي تعمير جي مسئلن تي ڪم ڪري رهيو آهي.

بين ٽيلر
Booking.com (USA) تي پرنسپل ڊولپر
Booking.com پليٽ فارم جي اندروني ترقي ۾ مصروف.
سروس ميش / سروس دريافت، بيچ نوڪري جي شيڊول، واقعن جي جواب ۽ پوسٽ مارٽم جي عمل ۾ ماهر.
روسي ۾ ڳالهائيندو ۽ سيکاريندو.

Evgeniy Varavva
گوگل تي جنرل ڊولپر (سان فرانسسڪو).
ڪمپيوٽر وژن ۽ روبوٽڪس ۾ تحقيق ڪرڻ لاءِ اعليٰ لوڊ ويب منصوبن کان تجربو.
2011 کان وٺي، هو گوگل تي ورهايل سسٽم جي تخليق ۽ آپريشن ۾ ملوث آهي، منصوبي جي مڪمل زندگي جي چڪر ۾ حصو وٺي رهيو آهي: تصور، ڊيزائن ۽ آرڪيٽيڪچر، لانچ، فولڊنگ ۽ سڀني وچولي مرحلن.

Eduard Medvedev
ٽنگسٽن ليبز ۾ CTO (جرمني)
StackStorm تي انجنيئر طور ڪم ڪيو، پليٽ فارم جي ChatOps ڪارڪردگي لاء ذميوار. ڊيٽا سينٽر آٽوميشن لاءِ ChatOps ٺاهيا ۽ لاڳو ڪيا ويا. روسي ۽ بين الاقوامي ڪانفرنس ۾ اسپيڪر.

پروگرام

پروگرام فعال طور تي ترقي ڪئي پئي وڃي. هاڻي اهو ڏسڻ ۾ اچي ٿو، فيبروري تائين اهو بهتر ۽ وڌايو ويندو.

موضوع #1: SRE جا بنيادي اصول ۽ طريقا

  • SRE ٿيڻ لاءِ ڇا وٺندو؟
  • DevOps بمقابلہ SRE
  • ڇو ڊولپرز SRE جو قدر ڪن ٿا ۽ ڏاڍا اداس آهن جڏهن اهي پروجيڪٽ ۾ نه آهن
  • SLI، SLO ۽ SLA
  • نقص بجيٽ ۽ SRE ۾ ان جو ڪردار

موضوع #2: ورهايل سسٽم جي ڊيزائن

  • ايپليڪيشن فن تعمير ۽ ڪارڪردگي
  • غير خلاصي وڏي سسٽم ڊيزائن
  • ڪارڪردگي / ناڪامي لاء ڊزائين
  • gRPC يا REST
  • ورجننگ ۽ پسمانده مطابقت

موضوع #3: ڪيئن هڪ SRE پروجيڪٽ قبول ڪيو ويو آهي

  • SRE کان بهترين طريقا
  • پروجيڪٽ جي قبوليت جي فهرست
  • لاگنگ، ماپ، نشان لڳائڻ
  • اسان جي پنهنجي هٿن ۾ CI/CD کڻڻ

موضوع نمبر 4: ورهايل نظام جو ڊزائين ۽ لانچ

  • ريورس انجنيئرنگ - سسٽم ڪيئن ڪم ڪندو آهي؟
  • اسان SLI ۽ SLO تي متفق آهيون
  • عملي صلاحيت جي منصوبه بندي
  • ايپليڪيشن ڏانهن ٽرئفڪ کي شروع ڪرڻ، اسان جا صارف ان کي "استعمال" ڪرڻ شروع ڪن ٿا
  • لانچ ڪرڻ Prometheus ، گرافانا ، لچڪدار

موضوع #5: نگراني، مشاهدو ۽ خبردار ڪرڻ

  • نگراني بمقابلہ مشاهدو
  • Prometheus سان نگراني ۽ خبرداري قائم ڪرڻ
  • SLI ۽ SLO جي عملي نگراني
  • علامات بمقابلہ. سبب
  • بليڪ باڪس بمقابلہ وائٹ باڪس مانيٽرنگ
  • ايپليڪيشن ۽ سرور جي دستيابي جي ورهايل نگراني
  • 4 گولڊن سگنلز (بيضابطي جو پتو لڳائڻ)

موضوع نمبر 6: ٽيسٽنگ سسٽم جي اعتبار جو عمل

  • دٻاءُ هيٺ ڪم ڪرڻ
  • ناڪامي- انجڻ
  • افراتفري بندر

موضوع #7: واقعا جوابي مشق

  • دٻاء جو انتظام الگورتھم
  • واقعي جي شرڪت ڪندڙن جي وچ ۾ رابطي
  • پوسٽ مارٽم
  • علم ورهائڻ
  • ثقافت کي ترتيب ڏيڻ
  • غلطي جي نگراني
  • بي عيب بيان بازي ڪرڻ

موضوع #8: لوڊ مينيجمينٽ جا طريقا

  • لوڊ توازن
  • ايپليڪيشن غلطي رواداري: ٻيهر ڪوشش ڪريو، ٽائيم ختم، ناڪامي انجڻ، سرڪٽ برڪر
  • DDoS (لوڊ ٺاهڻ) + ڪاسڪيڊنگ ناڪاميون

موضوع #9: واقعن جو جواب

  • بحث مباحثو ڪرڻ
  • آن-ڪال مشق
  • مختلف قسم جا حادثا (جانچ، ترتيب جي تبديلي، هارڊويئر ناڪامي)
  • حادثا انتظام پروٽوڪول

موضوع #10: تشخيص ۽ مسئلو حل ڪرڻ

  • لاگنگ
  • ڊيبگنگ
  • اسان جي ايپليڪيشن تي تجزيي ۽ ڊيبگنگ جي مشق ڪريو

موضوع #11: سسٽم جي اعتبار جي جاچ

  • دٻاء جي جاچ
  • ترتيب جي جاچ
  • ڪارڪردگي جاچ
  • ڪينري releaseڏڻ

موضوع نمبر 12: آزاد ڪم ۽ جائزو

شرڪت ڪندڙن لاء سفارشون ۽ گهرجون

SRE هڪ ٽيم ڪوشش آهي. اسان هڪ ٽيم جي طور تي ڪورس وٺڻ جي صلاح ڏين ٿا. ان ڪري اسان پيش ڪريون ٿا وڏيون رعايتون تيار ڪيل ٽيمن لاءِ.

ڪورس جي قيمت 60 ₽ في شخص آهي.
جيڪڏهن ڪو ڪمپني 5+ ماڻهن جو هڪ گروپ موڪلي ٿو - 40 ₽.

ڪورس Kubernetes تي ٺهيل آهي. پاس ڪرڻ لاء، توهان کي ڄاڻڻ جي ضرورت آهي Kubernetes بنيادي سطح تي. جيڪڏهن توهان هن سان ڪم نه ڪيو، ته توهان Slurm Basic ذريعي وڃو (онлайн يا سخت نومبر 18-20).
اضافي طور تي، توهان کي لينڪس ۾ مهارت حاصل ڪرڻ جي ضرورت آهي ۽ ڄاڻو Gitlab ۽ Prometheus.

رجسٽريشن

جيڪڏهن توهان وٽ حصو وٺڻ لاءِ هڪ پيچيده خيال آهي، مثال طور، سي اي او، سي ٽي او ۽ ڊولپرز جي هڪ ٽيم لاءِ ڪورس ۾ اچڻ لاءِ، ۽ انهن لاءِ انٽرنشپ ڪرڻ لاءِ انتظام عمودي کي مدنظر رکندي، مون کي ذاتي پيغام ۾ لکو.

جو ذريعو: www.habr.com

تبصرو شامل ڪريو