پیداوار کی تیاری کی فہرست

مضمون کا ترجمہ خاص طور پر کورس کے طلباء کے لیے تیار کیا گیا تھا۔ "DevOps طریقوں اور اوزار"، جو آج سے شروع ہو رہا ہے!

پیداوار کی تیاری کی فہرست

کیا آپ نے کبھی پروڈکشن میں کوئی نئی سروس جاری کی ہے؟ یا شاید آپ اس طرح کی خدمات کی حمایت میں ملوث تھے؟ اگر ہاں، تو آپ کو کس چیز نے حوصلہ دیا؟ پیداوار کے لیے کیا اچھا ہے اور کیا برا؟ آپ ٹیم کے نئے اراکین کو موجودہ خدمات کے اجراء یا دیکھ بھال کے بارے میں کس طرح تربیت دیتے ہیں۔

جب صنعتی آپریشن کے طریقوں کی بات آتی ہے تو زیادہ تر کمپنیاں "وائلڈ ویسٹ" کے طریقوں کو اپناتی ہیں۔ ہر ٹیم آزمائش اور غلطی کے ذریعے اپنے ٹولز اور بہترین طریقوں پر فیصلہ کرتی ہے۔ لیکن یہ اکثر نہ صرف منصوبوں کی کامیابی کو متاثر کرتا ہے بلکہ انجینئرز کو بھی متاثر کرتا ہے۔

آزمائش اور غلطی ایک ایسا ماحول پیدا کرتی ہے جہاں انگلی اٹھانا اور الزام تراشی عام ہے۔ اس رویے کے ساتھ، غلطیوں سے سیکھنا اور انہیں دوبارہ نہ دہرانا مشکل ہو جاتا ہے۔

کامیاب تنظیمیں:

  • پیداوار کے لیے رہنما اصولوں کی ضرورت کا احساس،
  • بہترین طریقوں کا مطالعہ کریں،
  • نئے نظام یا اجزاء کو تیار کرتے وقت پیداوار کی تیاری کے مسائل پر بات چیت شروع کریں،
  • پیداوار کے لیے تیاری کے قوانین کی تعمیل کو یقینی بنائیں۔

پیداوار کی تیاری میں "جائزہ" کا عمل شامل ہے۔ جائزہ چیک لسٹ یا سوالات کے سیٹ کی شکل میں ہو سکتا ہے۔ جائزے دستی طور پر، خودکار طور پر، یا دونوں کیے جا سکتے ہیں۔ ضروریات کی جامد فہرستوں کے بجائے، آپ چیک لسٹ ٹیمپلیٹس بنا سکتے ہیں جنہیں مخصوص ضروریات کے مطابق ڈھالا جا سکتا ہے۔ اس طرح، انجینئرز کو وراثت میں علم حاصل کرنے اور ضرورت پڑنے پر کافی لچک دی جا سکتی ہے۔

پیداوار کے لیے تیاری کے لیے سروس کو کب چیک کیا جائے؟

پروڈکشن ریڈی نیس چیک کرنا نہ صرف ریلیز سے پہلے بلکہ کسی اور آپریشن ٹیم یا کسی نئے ملازم کو منتقل کرتے وقت بھی مفید ہے۔

چیک کریں جب:

  • آپ پروڈکشن میں ایک نئی سروس جاری کر رہے ہیں۔
  • آپ پروڈکشن سروس کے آپریشن کو دوسری ٹیم، جیسے کہ SRE کو منتقل کرتے ہیں۔
  • آپ پروڈکشن سروس کا آپریشن نئے ملازمین کو منتقل کرتے ہیں۔
  • تکنیکی مدد کو منظم کریں۔

پیداوار کی تیاری کی فہرست

کچھ عرصہ پہلے، مثال کے طور پر، I опубликовала پیداوار کے لیے تیاری کی جانچ کے لیے چیک لسٹ۔ اگرچہ اس فہرست کی ابتدا گوگل کلاؤڈ کے صارفین سے ہوئی ہے، لیکن یہ گوگل کلاؤڈ سے باہر مفید اور قابل اطلاق ہوگی۔

ڈیزائن اور ترقی

  • ایک دوبارہ قابل تعمیر عمل تیار کریں جس کے لیے بیرونی خدمات تک رسائی کی ضرورت نہ ہو اور یہ بیرونی نظام کی ناکامی پر منحصر نہ ہو۔
  • ڈیزائن اور ترقی کی مدت کے دوران، اپنی خدمات کے لیے SLOs کی وضاحت اور سیٹ کریں۔
  • بیرونی خدمات کی دستیابی سے متعلق توقعات کو دستاویز کریں جن پر آپ انحصار کرتے ہیں۔
  • کسی ایک عالمی وسائل پر انحصار کو ہٹا کر ناکامی کے ایک نقطہ سے بچیں۔ وسائل کی نقل تیار کریں یا جب وسیلہ دستیاب نہ ہو تو فال بیک استعمال کریں (مثال کے طور پر، ہارڈ کوڈڈ ویلیو)۔

کنفیگریشن مینجمنٹ

  • جامد، چھوٹی اور غیر خفیہ ترتیب کو کمانڈ لائن پیرامیٹرز کے ذریعے منتقل کیا جا سکتا ہے۔ باقی ہر چیز کے لیے، کنفیگریشن اسٹوریج سروسز استعمال کریں۔
  • کنفیگریشن سروس دستیاب نہ ہونے کی صورت میں ڈائنامک کنفیگریشن میں فال بیک سیٹنگز ہونی چاہئیں۔
  • ترقیاتی ماحول کی ترتیب کا تعلق پیداوار کی ترتیب سے نہیں ہونا چاہیے۔ بصورت دیگر، یہ ترقیاتی ماحول سے پیداواری خدمات تک رسائی کا باعث بن سکتا ہے، جو رازداری کے مسائل اور ڈیٹا کے رساو کا سبب بن سکتا ہے۔
  • دستاویز کریں کہ کیا متحرک طور پر کنفیگر کیا جا سکتا ہے اور اگر کنفیگریشن ڈیلیوری سسٹم دستیاب نہیں ہے تو فال بیک رویے کی وضاحت کریں۔

رہائی کا انتظام

  • رہائی کے عمل کو تفصیل سے دستاویز کریں۔ بیان کریں کہ ریلیز کس طرح SLOs کو متاثر کرتی ہے (مثال کے طور پر، کیشے کی کمی کی وجہ سے تاخیر میں عارضی اضافہ)۔
  • دستاویز کینری ریلیز۔
  • کینری ریلیز ریویو پلان اور اگر ممکن ہو تو خودکار رول بیک میکانزم تیار کریں۔
  • اس بات کو یقینی بنائیں کہ رول بیکس وہی عمل استعمال کر سکتے ہیں جیسے کہ تعیناتی۔

مشاہدہ

  • اس بات کو یقینی بنائیں کہ SLO کے لیے مطلوبہ میٹرکس کا سیٹ اکٹھا کیا گیا ہے۔
  • یقینی بنائیں کہ آپ کلائنٹ اور سرور کے ڈیٹا میں فرق کر سکتے ہیں۔ خرابی کی وجوہات کو تلاش کرنے کے لیے یہ ضروری ہے۔
  • لیبر کے اخراجات کو کم کرنے کے لیے انتباہات مرتب کریں۔ مثال کے طور پر، معمول کی کارروائیوں کی وجہ سے انتباہات کو ہٹا دیں۔
  • اگر آپ Stackdriver استعمال کرتے ہیں، تو اپنے ڈیش بورڈز میں GCP پلیٹ فارم میٹرکس شامل کریں۔ GCP انحصار کے لیے الرٹس مرتب کریں۔
  • ہمیشہ آنے والے نشانات کا پرچار کریں۔ یہاں تک کہ اگر آپ ٹریسنگ میں ملوث نہیں ہیں، تو یہ نچلی سطح کی خدمات کو پیداوار میں مسائل کو ڈیبگ کرنے کی اجازت دے گا۔

تحفظ اور حفاظت

  • یقینی بنائیں کہ تمام بیرونی کنکشنز انکرپٹڈ ہیں۔
  • یقینی بنائیں کہ آپ کے پروڈکشن پروجیکٹس میں درست IAM سیٹ اپ ہے۔
  • ورچوئل مشین مثالوں کے گروپس کو الگ کرنے کے لیے نیٹ ورکس کا استعمال کریں۔
  • ریموٹ نیٹ ورکس سے محفوظ طریقے سے جڑنے کے لیے VPN استعمال کریں۔
  • ڈیٹا تک صارف کی رسائی کو دستاویز اور مانیٹر کریں۔ یقینی بنائیں کہ ڈیٹا تک تمام صارف کی رسائی کا آڈٹ اور لاگ ان ہے۔
  • یقینی بنائیں کہ ڈیبگنگ اینڈ پوائنٹس ACLs کے ذریعہ محدود ہیں۔
  • صارف کے ان پٹ کو صاف کریں۔ صارف کے ان پٹ کے لیے پے لوڈ سائز کی حدیں ترتیب دیں۔
  • یقینی بنائیں کہ آپ کی سروس انفرادی صارفین کے لیے آنے والی ٹریفک کو منتخب طور پر روک سکتی ہے۔ یہ دوسرے صارفین کو متاثر کیے بغیر خلاف ورزیوں کو روک دے گا۔
  • بیرونی اختتامی مقامات سے پرہیز کریں جو بہت ساری اندرونی کارروائیوں کا آغاز کرتے ہیں۔

اہلیت کی منصوبہ بندی

  • دستاویز کریں کہ آپ کی سروس کی پیمائش کیسے ہوتی ہے۔ مثال کے طور پر: صارفین کی تعداد، آنے والے پے لوڈ کا سائز، آنے والے پیغامات کی تعداد۔
  • اپنی خدمت کے لیے وسائل کی ضروریات کو دستاویز کریں۔ مثال کے طور پر: وقف شدہ ورچوئل مشین مثالوں کی تعداد، اسپینر مثالوں کی تعداد، خصوصی ہارڈ ویئر جیسے GPU یا TPU۔
  • دستاویز کے وسائل کی حدود: وسائل کی قسم، علاقہ، وغیرہ۔
  • نئے وسائل بنانے کے لیے کوٹہ کی پابندیاں دستاویز کریں۔ مثال کے طور پر، اگر آپ نئی مثالیں بنانے کے لیے API کا استعمال کرتے ہیں تو GCE API کی درخواستوں کی تعداد کو محدود کرنا۔
  • کارکردگی میں کمی کا تجزیہ کرنے کے لیے لوڈ ٹیسٹ چلانے پر غور کریں۔

بس۔ کلاس میں ملتے ہیں!

ماخذ: www.habr.com

نیا تبصرہ شامل کریں