څنګه ما یوه اونۍ د SRE انجینر انٹرن په توګه تیره کړه. د سافټویر انجنیر د سترګو له لارې دنده

څنګه ما یوه اونۍ د SRE انجینر انٹرن په توګه تیره کړه. د سافټویر انجنیر د سترګو له لارې دنده

د SRE انجنیر - روزونکی

لومړی، اجازه راکړئ خپل ځان معرفي کړم. زه - @tristan.readپه ګروپ کې د مخکښ انجنیر څارنه:: روغتیا GitLab. تیره اونۍ ما زموږ د یو آن تلیفون SRE انجینر سره د انٹرننګ ویاړ درلود. موخه دا وه چې وګورو چې څنګه د دندې افسر هره ورځ پیښو ته ځواب ووایی او په دنده کې د ریښتینې ژوند تجربه ترلاسه کړي. موږ غواړو زموږ انجینران د کاروونکو اړتیاو ښه پوه شي دندې څارنه:: روغتیا.

زه باید د یوې اونۍ لپاره د SRE انجنیر په هر ځای کې تعقیب کړم. دا دی، زه د سپارلو په وخت کې حاضر وم، د ورته خبرتیا چینلونو څارنه وکړه او د پیښو ځوابونه چې کله او کله پیښ شوي.

پیښې

په یوه اونۍ کې 2 پیښې وې.

1. کریپټومینر

GitLab.com د چهارشنبه په کارولو کې یو کود ولید د GitLab رنرa، د کریپټو اسعارو کان کېنولو لپاره د رنر دقیقو کارولو هڅو له امله رامینځته شوی. پیښه زموږ د خپل سرغړونې بې طرفه کولو وسیلې کارولو سره معامله شوې ، کوم چې د چلونکي دندې ودروي او پروژه او حساب یې له دې سره تړلی حذف کوي.

که دا پیښه نه وی لیدل شوی، یو اتوماتیک وسیله به یې نیولی وای، مګر پدې حالت کې، د SRE انجنیر لومړی سرغړونه ولیدله. د پېښې یوه دنده رامنځته شوه، خو په اړه یې معلومات بند دي.

2. د کانري او اصلي غوښتنلیکونو د فعالیت تخریب

پیښه په Gitlab.com کې د کانري او اصلي ویب غوښتنلیکونو کې د سستۍ او د غلطیو د زیاتوالي له امله رامینځته شوې. د اپډیکس ډیری ارزښتونه سرغړونه شوي.

د خلاصې پیښې دنده: https://gitlab.com/gitlab-com/gl-infra/production/issues/1442

کلیدي موندنې

دلته یو څو شیان دي چې ما د خپلې دندې په اونۍ کې زده کړل.

1. خبرتیاوې خورا ګټورې دي کله چې د نورم څخه انحراف کشف کړئ.

خبرتیاوې په څو ډولونو ویشل کیدی شي:

  • خبرتیاوې د یو ټاکلي حد ارزښت پراساس، لکه "په هره ثانیه کې 10 5xx تېروتنې رامنځته شوې."
  • خبرتیاوې په کوم کې چې حد د سلنې ارزښت دی لکه "په ټاکل شوي وخت کې د غوښتنو ټول حجم 5٪ کې د 10xx غلطیو فریکونسۍ."
  • د تاریخي اوسط پر بنسټ خبرتیاوې لکه "په 5 فیصده کې 90xx تېروتنې".

په عموم ډول، ډولونه 2 او 3 د دندې پر مهال د SREs لپاره ډیر ګټور دي، ځکه چې دوی په پروسه کې د نورم څخه انحراف څرګندوي.

2. ډیری خبرتیاوې هیڅکله پیښو ته وده نه ورکوي.

د SR انجنیران د خبرتیاو دوامداره جریان سره معامله کوي، چې ډیری یې په حقیقت کې مهم ندي.

نو ولې خپل خبرتیاوې یوازې واقعیا مهمو ته محدود نه کړئ؟ که څه هم د دې تګلارې سره، تاسو ممکن د هغه لومړنۍ نښې نښانې ونه پیژنئ چې د واورې بال به په ریښتینې ستونزه کې وي چې لوی زیان ګواښوي.

د زنګ وهلو SRE دنده دا ده چې دا معلومه کړي چې کوم خبرتیاوې په حقیقت کې یو څه جدي په ګوته کوي، او ایا دوی باید ګړندۍ شي او ورسره معامله وشي. زه شک لرم چې دا د خبرتیاو د انعطاف له امله هم دی: دا به غوره وي که چیرې د پورته بیان شوي وضعیت سره سم د خبرتیاو تنظیم کولو لپاره ډیری کچې یا "سمارټ" لارې شتون ولري.

د ځانګړتیا وړاندیز: https://gitlab.com/gitlab-org/gitlab/issues/42633

3. زموږ SRE په دنده کې ډیری وسایل کاروي.

داخلي:

  • د GitLab انفرا پروژه: د چلولو کتابونه دلته ژوند کوي، شفټ/اونۍ دندې، د پیښو غبرګون دندې.
  • د GitLab مسلې: څیړنې، بیاکتنې، او ساتنه هم په مسلو کې تعقیب کیږي.
  • د GitLab لیبلونه: د اتوماتیک دندې د ځانګړي لیبلونو په کارولو سره پیل شوي ، کوم چې بوټونه د دندې فعالیت تعقیبولو لپاره کاروي.

بهرنۍ:

  • PagerDuty: خبرتیاوې
  • سست: د PagerDuty/AlertManager پیغام جریان دلته ځي. د مختلف کارونو ترسره کولو لپاره د سلیش کمانډونو سره ادغام ، لکه د خبرتیا بندول یا پیښې ته وده ورکول.
  • ګرافانا: د اوږد مهاله رجحاناتو تمرکز سره د میټریکونو لید.
  • کیبانا: لید / لاګ لټون ورکوي ، د ځانګړو پیښو ژور کیندنې وړتیا.
  • زوم: په زوم کې دوامداره "بریک آوټ خونه" شتون لري. دا د SRE انجنیرانو ته اجازه ورکوي چې په چټکۍ سره د پیښو په اړه بحث وکړي پرته له دې چې ارزښتناکه وخت ضایع کړي د خونې په جوړولو او د ګډون کوونکو سره اړیکه ونیسي.

او ډیری نور.

4. د GitLab سره د GitLab.com څارنه د ناکامۍ یو واحد ټکی دی

که GitLab.com د لوی خدماتو بندیدو تجربه وکړي، موږ نه غواړو چې دا د مسلې حل کولو لپاره زموږ وړتیا اغیزه وکړي. دا د GitLab.com اداره کولو لپاره د دوهم GitLab مثال په لاره اچولو سره ودرول کیدی شي. په حقیقت کې، دا لا دمخه زموږ لپاره کار کوي: https://ops.gitlab.net/.

5. په ګیټ لیب کې د اضافه کولو لپاره یو څو ځانګړتیاوې په پام کې ونیسئ

  • د څو کاروونکي دندې ترمیم, د Google Docs سره ورته. دا به د پیښې په جریان کې د پیښو په اړه دندو سره مرسته وکړي، او همدارنګه د بیان کولو دندې. په دواړو حالتونو کې، ډیری برخه اخیستونکي ممکن په ریښتیني وخت کې یو څه اضافه کولو ته اړتیا ولري.
  • Больше вебхуков для задач. Возможность запускать различные шаги рабочего процесса GitLab изнутри поможет снизить зависимость от интеграций Slack. Например, возможность разрешить оповещение в PagerDuty через слэш-команду в задаче GitLab.
    پایلې

د SRE انجنیران د ډیری پیچلتیاوو سره سخت وخت لري. دا به خورا ښه وي چې د GitLab نور محصولات وګورئ چې دې مسلو ته رسیدګي کوي. موږ دمخه په محصول کې ځینې اضافې کار کوو چې پورته ذکر شوي کاري جریان به اسانه کړي. تفصیلات په کې شتون لري د Ops محصول لید برخه.

موږ په 2020 کې ټیم ته پراختیا ورکوو ترڅو دا ټولې عالي ځانګړتیاوې یوځای راوړو. که علاقه لرئ، مهرباني وکړئ وګورئ خالي بستونه، او د هرې پوښتنې سره زموږ په ټیم کې د هرچا سره اړیکه ونیسئ.

سرچینه: www.habr.com

Add a comment