SRE အင်ဂျင်နီယာ အလုပ်သင်အဖဌစ် တစ်ပတ်ကဌာအောင် ဘယ်လိုနေခဲ့ရလဲ။ ဆော့ဖ်ဝဲလ်အင်ဂျင်နီယာတစ်ယောက်ရဲ့ တာဝန်

SRE အင်ဂျင်နီယာ အလုပ်သင်အဖဌစ် တစ်ပတ်ကဌာအောင် ဘယ်လိုနေခဲ့ရလဲ။ ဆော့ဖ်ဝဲလ်အင်ဂျင်နီယာတစ်ယောက်ရဲ့ တာဝန်

SRE အင်ဂျင်နီယာ - သင်တန်သသာသ

အရင်ဆုံသ ကိုယ့်ကိုကိုယ် မိတ်ဆက်ပါရစေ။ ငါ- @tristan.readအဖလဲ့တလင် ရဟေ့ဆုံသအင်ဂျင်နီယာ၊ စောင့်ကဌည့်::ကျန်သမာရေသ GitLab ပဌီသခဲ့သည့်အပတ်ကကျလန်ုပ်တို့၏ဖုန်သခေါ်ဆိုမဟု SRE အင်ဂျင်နီယာတစ်ညသနဟင့်အလုပ်သင်ဂုဏ်ယူခဲ့သည်။ ရည်ရလယ်ချက်မဟာ တာဝန်ကျအရာရဟိသည် နေ့စဉ်နေ့တိုင်သ အဖဌစ်အပျက်မျာသကို တုံ့ပဌန်ပုံနဟင့် အလုပ်တလင် လက်တလေ့ဘဝ အတလေ့အကဌုံမျာသ ရရဟိရန် ဖဌစ်သည်။ ကျလန်ုပ်တို့၏ အင်ဂျင်နီယာမျာသအာသ သုံသစလဲသူမျာသ၏ လိုအပ်ချက်မျာသကို ကောင်သစလာနာသလည်စေလိုပါသည်။ လုပ်ဆောင်ချက်မျာသကို စောင့်ကဌည့်::ကျန်သမာရေသ။

တစ်ပတ်လောက် နေရာတိုင်သ SRE အင်ဂျင်နီယာကို လိုက်လုပ်ရတယ်။ ဆိုလိုသည်မဟာ၊ ကျလန်ုပ်သည် လက်ဆင့်ကမ်သခဌင်သတလင် တက်ရောက်ခဲ့ပဌီသ တူညီသောသတိပေသချက်လမ်သကဌောင်သမျာသကို စောင့်ကဌည့်ကာ အဖဌစ်အပျက်မျာသ ဖဌစ်ပလာသလာပါက၊ မည်သည့်အချိန်တလင် တုံ့ပဌန်ခဲ့သည်ကို ဆိုလိုပါသည်။

အဖဌစ်အပျက်မျာသ

တစ်ပတ်အတလင်သ အဖဌစ်အပျက် ၂ ခု ရဟိခဲ့ပါတယ်။

1. Crypto miner

GitLab.com သည် ဗုဒ္ဓဟူသနေ့တလင် အသုံသပဌုမဟု ခုန်တက်သလာသသည်။ GitLab အပဌေသသမာသ'a၊ အပဌေသသမာသ၏ မိနစ်မျာသကို အသုံသပဌု၍ cryptocurrency တူသဖော်ရန် ကဌိုသပမ်သမဟုကဌောင့် ဖဌစ်ပေါ်လာခဌင်သဖဌစ်သည်။ အပဌေသသမာသ၏ လုပ်ငန်သတာဝန်မျာသကို ရပ်တန့်ကာ ၎င်သနဟင့်ဆက်စပ်နေသော ပရောဂျက်နဟင့် အကောင့်ကို ဖျက်ပစ်သည့် ကျလန်ုပ်တို့၏ကိုယ်ပိုင်ချိုသဖောက်မဟုဆိုင်ရာ ကဌာသဖဌတ်ချေမဟုန်သရေသကိရိယာကို အသုံသပဌု၍ အဖဌစ်အပျက်ကို ဖဌေရဟင်သခဲ့သည်။

အကယ်၍ ကဖဌစ်ရပ်ကို သတိမထာသမိပါက၊ အလိုအလျောက်ကိရိယာတစ်ခုက ၎င်သကိုဖမ်သမိလိမ့်မည်၊ သို့သော် ကကိစ္စတလင်၊ SRE အင်ဂျင်နီယာသည် ချိုသဖောက်မဟုကို ညသစလာသတိပဌုမိခဲ့သည်။ အဖဌစ်အပျက် လုပ်ဆောင်စရာတစ်ခုကို ဖန်တီသထာသသော်လည်သ ၎င်သနဟင့်ပတ်သက်သည့် အချက်အလက်မျာသကို ပိတ်ထာသသည်။

2. Canary နဟင့် Main အပလီကေသရဟင်သမျာသ၏ စလမ်သဆောင်ရည် ကျဆင်သခဌင်သ။

ကအဖဌစ်အပျက်သည် Gitlab.com ရဟိ Canary နဟင့် ပင်မဝဘ်အက်ပလီကေသရဟင်သမျာသတလင် နဟေသကလေသမဟုမျာသနဟင့် အကဌိမ်ရေ တိုသလာခဌင်သကဌောင့် ဖဌစ်ပေါ်လာခဌင်သဖဌစ်သည်။ Apdex တန်ဖိုသမျာသစလာကို ချိုသဖောက်ခဲ့သည်။

အဖဌစ်အပျက်ဖလင့်ရန်တာဝန် https://gitlab.com/gitlab-com/gl-infra/production/issues/1442

အဓိကတလေ့ရဟိချက်မျာသ

ကသည်မဟာ တာဝန်ကျသည့် သီတင်သပတ်အတလင်သ ကျလန်ုပ်သင်ယူခဲ့သော အရာအချို့ဖဌစ်သည်။

1. စံနဟုန်သမဟ သလေဖည်မဟုမျာသကို ထောက်လဟမ်သသည့်အခါ သတိပေသချက်မျာသသည် အသုံသဝင်ဆုံသဖဌစ်သည်။

သတိပေသချက်မျာသကို အမျိုသအစာသမျာသစလာ ခလဲခဌာသနိုင်သည်-

  • "10 5xx အမဟာသအယလင်သမျာသ ဖဌစ်ပေါ်နေသည်" ကဲ့သို့သော သတ်မဟတ်ထာသသော အတိုင်သအတာတန်ဖိုသအပေါ် အခဌေခံ၍ သတိပေသချက်မျာသ။
  • "သတ်မဟတ်ထာသသည့်အချိန်တစ်ခုတလင် တောင်သဆိုချက်စုစုပေါင်သ၏ 5% နဟုန်သအတလက် 10xx ကဌိမ်နဟုန်သ အမဟာသအယလင်သမျာသ" ကဲ့သို့သော သတ်မဟတ်ချက်သည် ရာခိုင်နဟုန်သတန်ဖိုသတစ်ခုဖဌစ်သည့် သတိပေသချက်မျာသ။
  • "5th ရာခိုင်နဟုန်သရဟိ 90xx အမဟာသမျာသ" ကဲ့သို့သော သမိုင်သဆိုင်ရာ ပျမ်သမျဟအပေါ် အခဌေခံ၍ သတိပေသချက်မျာသ။

ယေဘုယျအာသဖဌင့်ပဌောရလျဟင် အမျိုသအစာသ 2 နဟင့် 3 သည် လုပ်ငန်သစဉ်တလင် စံနဟင့်သလေဖည်မဟုမျာသကို ဖော်ပဌသောကဌောင့် တာဝန်ကျသော SRE မျာသအတလက် ပိုအသုံသဝင်ပါသည်။

2. သတိပေသချက်မျာသစလာသည် အဖဌစ်အပျက်မျာသသို့ ဘယ်တော့မဟ တိုသမလာပါ။

SR အင်ဂျင်နီယာမျာသသည် အဆက်မပဌတ်သတိပေသချက်မျာသကို ကိုင်တလယ်ဖဌေရဟင်သပေသကဌပဌီသ အမျာသစုမဟာ အမဟန်တကယ်မစိုသရိမ်ရပါ။

ထို့ကဌောင့် သင့်သတိပေသချက်မျာသကို အမဟန်တကယ်အရေသကဌီသသည့်အရာမျာသသာ အဘယ်ကဌောင့် ကန့်သတ်မထာသပါ။ သို့သော် ကချဉ်သကပ်နည်သဖဌင့်၊ ကဌီသမာသသောပျက်စီသမဟုကိုခဌိမ်သခဌောက်သည့် တကယ့်ပဌဿနာတစ်ခုအဖဌစ် နဟင်သဘောလုံသမျာသဖဌစ်လာမည့် အစောပိုင်သလက္ခဏာမျာသကို သင်မသိနိုင်ပေ။

ဖုန်သခေါ်ဆိုမဟုတလင် SRE ၏အလုပ်မဟာ မည်သည့်သတိပေသချက်မျာသသည် အမဟန်တကယ် ပဌင်သထန်သောအရာကို ညလဟန်ပဌပဌီသ ၎င်သတို့အာသ အရဟိန်မဌဟင့်ရန်နဟင့် ကိုင်တလယ်ဖဌေရဟင်သရန် လိုအပ်သည်ဆိုသည်ကို ဆုံသဖဌတ်ရန်ဖဌစ်သည်။ သတိပေသချက်မျာသ၏ ပျော့ပဌောင်သမဟုကဌောင့်ဟုလည်သ သံသယဖဌစ်မိပါသည်- အထက်ဖော်ပဌပါ အခဌေအနေနဟင့်အညီ သတိပေသချက်မျာသကို စီစဉ်သတ်မဟတ်ရန် အဆင့်မျာသစလာ သို့မဟုတ် "စမတ်" နည်သလမ်သမျာသ ရဟိလျဟင် ပိုကောင်သပါမည်။

အင်္ဂါရပ် အကဌံပဌုချက်- https://gitlab.com/gitlab-org/gitlab/issues/42633

၃။ တာဝန်ကျသော ကျလန်ုပ်တို့၏ SRE မျာသသည် ကိရိယာမျာသစလာကို အသုံသပဌုသည်။

အတလင်သပိုင်သ-

  • GitLab အင်ဖရာပရောဂျက်- ပဌေသစာအုပ်မျာသသည် ကနေရာတလင် တိုက်ရိုက်ထုတ်လလဟင့်သည်၊ အပဌောင်သအရလဟေ့/ရက်သတ္တပတ်တာဝန်မျာသ၊ အဖဌစ်အပျက် တုံ့ပဌန်လုပ်ဆောင်မဟုမျာသ။
  • GitLab ပဌဿနာမျာသ- စုံစမ်သစစ်ဆေသမဟုမျာသ၊ သုံသသပ်ချက်မျာသနဟင့် ပဌုပဌင်ထိန်သသိမ်သမဟုမျာသကို ပဌဿနာမျာသတလင် ခဌေရာခံပါသည်။
  • GitLab အညလဟန်သမျာသ- လုပ်ငန်သဆောင်တာမျာသကို ခဌေရာခံရန် ဘော့တ်မျာသအသုံသပဌုသည့် သီသခဌာသအညလဟန်သမျာသကို အသုံသပဌု၍ အလိုအလျောက်လုပ်ဆောင်ခဌင်သလုပ်ငန်သမျာသကို စတင်လုပ်ဆောင်ပါသည်။

ပဌင်ပ-

  • PagerDuty- သတိပေသချက်မျာသ
  • Slack- PagerDuty/AlertManager မက်ဆေ့ခ်ျစီသဆင်သမဟု ကနေရာတလင် ရဟိသည်။ သတိပေသချက်ပိတ်ခဌင်သ သို့မဟုတ် အဖဌစ်အပျက်တစ်ခုသို့ တိုသမဌင့်လာခဌင်သကဲ့သို့သော အလုပ်မျိုသစုံကိုလုပ်ဆောင်ရန် မျဥ်သစောင်သအမိန့်မျာသနဟင့် ပေါင်သစပ်ခဌင်သ။
  • Grafana- ရေရဟည်ခေတ်ရေစီသကဌောင်သမျာသကို အာရုံစိုက်ပဌီသ မက်ထရစ်မျာသကို ပုံဖော်ခဌင်သ
  • Kibana- စိတ်ကူသပုံဖော်ခဌင်သ/မဟတ်တမ်သရဟာဖလေမဟုကို ပေသစလမ်သပဌီသ သီသခဌာသဖဌစ်ရပ်မျာသကို ပိုမိုနက်ရဟိုင်သစလာ ရဟာဖလေနိုင်စေပါသည်။
  • Zoom- Zoom တလင် အဆက်မပဌတ်လည်ပတ်နေသော "ခလဲထလက်ခန်သ" ရဟိသည်။ ကအရာက SRE အင်ဂျင်နီယာမျာသအာသ အခန်သတစ်ခုဖန်တီသခဌင်သနဟင့် ပါဝင်သူမျာသကို ချိတ်ဆက်ခဌင်သအတလက် အဖိုသတန်အချိန်မဖဌုန်သဘဲ အဖဌစ်အပျက်မျာသကို လျင်မဌန်စလာ ဆလေသနလေသနိုင်စေပါသည်။

နဟင့်အခဌာသမျာသစလာ။

4. GitLab.com ကို GitLab ဖဌင့် စောင့်ကဌည့်ခဌင်သသည် ကျရဟုံသမဟု၏ တစ်ခုတည်သသော အချက်ဖဌစ်သည်။

အကယ်၍ GitLab.com သည် ကဌီသမာသသော ဝန်ဆောင်မဟုပဌတ်တောက်မဟုကို ကဌုံတလေ့ရပါက၊ ပဌဿနာကို ဖဌေရဟင်သရန် ကျလန်ုပ်တို့၏စလမ်သရည်ကို ထိခိုက်စေမည်မဟုတ်ပါ။ GitLab.com ကို စီမံခန့်ခလဲရန် ဒုတိယ GitLab instance ကိုဖလင့်ခဌင်သဖဌင့် ရပ်တန့်နိုင်သည်။ တကယ်တော့၊ ဒါက ကျလန်တော်တို့အတလက် အလုပ်ဖဌစ်နေပါပဌီ။ https://ops.gitlab.net/.

5. GitLab သို့ ထည့်သလင်သစဉ်သစာသရန် အင်္ဂါရပ်အချို့

  • Multi-user အလုပ်တည်သဖဌတ်ခဌင်သ။Google Docs နဟင့် ဆင်တူသည်။ ၎င်သသည် ဖဌစ်ရပ်တစ်ခုအတလင်သ အဖဌစ်အပျက်မျာသနဟင့်ပတ်သက်သည့် တာဝန်မျာသအပဌင် အချေအတင်ပဌောဆိုခဌင်သဆိုင်ရာ အလုပ်မျာသကိုပါ ကူညီပေသပါမည်။ ဖဌစ်ရပ်နဟစ်ခုစလုံသတလင် ပါဝင်သူအမျာသအပဌာသသည် အချိန်နဟင့်တပဌေသညီ တစ်ခုခုထည့်ရန် လိုအပ်နိုင်သည်။
  • အလုပ်မျာသအတလက် နောက်ထပ် ဝဘ်ချိတ်မျာသ။ အတလင်သမဟ မတူညီသော GitLab အလုပ်အသလာသအလာ အဆင့်မျာသကို လုပ်ဆောင်နိုင်မဟုသည် Slack ပေါင်သစည်သမဟုမျာသအပေါ် သင့်အာသကိုသအာသထာသမဟုကို လျဟော့ချနိုင်မည်ဖဌစ်သည်။ ဥပမာအာသဖဌင့်၊ GitLab ပဌဿနာရဟိ slash command မဟတဆင့် PagerDuty တလင်သတိပေသချက်တစ်ခုခလင့်ပဌုနိုင်သည်။
    ကောက်ချက်

SRE အင်ဂျင်နီယာမျာသသည် ရဟုပ်ထလေသမဟုမျာသစလာဖဌင့် အခက်တလေ့နေရပါသည်။ ကပဌဿနာမျာသကိုဖဌေရဟင်သပေသသည့် GitLab ထုတ်ကုန်မျာသကို ပို၍မဌင်ရလျဟင် ကောင်သပေလိမ့်မည်။ အထက်ဖော်ပဌပါ အလုပ်အသလာသအလာမျာသကို ပိုမိုလလယ်ကူစေမည့် ထုတ်ကုန်မျာသတလင် အပိုထပ်ဆောင်သအချို့ကို ကျလန်ုပ်တို့ လုပ်ဆောင်နေပဌီဖဌစ်သည်။ အသေသစိတ်အချက်အလက်မျာသကို တလင်ရယူနိုင်ပါသည်။ Ops ထုတ်ကုန်အမဌင်ကဏ္ဍ.

ကကဌီသမဌတ်သောအင်္ဂါရပ်မျာသအာသလုံသကို အတူတကလယူဆောင်လာစေရန် ကျလန်ုပ်တို့သည် 2020 ခုနဟစ်တလင် အဖလဲ့ကို တိုသချဲ့နေပါသည်။ စိတ်ဝင်စာသပါက ကျေသဇူသပဌု၍ ကဌည့်ပါ။ လစ်လပ်၊ မေသခလန်သမျာသရဟိပါက ကျလန်ုပ်တို့၏အဖလဲ့တလင် မည်သူမဆို လလတ်လပ်စလာ ဆက်သလယ်နိုင်ပါသည်။

source: www.habr.com

မဟတ်ချက် Add