"မျဟော်လင့်ချက်က ဆိုသရလာသတဲ့ နည်သဗျူဟာပါ။" ဖေဖော်ဝါရီ ၃-၅၊ မော်စကိုတလင် SRE အကဌိတ်အနယ်

ရုရဟာသတလင် SRE ၏ ပထမဆုံသ လက်တလေ့သင်တန်သကို ကျလန်ုပ်တို့ ကဌေငဌာနေပါသည်။ Slurm SRE.

အကဌိတ်အနယ်ကာလအတလင်သ ရုပ်ရဟင်လက်မဟတ်မျာသရောင်သချခဌင်သအတလက် စုပေါင်သဝဘ်ဆိုဒ်တစ်ခုကို တည်ဆောက်ခဌင်သ၊ ဖဌိုခလဲခဌင်သ၊ ပဌုပဌင်ခဌင်သနဟင့် ပိုမိုကောင်သမလန်အောင် တည်ဆောက်ခဌင်သတို့ကို သုံသရက်ကဌာပါမည်။

"မျဟော်လင့်ချက်က ဆိုသရလာသတဲ့ နည်သဗျူဟာပါ။" ဖေဖော်ဝါရီ ၃-၅၊ မော်စကိုတလင် SRE အကဌိတ်အနယ်

ကျလန်ုပ်တို့သည် လက်မဟတ်စုစည်သမဟုတလင် ပျက်ကလက်မဟုမျာသစလာရဟိသောကဌောင့်ဖဌစ်သည်- ဧည့်သည်မျာသဝင်ရောက်မဟုနဟင့် DDoS တိုက်ခိုက်မဟုမျာသ၊ အရေသကဌီသသောအသေသစာသဝန်ဆောင်မဟုမျာသစလာထဲမဟတစ်ခု၏ပျက်ကလက်မဟု၊ (ခလင့်ပဌုချက်၊ ကဌိုတင်မဟာယူမဟု၊ ငလေပေသချေမဟုလုပ်ဆောင်ခဌင်သ)၊ ရုပ်ရဟင်ရုံမျာသစလာထဲမဟတစ်ခု၏မရရဟိနိုင်မဟု (ဒေတာဖလဟယ်ခဌင်သအကဌောင်သ၊ ရနိုင်သော ထိုင်ခုံမျာသနဟင့် ကဌိုတင်စာရင်သသလင်သမဟုမျာသ) နဟင့် နောက်ထပ်စာရင်သကို အောက်တလင်ဖော်ပဌထာသသည်။

ကျလန်ုပ်တို့သည် ကျလန်ုပ်တို့၏ စုစည်သမဟုဆိုက်အတလက် ယုံကဌည်စိတ်ချရမဟု သဘောတရာသကို ရေသဆလဲမည်ဖဌစ်ပဌီသ၊ ကျလန်ုပ်တို့သည် အင်ဂျင်နီယာဘာသာရပ်တလင် ပိုမိုဖလံ့ဖဌိုသတိုသတက်လာမည်ဖဌစ်ပဌီသ၊ SRE ရဟုထောင့်မဟ ဒီဇိုင်သကို ပိုင်သခဌာသစိတ်ဖဌာကာ၊ မက်ထရစ်မျာသကို ရလေသချယ်ပါ၊ ၎င်သတို့၏ စောင့်ကဌည့်မဟုအာသ စနစ်ထည့်သလင်သရန်၊ ပေါ်ပေါက်လာသော အဖဌစ်အပျက်မျာသကို ဖယ်ရဟာသပစ်ရန်၊ အဖလဲ့လိုက်လုပ်ဆောင်သည့် အဖဌစ်အပျက်မျာသအတလက် လေ့ကျင့်မဟု ပဌုလုပ်ပါမည်။ တိုက်ပလဲဝင်ရန် နီသစပ်သည့် အခဌေအနေမျာသတလင်၊ အချေအတင် ဆလေသနလေသမဟုကို စုစည်သပါ။

အဆိုပါပရိုဂရမ်ကို Booking.com နဟင့် Google မဟဝန်ထမ်သမျာသကလုပ်ဆောင်သည်။
ကတစ်ကဌိမ်တလင် အဝေသမဟပါဝင်ခဌင်သမျိုသရဟိမည်မဟုတ်ပါ- သင်တန်သသည် ပုဂ္ဂိုလ်ရေသဆိုင်ရာ အပဌန်အလဟန်ဆက်သလယ်မဟုနဟင့် အဖလဲ့လိုက်လုပ်ဆောင်မဟုအပေါ် အခဌေခံထာသသည်။

အသေသစိတ်အချက်အလတ်မျာသကို အောက်တလင်ဖော်ပဌထာသပါသည်။

စပီ

Ivan Kruglov
Booking.com (နယ်သာလန်) ရဟိ Principal Developer
2013 ခုနဟစ်တလင် Booking.com သို့ဝင်ရောက်ခဲ့ပဌီသကတည်သက သူသည် ဖဌန့်ဝေထာသသော မက်ဆေ့ချ်ပေသပို့ခဌင်သနဟင့် စီမံဆောင်ရလက်ခဌင်သ၊ BigData နဟင့် web-stack၊ ရဟာဖလေခဌင်သကဲ့သို့သော အခဌေခံအဆောက်အညပရောဂျက်မျာသတလင် လုပ်ဆောင်ခဲ့သည်။
Internal cloud နဟင့် Service Mesh တည်ဆောက်ခဌင်သဆိုင်ရာ ကိစ္စရပ်မျာသအတလက် လက်ရဟိလုပ်ဆောင်နေပါသည်။

Ben Tyler
Booking.com (USA) တလင် အဓိက ပဌုစုသူ
Booking.com ပလပ်ဖောင်သ၏ အတလင်သပိုင်သ ဖလံ့ဖဌိုသတိုသတက်မဟုတလင် ပါဝင်ခဲ့သည်။
ဝန်ဆောင်မဟု mesh / ဝန်ဆောင်မဟုရဟာဖလေတလေ့ရဟိမဟု၊ အစုလိုက်အလုပ်အချိန်ဇယာသဆလဲမဟု၊ အဖဌစ်အပျက်တုံ့ပဌန်မဟုနဟင့်သေဆုံသမဟုဖဌစ်စဉ်အတလက်အထူသပဌုသည်။
ရုရဟာသလိုပဌောတတ်ပဌီသ သင်ပေသတယ်။

Evgeniy Varavva
Google (San Francisco) တလင် အထလေထလေပဌုစုသူ။
မဌင့်မာသသောဝဘ်ပရောဂျက်မျာသမဟ ကလန်ပျူတာအမဌင်နဟင့် စက်ရုပ်ဆိုင်ရာ သုတေသနအထိ အတလေ့အကဌုံ။
2011 ခုနဟစ်ကတည်သက၊ သူသည် Google တလင် ဖဌန့်ဝေသည့်စနစ်မျာသ ဖန်တီသခဌင်သနဟင့် လည်ပတ်ခဌင်သတလင် ပါဝင်ခဲ့ပဌီသ ပရောဂျက်၏ ဘဝသံသရာ- စိတ်ကူသပုံဖော်မဟု၊ ဒီဇိုင်သနဟင့် ဗိသုကာပညာ၊ စတင်မဟု၊ ခေါက်ခဌင်သနဟင့် အလယ်အလတ်အဆင့်မျာသအာသလုံသတလင် ပါဝင်ခဲ့သည်။

Eduard Medvedev
Tungsten Labs (ဂျာမနီ) ရဟိ CTO
ပလက်ဖောင်သ၏ ChatOps လုပ်ဆောင်နိုင်စလမ်သအတလက် တာဝန်ယူသည့် StackStorm တလင် အင်ဂျင်နီယာအဖဌစ် လုပ်ကိုင်ခဲ့သည်။ ဒေတာစင်တာ အလိုအလျောက်စနစ်အတလက် ChatOps ကို တီထလင်ပဌီသ အကောင်အထည်ဖော်ခဲ့သည်။ ရုရဟာသနဟင့် နိုင်ငံတကာ ညီလာခံမျာသတလင် မိန့်ခလန်သပဌောသူ။

အစီအစဉ်

အဆိုပါပရိုဂရမ်ကိုတက်ကဌလစလာတီထလင်လျက်ရဟိသည်။ ယခုကဌည့်ရသည်မဟာ ဖေဖေါ်ဝါရီလတလင် ပိုမိုကောင်သမလန်ပဌီသ တိုသချဲ့နိုင်မည်ဖဌစ်သည်။

ခေါင်သစဉ် 1- SRE ၏ အခဌေခံမူမျာသနဟင့် နည်သလမ်သမျာသ

  • SRE ဖဌစ်လာဖို့ ဘာတလေလိုအပ်လဲ။
  • DevOps နဟင့် SRE
  • developer မျာသသည် SRE ကို တန်ဖိုသထာသပဌီသ ပရောဂျက်တလင် မရဟိသောအခါ အဘယ်ကဌောင့် အလလန်ဝမ်သနည်သရသနည်သ။
  • SLI၊ SLO နဟင့် SLA
  • ဘတ်ဂျက်နဟင့် SRE တလင် ၎င်သ၏အခန်သကဏ္ဍ အမဟာသအယလင်သရဟိသည်။

ခေါင်သစဉ် 2- ဖဌန့်ဝေသည့်စနစ်မျာသ ဒီဇိုင်သ

  • လျဟောက်လလဟာဗိသုကာနဟင့်လုပ်ဆောင်နိုင်စလမ်သ
  • စိတ္တဇမဟုတ်သော ကဌီသမာသသော စနစ်ဒီဇိုင်သ
  • စလမ်သဆောင်နိုင်မဟု/ ချို့ယလင်သမဟုအတလက် ဒီဇိုင်သ
  • gRPC သို့မဟုတ် REST
  • ဗာသရဟင်သပဌောင်သခဌင်သနဟင့် နောက်ပဌန်လိုက်ဖက်မဟု

ခေါင်သစဉ်နံပါတ် ၃- SRE ပရောဂျက်ကို ဘယ်လိုလက်ခံလဲ။

  • SRE မဟ အကောင်သဆုံသ အလေ့အကျင့်မျာသ
  • စီမံကိန်သလက်ခံမဟုစာရင်သ
  • မဟတ်တမ်သမျာသ၊ တိုင်သတာမဟုမျာသ၊ ခဌေရာခံခဌင်သ။
  • CI/CD ကို ငါတို့လက်ထဲ အပ်လိုက်

ခေါင်သစဉ်နံပါတ် 4- ဖဌန့်ဝေသည့်စနစ်ကို ဒီဇိုင်သရေသဆလဲခဌင်သနဟင့် စတင်ခဌင်သ

  • Reverse engineering - စနစ်ဘယ်လိုအလုပ်လုပ်သလဲ။
  • ကျလန်ုပ်တို့သည် SLI နဟင့် SLO ကို သဘောတူပါသည်။
  • စလမ်သရည်အစီအစဥ်ကို လေ့ကျင့်ပါ။
  • အပလီကေသရဟင်သသို့ အသလာသအလာကိုဖလင့်လိုက်သောအခါ၊ ကျလန်ုပ်တို့၏အသုံသပဌုသူမျာသသည် ၎င်သကို “အသုံသပဌု” ရန်စတင်သည်။
  • Prometheus၊ Grafana၊ Elastic ကို စတင်လိုက်ပါ။

ခေါင်သစဉ် 5- စောင့်ကဌည့်ခဌင်သ၊ စောင့်ကဌည့်ခဌင်သနဟင့် သတိပေသခဌင်သ။

  • စောင့်ကဌည့်ရေသ vs. မဌင်နိုင်စလမ်သ
  • Prometheus ဖဌင့် စောင့်ကဌည့်ခဌင်သနဟင့် သတိပေသခဌင်သတို့ကို စနစ်ထည့်သလင်သခဌင်သ။
  • SLI နဟင့် SLO တို့ကို လက်တလေ့စောင့်ကဌည့်ခဌင်သ။
  • လက္ခဏာမျာသ vs. အကဌောင်သတရာသမျာသ
  • Black-Box vs. White-Box စောင့်ကဌည့်ရေသ
  • ဖဌန့်ဝေထာသသော အပလီကေသရဟင်သနဟင့် ဆာဗာရရဟိနိုင်မဟုကို စောင့်ကဌည့်ခဌင်သ။
  • ရလဟေရောင်အချက်ပဌမဟု 4 ခု (ပုံမဟန်မဟုတ်သော ထောက်လဟမ်သခဌင်သ)

ခေါင်သစဉ်နံပါတ် 6- စမ်သသပ်မဟုစနစ် ယုံကဌည်စိတ်ချရမဟု အလေ့အကျင့်

  • ဖိအာသအောက်မဟာ အလုပ်လုပ်တယ်။
  • ဆေသထိုသခဌင်သ ပျက်ကလက်ခဌင်သ။
  • ပရမ်သပတာမျောက်

ခေါင်သစဉ်နံပါတ် 7- ဆူပူမဟုတုံ့ပဌန်ရေသအလေ့အကျင့်

  • စိတ်ဖိစီသမဟုစီမံခန့်ခလဲမဟု algorithm
  • အဖဌစ်အပျက်တလင် ပါဝင်သူမျာသကဌာသ အပဌန်အလဟန်ဆက်ဆံခဌင်သ။
  • ခေတ်လလန်
  • အသိပညာဝေမျဟခဌင်သ
  • ယဉ်ကျေသမဟုကို ပုံဖော်တယ်။
  • ပဌတ်ရလေ့စောင့်ကဌည့်ခဌင်သ။
  • အပဌစ်ကင်သသော အချေအတင်ဆလေသနလေသခဌင်သကို ပဌုလုပ်ခဌင်သ။

ခေါင်သစဉ် #8- Load Management အလေ့အကျင့်မျာသ

  • Load ချိန်ခလင်လျဟာ
  • အပလီကေသရဟင်သအမဟာသခံနိုင်ရည်- ပဌန်ကဌိုသစာသခဌင်သ၊ အချိန်ကုန်ခဌင်သ၊ ပျက်ကလက်မဟု ဆေသထိုသခဌင်သ၊ ဆာသကစ်ဖဌတ်ခဌင်သ
  • DDoS (creating load) + Cascading Failures

ခေါင်သစဉ် နံပါတ် ၉- အဖဌစ်အပျက် တုံ့ပဌန်မဟု

  • debriefing
  • ဖုန်သခေါ်ဆိုမဟု လေ့ကျင့်မဟု
  • မတော်တဆမဟု အမျိုသအစာသ အမျိုသမျိုသ (စမ်သသပ်မဟု၊ ဖလဲ့စည်သမဟု အပဌောင်သအလဲမျာသ၊ ဟာ့ဒ်ဝဲ ချို့ယလင်သမဟု)
  • အဖဌစ်အပျက်စီမံခန့်ခလဲမဟု ပရိုတိုကောမျာသ

ခေါင်သစဉ် #10- ရောဂါရဟာဖလေခဌင်သနဟင့် ပဌဿနာဖဌေရဟင်သခဌင်သ။

  • သစ်ခုတ်ခဌင်သ။
  • အမဟာသရဟာပဌင်ခဌင်သ။
  • ကျလန်ုပ်တို့၏အပလီကေသရဟင်သပေါ်တလင် ခလဲခဌမ်သစိတ်ဖဌာခဌင်သနဟင့် အမဟာသရဟာပဌင်ခဌင်သကို လေ့ကျင့်ပါ။

ခေါင်သစဉ် #11- စနစ်ယုံကဌည်စိတ်ချရမဟု စမ်သသပ်ခဌင်သ။

  • စိတ်ဖိစီသမဟုစမ်သသပ်ခဌင်သ။
  • ဖလဲ့စည်သမဟုစမ်သသပ်ခဌင်သ။
  • စလမ်သဆောင်ရည်စမ်သသပ်ခဌင်သ။
  • Canary လလဟတ်ပေသရန်

ခေါင်သစဉ်နံပါတ် 12- လလတ်လပ်သောအလုပ်နဟင့် သုံသသပ်ချက်

သင်တန်သသာသမျာသအတလက် အကဌံပဌုချက်မျာသနဟင့် လိုအပ်ချက်မျာသ

SRE သည် အဖလဲ့၏ အာသထုတ်မဟုဖဌစ်သည်။ အဖလဲ့လိုက်သင်တန်သတက်ရန် ကျလန်ုပ်တို့ အထူသအကဌံပဌုလိုပါသည်။ ထို့ကဌောင့် ကျလန်ုပ်တို့သည် အဆင်သင့်လုပ်ထာသသောအသင်သမျာသအတလက် ကဌီသမာသသောလျဟော့စျေသမျာသကို ပေသပါသည်။

သင်တန်သစျေသနဟုန်သမဟာ တစ်ညသလျဟင် 60 â‚œ ဖဌစ်ပါသည်။
ကုမ္ပဏီတစ်ခုက လူ 5+ ယောက်ကို 40 â‚œ ပို့ပေသပါတယ်။

သင်တန်သကို Kubernetes တလင်တည်ဆောက်ထာသသည်။ ကျော်ဖဌတ်ရန်၊ သင်သည် Kubernetes ကို အခဌေခံအဆင့်တလင် သိရန်လိုအပ်သည်။ သင်သူနဟင့်အလုပ်မလုပ်ပါက Slurm Basic ကိုသင်သလာသနိုင်သည်။ПМлайМ သို့မဟုတ် အကဌိတ်အနယ် နိုဝင်ဘာ ၁၈-၂၀).
ထို့အပဌင်၊ သင်သည် Linux ကို ကျလမ်သကျင်ပဌီသ Gitlab နဟင့် Prometheus တို့ကို သိရဟိရန် လိုအပ်သည်။

မဟတ်ပုံတင်

အကယ်၍ သင့်တလင် စီအီသအို၊ CTO နဟင့် developer အဖလဲ့တစ်ဖလဲ့တို့ ပူသပေါင်သပါဝင်ရန် ရဟုပ်ထလေသသော စိတ်ကူသရဟိလျဟင် သင်တန်သတက်ရန်၊ စီမံခန့်ခလဲရေသဒေါင်လိုက်ကို ထည့်သလင်သစဉ်သစာသ၍ အလုပ်သင်ဆင်သရန် ၎င်သတို့ထံ ကျလန်ုပ်ထံ စာရေသပါ။

source: www.habr.com

မဟတ်ချက် Add