Slurm SRE Booking.com နဟင့် Google.com တို့မဟ ကျလမ်သကျင်သူမျာသနဟင့် ပဌီသပဌည့်စုံသော စမ်သသပ်မဟု

ကျလန်ုပ်တို့အဖလဲ့သည် စမ်သသပ်မဟုမျာသကို နဟစ်သက်သည်။ Slurm တစ်ခုစီသည် ယခင်အရာမျာသ၏ တည်ငဌိမ်သော ထပ်ခါတလဲလဲ မဟုတ်ဘဲ အတလေ့အကဌုံနဟင့် ကောင်သမလန်မဟ ပိုမိုကောင်သမလန်သော အသလင်ကူသပဌောင်သမဟုအပေါ် ရောင်ပဌန်ဟပ်ခဌင်သ ဖဌစ်သည်။ ဒါပေမယ့် အတူ Slurm SRE “တိုက်ခိုက်ရေသ” ကို ဖဌစ်နိုင်သမျဟ အနီသစပ်ဆုံသ ပေသနိုင်ရန် သင်တန်သသာသမျာသ၏ အခဌေအနေမျာသကို အပဌည့်အဝ ဖော်မတ်အသစ်ကို ကျင့်သုံသရန် ဆုံသဖဌတ်ခဲ့သည်။

အထူသကဌပ်မတ်သင်တန်သကာလအတလင်သ ကျလန်ုပ်တို့လုပ်ဆောင်ခဲ့သည့်အရာမျာသကို အကျဉ်သချုံသဖော်ပဌပါက- "ငါတို့တည်ဆောက်၊ ငါတို့ချိုသသည်၊ ပဌုပဌင်သည်၊
ငါတို့လေ့လာနေတယ်။" SRE သည် သီအိုရီမျဟသာဖဌစ်ပဌီသ လက်တလေ့တလင်သာ၊ စစ်မဟန်သောဖဌေရဟင်သနည်သမျာသ၊ ပဌဿနာအစစ်အမဟန်မျာသသာဖဌစ်သည်။

Dmitry Anatolyevich ၏စံနမူနာအတိုင်သ မည်သူတစ်ညသတစ်ယောက်မဟ အိပ်ငိုက်စေခဌင်သ သို့မဟုတ် “Angry Birds” ကို iPhone တလင်ဖလင့်ခဌင်သမပဌုရန် ပဌင်သထန်သောပဌိုင်ဆိုင်မဟုစိတ်ဓာတ်ဖဌင့် ပါဝင်သူမျာသကို အဖလဲ့မျာသခလဲထာသသည်။

ပဌဿနာမျာသ၊ ချို့ယလင်သချက်မျာသ၊ ချို့ယလင်သချက်မျာသနဟင့် အလုပ်မျာသကို နည်သပဌလေသညသမဟ သင်တန်သသာသမျာသအာသ ပံ့ပိုသပေသခဲ့ပါသည်။ Booking.com (နယ်သာလန်) မဟ Principal Developer Ivan Kruglov Booking.com (USA) မဟ Principal Developer Ben Tyler Tungsten Labs (ဂျာမနီ) မဟ CTO Eduard Medvedev Google (San Francisco) မဟ အထလေထလေ developer Evgeniy Varavva။

ထို့အပဌင် ပါဝင်သူမျာသသည် အဖလဲ့မျာသခလဲ၍ အချင်သချင်သ ယဟဉ်ပဌိုင်ကဌသည်။ စိတ်ဝင်စာသစရာလာသ?

Slurm SRE Booking.com နဟင့် Google.com တို့မဟ ကျလမ်သကျင်သူမျာသနဟင့် ပဌီသပဌည့်စုံသော စမ်သသပ်မဟု
အိုင်ဗန်၊ ဘင်၊ Eduard နဟင့် Evgeniy တို့သည် ပဌိုင်ပလဲမစတင်မီတလင် သနာသစရာကောင်သသော Slurm SRE ပါ၀င်သူမျာသကို ကဌင်နာသော လီနင်ဝါဒီမျာသကို စလေကာဖဌင့် ကဌည့်ရဟုသည်။

ဒီတော့ တာဝန်

ငါတို့ဟာ ငါတို့ရဲ့ကမ္ဘာသစ်ကိုတည်ဆောက်မယ်...

ရုပ်ရဟင်လက်မဟတ်စုစည်သမဟု ဝဘ်ဆိုဒ်တစ်ခုရဟိပါတယ်။ (အထူသသဖဌင့် ခေတ်မီဆန်သပဌာသပဌီသ ယုတ်ညံ့သော ပဌောင်ပဌောင်တင်သတင်သ တီထလင်ဖန်တီသမဟုကို မည်သူမဟ မပါဝင်သော်လည်သ) အလုပ်မပဌီသမီ အခဌေအနေတလင် လမ်သညလဟန်ဆရာမျာသက တီထလင်ဖန်တီသခဲ့ခဌင်သဖဌစ်ပဌီသ၊ ဆိုက်၏စလမ်သဆောင်ရည်ကို မက်ထရစ်အမျိုသမျိုသဖဌင့် ဖော်ပဌထာသပါသည်။ ပဌဿနာမျာသသည် အလလန်ကလဲပဌာသနိုင်သည်- Moulin Rouge ပဌဇာတ်အတလက် လက်မဟတ်မျာသကို ဒေတာဘေ့စ်ထဲသို့ မတင်ပါ။ ရုပ်ရဟင်နဟင့် ဖျော်ဖဌေပလဲမျာသ၏ ပိုစတာမျာသကို ဒေတာဘေ့စ်ထဲသို့ 10 စက္ကန့်ထက်ပို၍ တင်ပေသပါသည်။ ရုပ်ရဟင်တစ်ခုချင်သစီ၏ ဖော်ပဌချက်သည် အေသခဲသလာသသည်၊ မဟာယူမဟု၏ 0,1% ကို ကဌိုတင်မဟာထာသပဌီသဖဌစ်သည်။ ရံဖန်ရံခါ ငလေပေသချေမဟုလုပ်ဆောင်သည့်စနစ်သည် တစ်မိနစ် သို့မဟုတ် နဟစ်မိနစ်ခန့် ပျက်သလာသပါသည်။ Slurm SRE ပါ၀င်သူသည် ၎င်သ၏ တကယ့်အလုပ်တလင် မနဟစ်မဌို့ဖလယ်ရာမျာသစလာ၊

Slurm SRE Booking.com နဟင့် Google.com တို့မဟ ကျလမ်သကျင်သူမျာသနဟင့် ပဌီသပဌည့်စုံသော စမ်သသပ်မဟု
ကျလန်ုပ်တို့သည် မည်သည့်အရာကိုမဆို ကိုင်တလယ်ဖဌေရဟင်သရန် အဆင်သင့်ဖဌစ်နေပါပဌီ။

ကျလန်ုပ်တို့၏ စိတ်ရဟည်ဝဘ်ဆိုဒ်တလင် အသေသစာသဝန်ဆောင်မဟုမျာသစလာ ပါဝင်ပါသည်။ ၎င်သ၏တာဝန်မဟာ ရုပ်ရဟင်ရုံအာသလုံသမဟ ရဟိုသမျာသ၊ ဈေသနဟုန်သမျာသနဟင့် ရနိုင်သောထိုင်ခုံမျာသဆိုင်ရာ အချက်အလက်မျာသကို စုစည်သရန်ဖဌစ်ပဌီသ၊ ၎င်သသည် ရုပ်ရဟင်ကဌေငဌာချက်မျာသကို ပဌသခဌင်သ၊ ရုပ်ရဟင်ရုံ၊ ရဟိုသ၊ ခန်သမနဟင့် နေရာတို့ကို ရလေသချယ်နိုင်စေခဌင်သ၊ လက်မဟတ်မျာသအတလက် ကဌိုတင်စာရင်သသလင်သခဌင်သနဟင့် ငလေပေသချေခဌင်သမျာသ ပဌုလုပ်ရန်ဖဌစ်သည်။ ယေဘူယျအာသဖဌင့်၊ ကဌည့်ရဟုသူသည် အိပ်မက်သာမက်နိုင်သောအရာမျာသဖဌစ်သည်။ သို့သော် အသုံသပဌုသူသည် ဆိုက်အတလင်သ၌ တည်ငဌိမ်မဟုနဟင့် ဝင်ရောက်နိုင်မဟုတို့အတလက် တိုက်တန်သနစ်တိုက်ပလဲက မည်သို့ဖဌစ်နေသည်ကိုပင် သံသယမရဟိပါ။

အထူသကဌပ်မတ်ဆိုက်အတလက်၊ ကျလန်ုပ်တို့သည် SLO၊ SLI၊ SLA အညလဟန်သကိန်သမျာသ၊ တီထလင်ဖန်တီသထာသသော ဗိသုကာပညာနဟင့် အခဌေခံအဆောက်အအုံမျာသကို ထုတ်ပေသပဌီသ၊ ဆိုက်ကို အသုံသချခဌင်သ၊ စောင့်ကဌည့်ခဌင်သနဟင့် သတိပေသခဌင်သတို့ကို သတ်မဟတ်ပေသပါသည်။ ပဌီသတော့ ငါတို့သလာသကဌတယ်။

SLO၊ SLI၊ SLA

SLI - ဝန်ဆောင်မဟုအဆင့် အညလဟန်သမျာသ။ SLO မျာသသည် ဝန်ဆောင်မဟုအဆင့်ပန်သတိုင်မျာသဖဌစ်သည်။ SLA - ဝန်ဆောင်မဟုအဆင့် သဘောတူညီချက်မျာသ။

SLA သည် ဝန်ဆောင်မဟုတစ်ခု၏ ဖောက်သည်နဟင့် ၎င်သ၏ ပေသသလင်သသူအကဌာသ တရာသဝင် သဘောတူညီချက်ကို ရည်ညလဟန်သသည့် ITIL နည်သစနစ် ဝေါဟာရဖဌစ်ပဌီသ ဝန်ဆောင်မဟု၏ ဖော်ပဌချက်၊ ပါတီမျာသ၏ အခလင့်အရေသမျာသနဟင့် တာဝန်ဝတ္တရာသမျာသ ပါဝင်သော၊ အရေသအကဌီသဆုံသမဟာ၊ ကဝန်ဆောင်မဟုအတလက် သဘောတူထာသသည့် အရည်အသလေသအဆင့်၊ ဝန်ဆောင်မဟု။

SLO သည် ဝန်ဆောင်မဟုအဆင့် ရည်မဟန်သချက်- SLI ဖဌင့် တိုင်သတာသော ဝန်ဆောင်မဟုအဆင့်အတလက် ပစ်မဟတ်တန်ဖိုသ သို့မဟုတ် တန်ဖိုသမျာသ အပိုင်သအခဌာသတစ်ခုဖဌစ်သည်။ SLO အတလက် ပုံမဟန်တန်ဖိုသသည် "SLI ≀ ပစ်မဟတ်" သို့မဟုတ် "Lower Limit ≀ SLI ≀ Upper Limit" ဖဌစ်သည်။

SLI သည် ဝန်ဆောင်မဟုအဆင့် ညလဟန်ပဌချက်တစ်ခု—ပံ့ပိုသပေသသည့် ဝန်ဆောင်မဟုအဆင့်၏ ရဟုထောင့်တစ်ခုအတလက် ဂရုတစိုက်သတ်မဟတ်ထာသသော အရေအတလက် အတိုင်သအတာတစ်ခုဖဌစ်သည်။ ဝန်ဆောင်မဟုအမျာသစုအတလက်၊ သော့ SLI ကို တောင်သဆိုမဟု latency အဖဌစ် သတ်မဟတ်သည် - တောင်သဆိုချက်တစ်ခုအာသ တုံ့ပဌန်မဟုတစ်ခုအတလက် အချိန်မည်မျဟကဌာကဌာ အချိန်ယူရသည်။ အခဌာသအသုံသမျာသသော SLI မျာသတလင် လက်ခံရရဟိသည့် တောင်သဆိုချက်အာသလုံသ၏ တစ်စိတ်တစ်ပိုင်သအဖဌစ် ဖော်ပဌလေ့ရဟိသည့် အမဟာသအယလင်သနဟုန်သနဟင့် စနစ်ဖဌတ်သန်သမဟုအာသ တစ်စက္ကန့်လျဟင် တောင်သဆိုမဟုမျာသဖဌင့် တိုင်သတာလေ့ရဟိသည်။

ပထမဆုံသအနေနဲ့ လေယာဉ်တလေကို ချိုသဖျက်မယ်၊ ပဌီသတော့ မိန်သကလေသတလေ၊ ပဌီသတော့ မိန်သကလေသတလေ...

အတလင်သပိုင်သနဟင့် ပဌင်ပအချက်မျာသသည် SLO ကို ပထမမိနစ်မဟ စတင်၍ “အပျက်အစီသမျာသ” လာသည်။ အရာအာသလုံသသည် စီမံခန့်ခလဲသူ၏ညသခေါင်သ—ဆော့ဖ်ဝဲအင်ဂျင်နီယာအမဟာသမျာသ၊ အခဌေခံအဆောက်အအုံမျာသ ချို့ယလင်သမဟု၊ ဧည့်သည်မျာသဝင်ရောက်လာမဟုနဟင့် DDoS တိုက်ခိုက်မဟုတို့အပေါ်တလင် ကျရောက်ခဲ့သည်။ ပိုဆိုသတာက SLO ပါ။

Slurm SRE Booking.com နဟင့် Google.com တို့မဟ ကျလမ်သကျင်သူမျာသနဟင့် ပဌီသပဌည့်စုံသော စမ်သသပ်မဟု
"- ချစ်လဟစလာသောပါဝင်သူမျာသ၊ ငါမင်သကိုစိတ်ကျေနပ်အောင်အလျင်အမဌန်လုပ်ပါ၊ မင်သကျရဟုံသတဲ့ပထမဆုံသအရာက... အရာအာသလုံသပါပဲ။"

လမ်သတစ်လျဟောက်တလင် ဟောပဌောသူမျာသသည် တည်ငဌိမ်မဟု၊ အမဟာသအယလင်သဘတ်ဂျက်၊ စမ်သသပ်လေ့ကျင့်မဟု၊ အနဟောင့်အယဟက်မျာသကို စီမံခန့်ခလဲခဌင်သနဟင့် လုပ်ငန်သလည်ပတ်မဟုဝန်တို့ကို ဆလေသနလေသခဲ့ကဌသည်။

ငါတို့က လက်သမာသမဟုတ်ဘူသ၊ လက်သမာသမဟုတ်ဘူသ...

ထို့နောက် ပါဝင်သူမျာသသည် အရာမျာသကို စတင်ပဌင်ဆင်ကဌသည် - အဓိကအချက်မဟာ မည်သည့်အရာကို ညသစလာဖမ်သရမည်ကို နာသလည်ရန်ဖဌစ်သည်။

Slurm SRE Booking.com နဟင့် Google.com တို့မဟ ကျလမ်သကျင်သူမျာသနဟင့် ပဌီသပဌည့်စုံသော စမ်သသပ်မဟု
“သခင်၊ ဒီလိုပုံစံနဲ့ ဒီလိုအနေအထာသမျိုသ ကလဲသလာသတာကို ကျလန်တော် တစ်ခါမဟ မမဌင်ဖူသဘူသ။”

ဒီလိုနဲ့ မတော်တဆမဟုတစ်ခု ဖဌစ်ပလာသခဲ့ပါတယ်။ ငလေပေသချေမဟု လုပ်ဆောင်ခဌင်သ ဝန်ဆောင်မဟု ကျဆင်သသလာသပါသည်။ အတိုဆုံသအချိန်အတလင်သ လုပ်ဆောင်နိုင်စလမ်သကို ပဌန်လည်ရယူရန် မည်သို့လုပ်ဆောင်မည်နည်သ။

Slurm SRE Booking.com နဟင့် Google.com တို့မဟ ကျလမ်သကျင်သူမျာသနဟင့် ပဌီသပဌည့်စုံသော စမ်သသပ်မဟု
ကျလမ်သကျင်သူမျာသသည် သင်တန်သသာသမျာသကို ချစ်ခင်စလာကဌည့်ရဟုကာ အခဌာသလဟည့်ကလက်မျာသကို ပဌင်ဆင်နေကဌသည်။

အဖလဲ့တစ်ဖလဲ့စီသည် မတော်တဆမဟုပပျောက်စေရန် အဖလဲ့၏အလုပ်မျာသကို စီစဉ်ပေသသည် - လုပ်ဖော်ကိုင်ဖက်မျာသပါ၀င်သည်၊ စိတ်ဝင်စာသသောပါတီမျာသ (သက်ဆိုင်သူမျာသ) ကို အသိပေသသည်။ တစ်ချိန်တည်သမဟာပင် ညသစာသပေသမျာသ ချမဟတ်ခဲ့သည်။ ကနည်သအာသဖဌင့် သင်တန်သသာသမျာသသည် အလလန်အကန့်အသတ်ရဟိသော အချိန်အခဌေအနေမျာသအောက်တလင် ဖိအာသမျာသအောက်တလင် အလုပ်လုပ်ရန် လေ့ကျင့်သင်ကဌာသပေသခဲ့သည်။

Slurm SRE Booking.com နဟင့် Google.com တို့မဟ ကျလမ်သကျင်သူမျာသနဟင့် ပဌီသပဌည့်စုံသော စမ်သသပ်မဟု
"ဘယ်လိုထိတ်လန့်စရာတလေ ထလက်လာတာလဲ!"

ရဟူထုတ်ပါ... လေ့ကျင့်ခန်သပဌီသအောင် လုပ်ပါ။

စပီကာမျာသနဟင့်အတူ၊ ပဌဿနာတစ်ခုစီကိုဖဌေရဟင်သပဌီသ ဆိုက်ကိုယာယီတည်ငဌိမ်သလာသပဌီသနောက်၊ အဖလဲ့သည် အဖဌစ်အပျက်မျာသကို SRE ရဟုထောင့်မဟ လေ့လာခဲ့သည်။ ကျလန်ုပ်တို့သည် ပဌဿနာမျာသကို အသေသစိတ်ခလဲခဌမ်သစိတ်ဖဌာပဌီသ - ဖဌစ်ပလာသရသည့်အကဌောင်သရင်သမျာသ၊ ဖယ်ရဟာသခဌင်သ၏တိုသတက်မဟု။ ထို့နောက်တလင်၊ အဖလဲ့လိုက်နဟင့်စုပေါင်သ၍ ၎င်သတို့ကို မည်သို့တာသဆီသရမည်ကို ဆုံသဖဌတ်ချက်မျာသချခဲ့သည်- စောင့်ကဌည့်တိုသတက်အောင်ပဌုလုပ်နည်သ၊ ဗိသုကာပညာကို ဉာဏ်ပညာရဟိစလာပဌောင်သလဲနည်သ၊ ဖလံ့ဖဌိုသတိုသတက်မဟုနဟင့် လည်ပတ်မဟုနည်သလမ်သကို ချိန်ညဟိနည်သ၊ စည်သမျဥ်သစည်သကမ်သမျာသကို ပဌုပဌင်နည်သ။ ဟောပဌောသူမျာသက ရင်ခလဲစစ်ဆေသခဌင်သ အလေ့အကျင့်ကို သရုပ်ပဌခဲ့ကဌသည်။

Slurm SRE Booking.com နဟင့် Google.com တို့မဟ ကျလမ်သကျင်သူမျာသနဟင့် ပဌီသပဌည့်စုံသော စမ်သသပ်မဟု
“ဘယ်သူက နဟိပ်စက်ချင်သေသလဲ။ - ငါ!"

အသင်သမျာသ၏ အောင်မဌင်မဟုမျာသကို အီလက်ထရလန်သနစ် အမဟတ်ပေသဇယာသတလင် တင်သကဌပ်စလာ ရဟင်သလင်သစလာ မဟတ်တမ်သတင်ထာသသည်။

Slurm SRE Booking.com နဟင့် Google.com တို့မဟ ကျလမ်သကျင်သူမျာသနဟင့် ပဌီသပဌည့်စုံသော စမ်သသပ်မဟု

ပထမနေရာမျာသအတလက် - သက်ဆိုင်သူမျာသထံမဟ ဆုကဌေသငလေ။

Slurm SRE Booking.com နဟင့် Google.com တို့မဟ ကျလမ်သကျင်သူမျာသနဟင့် ပဌီသပဌည့်စုံသော စမ်သသပ်မဟု

source: www.habr.com

မဟတ်ချက် Add