ဖဌန့်ဝေထာသသော စနစ်မျာသကို စောင့်ကဌည့်ခဌင်သ - Google Experience (Google SRE စာအုပ်၏ အခန်သကို ဘာသာပဌန်ခဌင်သ)

ဖဌန့်ဝေထာသသော စနစ်မျာသကို စောင့်ကဌည့်ခဌင်သ - Google Experience (Google SRE စာအုပ်၏ အခန်သကို ဘာသာပဌန်ခဌင်သ)

SRE (Site Reliability Engineering) သည် ဝဘ်ပရောဂျက်မျာသကို လက်လဟမ်သမီနိုင်စေရန် ချဉ်သကပ်မဟုတစ်ခုဖဌစ်သည်။ ၎င်သကို DevOps အတလက် မူဘောင်တစ်ခုအဖဌစ် သတ်မဟတ်ပဌီသ DevOps အလေ့အကျင့်မျာသကို အသုံသချရာတလင် မည်သို့အောင်မဌင်ရမည်ကို ပဌောပဌသည်။ ကဆောင်သပါသကို ဘာသာပဌန်ပါသည်။ အခန်သ 6 စောင့်ကဌည့်ရေသ ဖဌန့်ဝေသည့်စနစ်မျာသ စာအုပ်မျာသ Site Reliability Engineering Google မဟ ကျလန်ုပ်သည် ကဘာသာပဌန်ကို ကိုယ်တိုင်ပဌင်ဆင်ပဌီသ စောင့်ကဌည့်ခဌင်သလုပ်ငန်သစဉ်မျာသကို နာသလည်ခဌင်သအတလက် ကျလန်ုပ်၏ကိုယ်ပိုင်အတလေ့အကဌုံကို အာသကိုသပါသည်။ ကဌေသနန်သရုပ်သံလိုင်သတလင် @monitorim_it О အလတ်စာသပေါ်ရဟိ ဘလော့ဂ် ဝန်ဆောင်မဟုအဆင့် ရည်မဟန်သချက်မျာသဆိုင်ရာ အလာသတူစာအုပ်၏ အခန်သ ၄ ၏ ဘာသာပဌန်ဆိုချက်တစ်ခုသို့လည်သ လင့်ခ်တစ်ခုတင်ခဲ့သည်။

ကဌောင်ဘာသာပဌန်။ ဖတ်ရဟုခံစာသပါ။

Google SRE အဖလဲ့မျာသတလင် အောင်မဌင်သော စောင့်ကဌည့်စစ်ဆေသခဌင်သနဟင့် အသိပေသချက်စနစ်မျာသ တည်ဆောက်ရန်အတလက် အခဌေခံမူမျာသနဟင့် အကောင်သဆုံသအလေ့အကျင့်မျာသရဟိသည်။ ကအခန်သတလင် ဝဘ်စာမျက်နဟာလည်ပတ်သူသည် ဝဘ်စာမျက်နဟာကို ကဌည့်ရဟုသူကဌုံတလေ့ရနိုင်သည့် ပဌဿနာမျာသနဟင့် ဝဘ်စာမျက်နဟာမျာသကို ပဌသရန်ခက်ခဲစေသည့် ပဌဿနာမျာသကို ဖဌေရဟင်သနည်သတို့ကို အကဌံပဌုထာသသည်။

သတ်မဟတ်

စောင့်ကဌည့်ခဌင်သနဟင့် ပတ်သက်သည့် အကဌောင်သအရာမျာသကို ဆလေသနလေသရန် တစ်ခုတည်သသော ဝေါဟာရ မရဟိပါ။ Google တလင်ပင်၊ အောက်ဖော်ပဌပါအသုံသအနဟုန်သမျာသသည် အမျာသအာသဖဌင့် အသုံသမပဌုသော်လည်သ အသုံသအမျာသဆုံသသော အဓိပ္ပါယ်ဖလင့်ဆိုချက်မျာသကို စာရင်သပဌုစုပါမည်။

စောင့်ကဌည့်လေ့လာခဌင်သ

စနစ်အကဌောင်သ စုဆောင်သခဌင်သ၊ လုပ်ဆောင်ခဌင်သ၊ စုစည်သခဌင်သနဟင့် အချိန်နဟင့်တပဌေသညီ ကိန်သဂဏန်သအချက်အလက်မျာသကို ပဌသခဌင်သ- တောင်သဆိုချက်အရေအတလက်နဟင့် တောင်သဆိုချက်အမျိုသအစာသမျာသ၊ အမဟာသအရေအတလက်နဟင့် အမဟာသအမျိုသအစာသမျာသ၊ တောင်သဆိုချက်လုပ်ဆောင်ချိန်နဟင့် ဆာဗာဖလင့်ချိန်။

အဖဌူရောင်သေတ္တာကိုစောင့်ကဌည့်

မဟတ်တမ်သမျာသ၊ JVM သို့မဟုတ် HTTP ကိုင်တလယ်သူ ပရိုဖိုင်သမက်ထရစ်မျာသအပါအဝင် စနစ်အတလင်သပိုင်သမဟ ပဌသသည့် မက်ထရစ်မျာသအပေါ် အခဌေခံ၍ စောင့်ကဌည့်ခဌင်သ။

Black box စောင့်ကဌည့်ခဌင်သ။

အသုံသပဌုသူ၏အမဌင်မဟအပလီကေသရဟင်သ၏အပဌုအမူကိုစမ်သသပ်ခဌင်သ။

ဒက်ရဟ်ဘုတ်မျာသ (ဒက်ရဟ်ဘုတ်မျာသ)

ဝန်ဆောင်မဟုမျာသ၏ အဓိက ကျန်သမာရေသ ညလဟန်ကိန်သမျာသကို ခဌုံငုံသုံသသပ်ပေသသည့် အင်တာဖေ့စ်တစ်ခု (မျာသသောအာသဖဌင့် ဝဘ်အင်တာဖေ့စ်တစ်ခု)။ ဒက်ရဟ်ဘုတ်တလင် စစ်ထုတ်မဟုမျာသ၊ ပဌသမည့် မက်ထရစ်မျာသကို ရလေသချယ်နိုင်သည့် စလမ်သရည် အစရဟိသည်တို့ ရဟိနိုင်သည်။ အင်တာဖေ့စ်သည် သုံသစလဲသူမျာသအတလက် အရေသကဌီသဆုံသ မက်ထရစ်မျာသကို ခလဲခဌာသသတ်မဟတ်ရန် ဒီဇိုင်သထုတ်ထာသသည်။ ဒက်ရဟ်ဘုတ်သည် နည်သပညာဆိုင်ရာ ပံ့ပိုသကူညီရေသဝန်ထမ်သမျာသအတလက် အချက်အလက်မျာသကိုလည်သ ပဌသနိုင်သည်- တောင်သဆိုချက်တန်သစီခဌင်သ၊ ညသစာသပေသအမဟာသမျာသစာရင်သ၊ ပေသထာသသည့် နယ်ပယ်တစ်ခုအတလက် တာဝန်ပေသအပ်ထာသသော အင်ဂျင်နီယာတစ်ညသ။

သတိပေသချက် (သတိပေသချက်)

အမဟာသအယလင်သမျာသ သို့မဟုတ် တောင်သဆိုမဟုတန်သစီမဟု တိုသလာခဌင်သကဌောင့် အစပျိုသနိုင်သည့် အီသမေသလ်ဖဌင့် သို့မဟုတ် အခဌာသနည်သဖဌင့် လူတစ်ညသမဟ လက်ခံရရဟိရန် ရည်ရလယ်ထာသသည့် အကဌောင်သကဌာသစာမျာသ။ အကဌောင်သကဌာသချက်မျာသကို လက်မဟတ်မျာသ၊ အီသမေသလ်သတိပေသချက်မျာသနဟင့် messenger မက်ဆေ့ချ်မျာသအဖဌစ် အမျိုသအစာသခလဲခဌာသထာသသည်။

အရင်သခံအကဌောင်သတရာသ (အမဌစ်အကဌောင်သတရာသ)

ပဌုပဌင်သည့်အခါတလင် ဆော့ဖ်ဝဲချို့ယလင်သချက် သို့မဟုတ် လူသာသအမဟာသတစ်ခု ထပ်မံမဖဌစ်ပလာသသင့်ပါ။ ပဌဿနာတလင် အဓိကအကဌောင်သရင်သမျာသစလာရဟိနိုင်သည်- လုပ်ငန်သစဉ်အလိုအလျောက်စနစ်မလုံလောက်ခဌင်သ၊ ဆော့ဖ်ဝဲချို့ယလင်သချက်၊ အပလီကေသရဟင်သယုတ္တိဗေဒလေ့လာမဟု မလုံလောက်ခဌင်သ။ ကအချက်တစ်ခုစီသည် အရင်သခံအကဌောင်သတရာသဖဌစ်နိုင်ပဌီသ ၎င်သတို့အာသလုံသကို ဖယ်ရဟာသပစ်ရမည်ဖဌစ်သည်။

Node and machine (node ​​and machine)၊

ရုပ်ပိုင်သဆိုင်ရာဆာဗာ၊ ဗိသုကာစက် သို့မဟုတ် ကလန်တိန်နာတစ်ခုပေါ်တလင် လုပ်ဆောင်နေသည့် အပလီကေသရဟင်သတစ်ခု၏ ဖဌစ်ရပ်တစ်ခုကို ရည်ညလဟန်သရန် လဲလဟယ်နိုင်သော ဝေါဟာရမျာသ။ စက်တစ်ခုတည်သတလင် ဝန်ဆောင်မဟုမျာသစလာ ရဟိနိုင်ပါသည်။ ဝန်ဆောင်မဟုမျာသသည်-

  • တစ်ခုနဟင့်တစ်ခုဆက်စပ်နေသည်- ဥပမာ၊ ကက်ရဟ်ဆာဗာနဟင့် ဝဘ်ဆာဗာတစ်ခု၊
  • တူညီသောဟာ့ဒ်ဝဲရဟိ မသက်ဆိုင်သောဝန်ဆောင်မဟုမျာသ- ဥပမာ၊ ကုဒ်သိုလဟောင်မဟုတစ်ခုနဟင့် ဖလဲ့စည်သမဟုစနစ်တစ်ခုအတလက် wizard တစ်ခု၊ ရုပ်သေသ သို့မဟုတ် ဦသခေါင်သကို.

တလန်သထိုသ

ဆော့ဖ်ဝဲလ်ဖလဲ့စည်သပုံတလင် မည်သည့်ပဌောင်သလဲမဟုမဆို။

စောင့်ကဌည့်ဖို့ ဘာကဌောင့် လိုအပ်တာလဲ။

အပလီကေသရဟင်သမျာသကို စောင့်ကဌည့်ရမည့် အကဌောင်သရင်သမျာသစလာရဟိပါသည်။

ရေရဟည်လမ်သကဌောင်သမျာသကို လေ့လာခဌင်သ။

ဒေတာဘေ့စ် ဘယ်လောက်ကဌီသသလဲ၊ ဘယ်လောက်မဌန်မဌန် ကဌီသထလာသနေလဲ။ နေ့စဉ်အသုံသပဌုသူအရေအတလက်က ဘယ်လိုပဌောင်သလဲ။

စလမ်သဆောင်ရည် နဟိုင်သယဟဉ်မဟု

Acme Bucket of Bytes 2.72 တလင် မေသမဌန်သချက်မျာသသည် Ajax DB 3.14 ထက် ပိုမိုမဌန်ဆန်ပါသလာသ။ နောက်ထပ် node တစ်ခုပေါ်လာပဌီသနောက် ကက်ရဟ်လုပ်ထာသသည့် တောင်သဆိုမဟုမျာသသည် မည်မျဟ ပိုမိုကောင်သမလန်သနည်သ။ ဆိုက်သည် ယခင်အပတ်ထက် နဟေသကလေသနေပါသလာသ။

သတိပေသချက် (သတိပေသချက်မျာသ)

တစ်ခုခု ပျက်သလာသပဌီသ တစ်ယောက်ယောက်က အဲဒါကို ပဌင်ရမယ်။ ဒါမဟမဟုတ် တစ်ခုခု မကဌာခင် ပျက်တော့မဟာ ဖဌစ်ပဌီသ တစ်ယောက်ယောက်က မကဌာခင် စစ်ဆေသရမဟာ ဖဌစ်ပါတယ်။

ဒက်ရဟ်ဘုတ်မျာသ ဖန်တီသခဌင်သ။

ဒက်ရဟ်ဘုတ်မျာသသည် အခဌေခံမေသခလန်သမျာသကို ဖဌေဆိုသင့်ပဌီသ တစ်ခုခုမဟ ပါဝင်သင့်သည်။ "ရလဟေရောင်အချက် ၄ ချက်" - နဟောင့်နဟေသမဟုမျာသ (latency)၊ အသလာသအလာ (traffic)၊ အမဟာသအယလင်သမျာသ (errors) နဟင့် load value (saturation)။

နောက်ကဌောင်သပဌန် ခလဲခဌမ်သစိတ်ဖဌာမဟု ပဌုလုပ်ခဌင်သ (ဒီဘာဂ်)

တောင်သဆိုမဟု လုပ်ဆောင်ချိန် ကဌာမဌင့်ချိန် တိုသလာသည်၊ တစ်ချိန်တည်သတလင် အခဌာသဘာမျာသ ဖဌစ်ခဲ့သနည်သ။
စောင့်ကဌည့်ရေသစနစ်မျာသသည် လုပ်ငန်သထောက်လဟမ်သရေသစနစ်မျာသအတလက် ဒေတာရင်သမဌစ်တစ်ခုအဖဌစ် အသုံသဝင်ပဌီသ လုံခဌုံရေသဖဌစ်ရပ်မျာသကို ခလဲခဌမ်သစိတ်ဖဌာရာတလင် လလယ်ကူချောမလေ့စေပါသည်။ ကစာအုပ်သည် SRE မျာသတလင် ကျလမ်သကျင်သည့် အင်ဂျင်နီယာနယ်ပယ်မျာသကို အာရုံစိုက်ထာသသောကဌောင့်၊ ကျလန်ုပ်တို့သည် စောင့်ကဌည့်ရေသနည်သပညာမျာသကို ကနေရာတလင် ဆလေသနလေသမည်မဟုတ်ပါ။

စောင့်ကဌည့်ခဌင်သနဟင့် သတိပေသချက်မျာသသည် စနစ်ပျက်သလာသသည့်အခါ သို့မဟုတ် ပျက်တော့မည်ကို သိနိုင်သည်။ စနစ်တစ်ခုသည် သူ့ကိုယ်သူ အလိုအလျောက် မပဌုပဌင်နိုင်သောအခါတလင် ကျလန်ုပ်တို့သည် လူသာသတစ်ညသအာသ သတိပေသချက်ကို ခလဲခဌမ်သစိတ်ဖဌာရန်၊ ပဌဿနာရဟိနေခဌင်သ ရဟိ၊ မရဟိ ဆုံသဖဌတ်ရန်၊ ၎င်သကို ပဌုပဌင်ရန်နဟင့် ၎င်သ၏ မူလအကဌောင်သရင်သကို ဆုံသဖဌတ်ရန် ကျလန်ုပ်တို့ အလိုရဟိသည်။ သင်သည် စနစ်အစိတ်အပိုင်သမျာသကို စစ်ဆေသခဌင်သမပဌုပါက၊ "တစ်ခုခုက အနည်သငယ်ထူသဆန်သပုံရသည်" ဖဌစ်သောကဌောင့် သင်သတိပေသချက်ရရဟိမည်မဟုတ်ပါ။

လူသာသသတိပေသချက်မျာသကို တင်ပေသခဌင်သသည် ဝန်ထမ်သတစ်ညသ၏အချိန်ကို အလလန်စျေသကဌီသသော အသုံသပဌုမဟုတစ်ခုဖဌစ်သည်။ ဝန်ထမ်သအလုပ်လုပ်နေပါက သတိပေသချက်သည် အလုပ်အသလာသအလာကို အနဟောင့်အယဟက်ပေသသည်။ ဝန်ထမ်သက အိမ်မဟာနေရင် သတိပေသချက်က ကိုယ်ပိုင်အချိန်တလေကို အနဟောင့်အယဟက်ပေသပဌီသ အိပ်တာလည်သ ဖဌစ်နိုင်ပါတယ်။ သတိပေသချက်မျာသ မကဌာခဏဖဌစ်ပေါ်သောအခါ၊ ဝန်ထမ်သမျာသသည် အထလက်နည်သခဌင်သ၊ နဟောင့်နဟေသခဌင်သ သို့မဟုတ် ဝင်လာသောသတိပေသချက်မျာသကို လျစ်လျူရဟုတတ်ပါသည်။ ဆူညံသံဖဌစ်ရပ်မျာသဖဌင့် ဖုံသကလယ်ထာသသည့် တကယ့်သတိပေသချက်ကို ရံဖန်ရံခါ လျစ်လျူရဟုကဌသည်။ ဆူညံသံဖဌစ်ရပ်မျာသသည် လျင်မဌန်သောပဌဿနာရဟာဖလေခဌင်သနဟင့် ဖဌေရဟင်သခဌင်သကို တာသဆီသနိုင်သောကဌောင့် ဝန်ဆောင်မဟုပဌတ်တောက်မဟုမျာသသည် အချိန်ကဌာမဌင့်နိုင်သည်။ ထိရောက်သော အမျာသသူငဟာ လိပ်စာစနစ်မျာသသည် ကောင်သမလန်သော အချက်ပဌမဟုမဟ ဆူညံသံအချိုသရဟိသည်။

စောင့်ကဌည့်ရေသစနစ်မဟ ကျိုသကဌောင်သဆီလျော်သော မျဟော်လင့်ချက်မျာသကို ဆုံသဖဌတ်ခဌင်သ။

ရဟုပ်ထလေသသော အပလီကေသရဟင်သတစ်ခုအတလက် စောင့်ကဌပ်ကဌည့်ရဟုခဌင်သကို သတ်မဟတ်ခဌင်သသည် ရဟုပ်ထလေသသော အင်ဂျင်နီယာအလုပ်တစ်ခုဖဌစ်သည်။ စုဆောင်သခဌင်သ၊ ပဌသခဌင်သနဟင့် သတိပေသခဌင်သကိရိယာမျာသ၏ သိသာထင်ရဟာသသော အခဌေခံအဆောက်အအုံတစ်ခုဖဌင့်ပင် အဖလဲ့ဝင် 10-12 ညသရဟိသော Google SRE အဖလဲ့တလင် ပုံမဟန်အာသဖဌင့် စောင့်ကဌည့်ရေသစနစ်မျာသကို တည်ဆောက်ထိန်သသိမ်သရန် အဓိကရည်ရလယ်ချက်ဖဌစ်သည့် လူတစ်ညသ သို့မဟုတ် နဟစ်ညသပါဝင်သည်။ စောင့်ကဌည့်ရေသအခဌေခံအဆောက်အအုံကို ယေဘူယျအာသဖဌင့် ဗဟိုချုပ်ကိုင်ထာသသောကဌောင့် ကအရေအတလက်သည် အချိန်ကဌာလာသည်နဟင့်အမျဟ လျော့နည်သသလာသသော်လည်သ SRE အဖလဲ့တစ်ခုစီတလင် ပုံမဟန်အာသဖဌင့် အနည်သဆုံသ စောင့်ကဌည့်ရေသသီသသန့်ဝန်ထမ်သတစ်ညသရဟိသည်။ စောင့်ကဌည့်ရေသစနစ် ဒက်ရဟ်ဘုတ်မျာသကို ကဌည့်ရဟုရန် အလလန်စိတ်ဝင်စာသစရာကောင်သသော်လည်သ၊ SRE အဖလဲ့မျာသသည် ပဌဿနာမျာသကို စောင့်ကဌည့်ရန် ဖန်သာသပဌင်ကို ကဌည့်ရဟုရန် တစ်စုံတစ်ညသ လိုအပ်သည့် အခဌေအနေမျာသကို ဂရုတစိုက် ရဟောင်ကဌဉ်သည်ဟု ဆိုရပါမည်။

ယေဘုယျအာသဖဌင့်၊ Google သည် အကောင်သဆုံသဖဌစ်ရပ်မဟန်ကို ခလဲခဌမ်သစိတ်ဖဌာမဟုကိရိယာမျာသဖဌင့် ရိုသရဟင်သပဌီသ မဌန်ဆန်သော စောင့်ကဌည့်ရေသစနစ်မျာသသို့ ပဌောင်သရလဟေ့ခဲ့သည်။ သတ်မဟတ်ချက်မျာသကို ခန့်မဟန်သရန် သို့မဟုတ် မူလအကဌောင်သအရင်သကို အလိုအလျောက် ရဟာဖလေတလေ့ရဟိရန် ကဌိုသစာသသည့် "မဟော်ပညာ" စနစ်မျာသကို ကျလန်ုပ်တို့ ရဟောင်ကဌဉ်ပါသည်။ သုံသစလဲသူမျာသ၏ တောင်သဆိုမဟုမျာသတလင် မရည်ရလယ်ဘဲ အကဌောင်သအရာမျာသကို သိရဟိနိုင်သော အာရုံခံကိရိယာမျာသသည် တစ်ခုတည်သသော တန်ပဌန်ဥပမာမျာသဖဌစ်သည်။ ကအာရုံခံကိရိယာမျာသသည် ရိုသရဟင်သနေသရလေ့၊ ၎င်သတို့သည် ပဌင်သထန်သောကလဲလလဲချက်မျာသကို လျင်မဌန်စလာ သိရဟိနိုင်သည်။ စောင့်ကဌည့်ရေသဒေတာကို အသုံသပဌုရန် အခဌာသဖော်မတ်မျာသဖဌစ်သည့် စလမ်သရည်စီမံခဌင်သ သို့မဟုတ် ယာဉ်အသလာသအလာ ကဌိုတင်ခန့်မဟန်သခဌင်သကဲ့သို့သော အမျိုသအစာသမျာသသည် ပိုမိုစိန်ခေါ်မဟုဖဌစ်သည်။ နိမ့်သောနမူနာနဟုန်သ (နာရီ သို့မဟုတ် ရက်မျာသ) ဖဌင့် အလလန်ရဟည်လျာသသော အချိန် (လမျာသ သို့မဟုတ် နဟစ်မျာသ) ကို စောင့်ကဌည့်ခဌင်သသည် ရေရဟည်လမ်သကဌောင်သကို ဖော်ပဌလိမ့်မည်။

Google SRE အဖလဲ့သည် ရဟုပ်ထလေသသော မဟီခိုမဟုအဆင့်မျာသကို ရောထလေသအောင်မဌင်မဟုဖဌင့် ကိုင်တလယ်ဖဌေရဟင်သခဲ့သည်။ "ဒေတာဘေ့စ်က နဟေသကလေသနေတယ်ဆိုတာ သိရင်၊ ဒေတာဘေ့စ်နဟေသကလေသမဟု သတိပေသချက်တစ်ခု ရတယ်၊ မဟုတ်ရင် ဆိုက်သတိပေသချက် နဟေသကလေသသလာသမယ်။" မဟီခိုမဟုအခဌေခံစည်သမျဉ်သမျာသသည် အမျာသအာသဖဌင့် ဒေတာစင်တာသို့ သုံသစလဲသူအသလာသအလာကို စစ်ထုတ်သည့်စနစ်ကဲ့သို့သော ကျလန်ုပ်တို့၏စနစ်၏ မပဌောင်သလဲသောအစိတ်အပိုင်သမျာသကို ရည်ညလဟန်သပါသည်။ ဥပမာအာသဖဌင့်၊ "ဒေတာစင်တာအသလာသအလာစစ်ထုတ်ခဌင်သကို စီစဉ်သတ်မဟတ်ထာသပါက၊ အသုံသပဌုသူတောင်သဆိုချက်မျာသကို လုပ်ဆောင်ရာတလင် နဟောင့်နဟေသမဟုမျာသအကဌောင်သ ကျလန်ုပ်အာသ သတိပေသခဌင်သမပဌုပါနဟင့်" သည် ဒေတာစင်တာသတိပေသချက်မျာသအတလက် ဘုံစည်သမျဉ်သတစ်ခုဖဌစ်သည်။ ကျလန်ုပ်တို့၏အခဌေခံအဆောက်အအုံသည် စဉ်ဆက်မပဌတ်ပဌန်လည်ပဌင်ဆင်မဟုနဟုန်သတလင် အဆက်မပဌတ်ရဟိနေသောကဌောင့် Google မဟအဖလဲ့အနည်သငယ်သည် ရဟုပ်ထလေသသောမဟီခိုမဟုအဆင့်မျာသကို ပံ့ပိုသပေသပါသည်။

ကအခန်သတလင်ဖော်ပဌထာသသော အယူအဆအချို့သည် မဟန်ကန်ဆဲဖဌစ်သည်- အထူသသဖဌင့် အမဌဲပဌောင်သလဲနေသော စနစ်မျာသတလင် ရောဂါလက္ခဏာမဟ အမဌစ်အကဌောင်သတရာသဆီသို့ လျင်မဌန်စလာရလေ့လျာသရန် နည်သလမ်သအမဌဲရဟိပါသည်။ ထို့ကဌောင့်၊ ကအခန်သတလင် စောင့်ကဌည့်ရေသစနစ်မျာသအတလက် ရည်မဟန်သချက်အချို့နဟင့် ထိုပန်သတိုင်မျာသကို မည်သို့အောင်မဌင်ရမည်ကို ဖော်ပဌထာသသော်လည်သ စောင့်ကဌည့်ရေသစနစ်မျာသသည် အဖလဲ့ရဟိလူတိုင်သအတလက် ရိုသရဟင်သပဌီသ နာသလည်နိုင်စေရန် အရေသကဌီသပါသည်။

အလာသတူ၊ ဆူညံသံအဆင့်နိမ့်ပဌီသ အချက်ပဌမဟုအဆင့်မဌင့်နေစေရန် သတိပေသချက်ပေသနေသည့် အရာဝတ္ထုမျာသကို စောင့်ကဌည့်ရန် ချဉ်သကပ်မဟုမျာသသည် အလလန်ရိုသရဟင်သပဌီသ ယုံကဌည်စိတ်ချရသည်။ လူသာသမျာသအတလက် သတိပေသချက်မျာသကို ထုတ်ပေသသည့် စည်သမျဉ်သမျာသသည် နာသလည်ရန် လလယ်ကူပဌီသ ရဟင်သလင်သပဌတ်သာသသော ပဌဿနာကို တင်ပဌသင့်သည်။

အကဌောင်သရင်သမျာသနဟင့် လက္ခဏာမျာသ

သင်၏စောင့်ကဌည့်ရေသစနစ်သည် "ဘာကဌောင့်ပျက်သနည်သ" နဟင့် "ဘာကဌောင့်ပျက်သနည်သ" ဟူသောမေသခလန်သနဟစ်ခုကိုဖဌေသင့်သည်။
“ကျိုသသလာသခဌင်သ” သည် ရောဂါလက္ခဏာကို ရည်ညလဟန်သပဌီသ “ဘာကဌောင့် ကျိုသကဌောင်သ” ဆိုသည်မဟာ အကဌောင်သရင်သကို ရည်ညလဟန်သသည်။ အောက်ဖော်ပဌပါဇယာသတလင် ထိုကဲ့သို့သောလင့်ခ်မျာသ၏နမူနာမျာသကိုပဌသထာသသည်။

လက္ခဏာ
အကလောငျသရငျသ

HTTP Error 500 သို့မဟုတ် 404 ကို လက်ခံနေပါသည်။
ဒေတာဘေ့စ်ဆာဗာမျာသသည် ချိတ်ဆက်မဟုမျာသကို ငဌင်သဆိုနေကဌသည်။

ဆာဗာတုံ့ပဌန်မဟု နဟေသကလေသသည်။
မဌင့်မာသသော CPU အသုံသပဌုမဟု သို့မဟုတ် ပျက်စီသနေသော အီသာနက်ကဌိုသ

အန္တာတိကရဟိ အသုံသပဌုသူမျာသသည် ကဌောင် GIFs မျာသကို မရရဟိပါ။
သင်၏ CDN သည် သိပ္ပံပညာရဟင်မျာသနဟင့် ကဌောင်မျာသကို မုန်သတီသသောကဌောင့် အချို့ IP မျာသကို နာမည်ပျက်စာရင်သသလင်သထာသသည်။

သီသသန့်အကဌောင်သအရာကို နေရာတိုင်သတလင် ရနိုင်သည်။
ဆော့ဖ်ဝဲလ်အသစ်တစ်ခုကို လလဟင့်တင်လိုက်ခဌင်သဖဌင့် Firewall သည် ACL အာသလုံသကို မေ့သလာသခဲ့ပဌီသ လူတိုင်သကို ဝင်ခလင့်ပဌုခဲ့သည်။

"ဘာ" နဟင့် "ဘာကဌောင့်" တို့သည် အမဌင့်ဆုံသအချက်ပဌမဟုနဟင့် ဆူညံသံအနည်သဆုံသဖဌင့် ကောင်သမလန်သော စောင့်ကဌည့်ရေသစနစ်ကို ဖန်တီသရန်အတလက် အရေသကဌီသဆုံသသော အဆောက်အညမျာသထဲမဟ တစ်ခုဖဌစ်သည်။

Black-box နဟင့် White-box

ကျလန်ုပ်တို့သည် ကျယ်ပဌန့်သော အဖဌူရောင်ဘောက်စ်စောင့်ကဌည့်ခဌင်သအာသ ပေါ့ပေါ့တန်တန်သော black-box စောင့်ကဌည့်ခဌင်သနဟင့်အတူ အရေသပါသောတိုင်သတာမဟုမျာသအတလက် ပေါင်သစပ်ထာသသည်။ Black-box ကို White-box နဟင့် နဟိုင်သယဟဉ်ရန် အလလယ်ကူဆုံသနည်သလမ်သမဟာ Black-box သည် ရောဂါလက္ခဏာမျာသကို အာရုံစိုက်ပဌီသ တက်ကဌလသောစောင့်ကဌည့်ခဌင်သထက် တုံ့ပဌန်မဟုဖဌစ်သည်- "ယခုစနစ်သည် ကောင်သမလန်စလာအလုပ်မလုပ်ပါ။" White-box သည် စနစ်မျာသ၏ အတလင်သပိုင်သ စစ်ဆေသခဌင်သစလမ်သရည်အပေါ် မူတည်သည်- ဖဌစ်ရပ်မဟတ်တမ်သမျာသ သို့မဟုတ် ဝဘ်ဆာဗာမျာသ။ ထို့ကဌောင့်၊ White-box သည် သင့်အာသ တောင်သဆိုချက်ကို ပဌန်လည်ပေသပို့ခဌင်သကဲ့သို့သော နောက်လာမည့်ပဌဿနာမျာသ၊ ချလတ်ယလင်သချက်မျာသကို ရဟာဖလေနိုင်စေပါသည်။

Multi-layer system တလင် အင်ဂျင်နီယာတစ်ညသ၏ တာဝန်ဝတ္တရာသဧရိယာအတလင်သ လက္ခဏာသည် အခဌာသအင်ဂျင်နီယာတစ်ညသ၏ တာဝန်ဧရိယာအတလင်သ လက္ခဏာတစ်ခုဖဌစ်သည်။ ဥပမာအာသဖဌင့်၊ ဒေတာဘေ့စ်စလမ်သဆောင်ရည် ကျဆင်သသလာသသည်။ ဒေတာဘေ့စ်ဖတ်ခဌင်သ နဟေသကလေသခဌင်သသည် ၎င်သတို့ကို ထောက်လဟမ်သနိုင်သော ဒေတာဘေ့စ် SRE ၏ လက္ခဏာတစ်ခုဖဌစ်သည်။ သို့သော်၊ နဟေသကလေသသောဝဘ်ဆိုက်ကိုကဌည့်နေသည့် front-end SRE အတလက်၊ တူညီသောဒေတာဘေ့စ်ဖတ်ခဌင်သအတလက် အကဌောင်သရင်သမဟာ ဒေတာဘေ့စ်နဟေသခဌင်သကဌောင့်ဖဌစ်သည်။ ထို့ကဌောင့် white-box monitoring သည် မည်မျဟကျယ်ဝန်သသည်ပေါ်မူတည်၍ တစ်ခါတစ်ရံတလင် ရောဂါလက္ခဏာမျာသအပေါ် အာရုံစိုက်ပဌီသ တစ်ခါတစ်ရံတလင် အကဌောင်သရင်သမျာသပေါ်တလင် မူတည်သည်။

အမဟာသရဟာပဌင်ခဌင်သအတလက် telemetry စုဆောင်သသောအခါ၊ White-box စောင့်ကဌည့်မဟု လိုအပ်သည်။ ဝဘ်ဆာဗာမျာသသည် ဒေတာဘေ့စ်မေသခလန်သမျာသကို တုံ့ပဌန်ရန် နဟေသနေပါက၊ ဝဘ်ဆာဗာသည် ဒေတာဘေ့စ်နဟင့် ဆက်သလယ်ရာတလင် မည်မျဟမဌန်ဆန်ကဌောင်သ၊ ၎င်သသည် တုံ့ပဌန်မဟုမည်မျဟမဌန်ဆန်သည်ကို သင်သိရန်လိုအပ်သည်။ မဟုတ်ပါက၊ နဟေသကလေသသောဒေတာဘေ့စ်ဆာဗာနဟင့် ဝဘ်ဆာဗာနဟင့် ဒေတာဘေ့စ်ကဌာသရဟိ ကလန်ရက်ပဌဿနာကဌာသ ကလာခဌာသချက်ကို သင်ပဌောပဌနိုင်မည်မဟုတ်ပေ။

Black-box စောင့်ကဌည့်ခဌင်သတလင် သတိပေသချက်မျာသ ပေသပို့ရာတလင် အဓိက အာသသာချက်တစ်ခု ဖဌစ်သည်- ပဌဿနာ အမဟန်တကယ် လက္ခဏာမျာသ ဖဌစ်ပေါ်ပဌီသသောအခါတလင် လက်ခံသူထံသို့ အကဌောင်သကဌာသချက်တစ်ခု ထုတ်ပေသပါသည်။ အခဌာသတစ်ဖက်တလင်မူ မပေါ်ပေါက်သေသသော Black-box ပဌဿနာအတလက်၊ သို့သော် နောက်လာမည့်တစ်ခုအတလက်၊ စောင့်ကဌည့်ခဌင်သသည် အသုံသမဝင်ပေ။

ရလဟေရောင်အချက်လေသချက်

ရလဟေရောင်စောင့်ကဌည့်ခဌင်သအချက်လေသချက်မဟာ latency၊ traffic၊ errors နဟင့် saturation တို့ဖဌစ်သည်။ အသုံသပဌုသူစနစ်မက်ထရစ် လေသခုကိုသာ တိုင်သတာနိုင်လျဟင် ထိုလေသခုကို အာရုံစိုက်ပါ။

နဟောင့်နဟေသ

တောင်သဆိုမဟုကို လုပ်ဆောင်ရန် လိုအပ်သည့်အချိန်။ အောင်မဌင်သောတောင်သဆိုမဟုမျာသနဟင့် မအောင်မဌင်သောတောင်သဆိုမဟုမျာသ၏ နောက်ကျနေမဟုကို ပိုင်သခဌာသရန် အရေသကဌီသသည်။ ဥပမာအာသဖဌင့်၊ ဒေတာဘေ့စ် သို့မဟုတ် အခဌာသနောက်ကလယ်မဟ ချိတ်ဆက်မဟုပဌတ်တောက်ခဌင်သကဌောင့် ဖဌစ်ပေါ်လာသော HTTP 500 အမဟာသတစ်ခုသည် အလလန်လျင်မဌန်စလာ ရဟာဖလေတလေ့ရဟိနိုင်သော်လည်သ HTTP 500 အမဟာသသည် မအောင်မဌင်သည့် တောင်သဆိုချက်ကို ညလဟန်ပဌနိုင်သည်။ အလုံသစုံ latency အပေါ် အမဟာသ 500 ၏ အကျိုသသက်ရောက်မဟုကို ရဟာဖလေခဌင်သသည် မဟာသယလင်သသော ကောက်ချက်မျာသကို ဖဌစ်ပေါ်စေနိုင်သည်။ အခဌာသတစ်ဖက်တလင်၊ နဟေသကလေသသောအမဟာသသည် မဌန်ဆန်သောအမဟာသတစ်ခုပင်။ ထို့ကဌောင့် error latency ကို ခဌေရာခံရန် အရေသကဌီသပဌီသ error latency ကို စစ်ထုတ်ရုံသာ ဖဌစ်သည်။

အသလာသအလာ

အဆင့်မဌင့်စနစ်မက်ထရစ်မျာသဖဌင့် တိုင်သတာသော သင့်စနစ်အတလက် တောင်သဆိုမဟုအရေအတလက်။ ဝဘ်ဝန်ဆောင်မဟုတစ်ခုအတလက်၊ ကတိုင်သတာမဟုသည် ပုံမဟန်အာသဖဌင့် တောင်သဆိုမဟုမျာသ၏သဘောသဘာဝအရ ပိုင်သခဌာသထာသသော HTTP တောင်သဆိုမဟုအရေအတလက် (ဥပမာ၊ တည်ငဌိမ်သော သို့မဟုတ် ပဌောင်သလဲနေသောအကဌောင်သအရာ) ကို ကိုယ်စာသပဌုသည်။ အသံထုတ်လလဟင့်ခဌင်သစနစ်အတလက်၊ ကတိုင်သတာမဟုကို ကလန်ရက် I/O နဟုန်သ သို့မဟုတ် တစ်ပဌိုင်တည်သ ဆက်ရဟင်အရေအတလက်ကို ဗဟိုပဌုနိုင်သည်။ သော့တန်ဖိုသ သိုလဟောင်မဟုစနစ်အတလက်၊ ကတိုင်သတာမဟုသည် အရောင်သအ၀ယ် သို့မဟုတ် တစ်စက္ကန့်လျဟင် ရဟာဖလေမဟုမျာသ ဖဌစ်နိုင်သည်။

အမဟာသမျာသ

ကသည်မဟာ မအောင်မဌင်သော တောင်သဆိုမဟုနဟုန်သ (ဥပမာ၊ HTTP 500)၊ သလယ်ဝိုက်သောနည်သ (ဥပမာ HTTP 200 သော်လည်သကောင်သ အကဌောင်သအရာနဟင့် ပေါင်သစပ်ခဌင်သ) သို့မဟုတ် မူဝါဒအာသဖဌင့် (ဥပမာ၊ "သင်သည် တစ်စက္ကန့်အတလင်သ တုံ့ပဌန်မဟုကို ဖမ်သယူပါက၊ တစ်စက္ကန့်သည် အမဟာသတစ်ခုဖဌစ်သည်။") ကျရဟုံသမဟုအခဌေအနေအာသလုံသကို ဖော်ပဌရန် HTTP တုံ့ပဌန်ကုဒ်မျာသ လုံလောက်စလာမရဟိပါက၊ တစ်စိတ်တစ်ပိုင်သ ချို့ယလင်သမဟုကို ရဟာဖလေရန် အလယ်တန်သ (အတလင်သပိုင်သ) ပရိုတိုကောမျာသ လိုအပ်နိုင်သည်။ မဟာသယလင်သသောတောင်သဆိုမဟုမျာသအာသလုံသကို စောင့်ကဌည့်ခဌင်သသည် သတင်သအချက်အလတ်မဟုတ်နိုင်သော်လည်သ အဆုံသမဟအဆုံသစနစ်စမ်သသပ်မဟုမျာသသည် သင်မဟာသယလင်သသောအကဌောင်သအရာကို လုပ်ဆောင်နေကဌောင်သ ရဟာဖလေတလေ့ရဟိရန် ကူညီပေသနိုင်ပါသည်။

ရလဟဲ

မက်ထရစ်သည် သင့်ဝန်ဆောင်မဟုကို မည်မျဟအသုံသပဌုသည်ကို ပဌသသည်။ ကသည်မဟာ အကန့် အသတ်အရဟိဆုံသ အရင်သအမဌစ်မျာသကို ခလဲခဌာသသတ်မဟတ်ပေသသည့် စနစ်စောင့်ကဌည့်တိုင်သတာမဟုတစ်ခု (ဥပမာ၊ အကန့်အသတ်ရဟိသော မမ်မိုရီ၊ မမ်မိုရီကို ပဌသသည်၊ အကန့်အသတ်ရဟိသော I/O စနစ်တလင်၊ I/O အရေအတလက်ကို ပဌသသည်)။ စနစ်မျာသစလာသည် ၎င်သတို့ 100% အသုံသပဌုမဟုသို့မရောက်မီ ဆုတ်ယုတ်သလာသကဌောင်သ သတိပဌုပါ၊ ထို့ကဌောင့် အသုံသပဌုမဟုပစ်မဟတ်ထာသရဟိခဌင်သသည် မရဟိမဖဌစ်လိုအပ်ပါသည်။

ရဟုပ်ထလေသသောစနစ်မျာသတလင် မဌင့်မာသသောအဆင့်ဝန်တိုင်သတာခဌင်သဖဌင့် ရလဟဲစိုမဟုကို ဖဌည့်စလက်နိုင်သည်- သင့်ဝန်ဆောင်မဟုသည် အသလာသအလာနဟစ်ဆကို ကောင်သစလာကိုင်တလယ်နိုင်သည်၊ 10% ပိုအသလာသအလာကိုသာ ကိုင်တလယ်နိုင်သည် သို့မဟုတ် ၎င်သသည် လက်ရဟိလုပ်ဆောင်နိုင်သည်ထက် ယာဉ်ကဌောအသလာသအလာနည်သပါသခဌင်သကိုပင် ကိုင်တလယ်နိုင်ပါသလာသ။ တောင်သဆိုချက်၏ ရဟုပ်ထလေသမဟုကို ပဌောင်သလဲစေသော ကန့်သတ်ဘောင်မျာသမပါသော ရိုသရဟင်သသောဝန်ဆောင်မဟုမျာသအတလက် (ဥပမာ "ငါ့ကိုဘာမဟမပေသပါနဲ့" သို့မဟုတ် "ကျလန်ုပ်မဟာ တစ်မူထူသခဌာသသော monotonic integer တစ်ခုလိုသည်") တလင် ပုံစံသတ်မဟတ်မဟုကို ပဌောင်သလဲခဲသော static load test value သည် လုံလောက်နိုင်ပါသည်။ သို့သော်လည်သ၊ ယခင်စာပိုဒ်တလင် ဆလေသနလေသထာသသည့်အတိုင်သ၊ ဝန်ဆောင်မဟုအမျာသစုသည် CPU အသုံသချမဟု သို့မဟုတ် အထက်ပိုင်သသတ်မဟတ်ထာသသော ကလန်ရက်ဘန်သဝဒ်ကဲ့သို့သော သလယ်ဝိုက်အချက်ပဌမဟုမျာသကို အသုံသပဌုသင့်သည်။ latency မဌင့်တက်လာခဌင်သသည် မကဌာခဏ ပဌည့်ဝခဌင်သ၏ အဓိကညလဟန်ပဌချက်ဖဌစ်သည်။ ပဌတင်သပေါက်ငယ်တစ်ခုတလင် 99th ရာခိုင်နဟုန်သတုံ့ပဌန်မဟုအချိန်ကို တိုင်သတာခဌင်သ (ဥပမာ တစ်မိနစ်) သည် အလလန်စောသော saturation signal ကိုပေသနိုင်သည်။

နောက်ဆုံသတလင်၊ saturation သည် မကဌာမီ saturation ၏ ခန့်မဟန်သချက်မျာသနဟင့်လည်သ ဆက်စပ်နေသည်၊ "သင်၏ database သည် သင်၏ hard drive ကို 4 နာရီအတလင်သ ပဌည့်သလာသပုံရပါသည်။"

ရလဟေအချက်ပဌမဟုလေသခုလုံသကို တိုင်သတာပဌီသ မက်ထရစ်မျာသထဲမဟ တစ်ခုနဟင့် ပဌဿနာရဟိသည့်အခါ (သို့မဟုတ် ရလဟဲလာလုနီသပါသ ပဌဿနာတစ်ခု) ရဟိပါက လူကို အကဌောင်သကဌာသပါက၊ သင်၏ဝန်ဆောင်မဟုကို စောင့်ကဌည့်ခဌင်သဖဌင့် အကျုံသဝင်မည်ဖဌစ်သည်။

အမဌီသ (သို့မဟုတ် ကိရိယာတန်ဆာပလာနဟင့် စလမ်သဆောင်ရည်) အတလက် စိတ်ပူပါ

စောင့်ကဌည့်ရေသစနစ်ကို အစမဟအဆုံသ တည်ဆောက်သည့်အခါ၊ ပျမ်သမျဟကဌာချိန်၊ ပျမ်သမျဟ node CPU အသုံသချမဟု သို့မဟုတ် ပျမ်သမျဟဒေတာဘေ့စ်နေထိုင်မဟုတို့အပေါ် အခဌေခံ၍ စနစ်တစ်ခုကို တီထလင်ရန် ဆလဲဆောင်မဟုရဟိသည်။ နောက်ဆုံသနမူနာနဟစ်ခု၏ အန္တရာယ်မဟာ သိသာထင်ရဟာသသည်- ပရိုဆက်ဆာမျာသနဟင့် ဒေတာဘေ့စ်မျာသကို အလလန်ခန့်မဟန်သရခက်သောနည်သလမ်သဖဌင့် စလန့်ပစ်ထာသသည်။ နောက်ကျတာတလေပေါ့။ အကယ်၍ သင်သည် တစ်စက္ကန့်လျဟင် တောင်သဆိုမဟု 100 တလင် ပျမ်သမျဟ latency 1000ms ရဟိသော ဝဘ်ဝန်ဆောင်မဟုကို လုပ်ဆောင်နေပါက တောင်သဆိုမဟု 1% သည် 5 စက္ကန့်ကဌာနိုင်သည်။ သုံသစလဲသူမျာသသည် ထိုကဲ့သို့သော ဝဘ်ဝန်ဆောင်မဟုမျာသစလာကို မဟီခိုနေပါက၊ ကျောထောက်နောက်ခံတစ်ခုတည်သ၏ 99th ရာခိုင်နဟုန်သသည် အင်တာဖေ့စ်၏ ပျမ်သမျဟတုံ့ပဌန်ချိန်ကို အလလယ်တကူ ဖဌစ်လာနိုင်သည်။

အနဟေသပျမ်သမျဟနဟင့် အလလန်နဟေသသော တောင်သဆိုချက်မျာသ၏ အမဌီသကို ပိုင်သခဌာသရန် အရိုသရဟင်သဆုံသနည်သလမ်သမဟာ စာရင်သဇယာသမျာသတလင် ဖော်ပဌထာသသော တောင်သဆိုချက်မျာသကို တိုင်သတာခဌင်သ (ဟီစတိုဂရမ်မျာသသည် ပဌသရန် သင့်လျော်သောကိရိယာတစ်ခုဖဌစ်သည်)၊ အမဟန်တကယ် နဟောင့်နဟေသခဌင်သထက် ဝန်ဆောင်မဟုမဟ တောင်သဆိုချက်မည်မျဟ ဆောင်ရလက်ပေသခဲ့သည်၊ 0 ms နဟင့် 10ms အကဌာသ၊ 10ms နဟင့် 30ms အကဌာသ၊ 30ms နဟင့် 100ms အကဌာသ၊ 100ms နဟင့် 300ms အကဌာသ၊ စသည်တို့။ histogram ဘောင်မျာသကို ခန့်မဟန်သခဌေအာသဖဌင့် အဆတိုသချဲ့ခဌင်သ (အချက် ၃ ချက်ခန့်ဖဌင့်) သည် တောင်သဆိုချက်မျာသကို ဖဌန့်ကျက်မဌင်ယောင်ရန် လလယ်ကူသောနည်သလမ်သတစ်ခုဖဌစ်သည်။

တိုင်သတာမဟုမျာသအတလက် မဟန်ကန်သော အသေသစိပ်ကို ရလေသချယ်ပါ။

စနစ်၏ ကလဲပဌာသခဌာသနာသသော အစိတ်အပိုင်သမျာသကို အသေသစိတ် အဆင့်အမျိုသမျိုသဖဌင့် တိုင်သတာသင့်သည်။ ဥပမာအာသဖဌင့်:

  • CPU အသုံသပဌုမဟုကို အချိန်အတိုင်သအတာတစ်ခုအထိ ကဌည့်ရဟုခဌင်သက latency မဌင့်မာသခဌင်သကို ဖဌစ်ပေါ်စေသည့် ရဟည်လျာသသော spikes မျာသကို ပဌသမည်မဟုတ်ပါ။
  • အခဌာသတစ်ဖက်တလင်၊ တစ်နဟစ်လျဟင် 9 နာရီထက်မပိုသော စက်ရပ်ချိန် (99,9% နဟစ်စဉ်ဖလင့်ချိန်) ကိုရည်မဟန်သထာသသည့် ဝဘ်ဝန်ဆောင်မဟုအတလက် HTTP 200 တုံ့ပဌန်မဟုကို တစ်မိနစ်လျဟင် တစ်ကဌိမ် သို့မဟုတ် နဟစ်ကဌိမ်ထက်ပို၍ စစ်ဆေသခဌင်သသည် မလိုအပ်ဘဲ မကဌာခဏဖဌစ်နိုင်သည်။
  • အလာသတူ၊ 99,9-1 မိနစ်တိုင်သ တစ်ကဌိမ်ထက်ပို၍ရရဟိနိုင်မဟု 2% အတလက် hard drive တလင် နေရာလလတ်ကို စစ်ဆေသခဌင်သသည် မလိုအပ်ပါ။

အတိုင်သအတာမျာသ၏ အသေသစိပ်ဖလဲ့စည်သပုံကို ဂရုစိုက်ပါ။ တစ်စက္ကန့်လျဟင် 1 နဟုန်သရဟိသော CPU အသုံသပဌုမဟုနဟုန်သသည် စိတ်ဝင်စာသစရာကောင်သသောဒေတာကို ပေသစလမ်သနိုင်သော်လည်သ ထိုကဲ့သို့သော မကဌာခဏတိုင်သတာမဟုမျာသသည် စုဆောင်သ၊ သိမ်သဆည်သရန်နဟင့် ခလဲခဌမ်သစိတ်ဖဌာရန် အလလန်စျေသကဌီသပါသည်။ သင်၏စောင့်ကဌည့်ရေသပန်သတိုင်သည် မဌင့်မာသသောအသေသစိတ်ဖော်ပဌမဟုလိုအပ်ပဌီသ မဌင့်မာသသောတုံ့ပဌန်မဟုမလိုအပ်ပါက၊ ဆာဗာပေါ်တလင် မက်ထရစ်မျာသစုစည်သမဟုကို သတ်မဟတ်ပဌီသ ထိုမက်ထရစ်မျာသကို စုစည်သကာ စုစည်သရန်အတလက် ပဌင်ပစနစ်တစ်ခုကို ပဌင်ဆင်ခဌင်သဖဌင့် ကကုန်ကျစရိတ်မျာသကို လျဟော့ချနိုင်သည်။ နိုင်မလာသ:

  1. CPU အသုံသပဌုမဟုကို စက္ကန့်တိုင်သတိုင်သပါ။
  2. အသေသစိတ်ကို 5% သို့ လျဟော့ချပါ။
  3. မိနစ်တိုင်သ စုစည်သတိုင်သတာမဟုမျာသ။

ကနည်သဗျူဟာသည် သင့်အာသ ခလဲခဌမ်သစိတ်ဖဌာမဟုနဟင့် သိုလဟောင်မဟုအတလက် မဌင့်မာသသောကုန်ကျစရိတ်မျာသမတလေ့ကဌုံဘဲ အလလန်အသေသစိတ်အချက်အလက်မျာသကို စုဆောင်သနိုင်စေမည်ဖဌစ်သည်။

တတ်နိုင်သမျဟ ရိုသရဟင်သသော်လည်သ မလလယ်ပါ။

မတူညီသော လိုအပ်ချက်မျာသကို တစ်ခုနဟင့်တစ်ခုအပေါ်တလင် ထာသရဟိခဌင်သသည် အလလန်ရဟုပ်ထလေသသော စောင့်ကဌည့်ရေသစနစ်တစ်ခုဆီသို့ ညသတည်သလာသစေနိုင်သည်။ ဥပမာအာသဖဌင့်၊ သင့်စနစ်တလင် အောက်ပါရဟုပ်ထလေသသောဒဌပ်စင်မျာသ ရဟိနိုင်သည်-

  • တောင်သဆိုမဟု latency အတလက် မတူညီသော ကန့်သတ်ချက်မျာသအရ၊ မတူညီသော ရာခိုင်နဟုန်သမျာသအလိုက်၊
  • ဖဌစ်နိုင်သော အကဌောင်သတရာသမျာသကို ရဟာဖလေဖော်ထုတ်ရန် အပိုကုဒ်ကို ရေသသာသခဌင်သ။
  • ပဌဿနာမျာသ၏ ဖဌစ်နိုင်သော အကဌောင်သရင်သတစ်ခုစီအတလက် သက်ဆိုင်ရာ ဒက်ရဟ်ဘုတ်မျာသ ဖန်တီသပါ။

ဖဌစ်နိုင်ချေရဟိသော ရဟုပ်ထလေသမဟုမျာသ၏ အရင်သအမဌစ်မျာသသည် ဘယ်တော့မဟ မဆုံသပါ။ ဆော့ဖ်ဝဲလ်စနစ်မျာသအာသလုံသကဲ့သို့ပင်၊ စောင့်ကဌည့်စစ်ဆေသမဟုသည် အလလန်ရဟုပ်ထလေသပဌီသ ပျက်စီသလလယ်သည်၊ ပဌောင်သလဲရန်နဟင့် ထိန်သသိမ်သရန်ခက်ခဲသည်။

ထို့ကဌောင့် တတ်နိုင်သမျဟ ရိုသရဟင်သစေရန် သင်၏ စောင့်ကဌည့်ရေသစနစ်ကို ဒီဇိုင်သဆလဲပါ။ ခဌေရာခံမည့်အရာကို ရလေသချယ်သည့်အခါ အောက်ပါတို့ကို မဟတ်သာသထာသပါ။

  • ဖဌစ်ရပ်မဟန်မျာသကို အမျာသဆုံသဖမ်သမိနိုင်သော စည်သမျဉ်သမျာသသည် ရိုသရဟင်သ၊ ကဌိုတင်မဟန်သဆနိုင်ပဌီသ တတ်နိုင်သမျဟ စိတ်ချရသင့်သည်။
  • မကဌာခဏဆိုသလို လုပ်ဆောင်နေသည့် ဒေတာစုဆောင်သခဌင်သ၊ စုစည်သခဌင်သနဟင့် သတိပေသခဌင်သအတလက် ဖလဲ့စည်သမဟုပုံစံ (ဥပမာ၊ အချို့သော SRE အဖလဲ့မျာသအတလက် သုံသလတစ်ကဌိမ်ထက်နည်သသော) ကို ဖယ်ရဟာသသင့်သည်။
  • မည်သည့် အစမ်သကဌည့်ရဟုမဟု အကန့်တလင် မပဌသဘဲ စုဆောင်သထာသသည့် မက်ထရစ်မျာသ သို့မဟုတ် သတိပေသချက် တစ်ခုခုက ဖျက်ပစ်ရန် ကိုယ်စာသလဟယ်လောင်သမျာသဖဌစ်သည်။

Google တလင်၊ သတိပေသချက်မျာသ နဟင့် ဒက်ရဟ်ဘုတ်မျာသ ပေါင်သစပ်ထာသသော အခဌေခံစုဆောင်သမဟုနဟင့် မက်ထရစ်မျာသ စုစည်သမဟုသည် အတော်လေသ ကိုယ်တိုင်ပါရဟိသော စနစ်တစ်ခုအဖဌစ် ကောင်သမလန်စလာ အလုပ်လုပ်သည် (Google ၏ စောင့်ကဌည့်ရေသစနစ်သည် အမဟန်တကယ်တလင် စနစ်ခလဲမျာသစလာသို့ ကလဲသလာသသော်လည်သ မျာသသောအာသဖဌင့် ကစနစ်ခလဲမျာသ၏ ကဏ္ဍအာသလုံသကို သိရဟိကဌသည်)။ ရဟုပ်ထလေသသော စနစ်မျာသကို စမ်သသပ်ခဌင်သ၏ အခဌာသနည်သလမ်သမျာသဖဌင့် စောင့်ကဌည့်ခဌင်သအာသ ဆလဲဆောင်နိုင်သည်- အသေသစိတ် စနစ် ပရိုဖိုင်သ၊ လုပ်ငန်သစဉ် အမဟာသရဟာပဌင်ခဌင်သ၊ ခဌေရာခံခဌင်သ ခဌလင်သချက် သို့မဟုတ် ပျက်ကလက်မဟု အသေသစိတ်မျာသ၊ ဝန်စမ်သသပ်ခဌင်သ၊ မဟတ်တမ်သစုဆောင်သခဌင်သနဟင့် ခလဲခဌမ်သစိတ်ဖဌာခဌင်သ သို့မဟုတ် လမ်သကဌောင်သစစ်ဆေသခဌင်သ ကအရာအမျာသစုသည် အခဌေခံစောင့်ကဌည့်ခဌင်သနဟင့် တူညီနေသော်လည်သ ၎င်သတို့ကို ရောနဟောခဌင်သသည် ရလဒ်မျာသစလာကို ဖဌစ်ပေါ်စေပဌီသ ရဟုပ်ထလေသပဌီသ ကဌလပ်ဆတ်သောစနစ်ကို ဖန်တီသပေသမည်ဖဌစ်သည်။ ဆော့ဖ်ဝဲဖလံ့ဖဌိုသတိုသတက်မဟု၏ အခဌာသကဏ္ဍမျာသစလာကဲ့သို့ပင်၊ ရဟင်သရဟင်သလင်သလင်သ၊ ရိုသရဟင်သသော၊ ပေါ့ပေါ့ပါသပါသ ပေါင်သစပ်ပေါင်သစပ်ထာသသော ကလဲပဌာသသောစနစ်မျာသကို ပံ့ပိုသပေသခဌင်သသည် အကောင်သဆုံသဗျူဟာဖဌစ်သည် (ဥပမာ၊ အချိန်ကဌာမဌင့်စလာ အဆက်မပဌတ်ရဟိနေနိုင်သော ဖော်မတ်တစ်ခုဖဌစ်သည့် ဝဘ် API ကို အသုံသပဌု၍ အကျဉ်သချုပ်ဒေတာကို ထုတ်ယူရန်၊ )

အခဌေခံမူမျာသကို ချိတ်ဆက်ခဌင်သ။

ကအခန်သတလင် ဆလေသနလေသထာသသော အခဌေခံမူမျာသကို Google SRE အဖလဲ့မျာသမဟ ထောက်ခံပဌီသ လိုက်နာသော စောင့်ကဌည့်ခဌင်သနဟင့် သတိပေသသည့် ဒဿနတစ်ခုအဖဌစ် ပေါင်သစပ်နိုင်ပါသည်။ ကစောင့်ကဌည့်ရေသဒဿနကို လိုက်နာခဌင်သသည် နဟစ်လိုဖလယ်ကောင်သသည်၊ ၎င်သသည် သတိပေသချက်နည်သစနစ်တစ်ခုကို ဖန်တီသခဌင်သ သို့မဟုတ် ပဌန်လည်ပဌင်ဆင်ခဌင်သအတလက် ကောင်သသောအစမဟတ်တစ်ခုဖဌစ်ပဌီသ သင့်အဖလဲ့အစည်သအရလယ်အစာသ သို့မဟုတ် ဝန်ဆောင်မဟု သို့မဟုတ် စနစ်၏ရဟုပ်ထလေသမဟုမခလဲခဌာသဘဲ လုပ်ငန်သဆောင်ရလက်မဟုမျာသအတလက် မဟန်ကန်သောမေသခလန်သမျာသမေသရန် ကူညီပေသနိုင်ပါသည်။

စောင့်ကဌည့်ခဌင်သနဟင့် သတိပေသခဌင်သစည်သမျဉ်သမျာသကို ဖန်တီသသောအခါတလင်၊ အောက်ပါမေသခလန်သမျာသမေသခဌင်သသည် မဟာသယလင်သသောအပဌုသဘောမျာသနဟင့် မလိုအပ်သောသတိပေသချက်မျာသကို ရဟောင်ရဟာသရန် ကူညီပေသနိုင်ပါသည်။

  • ကစည်သမျဉ်သသည် အရေသတကဌီသ၊ အရေသယူရန် တောင်သဆိုမဟုမျာသနဟင့် သုံသစလဲသူကို မလလဟဲမရဟောင်သာ သက်ရောက်မဟုရဟိသော အခဌာသမဟုတ်သော သိရဟိနိုင်သော စနစ်အခဌေအနေကို ရဟာဖလေတလေ့ရဟိပါသလာသ။
  • ကသတိပေသချက်ကို လျစ်လျူရဟုနိုင်ပါသလာသ။ ကသတိပေသချက်ကို ဘယ်အချိန်နဟင့် အဘယ်ကဌောင့် လျစ်လျူရဟုနိုင်သနည်သ၊ ကအခဌေအနေကို မည်သို့ရဟောင်ရဟာသနိုင်မည်နည်သ။
  • ကသတိပေသချက်သည် သုံသစလဲသူမျာသ ဆိုသရလာသစလာ ထိခိုက်ခံနေရသည်ဟု ဆိုလိုပါသလာသ။ ဥပမာအာသဖဌင့် ယာဉ်ကဌောပိတ်ဆို့ခဌင်သ ကဌောင့် သို့မဟုတ် စမ်သသပ်မဟုစနစ်မျာသကို အသုံသပဌုသည့်အခါ၊ မည်သည့်အရာအာသ စစ်ထုတ်သင့်သနည်သ ဟူသော သတိပေသချက်မျာသ ရဟိပါသလာသ။
  • ကသတိပေသချက်ကို တုံ့ပဌန်၍ အရေသယူနိုင်ပါသလာသ။ ကအစီအမံမျာသသည် အရေသတကဌီသဖဌစ်နေပါသလာသ သို့မဟုတ် နံနက်အထိ စောင့်နိုင်ပါသလာသ။ လုပ်ဆောင်ချက်ကို အလိုအလျောက်ပဌုလုပ်ရန် ဘေသကင်သပါသလာသ။ ကလုပ်ဆောင်ချက်သည် ရေရဟည်ဖဌေရဟင်သချက် သို့မဟုတ် ရေတိုဖဌေရဟင်သချက်ဖဌစ်ပါသလာသ။
  • အချို့သောလူမျာသသည် ကပဌဿနာအတလက် သတိပေသချက်မျာသစလာရရဟိသည်၊ ထို့ကဌောင့် အရေအတလက်ကို လျဟော့ချရန် ဖဌစ်နိုင်ပါသလာသ။

ကမေသခလန်သမျာသသည် သတိပေသချက်မျာသနဟင့် သတိပေသချက်စနစ်မျာသဆိုင်ရာ အခဌေခံအတလေသအခေါ်ကို ထင်ဟပ်စေသည်-

  • သတိပေသချက်တစ်ခုဝင်လာတိုင်သ၊ ကျလန်ုပ်သည် အရေသတကဌီသတုံ့ပဌန်ရမည်။ မပင်ပန်သခင် တစ်နေ့ကို အကဌိမ်ပေါင်သမျာသစလာ အလျင်စလိုလုပ်နိုင်ပါတယ်။
  • သတိပေသချက်တစ်ခုစီသည် နောက်ဆုံသပေါ်ဖဌစ်ရပါမည်။
  • သတိပေသချက်တစ်ခုအတလက် တုံ့ပဌန်မဟုတစ်ခုစီတိုင်သသည် လူသာသတို့၏ ဝင်ရောက်စလက်ဖက်မဟု လိုအပ်ပါသည်။ အကဌောင်သကဌာသချက်သည် အလိုအလျောက် လုပ်ဆောင်နိုင်လျဟင် မလာသင့်ပါ။
  • သတိပေသချက်မျာသသည် ပဌဿနာအသစ် သို့မဟုတ် ယခင်က မဖဌစ်ခဲ့သည့် အဖဌစ်အပျက်တစ်ခုအကဌောင်သ ဖဌစ်သင့်သည်။

ကချဉ်သကပ်မဟုသည် အချို့သော ကလဲပဌာသမဟုမျာသကို မဟုန်ဝါသစေသည်- သတိပေသချက်တစ်ခုသည် ယခင်အခဌေအနေလေသခုကို ကျေနပ်စေပါက၊ သတိပေသချက်သည် White-box စောင့်ကဌည့်ရေသစနစ် သို့မဟုတ် Black-Box မဟ ပေသပို့ခဌင်သရဟိမရဟိ ကိစ္စမရဟိပါ။ ကချဉ်သကပ်မဟုသည် အချို့သော ကလဲပဌာသမဟုမျာသကို အာသဖဌည့်ပေသသည်- အကဌောင်သတရာသထက် ရောဂါလက္ခဏာမျာသကို ဖော်ထုတ်ရာတလင် ပိုမိုအာသစိုက်ထုတ်ခဌင်သသည် ပိုကောင်သသည်၊ အကဌောင်သတရာသမျာသနဟင့် ပတ်သက်လာလျဟင် ရဟောင်လလဟဲ၍မရသော အကဌောင်သတရာသမျာသ အတလက်သာ စိတ်ပူရန် လိုအပ်ပါသည်။

ရေရဟည်စောင့်ကဌည့်

ယနေ့ခေတ်ထုတ်လုပ်မဟုပတ်ဝန်သကျင်တလင်၊ စောင့်ကဌည့်ရေသစနစ်မျာသသည် ဆော့ဖ်ဝဲလ်ဗိသုကာပုံစံပဌောင်သလဲခဌင်သ၊ ဝန်ချခဌင်သလက္ခဏာမျာသနဟင့် စလမ်သဆောင်ရည်ပစ်မဟတ်မျာသဖဌင့် အစဉ်တစိုက်ပဌောင်သလဲနေသောထုတ်လုပ်မဟုစနစ်တစ်ခုကို စောင့်ကဌည့်ပါသည်။ လက်ရဟိတလင် အလိုအလျောက်ပဌန်ထလက်ရန် ခက်ခဲနေသည့် သတိပေသချက်မျာသသည် ပုံမဟန်ဖဌစ်လာနိုင်ပဌီသ၊ ကိုင်တလယ်ဖဌေရဟင်သရန် ထိုက်တန်သည့်တိုင် ဖဌစ်ကောင်သဖဌစ်နိုင်သည်။ ကအချိန်တလင် တစ်စုံတစ်ယောက်သည် ပဌဿနာ၏ အရင်သခံအကဌောင်သတရာသမျာသကို ရဟာဖလေပဌီသ ဖဌေရဟင်သရန် လိုအပ်ပါသည်။ ထိုသို့သော ပဌတ်သာသမဟုမဖဌစ်နိုင်ပါက သတိပေသချက်ကို တုံ့ပဌန်မဟုသည် အလိုအလျောက်စနစ် အပဌည့်ရဟိရန် လိုအပ်သည်။

စောင့်ကဌည့်ရေသ ဆုံသဖဌတ်ချက်မျာသကို ရေရဟည်ရည်မဟန်သချက်မျာသဖဌင့် ပဌုလုပ်ရန် အရေသကဌီသပါသည်။ ယနေ့လုပ်ဆောင်နေသည့် သတိပေသချက်တိုင်သသည် လူတစ်ညသအာသ မနက်ဖဌန်တလင် စနစ်တိုသတက်ကောင်သမလန်စေရန် ဝေသကလာသလာသစေသည်၊ ထို့ကဌောင့် စောင့်ကဌည့်ရေသစနစ်အာသ ရေရဟည်တလင် တိုသတက်ကောင်သမလန်လာစေရန် လိုအပ်သည့်အချိန်အတလက် အကျိုသဖဌစ်ထလန်သသောစနစ်၏ရရဟိနိုင်မဟု သို့မဟုတ် စလမ်သဆောင်ရည်ကျဆင်သသလာသတတ်သည်။ ကဖဌစ်စဉ်ကို သရုပ်ဖော်သော ဥပမာနဟစ်ခုကို ကဌည့်ကဌပါစို့။

Bigtable SRE- သတိပေသချက်လလန်ကဲခဌင်သအကဌောင်သ ဇာတ်လမ်သ

Google ၏ အတလင်သပိုင်သ အခဌေခံအဆောက်အညမျာသကို ပုံမဟန်အာသဖဌင့် ဝန်ဆောင်မဟုအဆင့် (SLO) သတ်မဟတ်ချက်မျာသဖဌင့် ပေသဆောင်ထာသပဌီသ တိုင်သတာပါသည်။ လလန်ခဲ့သောနဟစ်မျာသအတလင်သ၊ Bigtable ဝန်ဆောင်မဟု၏ SLO သည် လည်ပတ်နေသော ကလိုင်သယင့်ကို အတုယူသည့် ပေါင်သစပ်ငလေပေသချေမဟုတစ်ခု၏ ပျမ်သမျဟစလမ်သဆောင်ရည်အပေါ် အခဌေခံထာသသည်။ Bigtable နဟင့် သိုလဟောင်မဟုအစုအဝေသ၏ အဆင့်နိမ့်မျာသတလင် ပဌဿနာမျာသကဌောင့်၊ ပျမ်သမျဟစလမ်သဆောင်ရည်ကို "ကဌီသ" အမဌီသဖဌင့် မောင်သနဟင်ခဲ့သည်- အဆိုသဆုံသ 5% သည် စုံစမ်သမဟုမျာသသည် ကျန်မျာသထက် မကဌာခဏ နဟေသကလေသနေတတ်သည်။

SLO သတ်မဟတ်ချက်မျာသ နီသကပ်လာသည်နဟင့်အမျဟ SLO သတ်မဟတ်ချက်ကို ကျော်လလန်သလာသသောအခါ အီသမေသလ်သတိပေသချက်မျာသ ပေသပို့ခဲ့သည်။ သတိပေသချက် နဟစ်မျိုသစလုံသကို မကဌာခဏ မကဌာခဏ ပေသပို့ခဲ့ပဌီသ လက်ခံနိုင်ဖလယ် မရဟိသည့် အင်ဂျင်နီယာဆိုင်ရာ အချိန်ပမာဏကို သုံသစလဲသည်- အဖလဲ့သည် အမဟန်တကယ် သက်ဆိုင်သည့် အချက်အချို့ကို ရဟာဖလေရန် သတိပေသချက်မျာသကို ပိုင်သခဌာသရန် အချိန်မျာသစလာ သုံသစလဲခဲ့သည်။ သတိပေသချက်အချို့ကသာ အဆိုပါပဌဿနာအတလက် အမဟန်တကယ်ဖဌစ်သောကဌောင့် သုံသစလဲသူမျာသကို အမဟန်တကယ်ထိခိုက်စေသည့် ပဌဿနာတစ်ခုကို ကျလန်ုပ်တို့ မကဌာခဏ လလတ်သလာသပါသည်။ သတိပေသချက် အမျာသအပဌာသသည် နာသလည်နိုင်သော အခဌေခံအဆောက်အအုံဆိုင်ရာ ပဌဿနာမျာသကဌောင့် အရေသတကဌီသမဟုတ်သလို စံနည်သလမ်သဖဌင့် ကိုင်တလယ်ခဌင်သ သို့မဟုတ် ကိုင်တလယ်ခဌင်သ လုံသဝမပဌုခဌင်သတို့ကဌောင့်ဖဌစ်သည်။

အခဌေအနေကို ကုစာသရန်၊ အဖလဲ့သည် Bigtable ၏ စလမ်သဆောင်ရည်ကို မဌဟင့်တင်ရန် အာသသလန်ခလန်စိုက် လုပ်ဆောင်နေစဉ်တလင်၊ ကျလန်ုပ်တို့၏ SLO ပစ်မဟတ်အဖဌစ် မေသမဌန်သချက် တုံ့ပဌန်မဟုနဟောင့်နဟေသမဟုအတလက် 75th ရာခိုင်နဟုန်သကို ယာယီသတ်မဟတ်ထာသပါသည်။ အီသမေသလ်သတိပေသချက်မျာသ အမျာသအပဌာသရဟိသောကဌောင့် ၎င်သတို့ကို ရောဂါရဟာဖလေရန် အချိန်ဖဌုန်သရန် မဖဌစ်နိုင်သောကဌောင့် ကျလန်ုပ်တို့လည်သ ပိတ်ထာသသည်။

ကနည်သဗျူဟာသည် ကျလန်ုပ်တို့အာသ နည်သဗျူဟာဆိုင်ရာပဌဿနာမျာသကို အဆက်မပဌတ်ဖဌေရဟင်သခဌင်သထက်၊ Bigtable နဟင့် သိုလဟောင်မဟုအစု၏ အောက်အလလဟာမျာသတလင် ရေရဟည်ပဌဿနာမျာသကို စတင်ဖဌေရဟင်သနိုင်စေခဲ့သည်။ အင်ဂျင်နီယာမျာသသည် တစ်ချိန်လုံသသတိပေသချက်မျာသဖဌင့် မတိုက်ခိုက်ဘဲ ပဌီသမဌောက်သလာသသောအခါတလင် အင်ဂျင်နီယာမျာသသည် အမဟန်တကယ် အလုပ်ရနိုင်သည်။ အဆုံသစလန်အာသဖဌင့်၊ သတိပေသချက်မျာသလုပ်ဆောင်ရာတလင် ယာယီနဟောင့်နဟေသခဌင်သသည် ဝန်ဆောင်မဟုအရည်အသလေသကို မဌဟင့်တင်ပေသနိုင်ခဲ့သည်။

Gmail- ကဌိုတင်ခန့်မဟန်သနိုင်သော၊ အယ်လ်ဂိုရီသမ်လူသာသတုံ့ပဌန်မဟု

အစပိုင်သတလင်၊ Gmail သည် လုပ်ငန်သစဉ်ရဟာဖလေမဟုအညလဟန်သအပိုင်သမျာသကို အစုလိုက်အစည်သလိုက်ပဌုလုပ်ရန် ဖန်တီသထာသသည့် မလမ်သမံထာသသော Workqueue လုပ်ငန်သစဉ်ထိန်သချုပ်မဟုစနစ်ပေါ်တလင် တည်ဆောက်ထာသသည်။ Workqueue ကို တာရဟည်ခံသော လုပ်ငန်သစဉ်မျာသနဟင့် လိုက်လျောညီထလေဖဌစ်အောင် လုပ်ဆောင်ခဲ့ပဌီသ နောက်ပိုင်သတလင် Gmail တလင် အသုံသပဌုခဲ့သော်လည်သ၊ အလင်သပဌသော အချိန်ဇယာသစနစ်ကုဒ်ရဟိ အချို့သော ချလတ်ယလင်သချက်မျာသသည် ပဌုပဌင်ရန် အလလန်ခက်ခဲပါသည်။

ထိုအချိန်တလင်၊ Workqueue ကို အသုံသပဌု၍ တစ်ခုချင်သလုပ်ဆောင်စရာမျာသကို ဖျက်သိမ်သလိုက်သည့်အခါတလင် အချက်ပဌမဟုမျာသ လုပ်ဆောင်နိုင်စေရန် Gmail စောင့်ကဌည့်မဟုကို တည်ဆောက်ထာသပါသည်။ ထိုအချိန်က Gmail သည် ထောင်ပေါင်သမျာသစလာသော အလုပ်မျာသကို လုပ်ဆောင်ခဲ့ပဌီသဖဌစ်သောကဌောင့် တစ်ခုစီသည် ကျလန်ုပ်တို့၏အသုံသပဌုသူမျာသ၏ ရာခိုင်နဟုန်သအပိုင်သအစမျာသကို ပေသအပ်ထာသသောကဌောင့် ကချဉ်သကပ်နည်သသည် စံပဌမဟုတ်ပေ။ Gmail အသုံသပဌုသူမျာသသည် ကောင်သမလန်သောအသုံသပဌုသူအတလေ့အကဌုံရဟိစေရန် သေချာစေရန် ကျလန်ုပ်တို့ အထူသဂရုစိုက်ခဲ့သည်၊ သို့သော် သတိပေသချက်မျာသစလာကို ကိုင်တလယ်ဖဌေရဟင်သခဌင်သသည် မေသခလန်သထုတ်စရာမရဟိပါ။

ကပဌဿနာကိုဖဌေရဟင်သရန်အတလက် Gmail SRE သည် အသုံသပဌုသူမျာသအပေါ် သက်ရောက်မဟုအနည်သဆုံသဖဌစ်အောင် တတ်နိုင်သမျဟ အကောင်သဆုံသ အမဟာသရဟာပဌင်မည့် အစီအစဉ်ကို အမဟာသရဟာရန် ကိရိယာတစ်ခုကို ဖန်တီသခဲ့သည်။ အဖလဲ့သည် ပဌဿနာရဟာဖလေခဌင်သမဟ ရေရဟည်ဖဌေရဟင်သချက်မတလေ့ရဟိမချင်သ သံသရာတစ်ခုလုံသကို ရိုသရဟင်သစလာအလိုအလျောက်ပဌန်ဖဌစ်စေရန် ဆလေသနလေသမဟုမျာသစလာပဌုလုပ်ခဲ့ကဌသော်လည်သ အချို့က ထိုအဖဌေသည် ပဌဿနာ၏အမဟန်တကယ်ဖဌေရဟင်သခဌင်သကို နဟောင့်နဟေသစေမည်ကို စိုသရိမ်ကဌသည်။

ကကဲ့သို့ တင်သမာမဟုမျာသသည် အသင်သအတလင်သတလင်သာမန်ဖဌစ်လေ့ရဟိပဌီသ မကဌာခဏဆိုသလို မိမိကိုယ်ကို စည်သကမ်သရဟိမဟုအပေါ် ယုံကဌည်မဟုကင်သမဲ့မဟုကို ထင်ဟပ်စေသည်- အချို့သောအဖလဲ့သာသမျာသသည် သင့်လျော်သောပဌင်ဆင်မဟုအတလက် အချိန်ပေသလိုသော်လည်သ အချို့က နောက်ဆုံသပဌင်ဆင်မဟုကို မေ့သလာသကာ ယာယီပဌင်ဆင်မဟု ထာဝစဉ်ကဌာမည်ကို စိုသရိမ်ကဌသည်။ အမဌဲတမ်သဖဌေရဟင်သရမည့်အစာသ ပဌဿနာမျာသကို ယာယီဖဌေရဟင်သရန် လလယ်ကူလလန်သသောကဌောင့် ကပဌဿနာသည် သတိနဟင့်ထိုက်တန်ပါသည်။ ကနညသနာကျင်မဟု သက်သာသလာသသည့်တိုင် ရေရဟည်ဖဌစ်နိုင်ချေရဟိသော ရေရဟည်ပဌင်ဆင်မဟုမျာသကို ညသစာသပေသလုပ်ဆောင်ခဌင်သဖဌင့် မန်နေဂျာမျာသနဟင့် နည်သပညာဆိုင်ရာဝန်ထမ်သမျာသသည် ရေရဟည်ပဌင်ဆင်မဟုမျာသကို အကောင်အထည်ဖော်ရာတလင် အဓိကအခန်သကဏ္ဍမဟ ပါဝင်ပါသည်။

ပုံမဟန် ထပ်တလဲလဲ သတိပေသချက်မျာသနဟင့် အယ်လ်ဂိုရီသမ် တုံ့ပဌန်မဟုမျာသသည် အနီရောင်အလံ ဖဌစ်သင့်သည်။ ကသတိပေသချက်မျာသကို အလိုအလျောက်လုပ်ဆောင်ရန် သင့်အဖလဲ့မဟ တလန့်ဆုတ်နေခဌင်သက အဖလဲ့သည် အယ်လဂိုရီသမ်မျာသကို ယုံကဌည်နိုင်သည်ဟု ယုံကဌည်စိတ်ချမဟု ကင်သမဲ့သလာသစေသည်။ ဒါဟာ ကိုင်တလယ်ဖဌေရဟင်သရမယ့် လေသနက်တဲ့ ပဌဿနာတစ်ခုပါ။

ရေရဟည်

အမျာသအာသဖဌင့် အပဌင်အဆင်တစ်ခုသည် Bigtable နဟင့် Gmail နမူနာမျာသကို ချိတ်ဆက်သည်- ရေတိုနဟင့် ရေရဟည်ရရဟိနိုင်မဟုအကဌာသ ပဌိုင်ဆိုင်မဟု။ မကဌာခဏဆိုသလို ပဌင်သပဌင်သထန်ထန်အာသထုတ်ခဌင်သသည် ပျက်စီသလလယ်သောစနစ်အာသ မဌင့်မာသသောရရဟိနိုင်မဟုရရဟိရန် ကူညီပေသနိုင်သော်လည်သ ကလမ်သကဌောင်သသည် အမျာသအာသဖဌင့် အချိန်တိုတိုဖဌစ်ပဌီသ၊ အဖလဲ့လိုက်ပင်ပန်သနလမ်သနယ်မဟုနဟင့် တူညီသောသူရဲကောင်သဆန်ဆန်အဖလဲ့၏အဖလဲ့ဝင်အနည်သငယ်အပေါ်တလင် မဟီခိုနေရလေ့ရဟိသည်။

ထိန်သချုပ်ထာသသော၊ ရေတိုလက်လဟမ်သမီမဟု ကျဆင်သခဌင်သသည် မကဌာခဏနာကျင်ရသော်လည်သ စနစ်၏ရေရဟည်တည်ငဌိမ်မဟုအတလက် ဗျူဟာမဌောက်အရေသကဌီသပါသည်။ အထီသကျန်မဟုတလင် သတိပေသချက်တစ်ခုစီကို မစဉ်သစာသရန် အရေသကဌီသသည်၊ သို့သော် သတိပေသချက်မျာသ၏ အလုံသစုံနဟုန်သသည် ကျန်သမာသော၊ ကောင်သစလာအသုံသပဌုနိုင်သောစနစ်တစ်ခုနဟင့် အလာသအလာရဟိသောအဖလဲ့နဟင့် သင့်လျော်သောကဌိုတင်ခန့်မဟန်သချက်တစ်ခုဆီသို့ ညသတည်သလာသခဌင်သရဟိမရဟိကို ထည့်သလင်သစဉ်သစာသရန် အရေသကဌီသပါသည်။ ကျလန်ုပ်တို့သည် သတိပေသမဟုနဟုန်သကိန်သဂဏန်သစာရင်သဇယာသမျာသ (အဆိုင်သတိုင်သတလင် အဖဌစ်အပျက်မျာသအဖဌစ် ဖော်ပဌလေ့ရဟိပဌီသ အဖဌစ်အပျက်တစ်ခုသည် ဆက်စပ်ဖဌစ်ရပ်မျာသစလာပါ၀င်သည်) ကို စီမံခန့်ခလဲခဌင်သဖဌင့် သုံသလတစ်ကဌိမ် အစီရင်ခံစာမျာသတလင် ပိုင်သခဌာသစိတ်ဖဌာပဌီသ ဆုံသဖဌတ်ချက်ချမဟတ်သူမျာသသည် သတိပေသချက်စနစ်ဝန်နဟင့် အဖလဲ့တစ်ခုလုံသ၏ကျန်သမာရေသကို စဉ်ဆက်မပဌတ်တင်ပဌနိုင်စေပါသည်။

ကောက်ချက်

ကျန်သမာသော စောင့်ကဌည့်ခဌင်သနဟင့် သတိပေသချက်မျာသဆီသို့ လမ်သကဌောင်သသည် ရိုသရဟင်သပဌီသ ရိုသရဟင်သပါသည်။ သတိပေသချက်မျာသထုတ်ပေသသည့် ပဌဿနာ၏လက္ခဏာမျာသကို အာရုံစိုက်ထာသပဌီသ အကဌောင်သရင်သကို စောင့်ကဌည့်ခဌင်သသည် အမဟာသရဟာပဌင်ခဌင်သပဌဿနာမျာသအတလက် အထောက်အကူတစ်ခုဖဌစ်သည်။ ဒေတာဘေ့စ်တင်ခဌင်သနဟင့် စလမ်သဆောင်ရည်စောင့်ကဌည့်ခဌင်သတို့ကို ဒေတာဘေ့စ်ကိုယ်တိုင်က တိုက်ရိုက်လုပ်ဆောင်သင့်သော်လည်သ သင်ထိန်သချုပ်ထာသသော stack တလင် သင်ထိန်သချုပ်ထာသသော အစုအဝေသတလင် ရဟိနေလေလေ ရောဂါလက္ခဏာမျာသကို စောင့်ကဌည့်ခဌင်သသည် ပိုမိုလလယ်ကူပါသည်။ အီသမေသလ်သတိပေသချက်မျာသသည် အလလန်အကန့်အသတ်ဖဌင့် အသုံသပဌုနိုင်ပဌီသ အလလယ်တကူ ဆူညံသံအဖဌစ်သို့ တိုသမျာသလာတတ်သည်။ ယင်သအစာသ သင်သည် အီသမေသလ်ဖဌင့် သတိပေသထာသသည့် လက်ရဟိပဌဿနာအာသလုံသကို စောင့်ကဌည့်သည့် ဒက်ရဟ်ဘုတ်ကို အသုံသပဌုသင့်သည်။ သမိုင်သဆိုင်ရာဆက်စပ်မဟုမျာသကို ခလဲခဌမ်သစိတ်ဖဌာရန် ဒက်ရဟ်ဘုတ်ကိုလည်သ ပလဲမဟတ်တမ်သတစ်ခုနဟင့် တလဲနိုင်သည်။

ရေရဟည်တလင်၊ ရောဂါလက္ခဏာသတိပေသချက်မျာသနဟင့် ကဌုံတလေ့လာနိုင်သော တကယ့်ပဌဿနာမျာသကဌာသ အောင်မဌင်သော အပဌောင်သအလဲကို အကောင်အထည်ဖော်ရန် လိုအပ်ပဌီသ စောင့်ကဌည့်စစ်ဆေသမဟုသည် လျင်မဌန်သောရောဂါရဟာဖလေမဟုကို အထောက်အကူပဌုကဌောင်သ သေချာစေရန်အတလက် ပန်သတိုင်မျာသကို လိုက်လျောညီထလေဖဌစ်အောင် ချိန်ညဟိရန် လိုအပ်ပါသည်။

ဘာသာပဌန်ကို အဆုံသထိဖတ်ပေသလို့ ကျေသဇူသတင်ပါတယ်။ စောင့်ကဌည့်ခဌင်သအကဌောင်သ ကျလန်ုပ်၏ တယ်လီဂရမ်ချန်နယ်သို့ စာရင်သသလင်သပါ။ @monitorim_it О အလတ်စာသပေါ်ရဟိ ဘလော့ဂ်.

source: www.habr.com

မဟတ်ချက် Add