ဒေတာစင်တာ၏ မီးခိုးစမ်းသပ်မှု မီးလောင်ပါက ဆာဗာများကို ငြိမ်းသတ်သင့်ပါသလား။

သင့်စက်ကိရိယာတွေနဲ့ ဒေတာစင်တာက သာယာတဲ့ နွေရာသီတစ်ရက်ဆိုရင် သင်ဘယ်လိုခံစားရမလဲ။

ဒေတာစင်တာ၏ မီးခိုးစမ်းသပ်မှု မီးလောင်ပါက ဆာဗာများကို ငြိမ်းသတ်သင့်ပါသလား။

အားလုံးမင်္ဂလာပါ! ငါ့နာမည်က Dmitry Samsonov ဖြစ်ပြီး၊ ငါက ထိပ်တန်းစနစ် စီမံခန့်ခွဲသူအဖြစ် အလုပ်လုပ်တယ်။Odnoklassniki“ ဓာတ်ပုံတွင် ကျွန်ုပ်တို့၏ပရောဂျက်ကို ဝန်ဆောင်မှုပေးသည့် စက်ပစ္စည်းများကို တပ်ဆင်ထားသည့် ဒေတာစင်တာ လေးခုအနက်မှ တစ်ခုကို ပြသထားသည်။ ဤနံရံများ၏နောက်ကွယ်တွင် စက်ပစ္စည်းကိရိယာ ၄ဝဝဝ ခန့်ရှိသည်- ဆာဗာများ၊ ဒေတာသိမ်းဆည်းမှုစနစ်များ၊ ကွန်ရက်ကိရိယာများ စသည်တို့ဖြစ်သည်။ - ကျွန်ုပ်တို့၏စက်ပစ္စည်းအားလုံး၏ ⅓ နီးပါး။
ဆာဗာအများစုသည် Linux ဖြစ်သည်။ Windows (MS SQL) တွင် ဆာဗာ ဒါဇင်များစွာ ရှိသည် - ကျွန်ုပ်တို့ နှစ်ပေါင်းများစွာ စနစ်တကျ စွန့်ပစ်ခဲ့သော ကျွန်ုပ်တို့၏ အမွေအနှစ်များ။
ထို့ကြောင့်၊ ဇွန်လ 5 ရက်၊ 2019 ခုနှစ် 14:35 နာရီတွင် ကျွန်ုပ်တို့၏ဒေတာစင်တာတစ်ခုရှိ အင်ဂျင်နီယာများသည် မီးသတိပေးချက်ကို သတင်းပို့ပါသည်။

အပျက်သဘော

၁၄:၄၅။ ဒေတာစင်တာများတွင် အသေးစား မီးခိုးငွေ့များသည် သင်ထင်သည်ထက် ပိုအဖြစ်များပါသည်။ ခန်းမများအတွင်းရှိ အညွှန်းများသည် ပုံမှန်ဖြစ်သည်၊ ထို့ကြောင့် ကျွန်ုပ်တို့၏ ပထမဆုံးတုံ့ပြန်မှုမှာ အတော်လေး ငြိမ်သက်သွားသည်- တစ်ခုခုကို ပြုပြင်ခြင်းမှလွဲ၍ တစ်ခုခုကို ပြင်ဆင်ခြင်းနှင့် သက်ဆိုင်သည့်အလုပ်မှလွဲ၍ ထုတ်လုပ်ရေးဆိုင်ရာ တားမြစ်ချက်တစ်ခုဖြစ်သည့် ထုတ်လုပ်မှုဆိုင်ရာ တားမြစ်ချက်ကို မိတ်ဆက်ခဲ့သည်။

အမျက်ဒေါသ

ခေါင်မိုးပေါ်မီးလောင်တဲ့နေရာအတိအကျကို မီးသတ်သမားတွေဆီကနေ စုံစမ်းကြည့်ဖူးလား ဒါမှမဟုတ် မီးလောင်နေတဲ့အမိုးပေါ်ကို ကိုယ်တိုင်တက်ဖို့ အခြေအနေကို အကဲဖြတ်ဖို့ ကြိုးစားဖူးပါသလား။ လူငါးဦးမှရရှိသော သတင်းအချက်အလက်များအပေါ် ယုံကြည်စိတ်ချရမှုအတိုင်းအတာသည် အဘယ်နည်း။

14: 50 ။ မီးသည် အအေးခံစနစ်သို့ ချဉ်းကပ်လာနေကြောင်း သတင်းရရှိထားသည်။. ဒါပေမယ့် လာမှာလား။ တာဝန်ကျစနစ်စီမံခန့်ခွဲသူက ဤဒေတာစင်တာ၏မျက်နှာစာများမှ ပြင်ပအသွားအလာများကို ဖယ်ရှားပေးသည်။

လောလောဆယ်တွင်၊ ကျွန်ုပ်တို့၏ဝန်ဆောင်မှုအားလုံး၏မျက်နှာစာများကို ဒေတာစင်တာသုံးခုတွင် ပွားထားပြီး၊ ဟန်ချက်ညီမှုကို DNS အဆင့်တွင်အသုံးပြုကာ ဒေတာစင်တာတစ်ခု၏လိပ်စာများကို DNS မှဖယ်ရှားနိုင်စေကာ အသုံးပြုသူများအား ဝန်ဆောင်မှုများသို့ဝင်ရောက်ခွင့်ပြဿနာများမှ ကာကွယ်ပေးသည်။ . ဒေတာစင်တာတွင် ပြဿနာများ ဖြစ်ပွားနေပြီဆိုလျှင်၊ ၎င်းသည် အလိုအလျောက် လည်ပတ်မှုကို ထွက်သွားစေသည်။ ဤနေရာတွင် သင်ပိုမိုဖတ်ရှုနိုင်ပါသည်- Odnoklassniki ရှိ ချိန်ခွင်လျှာညှိခြင်းနှင့် အမှားခံနိုင်ရည်ရှိခြင်း။

မီးလောင်မှုသည် ကျွန်ုပ်တို့အား မည်သည့်နည်းနှင့်မျှ မထိခိုက်သေးသော်လည်း အသုံးပြုသူများနှင့် စက်ပစ္စည်းများ ထိခိုက်ပျက်စီးခြင်း မရှိပေ။ ဒါက မတော်တဆမှုလား။ စာတမ်း၏ ပထမအပိုင်းသည် "မတော်တဆထိခိုက်မှု" ၏ သဘောတရားကို အဓိပ္ပါယ်ဖွင့်ဆိုထားပြီး အပိုင်းသည် ဤကဲ့သို့ အဆုံးသတ်သည်-
«မတော်တဆမှု ရှိ၊ မရှိ သံသယရှိလျှင် မတော်တဆမှု ဖြစ်၏။»

၁၄:၅၃။ အရေးပေါ်ညှိနှိုင်းရေးမှူးကို ခန့်အပ်ထားသည်။

ညှိနှိုင်းရေးမှူးသည် ပါဝင်သူအားလုံးကြား ဆက်သွယ်ရေးကို ထိန်းချုပ်ရန်၊ မတော်တဆမှု၏ အတိုင်းအတာကို အကဲဖြတ်ခြင်း၊ အရေးပေါ် လုပ်ဆောင်ချက် အစီအစဉ်ကို အသုံးပြုခြင်း၊ လိုအပ်သော ဝန်ထမ်းများကို ဆွဲဆောင်ခြင်း၊ ပြုပြင်မှု ပြီးစီးမှုကို စောင့်ကြည့်စစ်ဆေးခြင်း နှင့် အရေးကြီးဆုံးမှာ မည်သည့်လုပ်ငန်းတာဝန်များကိုမဆို တာဝန်လွှဲအပ်သူဖြစ်သည်။ တစ်နည်းဆိုရသော် ဤသူသည် အရေးပေါ်တုံ့ပြန်ရေးလုပ်ငန်းစဉ်တစ်ခုလုံးကို စီမံခန့်ခွဲသူဖြစ်သည်။

ညှိနှိုင်း

၁၅:၀၁။ ထုတ်လုပ်မှုနှင့် မသက်ဆိုင်သော ဆာဗာများကို ကျွန်ုပ်တို့ စတင်ပိတ်လိုက်ပါသည်။
၁၅:၀၃။ ကျွန်ုပ်တို့သည် ရယူထားသည့် ဝန်ဆောင်မှုအားလုံးကို မှန်ကန်စွာ ပိတ်ပါသည်။
၎င်းတွင် မျက်နှာစာများသာမက (ဤအချက်ကြောင့် အသုံးပြုသူများ သုံးစွဲခွင့်မရှိတော့သော) နှင့် ၎င်းတို့၏ အရန်ဝန်ဆောင်မှုများ (လုပ်ငန်းဆိုင်ရာ ယုတ္တိဗေဒ၊ ကက်ရှ်များ စသည်ဖြင့်) များသာမက ပွားခြင်းအချက် 2 သို့မဟုတ် ထို့ထက်ပိုသော ဒေတာဘေ့စ်အမျိုးမျိုးလည်း ပါဝင်သည်။Cassandra, binary data သိုလှောင်မှု, အအေးခန်း, NewSQL စသည်ဖြင့်)။
15: 06 ။ ဒေတာစင်တာ ခန်းမတစ်ခု မီးလောင်မှု ဖြစ်ပွားနေကြောင်း သတင်း ရရှိသည်။ ဒီအခန်းထဲမှာ စက်ပစ္စည်းမရှိဘူး၊ ဒါပေမယ့် မီးက အိမ်ခေါင်မိုးကနေ ခန်းမတွေဆီ ပျံ့နှံ့သွားတာက ဖြစ်ပျက်နေတဲ့ပုံတွေကို အများကြီး ပြောင်းလဲသွားစေတယ်။
(နောက်ပိုင်းတွင် ခန်းမကို အမိုးမှ ဓာတုနည်းဖြင့် အလုံပိတ်ထားသောကြောင့် ရုပ်ပိုင်းဆိုင်ရာ ခြိမ်းခြောက်မှု မရှိခဲ့ကြောင်း ထွက်ပေါ်လာခဲ့သည်။ ခြိမ်းခြောက်မှုသည် ဤခန်းမ၏ အအေးပေးစနစ်အတွက်သာ ဖြစ်သည်။)
၁၅:၀၇။ ကျွန်ုပ်တို့သည် ထပ်လောင်းစစ်ဆေးမှုများမပါဘဲ ဆာဗာများတွင် အရှိန်မြှင့်မုဒ်တွင် အမိန့်ပေးမှုကို ခွင့်ပြုသည် (ငါတို့အကြိုက်ဆုံးဂဏန်းတွက်စက်မပါဘဲ).
၁၅:၀၈။ ခန်းမအတွင်းရှိ အပူချိန်သည် ပုံမှန်ကန့်သတ်ချက်များအတွင်း ရှိနေသည်။
15: 12 ။ ခန်းမများတွင် အပူချိန် တိုးလာကြောင်း မှတ်တမ်းတင်ခဲ့သည်။
၁၅:၁၃။ ဒေတာစင်တာရှိ ဆာဗာတစ်ဝက်ကျော်ကို ပိတ်ထားသည်။ ဆက်ကြရအောင်။
၁၅:၁၆။ စက်ပစ္စည်းအားလုံးကို ပိတ်ရန် ဆုံးဖြတ်ချက်ချခဲ့သည်။
၁၅:၂၁။ ကျွန်ုပ်တို့သည် အပလီကေးရှင်းနှင့် လည်ပတ်မှုစနစ်ကို မှန်ကန်စွာပိတ်ခြင်းမရှိဘဲ နိုင်ငံမဲ့ဆာဗာများသို့ ပါဝါပိတ်ရန် စတင်ပါသည်။
၁၅:၂၃။ MS SQL အတွက် တာဝန်ရှိသော လူတစ်စုအား ခွဲဝေချထားသည် (ထိုအထဲမှ အနည်းငယ်သာ ရှိသည်၊ ၎င်းတို့အပေါ် ဝန်ဆောင်မှုများ၏ မှီခိုမှုမှာ ကြီးကြီးမားမား မဟုတ်သော်လည်း လုပ်ဆောင်နိုင်စွမ်းကို ပြန်လည်ရယူသည့် လုပ်ထုံးလုပ်နည်းသည် ပိုကြာပြီး ဥပမာ၊ Cassandra ထက် ပိုရှုပ်ထွေးသည်)။

စိတ်ကျရောဂါ

15: 25 ။ 16 (အမှတ် 6၊ 7၊ 8၊ 9) မှ ခန်းမ လေးခန်းတွင် ဓာတ်အား ပိတ်ထားရကြောင်း သတင်း ရရှိပါသည်။ ကျွန်ုပ်တို့၏စက်ပစ္စည်းသည် ခန်းမ 7 နှင့် 8 တွင်တည်ရှိသည်။ ကျွန်ုပ်တို့၏ဟောခန်းနှစ်ခု (နံပါတ် ၁ နှင့် ၃) နှင့်ပတ်သက်သော အချက်အလက်မရှိပါ။
ပုံမှန်အားဖြင့်၊ မီးလောင်ကျွမ်းစဉ်အတွင်း ပါဝါထောက်ပံ့မှုကို ချက်ချင်းပိတ်ထားသော်လည်း၊ ဤအခြေအနေတွင်၊ ဒေတာစင်တာ၏ မီးသတ်သမားများနှင့် နည်းပညာဆိုင်ရာဝန်ထမ်းများ၏ ညှိနှိုင်းလုပ်ဆောင်မှုကြောင့် ၎င်းကို နေရာတိုင်းတွင် မပိတ်ဘဲ ချက်ချင်းမပိတ်ဘဲ လိုအပ်သလို လိုအပ်ပါသည်။
(အခန်း ၈ နှင့် ၉ တွင် ပါဝါမပိတ်ကြောင်း နောက်ပိုင်းတွင် တွေ့ရှိခဲ့သည်။)
၁၅:၂၈။ ကျွန်ုပ်တို့သည် အခြားဒေတာစင်တာများတွင် အရန်သိမ်းဆည်းမှုများမှ MS SQL ဒေတာဘေ့စ်များကို စတင်အသုံးပြုနေပြီဖြစ်သည်။
ဘယ်လောက်ကြာမလဲ? လမ်းကြောင်းတစ်ခုလုံးအတွက် လုံလောက်သော ကွန်ရက်စွမ်းရည်ရှိပါသလား။
15: 37 ။ ကွန်ရက်၏ အချို့သော အစိတ်အပိုင်းများကို ပိတ်ပစ်လိုက်ကြောင်း မှတ်တမ်းတင်ထားသည်။
စီမံခန့်ခွဲမှုနှင့် ထုတ်လုပ်မှုကွန်ရက်တို့သည် တစ်ခုနှင့်တစ်ခု သီးခြားစီဖြစ်သည်။ ထုတ်လုပ်မှုကွန်ရက်ကို ရရှိနိုင်ပါက ဆာဗာသို့သွားကာ အက်ပ်လီကေးရှင်းကို ရပ်ကာ OS ကို ပိတ်နိုင်သည်။ မရရှိနိုင်ပါက IPMI မှတစ်ဆင့် လော့ဂ်အင်ဝင်နိုင်ပြီး အပလီကေးရှင်းကို ရပ်ကာ OS ကို ပိတ်နိုင်သည်။ ကွန်ရက်တစ်ခုမှမရှိရင် ဘာမှလုပ်လို့မရဘူး။ “ကျေးဇူးတင်ပါတယ် Cap!” လို့ထင်လိမ့်မယ်။
“ယေဘူယျအားဖြင့်၊ ကမောက်ကမတွေ အများကြီးရှိတယ်” ဟုလည်း သင်ထင်ကောင်းထင်နိုင်သည်။
ဆာဗာများသည် မီးမရှိသည့်တိုင် အပူပမာဏများစွာကို ထုတ်ပေးနေခြင်းပင်ဖြစ်သည်။ ပို၍တိကျသည်မှာ၊ အအေးခံသောအခါတွင် ၎င်းတို့သည် အပူကိုထုတ်ပေးပြီး အအေးမရှိသည့်အခါတွင်၊ ၎င်းတို့သည် စက်ပစ္စည်း၏တစ်စိတ်တစ်ပိုင်းကို အရည်ပျော်ကာ အခြားအစိတ်အပိုင်းကို ပိတ်ပစ်ကာ အဆိုးဆုံးမှာ ငရဲမီးမွှားအဖြစ် ဖန်တီးကြခြင်းဖြစ်သည်။ ခန်းမအတွင်း၌ မီးသည် အရာအားလုံးကို ဖျက်ဆီးပစ်မည်ဟု အာမခံထားသည်။

ဒေတာစင်တာ၏ မီးခိုးစမ်းသပ်မှု မီးလောင်ပါက ဆာဗာများကို ငြိမ်းသတ်သင့်ပါသလား။

၁၅:၃၉။ conf ဒေတာဘေ့စ်နှင့် ပြဿနာများကို ကျွန်ုပ်တို့ ဖြေရှင်းပေးပါသည်။

conf ဒေတာဘေ့စ်သည် ဆက်တင်များကို လျင်မြန်စွာပြောင်းလဲရန်အတွက် ထုတ်လုပ်ရေးအပလီကေးရှင်းအားလုံးမှ အသုံးပြုသည့် တူညီသောအမည်၏ဝန်ဆောင်မှုအတွက် နောက်ကွယ်မှဖြစ်သည်။ ဤအခြေခံမရှိဘဲ၊ ကျွန်ုပ်တို့သည် portal ၏လည်ပတ်မှုကိုမထိန်းချုပ်နိုင်သော်လည်း portal ကိုယ်တိုင်လုပ်ဆောင်နိုင်သည်။

၁၅:၄၁။ Core ကွန်ရက်စက်ပစ္စည်းရှိ အပူချိန်အာရုံခံကိရိယာများသည် အမြင့်ဆုံးခွင့်ပြုချက်နှင့် နီးကပ်စွာဖတ်ရှုခြင်းကို မှတ်တမ်းတင်သည်။ ၎င်းသည် rack တစ်ခုလုံးကို သိမ်းပိုက်ပြီး ဒေတာစင်တာအတွင်းရှိ ကွန်ရက်အားလုံး၏ လုပ်ဆောင်မှုကို သေချာစေသည်။

ဒေတာစင်တာ၏ မီးခိုးစမ်းသပ်မှု မီးလောင်ပါက ဆာဗာများကို ငြိမ်းသတ်သင့်ပါသလား။

၁၅:၄၂။ ပြဿနာခြေရာခံကိရိယာနှင့် ဝီကီတို့ကို မရရှိနိုင်ပါ၊ အသင့်အနေအထားသို့ ပြောင်းပါ။
၎င်းသည် ထုတ်လုပ်မှုမဟုတ်သော်လည်း မတော်တဆမှုတစ်ခုဖြစ်ပွားပါက မည်သည့်အသိပညာအခြေခံရရှိနိုင်မှုမှာ အရေးကြီးပါသည်။
၁၅:၅၀။ စောင့်ကြည့်ရေးစနစ်များထဲမှ တစ်ခု ပိတ်သွားပါပြီ။
၎င်းတို့ထဲမှ အများအပြားရှိပြီး ၎င်းတို့သည် ဝန်ဆောင်မှုများ၏ မတူညီသော ရှုထောင့်များအတွက် တာဝန်ရှိပါသည်။ ၎င်းတို့ထဲမှအချို့သည် ဒေတာစင်တာတစ်ခုစီတွင် အလိုအလျောက်လည်ပတ်ရန် စီစဉ်ထားသည် (ဆိုလိုသည်မှာ ၎င်းတို့သည် ၎င်းတို့၏ကိုယ်ပိုင်ဒေတာစင်တာကိုသာ စောင့်ကြည့်ခြင်းဖြစ်သည်)၊ အခြားအရာများသည် မည်သည့်ဒေတာစင်တာ၏ဆုံးရှုံးမှုကိုမဆို ပွင့်လင်းမြင်သာစွာရှင်သန်နိုင်သော ဖြန့်ဝေထားသောအစိတ်အပိုင်းများပါ၀င်သည်။
ဒီကိစ္စမှာ အလုပ်မလုပ်တော့ဘူး။ စီးပွားရေး ယုတ္တိဗေဒ အညွှန်းကိန်းများ မမှန်မကန် ထောက်လှမ်းခြင်း စနစ်Master-standby မုဒ်တွင် လုပ်ဆောင်သည်။ အသင့်အနေအထားသို့ ပြောင်းခဲ့သည်။

လက်ခံခြင်း

၁၅:၅၁။ MS SQL မှလွဲ၍ ဆာဗာအားလုံးကို မှန်ကန်စွာပိတ်ခြင်းမရှိဘဲ IPMI မှတစ်ဆင့် ပိတ်ထားသည်။
လိုအပ်ပါက IPMI မှတစ်ဆင့် ကြီးမားသော ဆာဗာစီမံခန့်ခွဲမှုအတွက် အဆင်သင့်ဖြစ်ပြီလား။

ဤအဆင့်တွင် ဒေတာစင်တာရှိ စက်ကိရိယာများကို ကယ်တင်ခြင်း ပြီးမြောက်သည့်အချိန်ဖြစ်သည်။ လုပ်နိုင်သမျှ ပြီးပြီ။ လုပ်ဖော်ကိုင်ဖက်အချို့ အနားယူနိုင်သည်။
16: 13 ။ ခေါင်မိုးပေါ်တွင် လေအေးပေးစက်များမှ ဖရီးရွန်ပိုက်များ ပေါက်ကွဲကြောင်း သတင်းရရှိထားသည် - ယင်းက မီးငြိမ်းသွားပြီးနောက် ဒေတာစင်တာ၏ လွှတ်တင်မှုကို နှောင့်နှေးစေမည်ဖြစ်သည်။
၁၆:၁၉။ ဒေတာစင်တာ၏ နည်းပညာဆိုင်ရာ ဝန်ထမ်းများထံမှ ရရှိသည့် အချက်အလက်များအရ ခန်းမများအတွင်း အပူချိန် တိုးလာမှု ရပ်တန့်သွားကြောင်း သိရသည်။
၁၇:၁၀။ conf ဒေတာဘေ့စ်ကို ပြန်လည်ရယူပြီးဖြစ်သည်။ ယခု ကျွန်ုပ်တို့သည် အပလီကေးရှင်းဆက်တင်များကို ပြောင်းလဲနိုင်ပါပြီ။
အရာအားလုံးသည် အမှားအယွင်းခံနိုင်ပြီး ဒေတာစင်တာတစ်ခုမရှိဘဲ အလုပ်လုပ်ပါက အဘယ်ကြောင့် ဤမျှအရေးကြီးသနည်း။
ပထမအချက်မှာ အရာအားလုံးသည် အမှားခံနိုင်ရည်မရှိပေ။ ဒေတာစင်တာ ချို့ယွင်းမှုကို ကောင်းစွာ မအောင်မြင်သေးသော ဆင့်ပွားဝန်ဆောင်မှု အမျိုးမျိုးရှိပြီး၊ မာစတာ-အသင့်အနေအထားတွင် ဒေတာဘေ့စ်များ ရှိပါသည်။ ဆက်တင်များကို စီမံခန့်ခွဲနိုင်စွမ်းသည် ခက်ခဲသောအခြေအနေများတွင်ပင် သုံးစွဲသူများအပေါ် မတော်တဆမှု၏အကျိုးဆက်များ၏သက်ရောက်မှုကို လျှော့ချရန် လိုအပ်သည့်အရာအားလုံးကို လုပ်ဆောင်နိုင်စေပါသည်။
ဒုတိယအနေဖြင့်၊ လာမည့်နာရီများတွင် ဒေတာစင်တာ၏လည်ပတ်မှုကို အပြည့်အဝပြန်လည်ရယူနိုင်မည်မဟုတ်ကြောင်း ရှင်းရှင်းလင်းလင်းသိလာရသောကြောင့် ပုံတူများ ရေရှည်မရရှိနိုင်ခြင်းသည် အပြည့်ဒစ်များကဲ့သို့သော နောက်ဆက်တွဲပြဿနာများကို မဖြစ်ပေါ်စေကြောင်း သေချာစေရန် အစီအမံများပြုလုပ်ရန် လိုအပ်ပါသည်။ ကျန်ဒေတာစင်တာများ။
၁၇:၂၉။ ပီဇာအချိန်။ ကျွန်ုပ်တို့သည် စက်ရုပ်များမဟုတ်ဘဲ လူများကို အလုပ်ခန့်ထားသည်။

ဒေတာစင်တာ၏ မီးခိုးစမ်းသပ်မှု မီးလောင်ပါက ဆာဗာများကို ငြိမ်းသတ်သင့်ပါသလား။

ပြန်လည်ထူထောင်ရေး

၁၈:၀၂။ အမှတ် ၈ (ကျွန်ုပ်တို့၏) ဟောခန်းများတွင် ၉၊ ၁၀ နှင့် ၁၁ တို့တွင် အပူချိန် တည်ငြိမ်သွားပါသည်။ အော့ဖ်လိုင်းကျန်ရှိနေသည့်အရာများထဲမှတစ်ခု (နံပါတ် 18) သည် ကျွန်ုပ်တို့၏စက်ပစ္စည်းများကို တပ်ဆင်ထားပြီး ထိုနေရာတွင် အပူချိန်သည် ဆက်လက်မြင့်တက်နေပါသည်။
၁၈:၃၁။ ဟောခန်းအမှတ် ၁ နှင့် ၃ တို့တွင် စက်ပစ္စည်းကိရိယာများ စတင်တပ်ဆင်ရန် ကြိုပေးခဲ့ကြသည် - အဆိုပါခန်းမများ မီးလောင်မှုကြောင့် ထိခိုက်မှုမရှိခဲ့ပါ။

လက်ရှိတွင်၊ အစိုးရိမ်ရဆုံးနေရာများမှ စတင်၍ ခန်းမနံပါတ် 1၊ 3၊ 8 တွင် ဆာဗာများကို စတင်ဖွင့်လှစ်ထားပါသည်။ လုပ်ဆောင်နေသည့် ဝန်ဆောင်မှုအားလုံး၏ မှန်ကန်သောလုပ်ဆောင်ချက်ကို စစ်ဆေးထားသည်။ ခန်းမနံပါတ် 7 နဲ့ အဆင်မပြေသေးဘူး။

၁၈:၄၄။ ဒေတာစင်တာ၏ နည်းပညာဆိုင်ရာ ဝန်ထမ်းများသည် အခန်းနံပါတ် 18 (ကျွန်ုပ်တို့၏စက်ကိရိယာများတည်ရှိရာ) တွင် ဆာဗာများစွာကို ပိတ်ထားခြင်းမရှိကြောင်း တွေ့ရှိခဲ့သည်။ ကျွန်ုပ်တို့၏အချက်အလက်များအရ ဆာဗာ ၂၆ ခုသည် ထိုနေရာတွင် အွန်လိုင်းပေါ်တွင် ရှိနေသည်။ ဒုတိယစစ်ဆေးပြီးနောက်၊ ကျွန်ုပ်တို့သည် ဆာဗာ ၅၈ ခုကို တွေ့ရှိခဲ့သည်။
၂၀:၁၈။ ဒေတာစင်တာမှ နည်းပညာရှင်များသည် လေအေးပေးစက်မတပ်ထားသော အခန်းမှတဆင့် စင်္ကြံများမှတဆင့် ရွေ့လျားနေသော မိုဘိုင်းပြွန်များမှတဆင့် လေမှုတ်ထုတ်ပါသည်။
၂၃:၀၈။ ပထမဆုံး Admin ကို အိမ်ပြန်ပို့တယ်။ မနက်ဖြန် အလုပ်ဆက်လုပ်ရန် တစ်စုံတစ်ယောက်သည် ညဘက်တွင် အိပ်ရန် လိုအပ်သည်။ ထို့နောက်၊ ကျွန်ုပ်တို့သည် နောက်ထပ် စီမံခန့်ခွဲသူနှင့် ဆော့ဖ်ဝဲရေးသားသူအချို့ကို ထုတ်ပြန်ပါမည်။
၀၂:၅၆။ လွှင့်တင်နိုင်တဲ့ အရာအားလုံးကို ကျွန်တော်တို့ စတင်ခဲ့ပါတယ်။ ကျွန်ုပ်တို့သည် အလိုအလျောက်စမ်းသပ်မှုများကို အသုံးပြု၍ ဝန်ဆောင်မှုအားလုံးကို စစ်ဆေးခြင်းများစွာ ပြုလုပ်ပါသည်။

ဒေတာစင်တာ၏ မီးခိုးစမ်းသပ်မှု မီးလောင်ပါက ဆာဗာများကို ငြိမ်းသတ်သင့်ပါသလား။

၀၃:၀၂။ နောက်ဆုံး၊ 03th Hall တွင် လေအေးပေးစက်ကို ပြန်လည်ပြုပြင်ထားပါသည်။
၀၃:၃၆။ ကျွန်ုပ်တို့သည် ဒေတာစင်တာရှိ မျက်နှာစာများကို DNS ဖြင့် လှည့်ပတ်စေပါသည်။ ဤအခိုက်အတန့်မှစ၍ သုံးစွဲသူအသွားအလာ ရောက်ရှိလာပါသည်။
အုပ်ချုပ်ရေးအဖွဲ့ အများစုကို အိမ်ပြန်ပို့တယ်။ ဒါပေမယ့် ကျွန်တော်တို့က လူနည်းနည်းပဲ ကျန်ခဲ့တယ်။

သေးငယ်သော FAQ-
မေး- 18:31 ကနေ 02:56 ထိ ဘာဖြစ်သွားတာလဲ။
A- "ဘေးအန္တရာယ်ဆိုင်ရာ ဆောင်ရွက်မှု အစီအစဉ်" ကို လိုက်နာခြင်းဖြင့်၊ ကျွန်ုပ်တို့သည် အရေးကြီးဆုံးသော အရာများဖြင့် စတင်ကာ ဝန်ဆောင်မှုအားလုံးကို စတင်ဆောင်ရွက်ပါသည်။ ဤကိစ္စတွင်၊ ချတ်ရှိညှိနှိုင်းရေးမှူးသည် OS နှင့် အပလီကေးရှင်းများ စတင်ခြင်းရှိ၊ မရှိ၊ အမှားအယွင်းများ ရှိမရှိ၊ ညွှန်ကိန်းများ ပုံမှန်ဟုတ်မဟုတ် စစ်ဆေးပေးသော အခမဲ့ စီမံခန့်ခွဲသူတစ်ဦးထံသို့ ဝန်ဆောင်မှုကို ထုတ်ပေးပါသည်။ လွှင့်တင်မှုပြီးသွားသောအခါတွင် သူသည် အခမဲ့ဖြစ်ပြီး ညှိနှိုင်းရေးမှူးထံမှ ဝန်ဆောင်မှုအသစ်တစ်ခုကို လက်ခံရရှိကြောင်း ချတ်သို့ သတင်းပို့သည်။
မအောင်မြင်သော ဟာ့ဒ်ဝဲကြောင့် လုပ်ငန်းစဉ်သည် ပိုမိုနှေးကွေးသွားပါသည်။ OS ကို ရပ်တန့်ပြီး ဆာဗာများကို ပိတ်ခြင်းသည် မှန်ကန်သော်လည်း၊ အချို့သော ဆာဗာများသည် ဒစ်များ၊ မန်မိုရီနှင့် ကိုယ်ထည်များ ရုတ်တရက် ချို့ယွင်းမှုကြောင့် ပြန်မလာပါ။ ဓာတ်အား ဆုံးရှုံးသောအခါတွင် ပျက်ယွင်းမှုနှုန်း တိုးလာသည်။
မေး- အရာအားလုံးကို တစ်ပြိုင်နက်တည်း မလုပ်ဆောင်နိုင်တာ ဘာကြောင့်လဲ၊ ပြီးတော့ စောင့်ကြည့်မှုမှာ ဖြစ်ပေါ်လာတာကို ပြင်ပါ။
A- ဝန်ဆောင်မှုများကြားတွင် မှီခိုမှုများရှိနေသောကြောင့် အရာအားလုံးကို ဖြည်းဖြည်းချင်းလုပ်ဆောင်ရပါမည်။ စောင့်ကြည့်မှုမစောင့်ဘဲ အရာအားလုံးကို ချက်ချင်းစစ်ဆေးသင့်သည် - ဘာကြောင့်လဲဆိုတော့ ပိုဆိုးလာမှာကို မစောင့်ဘဲနဲ့ ပြဿနာတွေကို ချက်ချင်းကိုင်တွယ်ဖြေရှင်းတာက ပိုကောင်းပါတယ်။

၇:၄၀။ နောက်ဆုံး admin (ညှိနှိုင်းရေးမှူး) အိပ်ရာဝင်သွားတယ်။ ပထမနေ့ အလုပ်ပြီးပါပြီ။
၈:၀၉။ ပထမဆုံး developer များ၊ ဒေတာစင်တာအင်ဂျင်နီယာများနှင့် စီမံခန့်ခွဲသူများ (ညှိနှိုင်းရေးမှူးအသစ် အပါအဝင်) သည် ပြန်လည်ထူထောင်ခြင်းလုပ်ငန်းကို စတင်ခဲ့သည်။
၀၉:၃၇။ ခန်းမနံပါတ် 09 (နောက်ဆုံးတစ်ခု) ကို စတင်ဖွင့်လှစ်ခဲ့သည်။
တစ်ချိန်တည်းမှာပင်၊ ကျွန်ုပ်တို့သည် အခြားအခန်းများတွင် ပြုပြင်မထားသောအရာကို ပြန်လည်ရယူရန် ဆက်လက်လုပ်ဆောင်နေသည်- disks/memory/servers များကို အစားထိုးခြင်း၊ စောင့်ကြည့်ခြင်းတွင် "လောင်ကျွမ်းသွားသော အရာအားလုံးကို ပြုပြင်ခြင်း"၊ master-standby schemes တွင် အခန်းကဏ္ဍများပြန်ပြောင်းခြင်းနှင့် အခြားအရာများပါရှိသည့် အခြားသေးငယ်သောအရာများ၊ သို့သော်လည်း တော်တော်များတယ်။
၁၇:၀၈။ ကျွန်ုပ်တို့သည် ထုတ်လုပ်မှုနှင့် ပုံမှန်အလုပ်အားလုံးကို ခွင့်ပြုသည်။
၂၁:၄၅။ ဒုတိယနေ့ အလုပ်ပြီးပါပြီ။
၀၉:၄၅။ ဒီနေ့သောကြာနေ့ပါ။ စောင့်ကြည့်မှုတွင် ပြဿနာအနည်းငယ်ရှိသေးသည်။ သီတင်းကျွတ်ပိတ်ရက်ရောက်ပြီဆိုတော့ လူတိုင်း အပန်းဖြေချင်ကြပါတယ်။ ကျွန်တော်တို့ တတ်နိုင်သမျှ အကြီးကြီး ပြုပြင်မှုတွေ လုပ်နေပါတယ်။ ရွှေ့ဆိုင်းနိုင်သည့် ပုံမှန်စီမံခန့်ခွဲရေးတာဝန်များကို ရွှေ့ဆိုင်းလိုက်ပါသည်။ ညှိနှိုင်းရေးမှူးက အသစ်ပါ။
၁၅:၄၀။ အခြားဒေတာစင်တာရှိ Core ကွန်ရက်စက်ပစ္စည်းအစုအဝေး၏ ထက်ဝက်သည် ရုတ်တရက် ပြန်လည်စတင်ခဲ့သည်။ အန္တရာယ်များကို လျှော့ချရန် မျက်နှာစာများကို လှည့်ခြင်းမှ ဖယ်ရှားခဲ့သည်။ အသုံးပြုသူများအတွက် အကျိုးသက်ရောက်မှု မရှိပါ။ နောက်ပိုင်းတွင် ၎င်းသည် ကိုယ်ထည် ချို့ယွင်းသွားကြောင်း ထွက်ပေါ်လာခဲ့သည်။ ညှိနှိုင်းရေးမှူးက မတော်တဆမှုနှစ်ခုကို တစ်ပြိုင်နက်တည်း ပြုပြင်ပေးနေပါတယ်။
၁၇:၁၇။ အခြားဒေတာစင်တာရှိ ကွန်ရက်လည်ပတ်မှုကို ပြန်လည်ရယူထားပြီး၊ အရာအားလုံးကို စစ်ဆေးပြီးဖြစ်သည်။ ဒေတာစင်တာကို လှည့်ပတ်ထားသည်။
၁၈:၂၉။ သုံးရက်မြောက်သောနေ့၏လုပ်ငန်းနှင့် ယေဘုယျအားဖြင့် မတော်တဆမှုပြီးသွားပြီးနောက် ပြန်လည်ထူထောင်ရေးလုပ်ငန်းများ။

afterword

၂၀၁၁ 404 error ၏နေ့တွင်“အတန်းဖော်”၊ အကြီးမားဆုံး မတော်တဆမှုမှ လွတ်မြောက်ခဲ့သည်။ - ပေါ်တယ်သည် သုံးရက်အတွင်း လုံးဝ သို့မဟုတ် တစ်စိတ်တစ်ပိုင်း မရရှိနိုင်ပါ။ ဤအချိန်တစ်လျှောက်လုံးတွင် မတူညီသောကုမ္ပဏီများမှ၊ မတူညီသောမြို့များမှ လူပေါင်း 100 ကျော် (ကျေးဇူးတင်ပါတယ် ထပ်မံ၍) ဒေတာစင်တာများတွင် အဝေးမှ တိုက်ရိုက်၊ ကိုယ်တိုင်နှင့် အလိုအလျောက် ဆာဗာထောင်ပေါင်းများစွာကို ပြုပြင်ပေးပါသည်။
ကျွန်တော်တို့ ကောက်ချက်ဆွဲပြီးပါပြီ။ ထပ်မံမဖြစ်ပွားစေရန်အတွက် ကျွန်ုပ်တို့သည် ယနေ့တိုင် ကျယ်ကျယ်ပြန့်ပြန့် ဆောင်ရွက်လျက်ရှိပါသည်။

လက်ရှိ မတော်တဆမှုနှင့် 404 အကြား အဓိက ကွာခြားချက်များကား အဘယ်နည်း။

  • ကျွန်ုပ်တို့တွင် "မတော်တဆထိခိုက်မှုဆိုင်ရာ စီမံချက်" တစ်ခုရှိသည်။ လေးပုံတစ်ပုံတစ်ကြိမ်၊ ကျွန်ုပ်တို့သည် လေ့ကျင့်ခန်းများပြုလုပ်သည် - ကျွန်ုပ်တို့သည် စီမံခန့်ခွဲသူများအဖွဲ့ (တစ်လှည့်စီ) မှ "အရေးပေါ်ဆောင်ရွက်မှုအစီအစဉ်" ကိုအသုံးပြု၍ ဖယ်ရှားရမည့် အရေးပေါ်အခြေအနေတွင် ပါဝင်သရုပ်ဆောင်ထားပါသည်။ ဦးဆောင်စနစ် စီမံခန့်ခွဲသူများသည် ညှိနှိုင်းရေးမှူး၏ အခန်းကဏ္ဍကို အလှည့်ကျ လုပ်ဆောင်ကြသည်။
  • စမ်းသပ်မုဒ်တွင် သုံးလတစ်ကြိမ်၊ ကျွန်ုပ်တို့သည် ဒေတာစင်တာများကို LAN နှင့် WAN ကွန်ရက်များမှတစ်ဆင့် ခွဲထုတ်ပြီး ပိတ်ဆို့မှုများကို ချက်ချင်းဖော်ထုတ်နိုင်စေပါသည်။
  • ကျွန်ုပ်တို့သည် စံချိန်စံညွှန်းများကို တင်းကျပ်ထားသောကြောင့် ကျိုးပဲ့သောဒစ်များ နည်းပါးသွားသည်- လည်ပတ်ချိန်နည်းပါးခြင်း၊ SMART အတွက် ကန့်သတ်ချက်များ၊
  • ဆာဗာပြန်လည်စတင်ပြီးနောက် ပြန်လည်ရယူရန် အချိန်များစွာလိုအပ်သော ဟောင်းနွမ်းပြီး မတည်မငြိမ်ဒေတာဘေ့စ် BerkeleyDB ကို ကျွန်ုပ်တို့ လုံးဝစွန့်ပစ်ခဲ့သည်။
  • ကျွန်ုပ်တို့သည် MS SQL ဖြင့် ဆာဗာအရေအတွက်ကို လျှော့ချပြီး ကျန်ရှိသည့်အရာများအပေါ် မှီခိုမှုကို လျှော့ချခဲ့သည်။
  • ငါတို့မှာ ကိုယ်ပိုင်ရှိတယ်။ cloud - one-cloudကျွန်ုပ်တို့သည် ဝန်ဆောင်မှုအားလုံးကို တက်ကြွစွာ ရွှေ့ပြောင်းနေသည်မှာ ယခု နှစ်နှစ်ရှိပြီဖြစ်သည်။ cloud သည် အပလီကေးရှင်းနှင့် အလုပ်လုပ်သည့် စက်ဝန်းတစ်ခုလုံးကို အလွန်ရိုးရှင်းစေပြီး မတော်တဆမှုတစ်ခုတွင် ၎င်းသည် ဤကဲ့သို့သောထူးခြားသောကိရိယာများကို ပံ့ပိုးပေးသည်-
    • တစ်ချက်နှိပ်ရုံဖြင့် အပလီကေးရှင်းအားလုံး၏ ရပ်တန့်မှုကို မှန်ကန်စေပါသည်။
    • မအောင်မြင်သော ဆာဗာများမှ အပလီကေးရှင်းများကို လွယ်ကူစွာ ရွှေ့ပြောင်းခြင်း၊
    • ဒေတာစင်တာတစ်ခုလုံးကို အလိုအလျောက် အဆင့်သတ်မှတ်ခြင်း (ဝန်ဆောင်မှုများ၏ ဦးစားပေးအစီအစဉ်အတိုင်း) စတင်ခြင်း။

ဤဆောင်းပါးတွင်ဖော်ပြထားသော မတော်တဆမှုသည် ၄၀၄ ရက်မြောက်နေ့ကတည်းက အကြီးမားဆုံးဖြစ်သည်။ ဟုတ်ပါတယ် အရာအားလုံးက ချောချောမွေ့မွေ့ ဖြစ်သွားတာတော့ မဟုတ်ပါဘူး။ ဥပမာအားဖြင့်၊ အခြားဒေတာစင်တာရှိ မီးလောင်ပျက်စီးသွားသော ဒေတာစင်တာကို မရရှိနိုင်ချိန်တွင် ဆာဗာတစ်ခုရှိ ဒစ်ခ်တစ်ခု မအောင်မြင်ခဲ့ကြောင်း၊ ဆိုလိုသည်မှာ Cassandra အစုအဝေးရှိ ပုံစံတူသုံးမျိုးအနက်မှ တစ်ခုသာ အသုံးပြုခွင့်ရှိနေသည့်အတွက်ကြောင့် မိုဘိုင်းလ်၏ 404%၊ အပလီကေးရှင်းအသုံးပြုသူများသည် အကောင့်ဝင်၍မရပါ။ တစ်ချိန်တည်းမှာပင်၊ ချိတ်ဆက်ပြီးသားအသုံးပြုသူများ ဆက်လက်လုပ်ဆောင်ခဲ့သည်။ စုစုပေါင်း၊ မတော်တဆမှု၏ရလဒ်အနေဖြင့်၊ banal bugs မှဝန်ဆောင်မှုဗိသုကာတွင်ချို့ယွင်းချက်များအထိပြဿနာ 4,2 ကျော်ကိုဖော်ထုတ်ခဲ့သည်။

သို့သော် လက်ရှိ မတော်တဆမှု နှင့် 404th အကြား အရေးအကြီးဆုံး ကွာခြားချက်မှာ မီး၏ အကျိုးဆက်များကို ဖယ်ရှားနေစဉ်တွင် သုံးစွဲသူများထံသို့ ဗီဒီယို ခေါ်ဆိုမှုများ ပြုလုပ်နေဆဲ ဖြစ်ကြောင်း ၊ အတိအကျဂိမ်းကစားခြင်း၊ သီချင်းနားထောင်ခြင်း၊ အချင်းချင်းလက်ဆောင်များပေးခြင်း၊ ဗီဒီယိုကြည့်ခြင်း၊ တီဗီစီးရီးနှင့် တီဗီချန်နယ်များ OK ကို, နှင့်လည်း streamed အိုကေ.

မင်းရဲ့ မတော်တဆမှုက ဘယ်လိုလဲ။

source: www.habr.com

မှတ်ချက် Add