Slurm SRE - သုံးစွဲသူ ပျော်ရွှင်မှုကို သေချာစေရန် သင်ယူခြင်း။

Slurm SRE - သုံးစွဲသူ ပျော်ရွှင်မှုကို သေချာစေရန် သင်ယူခြင်း။

Slurm SRE သည် ဖေဖော်ဝါရီ ၃ ရက်တွင် မော်စကို၌ စတင်သည်။

ဤသည်မှာ "ဆရာပြီးနောက် ပြန်လုပ်ပါ" အစီအစဉ်မှ ဝေးကွာသွားသည့် ပထမဆုံး အထူးကြပ်မတ်မှုဖြစ်သည်။ အခြေအနေများကို တိုက်ဖျက်ရန် အတတ်နိုင်ဆုံး အနီးကပ် SRE ပရောဂျက်တစ်ခုတွင် သင်သည် အလုပ်ရှာရလိမ့်မည်။

သင့်လက်ထဲတွင် ပြီးပြည့်စုံသော အလုပ်ပရောဂျက်တစ်ခုကို ရရှိမည်ဖြစ်ပြီး ၎င်းကို အချိန်နှင့်တပြေးညီ လုပ်ဆောင်နိုင်မည်ဖြစ်သည်။ ပုံမှန် SRE လုပ်ဆောင်စရာတစ်ခုက သင့်အား စောင့်ကြိုနေပါသည်- မရင်းနှီးသောကုဒ်ဖြင့် လုပ်ဆောင်ခြင်း၊ ဖြန့်ဝေမှုစနစ်များကို တစ်ပြိုင်တည်းလုပ်ဆောင်ခြင်းဆိုင်ရာ ပြဿနာများ၊ လုပ်ဖော်ကိုင်ဖက်များနှင့် ဆက်သွယ်ရာတွင် အခက်အခဲများ။

အသေးအဖွဲမဟုတ်သော စနစ်ကျရှုံးမှုများကို လက်တွေ့ဘဝမှ ထုတ်ယူသည်ကို သင်တွေ့လိမ့်မည်။ (“လုပ်ဖော်ကိုင်ဖက်တွေ တောင်းပန်ပါတယ်၊ နောက်နှစ်ရက်အတွင်း အစည်းအဝေးတွေ မတက်နိုင်တော့ပေမယ့် ကျွန်တော်တို့ အစီအစဉ်အတွက် ကောင်းမွန်တဲ့ ကိစ္စတစ်ခု ပေါ်လာပါပြီ”)။

ကျွန်ုပ်တို့၏လေ့ကျင့်ရေးကုမ္ပဏီအတွက် စက္ကန့်တိုင်း အမြတ်ဆုံးရှုံးသွားသောကြောင့် အဖြစ်အပျက်များသည် လျင်မြန်စွာ ဖွံ့ဖြိုးတိုးတက်လာမည်ဖြစ်ပါသည်။

သင်တန်းသားတွေကို အဖွဲ့တွေခွဲမယ်။ အဖွဲ့တစ်ဖွဲ့စီတွင် နည်းပြတစ်ဦး၊ သင်တန်းဟောပြောသူ တစ်ဦးရှိမည်ဖြစ်သည်။ အဖွဲ့တစ်ဖွဲ့စီသည် ၎င်း၏ကိုယ်ပိုင်နောက်ခံအတွက် တာဝန်ရှိသည်။ အဖြစ်အပျက်များ ပေါ်ပေါက်လာသည်နှင့်အမျှ သင့်အဖွဲ့၏ အလုပ်များကို စုစည်းပြီး အခြားအဖွဲ့များနှင့် အပြန်အလှန် ဆက်ဆံရန် လိုအပ်ပါသည်။ ကျွန်ုပ်တို့သည် ရမှတ်ဖြင့် ကစားသည်- တရားသူကြီးများသည် ၎င်း၏ လုပ်ဆောင်ချက်များသည် မည်မျှ လုံလောက်ပြီး ထိရောက်မှု ရှိသည်ကို သိနိုင်စေရန် တရားသူကြီးများက အမှတ်များ နုတ်ယူကာ ပေါင်းထည့်မည်ဖြစ်သည်။ အဆုံးမှာ ကံထူးရှင်ကို ကြေညာပေးပါမယ်။

အဖြစ်အပျက်တစ်ခုစီပြီးနောက် လုပ်ငန်းစဉ်များတွင် စနစ်ပိုင်းဆိုင်ရာပြဿနာများကို ဖော်ထုတ်ပြီး ပြုပြင်ပေးမည့် debriefing တစ်ခုရှိပါမည်။ ကုသပေးသူများသည် အပြစ်ကင်းစင်သော ယဉ်ကျေးမှုကို လိုက်နာရန် သေချာစေမည်ဖြစ်သည်။ ကျွန်ုပ်တို့၏ဒေသတွင်၊ အပြစ်ကင်းသောချဉ်းကပ်မှုမှာ အလွန်ပျံ့နှံ့သေးသော်လည်း ၎င်းသည် SRE နှင့် DevOps ကို အကောင်အထည်ဖော်ရန် သော့ချက်တစ်ခုဖြစ်သည်။

ကျွန်ုပ်တို့သည် သုံးရက်အတွင်း ကမ္ဘာလုံးဆိုင်ရာ ပါရာဒိုင်းအပြောင်းအရွှေ့ကို အောင်မြင်ရန် မျှော်လင့်ပါသည်- သင့်အား SRE အင်ဂျင်နီယာတစ်ဦးကဲ့သို့ တွေးခေါ်တတ်စေရန် သင်ကြားပေးပြီး SRE အင်ဂျင်နီယာကဲ့သို့ ပရောဂျက်တစ်ခုကို ကြည့်ရှုပါ။

ပါဝင်ရန်၊ လက်ပ်တော့တစ်လုံး၊ နားကြပ်တစ်လုံးနှင့် Kubernetes ၏ အခြေခံအသိပညာ လိုအပ်ပါသည်။ နောက်ဆုံးအချက်မရှိပါက ကျန်အချိန်များတွင် အွန်လိုင်းသင်တန်းကို တက်ရောက်နိုင်ပါသည်။ Slurm Kubernetes.

မှတ်ပုံတင် ဒီမှာ.

source: www.habr.com

မှတ်ချက် Add