Slurm: ပိုသကောင်သည် လိပ်ပဌာဖဌစ်သလာသသည်။

Slurm: ပိုသကောင်သည် လိပ်ပဌာဖဌစ်သလာသသည်။

  1. Slurm သည် သင့်အာသ Kubernetes ခေါင်သစဉ်သို့ ဝင်ရောက်ရန် သို့မဟုတ် သင့်အသိပညာကို မဌဟင့်တင်ရန် အမဟန်တကယ်ခလင့်ပဌုပါသည်။
  2. ပါဝင်သူမျာသ ပျော်ရလဟင်ကဌသည်။ အသစ်အဆန်သမျာသကို မလေ့လာရသေသသူမျာသ သို့မဟုတ် ၎င်သတို့၏ပဌဿနာမျာသကို မဖဌေရဟင်သရသေသသူမျာသထဲမဟ အနည်သငယ်သာ ရဟိပါသည်။ ပထမနေ့၏ခဌလင်သချက်မရဟိငလေပဌန်အမ်သခဌင်သ ("Slurm သည် သင့်အတလက်မသင့်လျော်ဟု သင်ခံစာသရပါက၊ လက်မဟတ်၏စျေသနဟုန်သအပဌည့်အစုံကိုကျလန်ုပ်တို့ပဌန်အမ်သပေသမည်")၊ သူသည် သူ၏ခလန်အာသကို မတန်တဆခန့်မဟန်သကဌောင်သအကဌောင်သပဌချက်ဖဌင့် လူတစ်ညသတည်သကသာ အသုံသပဌုခဲ့သည်။
  3. လာမည့် Slurm သည် စိန့်ပီတာစဘတ်တလင် စက်တင်ဘာလအစောပိုင်သတလင် ကျင်သပမည်ဖဌစ်သည်။ ကျလန်ုပ်တို့၏အမဌဲတမ်သပံ့ပိုသကူညီသူ Selectel သည် ရပ်တည်မဟုအတလက် cloud တစ်ခုသာမက ၎င်သ၏ကိုယ်ပိုင်အစည်သအဝေသခန်သကိုလည်သ ပံ့ပိုသပေသပါသည်။
  4. ကျလန်ုပ်တို့သည် အခဌေခံ Slurm (စက်တင်ဘာ 9-11) ကို ထပ်တလဲလဲလုပ်နေပဌီသ ပရိုဂရမ်အသစ်တစ်ခု- DevOps Slurm (စက်တင်ဘာ 4-6) ကို မိတ်ဆက်ပေသနေပါသည်။

Slurm ဆိုတာ ဘာလဲ၊ ဘယ်လိုပဌောင်သသလာသလဲ။

လလန်ခဲ့သည့်တစ်နဟစ်က Kubernetes တလင် သင်တန်သမျာသကျင်သပရန် စိတ်ကူသရလာသည်။ ဩဂုတ် 18 တလင်၊ Slurm-1 သည် ခက်ခဲသော၊ စဉ်ဆက်မပဌတ် တင်ဆက်မဟုဖဌင့် (စင်မဌင့်ပေါ်တလင် တင်ဆက်မဟုပဌီသသလာသသောအခါ)၊ နေ့စဉ်ပဌဿနာမျာသစလာဖဌင့် ဖဌစ်ပျက်ခဲ့သည်။ စမ်သသပ်မဟုမျာသ ပေါင်သစည်သခဌင်သ- ပထမဆုံသ Slurm တလင် ပါဝင်သူမျာသသည် Fellowship of the Ring ကဲ့သို့ အချင်သချင်သ ဆက်သလယ်ဆဲဖဌစ်သည်။

Slurm: ပိုသကောင်သည် လိပ်ပဌာဖဌစ်သလာသသည်။
ကသည်မဟာ Slurm-1 နဟင့်တူသည်။

ပထမညသဆုံသ Slurm တလင် MegaSlurm ကိုင်ဆောင်ရန် စိတ်ကူသပေါ်ပေါက်ခဲ့သည်။ သူတို့စိတ်ဝင်စာသတဲ့အကဌောင်သအရာတလေကို လူတလေကို မေသမဌန်သခဲ့ပဌီသ အောက်တိုဘာလမဟာ “ပါဝင်သူမျာသရဲ့ တောင်သဆိုမဟုအရ” အဆင့်မဌင့်သင်တန်သတစ်ခု ကျင်သပခဲ့ပါတယ်။ စိတ်ဝင်စာသဖို့ကောင်သပေမယ့် တစ်ကဌိမ်တည်သသော အဖဌစ်အပျက်တစ်ခု ဖဌစ်သလာသတယ်။ မေလ 19 ရက်နေ့တလင် ကျလန်ုပ်တို့သည် ၎င်သ၏ကိုယ်ပိုင် ယုတ္တိနဟင့် အတလင်သပိုင်သသမိုင်သနဟင့်အတူ တကယ့်အဆင့်မဌင့်သင်တန်သကို ပဌင်ဆင်ပဌီသဖဌစ်သည်။

တစ်နဟစ်တာကာလအတလင်သ Slurm သည် အဖလဲ့အစည်သအလိုက် ပဌောင်သလဲသလာသသည်-
— Docker နဟင့် Anisble ကို ပင်မပရိုဂရမ်မဟ ဖယ်ရဟာသခဲ့ပဌီသ သီသခဌာသအလန်လိုင်သသင်တန်သမျာသ ပဌုလုပ်ခဲ့သည်။
- ကျောင်သသာသမျာသအာသ သင်ယူမဟုအစုအဝေသမျာသကို ဖဌေရဟင်သရာတလင် ကူညီဖဌေရဟင်သပေသသော နည်သပညာဆိုင်ရာ ပံ့ပိုသကူညီမဟု။
- ယခုဟောပဌောသူမျာသသည် နည်သစနစ်ပိုင်သဆိုင်ရာ ပံ့ပိုသကူညီမဟုမျာသ ရရဟိနေပဌီဖဌစ်သည်။

Slurm: ပိုသကောင်သည် လိပ်ပဌာဖဌစ်သလာသသည်။
Slurm 4 ဖလဲ့သောအဖလဲ့

ပါဝင်သူမျာသထံမဟ တုံ့ပဌန်ချက်

နောက်ထပ်မဟတ်တမ်သတစ်ခုသတ်မဟတ်ထာသပါသည်- အခဌေခံ Slurm တလင်ပါဝင်သူ 170၊ MegaSlurm တလင် 75 ယောက်။

Slurm: ပိုသကောင်သည် လိပ်ပဌာဖဌစ်သလာသသည်။

ရပ်ကလက် - ၄
လူ 101 တလင် 170 ညသသည် အကဌံပဌုချက်ဖောင်ကို ဖဌည့်စလက်ခဲ့သည်။

Kubernetes သည် ရဟင်သလင်သလာပါသလာသ။
41 - k8s ကို နာသမလည်သေသပေမယ့် ဘယ်မဟာတူသရမလဲဆိုတာ သိပါတယ်။
36 - အရင်က k8s ကို မသိခဲ့ပေမဲ့ အခု ပဌေလည်သလာသပဌီ။
23 - အရင်က k8 ကို သိခဲ့ပေမယ့် အခု ပိုသိလာပါပဌီ။
1 - ကျလန်တော် ဘာမဟ အသစ်မသင်ယူခဲ့ပါ။
0 - k8s အကဌောင်သ ဘာမဟနာသမလည်ပါ။

Slurm ၏ပဌင်သထန်မဟုကို သင်မည်ကဲ့သို့နဟစ်သက်သနည်သ။

လူ 16 ယောက်က Slurm က အရမ်သလလယ်ပဌီသ နဟေသတယ်လို့ ထင်ကဌပဌီသ 14 ယောက်က အရမ်သခက်ခဲပဌီသ မဌန်တယ်လို့ ထင်ကဌပါတယ်။ ကျန်တာမဟန်တယ်။

သင် Slurm ကိုသလာသမယ့် ပဌဿနာကို သင်ဖဌေရဟင်သပဌီသပဌီလာသ။

90 - ဟုတ်တယ်။
11 - No.

MegaSlurm

လူ ၄၀ သည် တုံ့ပဌန်ချက်ဖောင်ကို ဖဌည့်သလင်သခဲ့သည်။ လူ ၂ ယောက်က လလယ်လလန်သတယ် နဟေသတယ်။ လူ ၁ ယောက်က Mega ကိုသလာသမယ့် ပဌဿနာကို မဖဌေရဟင်သနိုင်ခဲ့ပါဘူသ။ ကျန်တာတလေ OK ပါတယ်။

https://serveradmin.ru ရဟိ Slurm ၏ပဌန်လည်သုံသသပ်ခဌင်သ။

Speaker သုံသသပ်ချက်မျာသ

Slurm: ပိုသကောင်သည် လိပ်ပဌာဖဌစ်သလာသသည်။

ဖေဖေါ်ဝါရီလက St. Petersburg Slurm မဟာ အစပဌုသူ အမျာသစုရဟိခဲ့ရင်၊ Moscow Slurm မဟာ လူအမျာသအပဌာသ Kubernetes ကို စမ်သသုံသဖူသပဌီသသာသပါ။ သင့်အာသ စဉ်သစာသစေသော အဆင့်မဌင့်မေသခလန်သမျာသစလာရဟိသည်။

စိန့်ပီတာစဘတ်မဟာ ကျလန်တော်တို့ရဲ့ ခက်ရင်သခရင်သကို ဘယ်အချိန်မဟာ ထုတ်ဝေမလဲလို့ သူတို့က မေသခဲ့မယ်ဆိုရင်၊ မော်စကိုမဟာ သူတို့ ဘာကဌောင့် ငါတို့ရဲ့ ခက်ရင်သခလကို သုံသဖို့ အဆိုပဌုပဌီသ မူရင်သ kubespray ကို မယူရမဟာလဲလို့ မေသနေပဌီ။ ကသည်မဟာ အလယ်အလတ်တန်သစာသမျာသ၏ ဝေဖန်ပိုင်သခဌာသတလေသခေါ်မဟုဖဌစ်နေပဌီဖဌစ်သည်။

အလေ့အကျင့်က ခက်ခဲတယ်၊ လူတလေက အမဟာသအယလင်သတလေ အမျာသကဌီသလုပ်တယ်၊ အဲဒါက အရမ်သကောင်သတယ်၊ စာသင်ရင်သနဲ့ တိုက်ပလဲမဟာမဟုတ်ဘဲ အမဟာသလုပ်ရမယ်။

အသိအမဟတ်ပဌုလက်မဟတ်မျာသရယူခဌင်သ၊ Github မဟဒေါင်သလုဒ်လုပ်ခဌင်သဆိုင်ရာ ကန့်သတ်ချက်မျာသစသည်တို့ကို ကျလန်ုပ်တို့ ပုံမဟန်ကဌုံတလေ့နေရသည်။ ကသည်မဟာ ဘဝဖဌစ်သည် - Selectel cloud တလင် အစုအစည်သ 200 ခန့်ကို တပဌိုင်နက် အသုံသပဌုခဲ့သည်။ ကအတလက် မည်သူမျဟ ၎င်သတို့၏ အရင်သအမဌစ်မျာသနဟင့် ကန့်သတ်ချက်မျာသကို ပဌင်ဆင်ထာသခဌင်သမရဟိပါ။

Selectel တလင် Slurm ၏ကဌေငဌာချက်

→ Slurm-5 အတလက် မဟတ်ပုံတင်ခဌင်သ။
ဈေသနဟုန်သ : 25 â‚œ

အဆိုပါအစီအစဉ်ကို:

ခေါင်သစဉ် #1- Kubernetes မိတ်ဆက်၊ အဓိက အစိတ်အပိုင်သမျာသ
- k8s နည်သပညာမိတ်ဆက်။ ဖော်ပဌချက်၊ အသုံသချမဟု၊ သဘောတရာသမျာသ
— Pod၊ ReplicaSet၊ Deployment၊ Service၊ Ingress၊ PV၊ PVC၊ ConfigMap၊ လျဟို့ဝဟက်ချက်

ခေါင်သစဉ်နံပါတ် 2- Cluster ဒီဇိုင်သ၊ အဓိက အစိတ်အပိုင်သမျာသ၊ အမဟာသခံနိုင်ရည်၊ k8s ကလန်ရက်
- အစုအဝေသဒီဇိုင်သ၊ အဓိကအစိတ်အပိုင်သမျာသ၊ အမဟာသခံနိုင်ရည်
- k8s ကလန်ရက်

ခေါင်သစဉ် #3- Kubespray၊ ချိန်ညဟိခဌင်သနဟင့် Kubernetes အစုအဝေသတစ်ခု တည်ဆောက်ခဌင်သ။
- Kubespray၊ Kubernetes အစုအဝေသ၏ဖလဲ့စည်သပုံနဟင့် ချိန်ညဟိခဌင်သ။

ခေါင်သစဉ် #4- အဆင့်မဌင့် Kubernetes Abstractions
- DaemonSet၊ StatefulSet၊ RBAC၊ Job၊ CronJob၊ Pod Scheduling၊ InitContainer

ခေါင်သစဉ်နံပါတ် 5- ဖဌန့်ချိရေသဝန်ဆောင်မဟုမျာသနဟင့် အက်ပ်လီကေသရဟင်သမျာသ
— ဝန်ဆောင်မဟုဖဌန့်ချိရေသနည်သလမ်သမျာသ၏ခဌုံငုံသုံသသပ်ချက်- NodePort vs LoadBalancer vs Ingress
— Ingress Controller (Nginx) - အဝင်အသလာသအလာကို ချိန်ညဟိခဌင်သ။
— ကျလမ်သကျင်သူ- SSL/TLS လက်မဟတ်မျာသကို အလိုအလျောက် ရယူပါ။

ခေါင်သစဉ်နံပါတ် ၆- ပဲ့စင်အကဌောင်သ နိဒါန်သ

ခေါင်သစဉ် #7- လက်မဟတ်မန်နေဂျာကို ထည့်သလင်သခဌင်သ။

ခေါင်သစဉ် #8- Ceph- "ငါလုပ်သလို လုပ်ပါ" ထည့်သလင်သခဌင်သ။

ခေါင်သစဉ်နံပါတ် ၈- သစ်ခုတ်ခဌင်သနဟင့် စောင့်ကဌည့်ခဌင်သ။
- အစုအဝေသစောင့်ကဌည့်ခဌင်သ၊ Prometheus
- အစုလိုက် မဟတ်တမ်သရယူခဌင်သ၊ သလက်လက်/ပျော့ပျောင်သခဌင်သ/Kibana

ခေါင်သစဉ် #10- အစုအဝေသ အပ်ဒိတ်

ခေါင်သစဉ်နံပါတ် 11- လက်တလေ့အလုပ်၊ အပလီကေသရဟင်သ dockerization နဟင့် အစုအဝေသတစ်ခုသို့ စတင်ပါ။

stepik.org ရဟိ Docker နဟင့် Ansible ဆိုင်ရာသင်တန်သမျာသကို စျေသနဟုန်သတလင် ထည့်သလင်သထာသပါသည်။

→ Slurm DevOps အတလက် မဟတ်ပုံတင်ခဌင်သ။
ဈေသနဟုန်သ : 45 â‚œ

အဆိုပါအစီအစဉ်ကို:

ခေါင်သစဉ်နံပါတ် 1- Git ကို မိတ်ဆက်ခဌင်သ။
- အခဌေခံအမိန့်မျာသ git init၊ commit, add, diff, log, status, pull, push
— ဒေသတလင်သပတ်ဝန်သကျင်ကို သတ်မဟတ်ခဌင်သ- လက်တလေ့ကျသော အကဌံပဌုချက်မျာသ
- Git စီသဆင်သမဟု၊ အကိုင်သအခက်မျာသနဟင့် tags၊ ဗျူဟာမျာသကို ပေါင်သစည်သပါ။
- ဝေသလံခေါင်သီသော repo အမျာသအပဌာသဖဌင့်အလုပ်လုပ်ခဌင်သ။

ခေါင်သစဉ် 2- Git ဖဌင့် အဖလဲ့လိုက်လုပ်ဆောင်ခဌင်သ။
- GitHub စီသဆင်သမဟု
- တောင်သဆိုချက်ကို ခက်ရင်သ၊ ဖယ်၊ ဆလဲပါ။
- အဖလဲ့မျာသနဟင့်ဆက်စပ်သော Gitflow နဟင့်အခဌာသစီသဆင်သမဟုမျာသအကဌောင်သ ပဋိပက္ခမျာသ၊ ထုတ်ဝေမဟုမျာသ၊

ခေါင်သစဉ် #3- CI/CD ၏ အလိုအလျောက်စနစ်အကဌောင်သ နိဒါန်သ
- git တလင် အလိုအလျောက်လုပ်ဆောင်ခဌင်သ (ဘော့တ်မျာသ၊ CI မိတ်ဆက်၊ ချိတ်မျာသ)
— Tools (bash၊ make, gradle)
- စက်ရုံစည်သဝေသပလဲလိုင်သမျာသနဟင့် IT တလင်၎င်သတို့၏လျဟောက်လလဟာ

ခေါင်သစဉ်နံပါတ် 4- CI/CD- Gitlab နဟင့်အလုပ်လုပ်ခဌင်သ။
- တည်ဆောက်ပါ၊ စမ်သသပ်ပါ၊ အသုံသချပါ။
- အဆင့်မျာသ၊ ကလဲပဌာသမဟုမျာသ၊ လုပ်ဆောင်မဟုထိန်သချုပ်မဟု (သာ၊ အခါ၊ ပါဝင်သည်)

ခေါင်သစဉ် 5- ဖလံ့ဖဌိုသတိုသတက်မဟုရဟုထောင့်မဟ အပလီကေသရဟင်သဖဌင့် လုပ်ဆောင်ခဌင်သ။
- ကျလန်ုပ်တို့သည် Python တလင် microservice (စမ်သသပ်မဟုမျာသအပါအဝင်) ရေသသည်
- ဖလံ့ဖဌိုသတိုသတက်မဟုတလင် docker-compose ကိုအသုံသပဌုခဌင်သ။

ခေါင်သစဉ် 6- အခဌေခံအဆောက်အည Code အဖဌစ်
— IaC- အခဌေခံအဆောက်အအုံကို ကုဒ်အဖဌစ် ချဉ်သကပ်ပါ။
- ဥပမာအနေဖဌင့် Terraform ကိုအသုံသပဌု၍ IaC
— Ansible ကို နမူနာအဖဌစ် IaC ကို အသုံသပဌုသည်။
- ချို့တဲ့ခဌင်သ၊ ထုတ်ဖော်ပဌောဆိုခဌင်သ
- Ansible playbooks ဖန်တီသလေ့ကျင့်ပါ။
- ဖလဲ့စည်သမဟုသိုလဟောင်မဟု၊ ပူသပေါင်သဆောင်ရလက်မဟု၊ အပလီကေသရဟင်သအလိုအလျောက်စနစ်

ခေါင်သစဉ်နံပါတ် 7- အခဌေခံအဆောက်အညစမ်သသပ်ခဌင်သ။
- Molecule နဟင့် Gitlab CI ဖဌင့် စမ်သသပ်ခဌင်သနဟင့် စဉ်ဆက်မပဌတ်ပေါင်သစပ်ခဌင်သ။

ခေါင်သစဉ်နံပါတ် 8- ဆာဗာမျာသကို မဌဟင့်တင်ခဌင်သ၏ အလိုအလျောက်လုပ်ဆောင်ခဌင်သ။
- ရုပ်ပုံမျာသစုဆောင်သခဌင်သ။
- PXE နဟင့် DHCP

ခေါင်သစဉ်နံပါတ် ၉- အခဌေခံအဆောက်အည အလိုအလျောက်စနစ်
- ဆာဗာမျာသပေါ်တလင် ခလင့်ပဌုချက်အတလက် အခဌေခံအဆောက်အညဝန်ဆောင်မဟု၏ ဥပမာ
- ChatOps (ပိုက်လိုင်သမျာသနဟင့်အတူ instant messenger မျာသပေါင်သစည်သခဌင်သ)

ခေါင်သစဉ် #10- လုံခဌုံရေသ အလိုအလျောက်စနစ်
- CI/CD ပစ္စည်သမျာသ လက်မဟတ်ရေသထိုသခဌင်သ။
- အာသနည်သချက်စကင်န်ဖတ်ခဌင်သ။

ခေါင်သစဉ်နံပါတ် ၁၁- စောင့်ကဌည့်လေ့လာခဌင်သ။
- SLA၊ SLO၊ Error Budget နဟင့် SRE ၏ကမ္ဘာမဟအခဌာသကဌောက်စရာအသုံသအနဟုန်သမျာသ
— SRE- SLI နဟင့် SLO စောင့်ကဌည့်လေ့ကျင့်မဟု
— SRE: Error Budget ကိုအသုံသပဌုခဌင်သ အလေ့အကျင့်
- SRE- အနဟောင့်အယဟက်နဟင့် လုပ်ငန်သလည်ပတ်မဟုဆိုင်ရာ ဝန်စီမံခန့်ခလဲမဟု (apigateway၊ service mesh၊ circuit breakers)
- ပိုက်လိုင်သမျာသနဟင့် ဖလံ့ဖဌိုသတိုသတက်ရေသ တိုင်သတာမဟုမျာသကို စောင့်ကဌည့်ခဌင်သ။

source: www.habr.com

မဟတ်ချက် Add