Slurm: Kubernetes рдЧрд╣рдиред рдХрд╛рд░реНрдпрдХреНрд░рдо рд░ рдмреЛрдирд╕

рдореЗ 27-29 рдорд╛ рд╣рд╛рдореА рдЪреМрдереЛ рд╕реНрд▓рд░реНрдо: рдХреБрдмреЗрд░рдиреЗрдЯрдорд╛ рдЧрд╣рдиред

Slurm: Kubernetes рдЧрд╣рдиред рдХрд╛рд░реНрдпрдХреНрд░рдо рд░ рдмреЛрдирд╕

рдмреЛрдирд╕: Docker, Ansible, Ceph рдорд╛ рдЕрдирд▓рд╛рдЗрди рдкрд╛рдареНрдпрдХреНрд░рдорд╣рд░реВ
рд╣рд╛рдореАрд▓реЗ Slurm рд╡рд┐рд╖рдпрд╣рд░реВрдмрд╛рдЯ рд╡реНрдпреБрддреНрдкрдиреНрди рдЧрд░реЗрдХрд╛ рдЫреМрдВ рдЬреБрди Kubernetes рд╕рдБрдЧ рдХрд╛рдо рдЧрд░реНрдирдХрд╛ рд▓рд╛рдЧрд┐ рдорд╣рддреНрддреНрд╡рдкреВрд░реНрдг рдЫ, рддрд░ k8s рд╕рдБрдЧ рд╕реАрдзреИ рд╕рдореНрдмрдиреНрдзрд┐рдд рдЫреИрдиред рдХрд╕рд░реА, рдХрд┐рди рд░ рдХреЗ рднрдпреЛ - рдХрдЯ рдЕрдиреНрддрд░реНрдЧрддред
рд╕рдмреИ Slurm 4 рд╕рд╣рднрд╛рдЧреАрд╣рд░реВрд▓реЗ рдпреА рдкрд╛рдареНрдпрдХреНрд░рдорд╣рд░реВрдорд╛ рдкрд╣реБрдБрдЪ рдкрд╛рдЙрдиреЗрдЫрдиреНред

рдкрд╣рд┐рд▓реЛ рджрд┐рдирдорд╛ рдкреВрд░рд╛ рдкреИрд╕рд╛ рдлрд┐рд░реНрддрд╛
рд╕реЗрдиреНрдЯ рдкреАрдЯрд░реНрд╕рдмрд░реНрдЧ рд╕реНрд▓рд░реНрдордорд╛, рджреБрдИ рд╕рд╣рднрд╛рдЧреАрд╣рд░реВ рдЫреЛрдбреЗ рдзреЗрд░реИ рдирдХрд╛рд░рд╛рддреНрдордХ рд╕рдореАрдХреНрд╖рд╛ред рдо рдХрд╕рд░реА рдкрдЫреБрддрд╛рдЙрдБрдЫреБ рдХрд┐ рдпреЛ рд╕рдордп рдорд╛ рдлрд┐рд░реНрддрд╛ рдЬрд╛рди рд░ рдкрд╛рд░рд╕реНрдкрд░рд┐рдХ рджрд╛рд╡реА рдмрд┐рдирд╛ рддрд┐рдиреАрд╣рд░реВрд╕рдБрдЧ рдЕрд▓рдЧ рд╣реБрди рдЕрд╕рдореНрднрд╡ рдерд┐рдпреЛред
рдпрджрд┐ рддрдкрд╛рдИрдВрд▓реЗ рд╕реНрд▓рд░реНрдордХреЛ рдмрд╛рд░реЗрдорд╛ рдХреЗ рдорди рдкрд░реНрджреИрди рднрдиреНрдиреЗ рдХреБрд░рд╛ рдкрддреНрддрд╛ рд▓рдЧрд╛рдЙрдиреБрднрдпреЛ рднрдиреЗ, рдкрд╣рд┐рд▓реЛ рджрд┐рди рдХреБрдиреИ рдкрдирд┐ рдЖрдпреЛрдЬрдХрд▓рд╛рдИ рд▓реЗрдЦреНрдиреБрд╣реЛрд╕реНред рд╣рд╛рдореА рдкрд╣реБрдБрдЪ рдЕрд╕рдХреНрд╖рдо рдкрд╛рд░реНрдиреЗрдЫреМрдВ рд░ рдкреВрд░реНрдг рд╕рд╣рднрд╛рдЧрд┐рддрд╛ рдореВрд▓реНрдп рдлрд┐рд░реНрддрд╛ рдЧрд░реНрдиреЗрдЫреМрдВред

рдкреНрд░рд╛рд╡рд┐рдзрд┐рдХ рд╕рд▓реНрд▓рд╛рд╣рдХрд╛рд░рд╣рд░реВ
рдХрд╕реИрд▓рд╛рдИ рдерд╛рд╣рд╛ рдЫ рднрдиреЗ рджрд┐рдорд┐рддреНрд░реА рд╕рд┐рдореЛрдиреЛрдн (рдЙрд╣рд╛рдБрд▓реЗ рдкреНрд░рд╛рд╡рд┐рдзрд┐рдХ рдирд┐рд░реНрджреЗрд╢рдХрд╣рд░реВрдХреЛ рдХреНрд▓рдм рдмрдирд╛рдЙрдиреБрднрдпреЛ), рд╣рд╛рдореАрд▓реЗ рдЙрд╣рд╛рдБрд▓рд╛рдИ рд╕реНрд▓рд░реНрдордорд╛ рдирд┐рдореНрддреЛ рджрд┐рдпреМрдВ (рдЕрдзреНрдпрдпрди рдЧрд░реНрди, рдкреНрд░рджрд░реНрд╢рди рдЧрд░реНрди рд╣реЛрдЗрди)ред рдЙрдирд▓реЗ рд╕рдмреИрд▓рд╛рдИ рд╕рд▓реНрд▓рд╛рд╣ рджрд┐рдиреЗ рд╡рд╛рдЪрд╛ рдЧрд░реЗ ред рдпреЛ рдкреНрд░рд╢рд╛рд╕рдХ рд░ рд╡рд┐рдХрд╛рд╕рдХрд░реНрддрд╛рд╣рд░реВрдХреЛ рд▓рд╛рдЧрд┐ рдЪрд╛рд╕реЛрдХреЛ рд╕рдореНрднрд╛рд╡рдирд╛ рдЫреИрди, рддрд░ рдпреЛ рдЖрдИрдЯреА рдкреНрд░рдмрдиреНрдзрдХрд╣рд░реВрдХреЛ рд▓рд╛рдЧрд┐ рдзреЗрд░реИ рд░реЛрдЪрдХ рд╣реБрдиреЗрдЫред

Slurm рдХреЗ рд╣реЛ

Slurm: Kubernetes рдЧрд╣рдиред рдХрд╛рд░реНрдпрдХреНрд░рдо рд░ рдмреЛрдирд╕

Slurm-4: рдЖрдзрд╛рд░рднреВрдд рдкрд╛рдареНрдпрдХреНрд░рдо (рдореЗ 27-29)
рдкрд╣рд┐рд▓реЛ рдкрдЯрдХ Kubernetes рд╣реЗрд░реНрди рд╡рд╛ рдЖрдлреНрдиреЛ рдЬреНрдЮрд╛рди рд╡реНрдпрд╡рд╕реНрдерд┐рдд рдЧрд░реНрди рдЪрд╛рд╣рдиреЗрд╣рд░реВрдХреЛ рд▓рд╛рдЧрд┐ рдбрд┐рдЬрд╛рдЗрди рдЧрд░рд┐рдПрдХреЛред
рдкреНрд░рддреНрдпреЗрдХ рд╕рд╣рднрд╛рдЧреАрд▓реЗ Selectel рдХреНрд▓рд╛рдЙрдбрдорд╛ рдЖрдлреНрдиреИ рдХреНрд▓рд╕реНрдЯрд░ рд╕рд┐рд░реНрдЬрдирд╛ рдЧрд░реНрдиреЗрдЫ рд░ рддреНрдпрд╣рд╛рдБ рдЕрдиреБрдкреНрд░рдпреЛрдЧ рддреИрдирд╛рдд рдЧрд░реНрдиреЗрдЫред

рдореВрд▓реНрдп: 25 рд╣рдЬрд╛рд░

рдХрд╛рд░реНрдпрдХреНрд░рдо

рд╡рд┐рд╖рдп #1: Kubernetes рдХреЛ рдкрд░рд┐рдЪрдп, рдореБрдЦреНрдп рдШрдЯрдХ
тАв k8s рдкреНрд░рд╡рд┐рдзрд┐рдХреЛ рдкрд░рд┐рдЪрдпред рд╡рд░реНрдгрди, рдЕрдиреБрдкреНрд░рдпреЛрдЧ, рдЕрд╡рдзрд╛рд░рдгрд╛рд╣рд░реВ
тАв Pod, ReplicaSet, Deployment, Service, Ingress, PV, PVC, ConfigMap, Secret
тАв рдЕрднреНрдпрд╛рд╕ рдЧрд░реНрдиреБрд╣реЛрд╕реН

рд╡рд┐рд╖рдп рдирдореНрдмрд░ реи: рдХреНрд▓рд╕реНрдЯрд░ рдбрд┐рдЬрд╛рдЗрди, рдореБрдЦреНрдп рдХрдореНрдкреЛрдиреЗрдиреНрдЯрд╣рд░реВ, рджреЛрд╖ рд╕рд╣рд┐рд╖реНрдгреБрддрд╛, k2s рдиреЗрдЯрд╡рд░реНрдХ
тАв рдХреНрд▓рд╕реНрдЯрд░ рдбрд┐рдЬрд╛рдЗрди, рдореБрдЦреНрдп рдХрдореНрдкреЛрдиреЗрдиреНрдЯрд╣рд░реВ, рджреЛрд╖ рд╕рд╣рд┐рд╖реНрдгреБрддрд╛
тАв k8s рдиреЗрдЯрд╡рд░реНрдХ

рд╡рд┐рд╖рдп #3: Kubespray, рдЯреНрдпреБрдирд┐рдЩ рд░ Kubernetes рдХреНрд▓рд╕реНрдЯрд░ рд╕реЗрдЯрдЕрдк
тАв Kubespray, рдХрдиреНрдлрд┐рдЧрд░реЗрд╕рди рд░ Kubernetes рдХреНрд▓рд╕реНрдЯрд░рдХреЛ рдЯреНрдпреБрдирд┐рдЩ
тАв рдЕрднреНрдпрд╛рд╕ рдЧрд░реНрдиреБрд╣реЛрд╕реН

рд╡рд┐рд╖рдп #4: Ceph, рдХреНрд▓рд╕реНрдЯрд░ рд╕реЗрдЯрдЕрдк рд░ рдЙрддреНрдкрд╛рджрдирдорд╛ рдХрд╛рдо рдЧрд░реНрдиреЗ рд╕реБрд╡рд┐рдзрд╛рд╣рд░реВ
тАв Ceph, рдХреНрд▓рд╕реНрдЯрд░ рд╕реЗрдЯрдЕрдк рд░ рдЙрддреНрдкрд╛рджрдирдорд╛ рдХрд╛рдо рдЧрд░реНрдиреЗ рд╕реБрд╡рд┐рдзрд╛рд╣рд░реВ
тАв рдЕрднреНрдпрд╛рд╕: ceph рд╕реЗрдЯрдЕрдк

рд╡рд┐рд╖рдп #5: рдЙрдиреНрдирдд Kubernetes Abstractions
тАв DaemonSet, StatefulSet, RBAC, Job, CronJob, Pod Scheduling, InitContainer

рд╡рд┐рд╖рдп #6: рд╣реЗрд▓рдордХреЛ рдкрд░рд┐рдЪрдп
тАв рд╣реЗрд▓рдордХреЛ рдкрд░рд┐рдЪрдп
тАв рдЕрднреНрдпрд╛рд╕ рдЧрд░реНрдиреБрд╣реЛрд╕реН

рд╡рд┐рд╖рдп #7: рдкреНрд░рдХрд╛рд╢рди рд╕реЗрд╡рд╛ рд░ рдЕрдиреБрдкреНрд░рдпреЛрдЧрд╣рд░реВ
тАв рд╕реЗрд╡рд╛ рдкреНрд░рдХрд╛рд╢рди рд╡рд┐рдзрд┐рд╣рд░реВрдХреЛ рд╕рд┐рдВрд╣рд╛рд╡рд▓реЛрдХрди: NodePort рдмрдирд╛рдо LoadBalancer рдмрдирд╛рдо Ingress
тАв рдкреНрд░рд╡реЗрд╢ рдирд┐рдпрдиреНрддреНрд░рдХ (Nginx): рдЖрдЧрдорди рдЯреНрд░рд╛рдлрд┐рдХ рд╕рдиреНрддреБрд▓рди
тАв рд╕рд░реНрдЯ-рдкреНрд░рдмрдиреНрдзрдХ: рд╕реНрд╡рдЪрд╛рд▓рд┐рдд рд░реВрдкрдорд╛ SSL/TLS рдкреНрд░рдорд╛рдгрдкрддреНрд░рд╣рд░реВ рдкреНрд░рд╛рдкреНрдд рдЧрд░реНрдиреБрд╣реЛрд╕реН
тАв рдЕрднреНрдпрд╛рд╕ рдЧрд░реНрдиреБрд╣реЛрд╕реН

рд╡рд┐рд╖рдп #8: рд▓рдЧрд┐рдЩ рд░ рдирд┐рдЧрд░рд╛рдиреА
тАв рдХреНрд▓рд╕реНрдЯрд░ рдирд┐рдЧрд░рд╛рдиреА, тАЛтАЛрдкреНрд░реЛрдореЗрдерд┐рдпрд╕
тАв рдХреНрд▓рд╕реНрдЯрд░ рд▓рдЧрд┐рдЩ, Fluentd/Elastic/Kibana
тАв рдЕрднреНрдпрд╛рд╕ рдЧрд░реНрдиреБрд╣реЛрд╕реН

рд╡рд┐рд╖рдп рдирдореНрдмрд░ 9: CI/CD, рд╕реНрдХреНрд░реНрдпрд╛рдЪрдмрд╛рдЯ рдХреНрд▓рд╕реНрдЯрд░рдорд╛ рдмрд┐рд▓реНрдбрд┐рдЩ рдбрд┐рдкреНрд▓реЛрдЗрдореЗрдиреНрдЯ

рд╡рд┐рд╖рдп рдирдореНрдмрд░ резреж: рд╡реНрдпрд╛рд╡рд╣рд╛рд░рд┐рдХ рдХрд╛рд░реНрдп, рдЕрдиреБрдкреНрд░рдпреЛрдЧ рдбрдХрд░рд╛рдЗрдЬреЗрд╢рди рд░ рдХреНрд▓рд╕реНрдЯрд░рдорд╛ рд▓рдиреНрдЪ

Slurm рд╡реЗрдмрд╕рд╛рдЗрдЯ

MegaSlurm: рдЙрдиреНрдирдд рдкрд╛рдареНрдпрдХреНрд░рдо (рдореЗ рейрез - рдЬреБрди реи)
Kubernetes рдЗрдиреНрдЬрд┐рдирд┐рдпрд░рд╣рд░реВ рд░ рдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЯрд╣рд░реВ, рд╕рд╛рдереИ рдЖрдзрд╛рд░ рдкрд╛рдареНрдпрдХреНрд░рдо рд╕реНрдирд╛рддрдХрд╣рд░реВрдХрд╛ рд▓рд╛рдЧрд┐ рдбрд┐рдЬрд╛рдЗрди рдЧрд░рд┐рдПрдХреЛред
рд╣рд╛рдореА рдХреНрд▓рд╕реНрдЯрд░ рдХрдиреНрдлрд┐рдЧрд░ рдЧрд░реНрдЫреМрдВ рддрд╛рдХрд┐ рдПрдХреИ рд╕рд╛рде рдХреНрд▓рд╕реНрдЯрд░ рдХрдореНрдкреЛрдиреЗрдиреНрдЯрд╣рд░реВрдХреЛ рдЕрджреНрдпрд╛рд╡рдзрд┐рдХ рд░ рдХреНрд▓рд╕реНрдЯрд░рдорд╛ рдбрд┐рдкреНрд▓реЛрдЗрдореЗрдиреНрдЯ рд╕реБрд░реБ рдЧрд░реНрди рд╕рдХрд┐рдпреЛрд╕реНред

рдореВрд▓реНрдп: ремреж рд╣рдЬрд╛рд░ (рд╕реНрд▓рд░реНрдо-рек рд╕рд╣рднрд╛рдЧреАрдХрд╛ рд▓рд╛рдЧрд┐ рекрел рд╣рдЬрд╛рд░)

рдХрд╛рд░реНрдпрдХреНрд░рдо

рд╡рд┐рд╖рдп #1: рднрд┐рддреНрд░рдмрд╛рдЯ рдлреЗрд▓рдУрднрд░ рдХреНрд▓рд╕реНрдЯрд░ рд╕рд┐рд░реНрдЬрдирд╛ рдЧрд░реНрдиреЗ рдкреНрд░рдХреНрд░рд┐рдпрд╛
тАв Kubespray рд╕рдБрдЧ рдХрд╛рдо рдЧрд░реНрджреИ
тАв рдЕрддрд┐рд░рд┐рдХреНрдд рдЕрд╡рдпрд╡рд╣рд░реВрдХреЛ рд╕реНрдерд╛рдкрдирд╛
тАв рдХреНрд▓рд╕реНрдЯрд░ рдкрд░реАрдХреНрд╖рдг рд░ рд╕рдорд╕реНрдпрд╛ рдирд┐рд╡рд╛рд░рдг
тАв рдЕрднреНрдпрд╛рд╕ рдЧрд░реНрдиреБрд╣реЛрд╕реН

рд╡рд┐рд╖рдп #2: рдмрд╛рд╣реНрдп рдкреНрд░рджрд╛рдпрдХ рдкреНрд░рдпреЛрдЧ рдЧрд░реЗрд░ рдХреНрд▓рд╕реНрдЯрд░рдорд╛ рдкреНрд░рд╛рдзрд┐рдХрд░рдг
тАв LDAP (Nginx + Python)
тАв OIDC (Dex + Gangway)
тАв рдЕрднреНрдпрд╛рд╕ рдЧрд░реНрдиреБрд╣реЛрд╕реН

рд╡рд┐рд╖рдп #3: рдиреЗрдЯрд╡рд░реНрдХ рдиреАрддрд┐
тАв CNI рдХреЛ рдкрд░рд┐рдЪрдп
тАв рдиреЗрдЯрд╡рд░реНрдХ рд╕реБрд░рдХреНрд╖рд╛ рдиреАрддрд┐
тАв рдЕрднреНрдпрд╛рд╕ рдЧрд░реНрдиреБрд╣реЛрд╕реН

рд╡рд┐рд╖рдп #4: рдХреНрд▓рд╕реНрдЯрд░рдорд╛ рд╕реБрд░рдХреНрд╖рд┐рдд рд░ рдЕрддреНрдпрдзрд┐рдХ рдЙрдкрд▓рдмреНрдз рдЕрдиреБрдкреНрд░рдпреЛрдЧрд╣рд░реВ
тАв PodSecurity Policy
тАв PodDisruptionBudget

рд╡рд┐рд╖рдп #5: Kubernetesред рд╣реБрдб рдореБрдирд┐ рд╣реЗрд░реМрдВ
тАв рдирд┐рдпрдиреНрддреНрд░рдХ рд╕рдВрд░рдЪрдирд╛
тАв рдЕрдкрд░реЗрдЯрд░ рд░ CRD рд╣рд░реВ
тАв рдЕрднреНрдпрд╛рд╕ рдЧрд░реНрдиреБрд╣реЛрд╕реН

рд╡рд┐рд╖рдп #6: рдХреНрд▓рд╕реНрдЯрд░рдорд╛ рд╕реНрдЯреЗрдЯрдлреБрд▓ рдПрдкреНрд▓рд┐рдХреЗрд╕рдирд╣рд░реВ
тАв рдЙрджрд╛рд╣рд░рдгрдХреЛ рд░реВрдкрдорд╛ PostgreSQL рдкреНрд░рдпреЛрдЧ рдЧрд░реЗрд░ рдбрд╛рдЯрд╛рдмреЗрд╕ рдХреНрд▓рд╕реНрдЯрд░ рд╕реБрд░реБ рдЧрд░реНрджреИ
тАв RabbitMQ рдХреНрд▓рд╕реНрдЯрд░ рд╕реБрд░реБ рдЧрд░реНрджреИ
тАв рдЕрднреНрдпрд╛рд╕ рдЧрд░реНрдиреБрд╣реЛрд╕реН

рд╡рд┐рд╖рдп #7: рдЧреЛрдкреНрдп рд░рд╛рдЦреНрдиреЗ
тАв Kubernetes рдорд╛ рдЧреЛрдкреНрдп рдкреНрд░рдмрдиреНрдз
тАв рднрд▓реНрдЯ

рд╡рд┐рд╖рдп #8: рддреЗрд░реНрд╕реЛ рдкреЛрдб рдЕрдЯреЛрд╕реНрдХреЗрд▓рд░
тАв рд╕рд┐рджреНрдзрд╛рдиреНрдд
тАв рдЕрднреНрдпрд╛рд╕ рдЧрд░реНрдиреБрд╣реЛрд╕реН

рд╡рд┐рд╖рдп #9: рдмреНрдпрд╛рдХрдЕрдк рд░ рдЖрдкрджрд╛ рд░рд┐рдХрднрд░реА
тАв Heptio Velero (рдкрд╣рд┐рд▓реЗ рдЖрд░реНрдХ) рд░ etcd рдкреНрд░рдпреЛрдЧ рдЧрд░реЗрд░ рдХреНрд▓рд╕реНрдЯрд░ рдмреНрдпрд╛рдХрдЕрдк рд░ рд░рд┐рдХрднрд░реА
тАв рдЕрднреНрдпрд╛рд╕ рдЧрд░реНрдиреБрд╣реЛрд╕реН

рд╡рд┐рд╖рдп #10: рдЖрд╡реЗрджрди рдкрд░рд┐рдирд┐рдпреЛрдЬрди
тАв рд▓рд┐рдиреНрдЯ
тАв рдЯреЗрдореНрдкреНрд▓реЗрдЯрд┐рдВрдЧ рд░ рдбрд┐рдкреНрд▓реЛрдЗрдореЗрдиреНрдЯ рдЙрдкрдХрд░рдгрд╣рд░реВ
тАв рдкрд░рд┐рдирд┐рдпреЛрдЬрди рд░рдгрдиреАрддрд┐рд╣рд░реВ

рд╡рд┐рд╖рдп рдирдореНрдмрд░ резрез: рд╡реНрдпрд╛рд╡рд╣рд╛рд░рд┐рдХ рдХрд╛рд░реНрдп
тАв рдПрдкреНрд▓рд┐рдХреЗрд╕рди рдбрд┐рдкреНрд▓реЛрдпрдореЗрдиреНрдЯрдХреЛ рд▓рд╛рдЧрд┐ CI/CD рдирд┐рд░реНрдорд╛рдг
тАв рдХреНрд▓рд╕реНрдЯрд░ рдЕрдкрдбреЗрдЯ

MegaSlurm рд╡реЗрдмрд╕рд╛рдЗрдЯ

рдбрдХрд░, рдЙрддреНрддрд░рджрд╛рдпреА рд░ рд╕реЗрдл

Slurm: Kubernetes рдЧрд╣рдиред рдХрд╛рд░реНрдпрдХреНрд░рдо рд░ рдмреЛрдирд╕

рдЗрддрд┐рд╣рд╛рд╕ рдпрд╛рддреНрд░рд╛

рдкрд╣рд┐рд▓реЛ Slurm рдПрдХ рдкреНрд░рдпреЛрдЧ рдерд┐рдпреЛред рд╡рдХреНрддрд╛рд╣рд░реВрд▓реЗ рд╕реНрдЯреЗрдЬрдорд╛ рд╢рд╛рдмреНрджрд┐рдХ рд░реВрдкрдорд╛ рдЖрдлреНрдиреЛ рдкреНрд░рд╕реНрддреБрддреАрдХрд░рдгрд╣рд░реВ рдкреВрд░рд╛ рдЧрд░реЗ, рд░ рд╢реНрд░реЛрддрд╛рд╣рд░реВрдорд╛ рдпрд╕реНрддреЛ рд╕реНрддрд░рдХрд╛ рдкреНрд░рд╢рд╛рд╕рдХрд╣рд░реВ рдмрд╕реЗ рдХрд┐ рдЙрдиреАрд╣рд░реВрд▓рд╛рдИ рд╡рдХреНрддрд╛рдХреЛ рд░реВрдкрдорд╛ рдЖрдордиреНрддреНрд░рд┐рдд рдЧрд░реНрдиреЗ рд╕рдордп рднрдпреЛред

рд╡рд╛рд╕реНрддрд╡рд┐рдХ рдЖрдзрд╛рд░рднреВрдд рдкрд╛рдареНрдпрдХреНрд░рдо рджреЛрд╕реНрд░реЛ рд╕реНрд▓рд░реНрдордорд╛ рднрдПрдХреЛ рдерд┐рдпреЛ: 80% рд╕рд╣рднрд╛рдЧреАрд╣рд░реВрд▓реЗ рдХреБрдмреЗрд░рдиреЗрдЯрд▓рд╛рдИ рдкрд╣рд┐рд▓реЛ рдкрдЯрдХ рджреЗрдЦреЗрдХрд╛ рдерд┐рдП, рд░ рддреЗрд╕реНрд░реЛрд▓реЗ рдбрдХрд░рд╕рдБрдЧ рдХрд╣рд┐рд▓реНрдпреИ рдХрд╛рдо рдЧрд░реЗрдХрд╛ рдерд┐рдПрдирдиреНред
рдмрд┐рд╣рд╛рди рдбрдХрд░рдорд╛ рд╡реНрдпрд╛рдЦреНрдпрд╛рди рд╕реБрдиреНрди рд░ рдмреЗрд▓реБрдХрд╛ рд▓рдбрд╛рдИ рдореЛрдбрдорд╛ рдХрд╛рдо рдЧрд░реНрди рдорд╛рдирд┐рд╕рд╣рд░реВрд▓рд╛рдИ рдХрддреНрддрд┐ рдЧрд╛рд╣реНрд░реЛ рдерд┐рдпреЛ рднрдиреНрдиреЗ рдХреБрд░рд╛ рд╕реНрдкрд╖реНрдЯ рдерд┐рдпреЛред
Ceph рд▓реЗ рдзреЗрд░реИ рдХрдард┐рдирд╛рдЗрд╣рд░реВ рдирд┐рдореНрддреНрдпрд╛рдпреЛред рдпрд╕рдмрд╛рд╣реЗрдХ, рддреНрдпрд╣рд╛рдБ рджрд░реНрд╢рдХрд╣рд░реВрдорд╛ 20 рдЬрдирд╛ рд╡реНрдпрдХреНрддрд┐рд╣рд░реВ рдерд┐рдП рдЬрд╕рд▓рд╛рдИ рдирд┐рд╢реНрдЪрд┐рдд рд░реВрдкрдорд╛ рд╕реЗрдлрд▓рд╛рдИ рд╡реНрдпрд╛рдЦреНрдпрд╛ рдЧрд░реНрди рдЖрд╡рд╢реНрдпрдХ рдерд┐рдпреЛ, рд░ рдЕрд░реНрдХреЛ 60 рдЬрд╕рд▓рд╛рдИ рд╕реЗрдлрдХреЛ рдЖрд╡рд╢реНрдпрдХрддрд╛ рдерд┐рдПрдиред

рддреЗрд╕реНрд░реЛ Slurm рдХреЛ рд▓рд╛рдЧреА, рд╣рд╛рдореАрд▓реЗ Docker рд░ Ansible рд▓рд╛рдИ рдЕрд▓рдЧ-рдЕрд▓рдЧ рд╡реЗрдмрд┐рдирд╛рд░рд╣рд░реВрдорд╛ рд╕рд╛рд░реНрдпреМрдВ, Kubernetes рдХреЛ рд▓рд╛рдЧрд┐ рдердк рд╕рдордп рдЦрд╛рд▓реА рдЧрд░реНрджреИред рд╕рдорд╛рдзрд╛рди рд╕рд╛рд░рдорд╛ рд╡реНрдпрд╛рд╡рд╣рд╛рд░рд┐рдХ рд░ рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрдирдорд╛ рдЕрд╡рд┐рдХрд╕рд┐рдд рднрдпреЛ: рд╡реНрдпрд╛рдЦреНрдпрд╛рди рдЕрдиреБрднрд╡реА рдХреЗрдЯрд╛рд╣рд░реВрдХрд╛ рд▓рд╛рдЧрд┐ рд░реВрдЪрд┐рд░рд╣рд┐рдд рдерд┐рдпреЛ, рд░ рдЫрд▓рдлрд▓ рд╢реБрд░реБрд╡рд╛рддрдХрд╛ рд▓рд╛рдЧрд┐ рд░реВрдЪрд┐рд░рд╣рд┐рдд рдерд┐рдпреЛред

рдЪреМрдереЛ Slurm рдХреЛ рд▓рд╛рдЧрд┐, рд╣рд╛рдореАрд▓реЗ Docker, Ansible рд░ Ceph рдорд╛ рдЕрдирд▓рд╛рдЗрди рдкрд╛рдареНрдпрдХреНрд░рдорд╣рд░реВ рдмрдирд╛рдпреМрдВред рд╡рд┐рдЪрд╛рд░ рд╕рд░рд▓ рдЫ: рдЬрд╕рд▓рд╛рдИ рдпрд╕рдХреЛ рдЖрд╡рд╢реНрдпрдХрддрд╛ рдЫ рдЙрдиреАрд╣рд░реВрд▓реЗ рд╡рд┐рдЪрд╛рд░рдкреВрд░реНрд╡рдХ рдкрд╛рдареНрдпрдХреНрд░рдо рд▓рд┐рдиреЗрдЫрдиреН, рдЬрд╕рд▓рд╛рдИ рдЖрд╡рд╢реНрдпрдХ рдЫреИрди рдЙрдиреАрд╣рд░реВрд▓реЗ рд╢рд╛рдиреНрддрдкреВрд░реНрд╡рдХ рдпрд╕рд▓рд╛рдИ рдмреЗрд╡рд╛рд╕реНрддрд╛ рдЧрд░реНрдиреЗрдЫрдиреНред рдкрд░реАрдХреНрд╖рдХрд╣рд░реВрдХреЛ рд╕рдореВрд╣ рджреНрд╡рд╛рд░рд╛ рдиреНрдпрд╛рдп рдЧрд░реНрджреИ, рдбрдХрд░ рдХреЛрд░реНрд╕рд▓реЗ 6-8 рдШрдгреНрдЯрд╛ рд▓рд┐рдиреНрдЫред Ansible рд░ Ceph рд▓реЗ рдЕрдЭреИ рдШрдбреА рдЧрд░реЗрдХрд╛ рдЫреИрдирдиреНред

рдЕрд╕реНрд╡реАрдХрд░рдг:

  • рдкреНрд░рдпреЛрдЧрд╛рддреНрдордХ рдкрд╛рдареНрдпрдХреНрд░рдоред рдХреЗрд╣реА рдирд┐рд░реНрдгрдпрд╣рд░реВ рд╕рдореНрднрд╡рддрдГ рдЕрд╕рдлрд▓ рд╣реБрдиреЗрдЫрдиреНред
  • рдкреНрд▓реЗрдЯрдлрд░реНрдо (Stepik.org) рдХрдЪреНрдЪрд╛ рдЫ, рд░ рд╣рд╛рдореАрд▓реЗ рдпрд╕рд╕рдБрдЧ рдкрд╣рд┐рд▓реЗ рдХрд╛рдо рдЧрд░реЗрдХрд╛ рдЫреИрдиреМрдВред рддреНрдпрд╣рд╛рдБ рд╕рдореНрднрд╡рддрдГ рдмрдореНрдк рд░ рд╕реНрдиреНрдпрд╛рдЧрд╣рд░реВ рд╣реБрдиреЗрдЫрдиреНред
  • рдкрд╛рдареНрдпрдХреНрд░рдо рд╕рд╛рдЙрдердмреНрд░рд┐рдЬрдХрд╛ рдХрд░реНрдордЪрд╛рд░реАрд╣рд░реВрдорд╛ рдорд╛рддреНрд░ рдкрд░реАрдХреНрд╖рдг рдЧрд░рд┐рдПрдХреЛ рдерд┐рдпреЛред рдкрдХреНрдХреИ рдкрдирд┐ рддрдкрд╛рдИрд▓реЗ рдЬрд╛рдБрджрд╛ рдХреЗрд╣рд┐ рд╕рдорд╛рдкреНрдд рдЧрд░реНрдиреБрдкрд░реНрдиреЗрдЫред

Slurm: Kubernetes рдЧрд╣рдиред рдХрд╛рд░реНрдпрдХреНрд░рдо рд░ рдмреЛрдирд╕

рдЕрд░реНрдХреЛ рджрд┐рди рдкрд╣рд┐рд▓реЛ рд╕реНрд▓рд░реНрдордХреЛ рдЪреНрдпрд╛рдЯрдорд╛ рдЙрдиреАрд╣рд░реВрд▓реЗ рд╕рдореНрдЭреЗ рдХрд┐ рдпреЛ рдХрддрд┐ рд░рд╛рдореНрд░реЛ рд░ рд░рдорд╛рдЗрд▓реЛ рдерд┐рдпреЛ, рд╕рдмреИ рд╕рдВрдЧрдардирд╛рддреНрдордХ рдбрд░рд▓рд╛рдЧреНрджрд╛ рдкрдирд┐ред рд╕рдмреИрднрдиреНрджрд╛ рдЬреАрд╡рдиреНрдд рдЫрд╛рдкрд╣рд░реВ рдкреНрд░рд╛рдкреНрдд рдЧрд░реНрди рдкрд╣рд┐рд▓реЛред рдЕрдирд▓рд╛рдЗрди рдкрд╛рдареНрдпрдХреНрд░рдорд╣рд░реВрдХреЛ рдкрд╣рд┐рд▓реЛ рд╡рд┐рджреНрдпрд╛рд░реНрдереАрд╣рд░реВрд▓рд╛рдИ рдХреЗ рд╣реБрдиреНрдЫ рд╣реЗрд░реМрдВред ЁЯЩВ

Slurm: Kubernetes рдЧрд╣рдиред рдХрд╛рд░реНрдпрдХреНрд░рдо рд░ рдмреЛрдирд╕

рд╕реНрд░реЛрдд: www.habr.com

рдПрдХ рдЯрд┐рдкреНрдкрдгреА рдердкреНрди