የመስመር ላይ SRE ኢንተክቲቭ: ሁሉንም ነገር ወደ መሬት እንሰብራለን, ከዚያም እናስተካክለዋለን, ተጨማሪ ሁለት ጊዜ እንሰብራለን እና ከዚያ እንደገና እንገነባለን.

አንድ ነገር እንሰብረው አይደል? አለበለዚያ እኛ እንገነባለን እና እንገነባለን, እንጠግነዋለን እና እንጠግነዋለን. ሟች መሰልቸት.

ምንም እንዳይደርስብን እንሰብረው - በዚህ ውርደት መወደስ ብቻ ሳይሆን። እና ከዚያ ሁሉንም ነገር እንደገና እንገነባለን - በጣም ጥሩ ፣ የበለጠ ስህተትን የሚቋቋም እና ፈጣን ቅደም ተከተል ይሆናል።

እና እንደገና እንሰብራለን.

ይህ የኛን አጠቃላይ የኮስሞናውቲክስ ሚስጥራዊ መሳሪያ - ቢግ የሩሲያ ጠፈር ሀመርን ለመጠቀም ውድድር ነው ብለው ያስባሉ?

አይ፣ ይህ የመስመር ላይ SRE የተጠናከረ ነው። እያንዳንዱ ኮርስ እንዲሁ ሆነ Slurm SRE መቼም እና ፈጽሞ እንደ ቀዳሚው. በሺዎች እና በሺዎች የሚቆጠሩ ተጠቃሚዎች በየሰከንዱ በሚገናኙበት እና ተመልካቹ ራሱ ብዙ ሚሊዮን በሆነበት ግዙፍ ውስብስብ ስርዓት ውስጥ ሊወድቅ ፣ ሊሰበር ፣ ሊደበዝዝ ፣ ሊደናቀፍ እና በመቶዎች በሚቆጠሩ ሌሎች መንገዶች ሊበላሽ እንደሚችል በጭራሽ ስለማይገምቱ። የ SRE መሐንዲሶች የሥራ ፈረቃ ስሜት.

በታህሳስ ውስጥ ሌላ እንይዛለን SRE የተጠናከረ.

የመስመር ላይ SRE ኢንተክቲቭ: ሁሉንም ነገር ወደ መሬት እንሰብራለን, ከዚያም እናስተካክለዋለን, ተጨማሪ ሁለት ጊዜ እንሰብራለን እና ከዚያ እንደገና እንገነባለን.

ትንሽ ወደኋላ እናድርግ። ከጥቂት አመታት በፊት የሰው ኃይል ማን ብዙ የዴቭኦፕ መሐንዲሶችን ወደ ኩባንያቸው መቅጠር እንደሚችል ለማየት እንዴት እንደሚሮጥ አስታውስ። ሽልማቱ ተቀይሯል. አሁን፣ ልክ እንደ Pantsir-S1 መከታተያ ስርዓት፣ በዙሪያው ያለውን ቦታ ይፈትሹ እና የSRE መሐንዲሶችን ይፈልጋሉ። በአንቀጹ ውስጥ ተናገርኩ "Evgeniy Varavva, በ Google ላይ ገንቢ. ጉግልን በ5 ቃላት እንዴት መግለፅ እንደሚቻል“በGoogle ውስጥ ላለ SRE መሐንዲስ ሕይወት ምን ይመስላል፣ እና እንደዚህ ያለ ኮርፖሬሽን እንኳን የኤስአርአይ ስፔሻሊስቶች እጥረት እንዴት እንደሚያጋጥመው።

በመስመር ላይ የተጠናከረ Slurm SRE በታህሳስ ወር በሶስት ቀናት ውስጥ ከ10፡00 እስከ 19፡00 የድህረ ገፆችን ፍጥነት፣ የስህተት መቻቻል እና ውሱን ሃብቶች ባሉበት ሁኔታ መገኘቱን እንዴት ማረጋገጥ እንደሚችሉ፣ የአይቲ ክስተቶችን ማስወገድ እና ችግሮች እንዳይደጋገሙ ገለፃ ማድረግ እንደሚችሉ ይማራሉ።

የኮርስ ድምጽ ማጉያዎች፡-

ኢቫን ክሩሎቭ. የሰራተኛ ሶፍትዌር መሐንዲስ በ Databrick. በድርጅት ኩባንያዎች ውስጥ በተሰራጨ የመልእክት አሰጣጥ እና ሂደት ፣ BigData እና ዌብ-ቁልል ፣ ፍለጋ ፣ የውስጥ ደመናን በመገንባት ፣ በአገልግሎት መረብ ውስጥ ልምድ ያለው።

ፓቬል ሴሊቫኖቭ. ከፍተኛ የዴቭኦፕስ መሐንዲስ በ Mail.ru Cloud Solutions። በደርዘን የሚቆጠሩ የተገነቡ መሠረተ ልማቶች እና በመቶዎች የሚቆጠሩ የተፃፉ CI/CD ቧንቧዎች አሉኝ። የተረጋገጠ የኩበርኔትስ አስተዳዳሪ። በ Kubernetes እና DevOps ላይ የበርካታ ኮርሶች ደራሲ። በሩሲያ እና በዓለም አቀፍ የአይቲ ኮንፈረንስ ላይ መደበኛ ተናጋሪ።

ሁሉም ነገር አስቸጋሪ, የማይታወቅ እና በተግባር ይሆናል. እርስዎ ይገነባሉ, ይሰብራሉ እና ይጠግኑታል - እና አንዳንድ ጊዜ በጣም በተለያየ ቅደም ተከተል.

ይገንቡ፡ ብዙ ማይክሮ አገልገሎቶችን ላቀፈ ጣቢያ SLO፣ SLI፣ SLA አመላካቾችን ማዘጋጀት አለቦት። የሚረዷቸውን አርክቴክቸር እና መሠረተ ልማት ማዳበር; ቦታውን መሰብሰብ, መሞከር እና ማሰማራት; ክትትል እና ማስጠንቀቂያ ማዘጋጀት.

እረፍት፡ SLOን የሚያበላሹ ውስጣዊ እና ውጫዊ ሁኔታዎችን ግምት ውስጥ ያስገባሉ፡ የገንቢ ስህተቶች፣ የመሠረተ ልማት ውድቀቶች፣ የጎብኝዎች ፍሰት፣ የ DoS ጥቃቶች። ጥንካሬን ፣ የስህተት በጀትን ፣ የሙከራ ልምዶችን ፣ አስተዳደርን እና የስራ ጫናን ማቋረጥን ይማሩ።

ጥገና፡- በአጭር ጊዜ ውስጥ አደጋን ለማስወገድ የቡድን ስራን በፍጥነት እና በብቃት ለማደራጀት ስልጠና ይሰጥዎታል፡ ባልደረቦችዎን ያሳትፉ፣ ባለድርሻ አካላትን ያሳውቁ እና ቅድሚያ የሚሰጧቸውን ነገሮች ያስቀምጡ።

ጥናት፡- የጣቢያው አቀራረብን ከ SRE እይታ አንጻር መተንተን ይችላሉ. ክስተቶችን ይተንትኑ. ለወደፊቱ እንዴት እነሱን ማስወገድ እንደሚችሉ ይወስኑ-ክትትል ማሻሻል, ስነ-ህንፃውን መለወጥ, የእድገት እና የአሠራር አቀራረቦች, ደንቦች. ሂደቶችን በራስ-ሰር ያድርጉ።

የመስመር ላይ SRE Intensive እውነተኛ ሁኔታዎችን ያስመስላል - አገልግሎቱን ወደነበረበት ለመመለስ ጊዜው በጣም የተገደበ ይሆናል. ልክ በእውነተኛ ህይወት ውስጥ, ልክ በእውነተኛ የስራ ሁኔታ ውስጥ.

የ SRE ኮርሱን ውሎች ማወቅ ይችላሉ, እንዲሁም ሙሉውን ፕሮግራም በ ላይ ያጠኑ ማያያዣ.

የመስመር ላይ የተጠናከረ ለዲሴምበር 2020 የታቀደ ነው። ለመሳተፍ በቅድሚያ ለሚከፍሉ ሰዎች ቅናሽ አዘጋጅተናል።

ለጠንካራ ስልጠና፣ መደበኛ ያልሆኑ ተግባራት እና ድንገተኛ አደጋዎች ዝግጁ ነዎት?

ብቻ አይሆንም። ሙያዊ እድገት ይኖራል.

ምንጭ: hab.com

አስተያየት ያክሉ