SRE אינטנסיבי באינטרנט: נשבור הכל עד הקרקע, ואז נתקן את זה, נשבור את זה עוד כמה פעמים, ואז נבנה את זה שוב

בוא נשבור משהו, נכון? אחרת אנחנו בונים ובונים, מתקנים ומתקנים. שעמום תמותה.

בואו נשבור את זה כדי שלא יקרה לנו שום דבר על זה – לא רק שנזכה לשבחים על הביזיון הזה. ואז נבנה הכל שוב - עד כדי כך שזה יהיה בסדר גודל טוב יותר, סובלני יותר לתקלות ומהיר יותר.

ואנחנו נשבור את זה שוב.

האם אתה חושב שזו תחרות לשימוש בכלי הסודי ביותר מכל הקוסמונאוטיקה שלנו - פטיש החלל הרוסי הגדול?

לא, זה SRE אינטנסיבי באינטרנט. זה קרה כל קורס Slurm SRE לעולם ולעולם לא כמו הקודם. פשוט כי אתה אף פעם לא מנחש שבמערכת מורכבת ענקית, אליה מתחברים אלפי ואלפי משתמשים בכל שנייה, והקהל עצמו הוא כמה מיליונים, הוא יכול ליפול, להישבר, להיות משעמם, להתקלקל, ובעוד מאות דרכים להרוס. מצב הרוח של משמרת החובה של מהנדסי SRE.

בדצמבר נקיים עוד אחד SRE אינטנסיבי.

SRE אינטנסיבי באינטרנט: נשבור הכל עד הקרקע, ואז נתקן את זה, נשבור את זה עוד כמה פעמים, ואז נבנה את זה שוב

בואו נעשה קצת רטרוספקטיבה. זכור איך רק לפני כמה שנים HR היה דוהר לראות מי יכול להעסיק את המהנדסים הרבים ביותר של DevOps בחברה שלהם. הפרס השתנה. כעת, כמו מערכת המעקב Pantsir-S1, הם בודקים את החלל שמסביב ומחפשים מהנדסי SRE. דיברתי בכתבה "Evgeniy Varavva, מפתח בגוגל. איך לתאר את גוגל ב-5 מילים"איך נראים החיים של מהנדס SRE בגוגל, ואיך אפילו תאגיד כזה חווה מחסור במומחי SRE.

באינטנסיבי המקוון Slurm SRE בדצמבר, בעוד שלושה ימים, בין השעות 10:00-19:00, תלמדו כיצד להבטיח את המהירות, סובלנות התקלות והזמינות של אתרי אינטרנט בתנאים של משאבים מוגבלים, למנוע תקריות IT ולנהל תחקיר כדי שבעיות לא יחזרו על עצמן.

דוברי הקורס:

איבן קרוגלוב. מהנדס תוכנה צוות ב-Databricks. בעל ניסיון בחברות ארגוניות בהעברת ועיבוד הודעות מבוזרות, BigData ו-web-stack, חיפוש, בניית ענן פנימי, רשת שירות.

פאבל סליוונוב. מהנדס DevOps בכיר ב-Mail.ru Cloud Solutions. יש לי עשרות תשתיות בנויות ומאות צינורות CI/CD כתובים. מנהל Kubernetes מוסמך. מחבר מספר קורסים על Kubernetes ו-DevOps. דובר קבוע בכנסי IT רוסית ובינלאומית.

הכל יהיה קשה, בלתי צפוי ובפועל. אתה תבנה, תשבור ותתקן - ולפעמים ברצפים שונים מאוד.

לִבנוֹת: יהיה עליך לנסח מדדי SLO, SLI, SLA עבור אתר המורכב ממספר שירותי מיקרו; לפתח את הארכיטקטורה והתשתית שיתמכו בהם; להרכיב, לבדוק ולפרוס את האתר; להגדיר ניטור והתראה.

לשבור: תשקול גורמים פנימיים וחיצוניים המדרדרים את SLO: שגיאות מפתחים, כשלים בתשתית, זרימת מבקרים, התקפות DoS. למד להבין את החוסן, תקציב השגיאות, שיטות הבדיקה, ניהול ההפרעות ועומס העבודה התפעולי.

לְתַקֵן: תקבל הכשרה לארגן במהירות וביעילות את עבודת הצוות כדי למנוע תאונה בזמן הקצר ביותר: לערב עמיתים, להודיע ​​לבעלי עניין ולקבוע סדרי עדיפויות.

לימוד: תוכל לנתח את הגישה לאתר מנקודת מבט של SRE. ניתוח אירועים. קבע כיצד להימנע מהם בעתיד: שיפור הניטור, שינוי הארכיטקטורה, גישות לפיתוח ותפעול, תקנות. אוטומציה של תהליכים.

SRE אינטנסיבי באינטרנט מדמה תנאים אמיתיים - הזמן לשחזור השירות יהיה מוגבל ביותר. ממש כמו בחיים האמיתיים, ממש כמו במצב עבודה אמיתי.

אתה יכול לברר את התנאים של קורס SRE, כמו גם ללמוד את התוכנית המלאה בכתובת קשר.

האינטנסיביות המקוונת מתוכננת לדצמבר 2020. למי שמשלם על ההשתתפות מראש, הכנו הנחה.

האם אתה מוכן לאימון אינטנסיבי, משימות לא סטנדרטיות ותאונות פתאומיות?

זה פשוט לא יקרה. תהיה צמיחה מקצועית.

מקור: www.habr.com

הוספת תגובה