Біз күйіп кетудің алдын алу үшін әрқашан байланысты күйді қалай өзгерттік

Мақаланың аудармасы курс студенттері үшін арнайы дайындалған «DevOps тәжірибелері мен құралдары».

Біз күйіп кетудің алдын алу үшін әрқашан байланысты күйді қалай өзгерттік

Интеркомның миссиясы - онлайн бизнесті жеке ету. Бірақ өнімді жұмыс істемей тұрғанда оны жекелендіру мүмкін емес. қалай. Жұмыс уақыты біздің бизнестің табысты болуы үшін маңызды, себебі біздің клиенттер бізге төлейтіндіктен ғана емес, сонымен қатар біз пайдаланамыз сіздің өніміңізбен. Егер біздің қызметіміз жұмыс істемесе, біз тұтынушыларымыздың ауыртпалығын сезінеміз.

Үздіксіз жұмыс бағдарламалық қамтамасыз ету архитектурасы және күнделікті жұмыс сапасы сияқты көптеген факторларға байланысты. Дегенмен, жиі байланыста болатын адамның қоңырауларға жауап беретіні жиі кездеседі PagerDuty. Бұл техникалық қолдау инженерлердің көмегін тұтынушылар сіздің өнімді сатып алғанда алатын нәрселермен біріктіретін қуатты тұтынушыға бағытталған құрал бола алады. Бұл сонымен қатар оқу мен өсу үшін үлкен мүмкіндіктер ашады, өйткені сәтсіздіктер мен қателіктер дағдыларды жаттықтыру және күрделі жұмыс механизмдерін түсіну үшін жақсы өріс болуы мүмкін.

Жұмыс уақытынан тыс уақытта «әрқашан байланыста» болу сіздің өміріңізге зиян тигізеді.

Бірақ сонымен бірге «әрдайым байланыста» болу сіздің өміріңізге зиянды әсер етуі мүмкін. Сіз бірдеңенің бұзылғаны туралы хабарламаға тез және сауатты жауап беруге дайын болуыңыз керек. Тіпті сол сәтте пейджерге шақырылмасаңыз да, «әрдайым қосулы» күйі жайсыздық сезімін тудырады, мен мұны жеке тәжірибемнен білемін. Әсіресе осыған байланысты ұйқының сапасы нашарлайды. Күннің кез келген уақытында кіру аймағында үнемі болу күйіп қалуға, апатияға немесе тұтастай алғанда, компьютерді енді ешқашан көрмеуге ұмтылуға әкелуі мүмкін.

Интеркомдағы «әрдайым қосылған» күйдің тарихы

Интеркомның алғашқы күндерінде біздің CTO Ciaran кеңседе де, кеңседе де тәулік бойы техникалық қолдау көрсету тобы болды. Интерком өскен сайын Сиаранға көмектесу үшін жұмыс тобы құрылды. Көп ұзамай жаңа әзірлеу топтары көптеген жаңа мүмкіндіктер мен қызметтерді жасай бастады және олар техникалық қолдау көрсетудің барлық міндеттерін өз мойнына алды.

Кез келген сәтте «кезекте» адамдар тым көп болды.

Ол кезде бұл әдіс ақылға қонымсыз болып көрінді, өйткені бұл кез келген сәтте біздің техникалық қолдау көрсету тобын кеңейтудің оңай жолы болды, ол біздің құндылықтарымызға сәйкес болды және ол бізді қуантты. меншік сезімі. Нәтижесінде, ешқандай жоспарсыз біз клиенттермен жұмыстан тыс уақытта үнемі хабарласатын төрт-бес командаға қол жеткіздік. Қалған әзірлеу топтарында қате жіберетін қиын нүктелер болмады, сондықтан олар сирек шақырылды.

Біз мақтануға тұрарлық техникалық қолдау көрсететін механиктер және шешуді қалайтын бірқатар маңызды мәселелер бар жағдайда екенімізді түсіндік, мысалы:

  • Кез келген уақытта тым көп адамдар сынаққа дайын болды. Біздің инфрақұрылым қалыпты демалыс күндерінсіз жұмыс істейтін кем дегенде бес әзірлеуші ​​инженерді қажет ететіндей үлкен емес еді.
  • Ескертулеріміздің және қоңырау шалу процедураларының сапасы командалар арасында сәйкес келмеді, біз жаңа және бұрыннан бар мәселе ескертулері үшін арнайы шолу процестерін қолдандық. Жұмыс кітабындағы нұсқаулар (мәселе көтерілген кезде орындалатын) негізінен олардың жоқтығымен көзге түсті.
  • Инженерлер жұмыс істеген командаға байланысты олардың күтулері қарама-қайшы болды. Мысалы, тек бірінші техникалық қолдау тобы кезекшілік ауысымдары мен демалыс күндері үшін өтемақы алды.
  • Тақ сағаттарда қажетсіз қоңырауларға жалпы төзімділік бар екені белгілі болды.
  • Ақырында, бұл жұмыс түрі бәріне бірдей жарамайды. Өмірлік жағдайлар кейде кезекшілік ауысымының адамдарға жақсы әсер етпейтінін көрсетті.

«Әрқашан қосылған» дұрыс күйін табу

Біз әр команданың бос уақыты болған кезде техникалық қолдау жұмысын жасайтын жаңа виртуалды команда құруды шештік. Команда ұйымдағы кез келген команданың әскерге шақырылғандары емес, еріктілерден құралады. Виртуалды топтағы инженерлер әр алты ай сайын ауысып, апталарды «байланыста» өткізді. Бақытымызға орай, виртуалды команданы біріктіру үшін жеткілікті волонтерлерді табу қиынға соққан жоқ.

Нәтижесінде біздің қолдау тобымыз 30 адамнан 6 немесе 7 адамға дейін қысқарды.

Содан кейін топ келісіп, мәселе ескертулері мен runbook сипаттамалары қандай болуы керектігін анықтады және ескертулерді жаңа қолдау көрсету тобына қайта жіберу процесін сипаттады. Олар Terraform модулі арқылы кодтағы барлық ескертулерді анықтады және әрбір өзгерту үшін өзара шолуды пайдалана бастады. Біз кезекшілерге өте қолайлы апталық ауысым үшін өтемақы деңгейін енгіздік. Біз сонымен қатар тек менеджерлерден тұратын екінші деңгейлі команданы құрдық. Бұл пәрмен техникалық қолдау көрсетуші инженерлер үшін жалғыз өрлеу нүктесі болуы керек.

Бізде бірнеше ай қажырлы жұмыс болды, оның барысында біз бұл процесті орнаттық, нәтижесінде қазір бұрынғыдай 30 инженер емес, бар болғаны 6 немесе 7 ғана байланыста болды. Жұмыс уақытында командалар өздерінің функцияларына немесе қызметтеріне қатысты мәселелерді дербес шешеді. Бұл уақыт әдетте бұзылулардың ең көп санын құрайды, бірақ қалған уақытта техникалық қолдауды еріктілер атқарады.

Біз не үйрендік

Виртуалды техникалық қолдау тобын іске қосқаннан кейін біз ақаулардың себептерін зерттеу немесе апатқа әкелген бір мәселені шешу үшін жалпы жиналыс сияқты жаңа тапсырмалардың тасқынын күттік. Дегенмен, біздің әзірлеу топтары апаттарды тудыратын факторлар үшін толық жауапкершілікті өз мойнына алды және кез келген кейінгі жауап әдетте дереу әрекет болды. Сондай-ақ, инженерлерді сағаттан кейін байланысуға мәжбүрлемеу үшін техникалық кеңес беру тапсырмасы қай командаға қайтарылатынын болдырмау керек еді.

Жұмыстан тыс қоңыраулар айына 10-ға дейін қысқартылды.

Ресми түрде біздің эскалация үрдісі сирек қолданылды. Инженерге қазіргі уақытта желіде жұмыс істейтін топ, әсіресе Сан-Францискодағы кеңседегі біздің жігіттер бейресми түрде көмектесті деген түсінік кең таралған. Топтық жұмыс және жедел шешу арқылы көптеген мәселелер түзетілді немесе азайтылды.

Сан-Францискодағы кеңсеміздегі инженерлер командаға толық команда ретінде қосылып, тұрақты техникалық қолдаудан тыс жұмыс істейді. Кейбір үстеме шығындар болды, бірақ біздің қолдау тобының мүшелігін бірнеше орындарда кеңейту біздің пайдамызға жұмыс істеді, өйткені бұл қарым-қатынас орнатудың, оларды нығайтудың және біз бәріміз бірге жұмыс істейтін технология стекі туралы көбірек білудің жақсы тәсілі екенін дәлелдеді.

Біздің командаларда интерком әзірлеушілерінің жұмысы біркелкі болды және біз веб-сайтымызда жүйелік инженер лауазымының артықшылықтары туралы сенімді түрде айта аламыз. Мансап, егер сіз өзіңіз қаламасаңыз, әрқашан байланыста болудың қажеті жоқ екенін айтады.

Деректер қоймаларымызды тұрақтандыру және масштабтау бойынша іргелі жұмыспен қатар, мәселелерді шешуге үнемі назар аудару жұмыстан тыс қоңыраулардың айына 10-нан азайуына әкелді. Біз бұл санды мақтан тұтамыз.

Біз техникалық қолдау көрсету тобымызды қолдау және жақсарту бойынша жұмысты жалғастырамыз және Домофон өскен сайын шешімдерімізді қайта қарастыру қажет болуы мүмкін, себебі бүгінгі жұмыс істейтін нәрсе келесі жолы қызметкерлер саны екі есеге дейін жұмыс істемеуі мүмкін. Дегенмен, бұл тәжірибе ұйымымыз үшін өте жағымды болды, әзірлеуші ​​инженерлеріміздің өмір сүру сапасын, қиындықтарға жауап беру сапасын және ең бастысы, тұтынушыларымыздың тәжірибесін айтарлықтай жақсартты.

Ақпарат көзі: www.habr.com

пікір қалдыру