Яндекс дежурный сменасын кантип эвакуацияладык

Яндекс дежурный сменасын кантип эвакуацияладык

Жумуш бир ноутбукка туура келсе жана башка адамдардан автономдуу түрдө аткарылса, анда алыскы жерге көчүүдө эч кандай көйгөй болбойт - эртең менен үйдө калуу. Бирок баары эле бактылуу боло бербейт.

Чакырык боюнча нөөмөт - бул кызматтын жеткиликтүүлүгү боюнча адистердин (SREs) командасы. Ал дежур администраторлорду, иштеп чыгуучуларды, менеджерлерди, ошондой эле ар бири 26 дюймдан турган 55 ЖК панелинен турган жалпы "башкаруучу тактаны" камтыйт. Компаниянын кызмат көрсөтүүлөрүнүн туруктуулугу жана көйгөйлөрдү чечүүнүн ылдамдыгы нөөмөт нөөмөтүнүн ишинен көз каранды.

Бүгүн Дмитрий Меликов tal10n, дежурный сменанын начальниги бир нече кундун ичинде техниканы уйлеруне ташып жеткируу жана жацы иш процесстерин жолго коюу женунде айтып берет. Мен ага сөз берем.

— Убакыттын чексиз запасы болгондо, каалаган нерсеңиз менен каалаган жерге ыңгайлуу кыймылдай аласыз. Бирок коронавирустун тездик менен жайылышы бизди таптакыр башка шарттарга койду. Яндекс кызматкерлери алыстан иштөөгө биринчилерден болуп өтүшкөн - ал тургай өзүн-өзү изоляциялоо режими киргизилгенге чейин. Ушундай болгон. Бейшемби күнү, 12-мартта, менден команданын ишин үйгө көчүрүү мүмкүнчүлүгүн баалоону суранышты. 13-жума күнү алыстан иштөөгө өтүү сунушу пайда болду. Шейшембиге караган түнү, 17-мартка караган түнү бизде бардыгы даяр: нөөмөттөгү адамдар үйдөн иштеп жатышты, жабдуулар ташылды, жетишпеген программалык камсыздоо жазылды, процесстер кайра конфигурацияланды. Эми мен аны кантип чечкенибизди айтып берем. Бирок адегенде нөөмөт нөөмөтүнүн чече турган милдеттерин эстеп калуу керек.

Биз кимбиз

Яндекс жүздөгөн кызматтары бар ири компания. Издөөнүн туруктуулугу, үн жардамчысы жана башка бардык продуктылар иштеп чыгуучулардан гана эмес. Маалымат борборундагы электр энергиясы үзгүлтүккө учурашы мүмкүн. Жумушчу асфальтты алмаштырууда кокусунан оптикалык кабельге зыян келтириши мүмкүн. Же колдонуучулардын активдүүлүгүнүн өсүшү мүмкүн, бул кубаттуулукту кайра бөлүштүрүү зарылдыгын жаратат. Анын үстүнө биз баарыбыз чоң, татаал инфраструктурада жашайбыз жана бир продуктуну чыгаруу кокусунан экинчисинин деградациясына алып келиши мүмкүн.

Биздин ачык мейкиндиктеги 26 панелдер - бул бир жарым миң эскертүү жана жүздөн ашык диаграммалар жана биздин кызматтарыбыздын панелдери. Негизи, бул чоң диагностикалык панель. Тажрыйбалуу нөөмөтчү администратор маанилүү компоненттердин абалын карап, тез түшүнө алат жана технологиялык көйгөйдү иликтөө багытын аныктай алат. Бул адам ар дайым бардык түзмөктөрдү карап турушу керек дегенди билдирбейт: автоматика өзү нөөмөтчүнүн атайын интерфейсине билдирүү жөнөтүү менен көңүл бурат, бирок визуалдык панелсиз маселени чечүү көп убакытты талап кылышы мүмкүн.

Көйгөйлөр пайда болгондо, нөөмөтчү биринчи кезекте алардын артыкчылыктарын баалайт. Андан кийин ал көйгөйдү бөлүп салат же анын колдонуучуларга тийгизген таасирин азайтат.

Көйгөйдү изоляциялоонун бир нече стандарттуу жолдору бар. Алардын бири кызматтардын деградациясы, дежурный администратор колдонуучулар анча байкабаган айрым функцияларды өчүрүп койгондо. Бул жүктү убактылуу азайтууга жана эмне болгонун аныктоого мүмкүндүк берет. Эгерде маалымат борбору менен көйгөй жаралса, нөөмөтчү оперативдүү топ менен байланышат, көйгөйдү түшүнөт, аны чечүү мөөнөттөрүн көзөмөлдөйт жана зарыл болгон учурда адистештирилген топторду тартат.

Дежурный администратор релизден улам пайда болгон көйгөйдү бөлүп ала албаганда, ал бул тууралуу кызмат көрсөтүү тобуна билдирет - жана иштеп чыгуучулар жаңы коддон каталарды издешет. Эгер алар аны түшүнө албаса, анда администратор башка өнүмдөрдүн иштеп чыгуучуларын же кызматтын жеткиликтүүлүгү боюнча инженерлерди тартат.

Мен бул жерде баары кандай иштээри жөнүндө көпкө сүйлөшө алам, бирок мен маанини жеткирип койдум деп ойлойм. Дежурный нөөмөт бардык кызматтардын ишин координациялайт жана глобалдык көйгөйлөргө көз салат. Дежурный администратордун көз алдында диагностикалык панелдин болушу маанилүү. Ошондуктан, алыстан иштөөгө өткөндө, баарына эле ноутбук бере албайсыз. Диаграммалар жана эскертүүлөр экранга туура келбейт. Эмне кылуу керек?

ой

Кеңседе нөөмөттөгү он администратордун баары бир панелдин артында нөөмөт менен иштешет, анын ичинде 26 монитор, эки компьютер, төрт NVIDIA Quadro NVS 810 видеокарта, эки стойкага орнотулган үзгүлтүксүз электр булагы жана бир нече көз карандысыз тармакка кирүү мүмкүнчүлүгү бар. Биз ар бир адамдын үйдө иштөө мүмкүнчүлүгүнө ээ болушубуз керек болчу. Мындай дубалды батирге чогултуу жөн эле мүмкүн эмес (менин жубайым буга өзгөчө кубанат), ошондуктан биз үйгө алып келип, чогулта турган портативдик версияны түзүүнү чечтик.

Биз конфигурация менен эксперимент жүргүзө баштадык. Биз бардык түзмөктөрдү азыраак дисплейге батырышыбыз керек болчу, андыктан монитор үчүн негизги талап пикселдик тыгыздыктын жогору болушу болгон. Биздин чөйрөдө жеткиликтүү 4K мониторлордун ичинен биз сыноо үчүн Lenovo P27u-10ну тандадык.

Ноутбуктардан 16 дюймдук MacBook Pro алдык. Бул бир нече 4K дисплейлерде сүрөттөрдү көрсөтүү үчүн зарыл болгон кыйла күчтүү графикалык подсистемага жана төрт универсалдуу Type-C коннекторуна ээ. Сиз суроо беришиңиз мүмкүн: эмне үчүн рабочий эмес? Ноутбукту кампадан дал ошол ноутбукка алмаштыруу окшош тутумдук блокту чогултууга жана конфигурациялоого караганда алда канча жеңил жана тезирээк. Ал эми салмагы азыраак.

Эми биз ноутбукка канча мониторлорду туташтыра аларыбызды түшүнүшүбүз керек болчу. Жана бул жерде маселе туташтыргычтардын саны эмес, биз муну чогултулган системаны сынап көрүү аркылуу гана биле алдык.

Яндекс дежурный сменасын кантип эвакуацияладык

тестирлөө

Биз бардык диаграммаларды жана эскертүүлөрдү төрт мониторго ыңгайлуу жайгаштырып, жада калса аларды ноутбукка туташтырдык, бирок көйгөйгө туш болдук. Туташкан мониторлордо 4x4K пикселдерди көрсөтүү видеокартага ушунчалык оорчулук келтиргендиктен, ноутбук кубатталып жатканда да кубаты түгөнгөн. Бактыга жараша, көйгөй Lenovo ThinkPad Thunderbolt 3 Dock Gen 2 жардамы менен чечилди. Мен мониторду, электр булагы, жадагалса сүйүктүү чычкан менен клавиатураны док станциясына туташтыра алдым.

Бирок дагы бир көйгөй дароо пайда болду: GPU ушунчалык катуу ысып кеткендиктен, ноутбук ысып кеткен, демек, батарея да ысып кеткен, натыйжада коргоочу режимге өтүп, зарядды кабыл алууну токтоткон. Жалпысынан алганда, бул кооптуу кырдаалдардан коргогон абдан пайдалуу режим. Кээ бир учурларда маселе жогорку технологиялык түзүлүштүн – желдетүүнү жакшыртуу үчүн ноутбуктун астына коюлган шариктүү калемдин жардамы менен чечилген. Бирок бул баарына эле жардам берген жок, ошондуктан биз стандарттык желдеткичтин ылдамдыгын да жогорулаттык.

Дагы бир жагымсыз өзгөчөлүгү бар эле. Бардык диаграммалар жана эскертүүлөр так аныкталган жерде болушу керек. Сиз конуу үчүн учакты башкарып жатканыңызды элестетиңиз - анан ылдамдык индикаторлору, бийиктиктер, вариометрлер, мамиле индикаторлору, компастар жана позиция индикаторлору өлчөмүн өзгөртүп, ар кайсы жерлерге секирип баштайт. Ошентип, биз буга жардам бере турган тиркемени жасоону чечтик. Бир күнү кечинде биз даяр алып, Electron.js жазып койдук API терезелерди түзүү жана башкаруу боюнча. Биз конфигурация процессорун жана аларды мезгил-мезгили менен жаңыртып турууну, ошондой эле чектелген сандагы мониторлорду колдоону коштук. Бир аздан кийин алар ар кандай орнотууларды колдоону кошушту.

Монтаждоо жана жеткирүү

Дүйшөмбүгө чейин жардам столунун усталары биз үчүн 40 монитор, он ноутбук жана ошончо эле сандагы док-станцияларды алышты. Алар муну кантип башкарганын билбейм, бирок аларга чоң рахмат.

Яндекс дежурный сменасын кантип эвакуацияладык

Анын баарын нөөмөттөгү администраторлордун батирлерине жеткирүү гана калды. Ал эми булар Москванын ар кайсы жерлериндеги он даректер: түштүк, чыгыш, борбор, ошондой эле кеңседен 45 чакырым алыстыкта ​​жайгашкан Балашиха (айтмакчы, кийинчерээк Серпуховдон интерн кошулган). Мунун баарын кандайдыр бир жол менен адамдар арасында бөлүштүрүү, логистика куруу керек болчу.

Мен биздин Карталарыбызга бардык даректерди киргиздим, ар кандай пункттардын ортосундагы маршрутту оптималдаштыруу мүмкүнчүлүгү дагы эле бар (мен курьерлердин акысыз бета версиясын колдондум). Биз өз командабызды эки кишиден турган төрт көз карандысыз командага бөлдүк, ар биринин өз маршруту бар. Менин машинам эң кенен болуп чыкты, ошондуктан мен бир эле учурда төрт кызматкерге жабдууларды алдым.

Яндекс дежурный сменасын кантип эвакуацияладык

Бардык жеткирүү рекорддук үч саатка созулду. Дүйшөмбү күнү кечинде кеңседен чыктык. Түнкү саат бирде мен үйдө болчумун. Ошол эле түнү жаңы техника менен нөөмөткө чыктык.

Натыйжада менен

Бир чоң диагностикалык консолдун ордуна ар бир нөөмөтчүнүн батирине он салыштырмалуу көчмө консолду чогулттук. Албетте, чече турган кээ бир деталдар бар эле. Маселен, бизде мурда кабарлоо үчүн нөөмөтчүгө бир “темир” телефон бар болчу. Бул жаңы шарттарда иштеген жок, ошондуктан биз нөөмөтчүлөр үчүн "виртуалдык телефондорду" ойлоп таптык (негизинен, мессенджердеги каналдар). Башка өзгөрүүлөр да болду. Бирок эң негизгиси, рекорддук убакыттын ичинде биз адамдарды гана эмес, алардын жугузуу коркунучун азайтып, бардык ишибизди процесстерге жана продукциянын туруктуулугуна зыян келтирбестен үйгө өткөрө алдык. Бир айдан бери ушул режимде иштеп жатабыз.

Төмөндө биздин нөөмөттөгү кызматкерлердин чыныгы иштеген жерлеринин сүрөттөрүн таба аласыздар.

Яндекс дежурный сменасын кантип эвакуацияладык

Яндекс дежурный сменасын кантип эвакуацияладык

Яндекс дежурный сменасын кантип эвакуацияладык

Яндекс дежурный сменасын кантип эвакуацияладык

Яндекс дежурный сменасын кантип эвакуацияладык

Source: www.habr.com