Како смо евакуисали дежурну смену Иандек-а

Како смо евакуисали дежурну смену Иандек-а

Када посао стане у један лаптоп и може се обављати самостално од других људи, онда нема проблема да се преселите на удаљену локацију - довољно је да ујутру останете код куће. Али нису сви те среће.

Дежурна смена је тим стручњака за доступност услуга (СРЕ). Укључује дежурне администраторе, програмере, менаџере, као и заједничку „контролну таблу“ од 26 ЛЦД панела од 55 инча сваки. Од рада дежурства зависи стабилност услуга компаније и брзина решавања проблема.

Данас Дмитриј Меликов тал10н, дежурни шеф смене, причаће како су за неколико дана успели да превезу опрему до својих кућа и успоставе нове процесе рада. Дајем му реч.

- Када имате бесконачну количину времена, можете се удобно кретати са било чим било где. Али брзо ширење коронавируса нас је довело у потпуно другачије услове. Запослени у Иандеку су међу првима прешли на даљински рад и пре увођења режима самоизолације. Десило се овако. У четвртак, 12. марта, замољен сам да проценим могућност премештања посла тима кући. У петак 13. била је препорука да се пређе на даљински рад. У ноћи на уторак, 17. марта, све је било спремно за нас: дежурни су радили код куће, опрема је премештена, софтвер који недостаје, написан, процеси су реконфигурисани. А сада ћу вам рећи како смо то урадили. Али прво треба да се сетите задатака које решава дежурна смена.

Ко смо

Иандек је велика компанија са стотинама услуга. Стабилност претраге, гласовног асистента и свих осталих производа не зависи само од програмера. Може доћи до прекида напајања у дата центру. Радник приликом замене асфалта може случајно да оштети оптички кабл. Или може доћи до пораста активности корисника, што ће захтевати хитну прерасподелу капацитета. Штавише, сви живимо у великој, сложеној инфраструктури, а ослобађање једног од производа може случајно довести до деградације другог.

26 панела на нашем отвореном простору су хиљаду и по упозорења и више од стотину графикона и панела наших услуга. У ствари, ово је огроман дијагностички панел. Искусан дежурни администратор, гледајући га, брзо разуме статус важних чворова и може да постави правац за истраживање технолошког проблема. То не значи да особа треба стално да гледа све уређаје: сама аутоматизација ће привући пажњу слањем обавештења на посебан интерфејс дежурног, али без визуелног панела решење проблема може бити одложено.

Када дође до проблема, полазник прво процењује њихов приоритет. Затим изолује проблем или минимизира његов утицај на кориснике.

Постоји неколико стандардних начина да се изолује проблем. Једна од њих је деградација услуга, када дежурни администратор онемогућава неке од функција које корисници најмање примећују. Ово вам омогућава да привремено смањите оптерећење и схватите шта се догодило. Ако постоји проблем са дата центром, дежурни контактира оперативни тим, разуме проблем, контролише време његовог решавања и по потреби повезује релевантне тимове.

Када дежурни администратор не може да изолује проблем који је настао због објављивања, он то пријављује сервисном тиму - а програмери траже грешке у новом коду. Ако то не успеју да схвате, онда администратор привлачи програмере из других производа или инжењере за доступност услуга.

Могу дуго да причам како је код нас све уређено, али мислим да сам већ пренео суштину. Дежурна смена координира рад свих служби и контролише глобалне проблеме. Важно је да дежурни администратор има дијагностички панел испред очију. Зато када пређете на рад на даљину, не можете једноставно узети и дати свима лаптоп. Графикони и упозорења неће стати на екран. Шта да радим?

Идеја

У канцеларији свих десет дежурних администратора ради у сменама на истој контролној табли, која укључује 26 монитора, два рачунара, четири НВИДИА Куадро НВС 810 видео картице, два уређаја за непрекидно напајање монтирана у рацк и неколико независних приступа мрежи. Морали смо да обезбедимо да сви имају прилику да раде од куће. Једноставно није могуће саставити такав зид у стану (моја супруга ће бити посебно срећна због тога), па смо одлучили да направимо преносиву верзију која се може донети и саставити код куће.

Почели смо да експериментишемо са конфигурацијом. Требало је да све уређаје поставимо на мање екрана, тако да је главни захтев за монитор била висока густина пиксела. Од 4К монитора доступних у нашем окружењу, за тестове смо изабрали Леново П27у-10.

Од лаптопа смо узели МацБоок Про од 16 инча. Има прилично моћан графички подсистем, који је неопходан за приказивање слика на неколико 4К дисплеја, и четири универзална конектора типа Ц. Можете питати: зашто не десктоп? Замена лаптопа са потпуно истим из складишта је много лакша и бржа од склапања и конфигурисања идентичне системске јединице. И да, тежи је мање.

Сада је било неопходно разумети колико монитора заиста можемо да повежемо са лаптопом. А проблем овде није број конектора, то смо могли да сазнамо само тестирањем система као склопа.

Како смо евакуисали дежурну смену Иандек-а

Тестирање

Све графиконе и упозорења смо удобно поставили на четири монитора и чак смо их повезали са лаптопом, али смо наишли на проблем. Рендеровање 4×4К пиксела на повезаним мониторима толико је оптеретило видео картицу да је лаптоп био испражњен чак и током пуњења. На срећу, проблем је решен уз помоћ прикључне станице Леново ТхинкПад Тхундерболт 3 Доцк Ген 2. Успели смо да повежемо монитор, напајање, па чак и ваш омиљени миш и тастатуру на прикључну станицу.

Али одмах се појавио још један проблем: ГПУ је толико пухао да се лаптоп прегрејао, што значи да се и батерија прегрејала, која је као резултат тога прешла у заштитни режим и престала да преузима пуњење. Генерално, ово је веома користан режим који штити од опасних ситуација. У неким случајевима проблем је решен уз помоћ високотехнолошког уређаја - хемијске оловке постављене испод лаптопа ради побољшања вентилације. Али ово није помогло свима, па смо такође повећали брзину стандардног вентилатора.

Постојала је још једна непријатна карактеристика. Сви графикони и упозорења морају бити постављени на строго дефинисано место. Замислите да управљате авионом за слетање - а онда индикатори брзине, висиномери, вариометри, вештачки хоризонти, компаси и индикатори положаја почињу да мењају величину и скачу на различитим местима. Зато смо одлучили да направимо апликацију која ће помоћи у томе. За једно вече смо то написали на Елецтрон.јс, узимајући готове АПИ за за креирање и управљање прозорима. Додали смо обрађивач конфигурације и њихово периодично ажурирање, као и подршку за ограничен број монитора. Мало касније, додали су подршку за различита подешавања.

Монтажа и испорука

До понедељка су нам чаробњаци из хелпдеска набавили 40 монитора, десет лаптопова и исто толико прикључних станица. Не знам како су то урадили, али хвала им пуно.

Како смо евакуисали дежурну смену Иандек-а

Остало је да се све ово достави у станове дежурних администратора. А ово је десет адреса у различитим деловима Москве: југ, исток, центар, а такође и Балашиха, која је 45 километара од канцеларије (узгред, касније је додат и приправник из Серпухова). Требало је некако све ово распоредити међу људима, изградити логистику.

Унео сам све адресе на нашим Мапама, још увек постоји могућност да оптимизујем руту између различитих тачака (користио сам бесплатну бета верзију алата за курире). Наш тим смо поделили у четири независна тима од по двоје људи, сваки је добио своју руту. Мој ауто се показао најпространијим, па сам узео опрему за четири запослена одједном.

Како смо евакуисали дежурну смену Иандек-а

Цела испорука трајала је рекордна три сата. Напустили смо канцеларију у понедељак у XNUMX:XNUMX. У један сат ујутру већ сам био код куће. Исте ноћи кренули смо на дежурство са новом опремом.

Са резултатом да

Уместо једне велике дијагностичке конзоле, у стану сваког дежурног сакупили смо десет релативно преносивих. Наравно, остало је још неколико ствари које је требало испеглати. На пример, раније смо имали један „гвоздени” телефон дежурног за обавештења. У новим условима то није функционисало, па смо осмислили „виртуелне телефоне“ за дежурне (у ствари, канале у месинџеру). Било је и других промена. Али најважније је да смо у рекордном року успели да пребацимо не само људе, смањујући ризик од њихове инфекције, већ и сав наш рад од куће без штете по процесе и стабилност производа. Радимо ово већ месец дана.

Испод ћете наћи фотографије стварних послова наших полазника.

Како смо евакуисали дежурну смену Иандек-а

Како смо евакуисали дежурну смену Иандек-а

Како смо евакуисали дежурну смену Иандек-а

Како смо евакуисали дежурну смену Иандек-а

Како смо евакуисали дежурну смену Иандек-а

Извор: ввв.хабр.цом