Si e evakuuam ndërrimin e detyrës Yandex

Si e evakuuam ndërrimin e detyrës Yandex

Kur puna përshtatet në një laptop dhe mund të kryhet në mënyrë autonome nga njerëzit e tjerë, atëherë nuk ka asnjë problem të lëvizni në një vend të largët - mjafton të qëndroni në shtëpi në mëngjes. Por jo të gjithë janë kaq me fat.

Ndërrimi i detyrës është një ekip specialistësh të disponueshmërisë së shërbimit (SRE). Ai përfshin administratorët e detyrave, zhvilluesit, menaxherët, si dhe një "pult" të përbashkët prej 26 panelesh LCD prej 55 inç secila. Stabiliteti i shërbimeve të kompanisë dhe shpejtësia e zgjidhjes së problemeve varen nga puna e ndërrimit të detyrës.

Sot Dmitry Melikov tal10n, shefi i turnit në detyrë, do të flasë sesi brenda pak ditësh arritën të transportonin pajisjet në shtëpitë e tyre dhe të vendosnin procese të reja pune. Unë i jap fjalën.

- Kur keni një rezervë të pafundme kohe, mund të lëvizni me lehtësi me çdo gjë kudo. Por përhapja e shpejtë e koronavirusit na ka vënë në kushte krejtësisht të ndryshme. Punonjësit e Yandex ishin ndër të parët që kaluan në punë në distancë, edhe para futjes së regjimit të izolimit. Ndodhi kështu. Të enjten, më 12 mars, më kërkuan të vlerësoja mundësinë e zhvendosjes së punës së ekipit në shtëpi. Të premten më 13, pati një rekomandim për të kaluar në punë në distancë. Natën e së martës, 17 mars, gjithçka ishte gati për ne: shoqëruesit po punonin në shtëpi, pajisjet u zhvendosën, programi që mungonte u shkrua, proceset u rikonfiguruan. Dhe tani do t'ju tregoj se si ia dolëm. Por së pari duhet të mbani mend për detyrat që zgjidh ndërrimi i detyrës.

Kush jemi ne

Yandex është një kompani e madhe me qindra shërbime. Stabiliteti i kërkimit, asistentit zanor dhe të gjitha produkteve të tjera nuk varet vetëm nga zhvilluesit. Furnizimi me energji elektrike mund të ndërpritet në qendrën e të dhënave. Një punëtor gjatë zëvendësimit të asfaltit mund të dëmtojë aksidentalisht kabllon optike. Ose mund të ketë një rritje të aktivitetit të përdoruesit, gjë që do të kërkojë një rialokim urgjent të kapacitetit. Për më tepër, ne të gjithë jetojmë në një infrastrukturë të madhe, komplekse dhe lëshimi i njërit prej produkteve mund të çojë aksidentalisht në degradimin e një tjetri.

26 panele në hapësirën tonë të hapur janë një mijë e gjysmë sinjalizime dhe më shumë se njëqind grafiku dhe panele të shërbimeve tona. Në fakt, ky është një panel i madh diagnostikues. Një administrator me përvojë pune, duke e parë atë, kupton shpejt statusin e nyjeve të rëndësishme dhe mund të vendosë drejtimin për hetimin e një problemi teknologjik. Kjo nuk do të thotë që një person duhet të shikojë vazhdimisht të gjitha pajisjet: vetë automatizimi do të tërheqë vëmendjen duke dërguar një njoftim në ndërfaqen speciale të oficerit të detyrës, por pa një panel vizual, zgjidhja e problemit mund të vonohet.

Kur shfaqen probleme, shoqëruesi së pari vlerëson prioritetin e tyre. Më pas izolon problemin ose minimizon ndikimin e tij tek përdoruesit.

Ka disa mënyra standarde për të izoluar një problem. Një prej tyre është degradimi i shërbimeve, kur administratori në detyrë çaktivizon disa nga funksionet që përdoruesit më pak i vënë re. Kjo ju lejon të zvogëloni përkohësisht ngarkesën dhe të kuptoni se çfarë ka ndodhur. Nëse ka një problem me qendrën e të dhënave, punonjësi i detyrës kontakton ekipin operativ, kupton problemin, kontrollon kohën e zgjidhjes së tij dhe, nëse është e nevojshme, lidh ekipet përkatëse.

Kur administratori në detyrë nuk mund të izolojë problemin që u shfaq për shkak të lëshimit, ai e raporton atë te ekipi i shërbimit - dhe zhvilluesit kërkojnë gabime në kodin e ri. Nëse ata nuk arrijnë ta kuptojnë, atëherë administratori tërheq zhvillues nga produkte të tjera ose inxhinierë për disponueshmërinë e shërbimeve.

Mund të flas gjatë se si është rregulluar gjithçka me ne, por mendoj se e kam përcjellë tashmë thelbin. Ndërrimi i detyrës koordinon punën e të gjitha shërbimeve dhe kontrollon problemet globale. Është e rëndësishme që administratori në detyrë të ketë para syve një panel diagnostik. Kjo është arsyeja pse kur kaloni në punë në distancë, nuk mund të merrni dhe t'i jepni të gjithëve një laptop. Grafikët dhe sinjalizimet nuk do të përshtaten në ekran. Çfarë duhet bërë?

Ide

Në zyrë, të dhjetë administratorët në detyrë punojnë me turne në të njëjtin panel, i cili përfshin 26 monitorë, dy kompjuterë, katër karta video NVIDIA Quadro NVS 810, dy furnizime me energji të pandërprerë të montuara në raft dhe disa aksese të pavarura në rrjet. Ne duhej të siguronim që të gjithë të kenë mundësinë të punojnë nga shtëpia. Thjesht nuk është e mundur të montoni një mur të tillë në një apartament (gruaja ime do të jetë veçanërisht e lumtur për këtë), kështu që vendosëm të krijojmë një version portativ që mund të sillet dhe montohet në shtëpi.

Filluam të eksperimentonim me konfigurimin. Na duhej t'i vendosnim të gjitha pajisjet në më pak ekrane, kështu që kërkesa kryesore për monitorin ishte një densitet i lartë pikselësh. Nga monitorët 4K të disponueshëm në mjedisin tonë, ne zgjodhëm Lenovo P27u-10 për teste.

Nga laptopët, morëm një MacBook Pro 16 inç. Ka një nënsistem grafik mjaft të fuqishëm, i cili është i nevojshëm për paraqitjen e imazheve në disa ekrane 4K dhe katër lidhës universale Type-C. Ju mund të pyesni: pse jo desktop? Zëvendësimi i një laptopi me të njëjtin nga depoja është shumë më i lehtë dhe më i shpejtë sesa montimi dhe konfigurimi i një njësie identike të sistemit. Dhe po, peshon më pak.

Tani ishte e nevojshme të kuptonim se sa monitorë mund të lidhim vërtet me një laptop. Dhe problemi këtu nuk është numri i lidhësve, ne mund ta zbulonim vetëm duke testuar sistemin si një asamble.

Si e evakuuam ndërrimin e detyrës Yandex

Testimi

I vendosëm me lehtësi të gjitha grafikët dhe sinjalizimet në katër monitorë dhe madje i lidhëm me një laptop, por hasëm në një problem. Shfaqja e pikselave 4×4K në monitorët e lidhur ngarkoi kartën video aq shumë sa laptopi u shkarkua edhe gjatë karikimit. Për fat të mirë, problemi u zgjidh me ndihmën e stacionit të lidhjes Lenovo ThinkPad Thunderbolt 3 Dock Gen 2. Ne arritëm të lidhim një monitor, energji elektrike dhe madje edhe miun dhe tastierën tuaj të preferuar me stacionin e dokimit.

Por një problem tjetër u shfaq menjëherë: GPU-ja u fry aq shumë sa laptopi u mbinxeh, që do të thotë se edhe bateria u mbinxeh, e cila si rezultat kaloi në modalitetin mbrojtës dhe pushoi së ngarkuari. Në përgjithësi, kjo është një mënyrë shumë e dobishme që mbron nga situata të rrezikshme. Në disa raste, problemi u zgjidh me ndihmën e një pajisjeje të teknologjisë së lartë - një stilolaps i vendosur nën laptop për të përmirësuar ventilimin. Por kjo nuk i ndihmoi të gjithëve, kështu që rritëm edhe shpejtësinë e ventilatorit standard.

Kishte një veçori tjetër të pakëndshme. Të gjitha grafikët dhe sinjalizimet duhet të vendosen në një vend të përcaktuar rreptësisht. Imagjinoni që po pilotoni një aeroplan për t'u ulur - dhe më pas treguesit e shpejtësisë, lartësimatësit, variometrat, horizontet artificiale, busullat dhe treguesit e pozicionit fillojnë të ndryshojnë madhësinë dhe kërcejnë në vende të ndryshme. Kështu që vendosëm të bëjmë një aplikacion që do të ndihmojë me këtë. Në një mbrëmje, e shkruam në Electron.js, duke marrë një të gatshme API për krijimin dhe menaxhimin e dritareve. Ne shtuam një mbajtës konfigurimi dhe përditësimin periodik të tyre, si dhe mbështetje për një numër të kufizuar monitorësh. Pak më vonë, ata shtuan mbështetje për konfigurime të ndryshme.

Montimi dhe shpërndarja

Deri të hënën, magjistarët nga zyra e ndihmës kishin marrë 40 monitorë, dhjetë laptopë dhe të njëjtin numër stacionesh docking për ne. Nuk e di si e kanë bërë, por faleminderit shumë.

Si e evakuuam ndërrimin e detyrës Yandex

Mbeti të gjitha këto t'i dorëzoheshin banesave të administratorëve në detyrë. Dhe këto janë dhjetë adresa në pjesë të ndryshme të Moskës: jug, lindje, qendër, dhe gjithashtu Balashikha, e cila është 45 kilometra larg zyrës (nga rruga, një praktikant nga Serpukhov u shtua gjithashtu më vonë). Ishte e nevojshme që disi të shpërndahej e gjithë kjo midis njerëzve, të ndërtohej logjistika.

Kam futur të gjitha adresat në Hartat tona, ka ende një mundësi për të optimizuar rrugën midis pikave të ndryshme (kam përdorur versionin beta falas të mjetit për korrierët). E ndamë ekipin tonë në katër ekipe të pavarura me nga dy persona, secila mori rrugën e vet. Makina ime doli të ishte më e bollshme, kështu që mora pajisje për katër punonjës menjëherë.

Si e evakuuam ndërrimin e detyrës Yandex

I gjithë dorëzimi zgjati tre orë rekord. U larguam nga zyra në orën XNUMX:XNUMX të së hënës. Në orën një të mëngjesit isha tashmë në shtëpi. Po atë natë shkuam në detyrë me pajisje të reja.

Cila është përfundimi

Në vend të një tastieje të madhe diagnostikuese, ne mblodhëm dhjetë të tilla relativisht të lëvizshme në banesën e çdo oficeri. Sigurisht, kishte ende disa gjëra për t'u hekurosur. Për shembull, më parë kishim një telefon "të hekurt" të nëpunësit për njoftime. Në kushtet e reja, kjo nuk funksionoi, kështu që ne dolëm me "telefonat virtualë" për ata që ishin në detyrë (në fakt, kanalet në messenger). Pati edhe ndryshime të tjera. Por gjëja kryesore është se në një kohë rekord arritëm të transferonim jo vetëm njerëzit, duke zvogëluar rrezikun e infektimit të tyre, por të gjithë punën tonë nga shtëpia pa dëmtuar proceset dhe stabilitetin e produktit. Ne e kemi bërë këtë për një muaj tani.

Më poshtë do të gjeni foto të punëve reale të shoqëruesve tanë.

Si e evakuuam ndërrimin e detyrës Yandex

Si e evakuuam ndërrimin e detyrës Yandex

Si e evakuuam ndërrimin e detyrës Yandex

Si e evakuuam ndërrimin e detyrës Yandex

Si e evakuuam ndërrimin e detyrës Yandex

Burimi: www.habr.com