Yandex-en txanda nola ebakuatu genuen

Yandex-en txanda nola ebakuatu genuen

Lana ordenagailu eramangarri batean sartzen denean eta beste pertsona batzuengandik modu autonomoan egin daitekeenean, ez dago arazorik urruneko kokapen batera mugitzeko; nahikoa da goizean etxean egotea. Baina denek ez dute zorte handia.

Betebeharra txanda Zerbitzuaren Eskuragarritasun Espezialisten (SRE) talde bat da. Betebeharreko administratzaileak, garatzaileak, kudeatzaileak eta 26 hazbeteko 55 LCD paneleko "arbel" komun bat barne hartzen ditu. Enpresaren zerbitzuen egonkortasuna eta arazoak konpontzeko abiadura betebehar-txandaren lanaren araberakoak dira.

Gaur Dmitry Melikov tal10n, guardiako txandako buruak, egun gutxitan ekipoak euren etxeetara eramatea eta lan prozesu berriak ezartzea nola lortu zuten hitz egingo du. Hitza ematen diot.

- Denbora-eskaintza amaigabea duzunean, edozein lekutara eroso mugi zaitezke. Baina koronavirusaren hedapen azkarrak baldintza guztiz ezberdinetan jarri gaitu. Yandex-eko langileak urrutiko lanera aldatzen lehenetakoak izan ziren, autoisolamendu erregimena ezarri aurretik ere. Horrela gertatu zen. Martxoaren 12an, osteguna, taldearen lana etxera eramateko aukera ebaluatzeko eskatu zidaten. Ostiralean, hilak 13, urrutiko lanera aldatzeko gomendioa zegoen. Martxoaren 17ko astearte gauean dena prest zegoen guretzat: arduradunak etxean lanean ari ziren, ekipoak mugitu, falta zen softwarea idatzi, prozesuak birkonfiguratu. Eta orain esango dizut nola egin dugun. Baina lehenik eta behin, betebehar-aldaketak konpontzen dituen zereginak gogoratu behar dituzu.

Nor gara gu

Yandex ehunka zerbitzu dituen enpresa handi bat da. Bilaketa, ahots-laguntzaile eta gainerako produktu guztien egonkortasuna garatzaileen menpe dago. Baliteke datu-zentroan elikadura-hornidura eten. Asfaltoa aldatzean langile batek kable optikoa kaltetu dezake ustekabean. Edo erabiltzaileen jardueraren gorakada egon daiteke, eta horrek ahalmenaren premiazko biresleipena eskatuko du. Gainera, guztiok azpiegitura handi eta konplexu batean bizi gara, eta produktuetako bat askatzeak ustekabean beste baten degradazioa ekar dezake.

Gure espazio irekiko 26 panel mila eta erdi alerta eta gure zerbitzuen ehun taula eta panel baino gehiago dira. Izan ere, hau diagnostiko panel erraldoia da. Esperientziadun betebehar-administratzaile batek, hari begiratuta, azkar ulertzen du nodo garrantzitsuen egoera eta arazo teknologiko bat ikertzeko norabidea ezarri dezake. Horrek ez du esan nahi pertsona batek gailu guztiak etengabe begiratu behar dituenik: automatizazioak berak arreta erakarriko du funtzionarioaren interfaze berezira jakinarazpen bat bidaliz, baina ikusizko panelik gabe, arazoaren konponbidea atzeratu daiteke.

Arazoak gertatzen direnean, laguntzaileak lehenik eta behin haien lehentasuna ebaluatzen du. Ondoren, arazoa isolatzen du edo erabiltzaileengan duen eragina minimizatzen du.

Arazo bat isolatzeko hainbat modu estandar daude. Horietako bat zerbitzuen degradazioa da, guardiako administratzaileak erabiltzaile gutxien nabaritzen dituen funtzio batzuk desgaitzen dituenean. Horri esker, aldi baterako karga murrizten duzu eta zer gertatu den jakiteko. Datu-zentroarekin arazoren bat badago, betebeharreko arduraduna eragiketa-taldearekin harremanetan jartzen da, arazoa ulertzen du, bere konponbidearen denbora kontrolatzen du eta, behar izanez gero, dagozkion taldeak konektatzen ditu.

Laneko administratzaileak kaleratzearen ondorioz sortutako arazoa isolatu ezin duenean, zerbitzu taldeari jakinaraziko dio, eta garatzaileek akatsak bilatzen dituzte kode berrian. Huts egiten badute, administratzaileak beste produktu edo ingeniari batzuen garatzaileak erakartzen ditu zerbitzuen erabilgarritasunerako.

Denbora luzez hitz egin dezaket dena nola antolatzen den gurekin, baina uste dut dagoeneko helarazi dudala funtsa. Betebehar-aldaketak zerbitzu guztien lana koordinatzen du eta arazo globalak kontrolatzen ditu. Garrantzitsua da guardiako administratzaileak diagnostiko panel bat bere begien aurrean izatea. Horregatik, urrutiko lanera aldatzen zarenean, ezin duzu ordenagailu eramangarri bat hartu eta eman guztiei. Grafikoak eta alertak ez dira pantailan sartuko. Zer egin?

Idea

Bulegoan, lanean diharduten hamar administratzaileek txandaka egiten dute lan aginte berean, 26 monitore, bi ordenagailu, lau NVIDIA Quadro NVS 810 bideo-txartel, rack-en muntatutako bi etenik gabeko hornidura eta sareko hainbat sarbide independente barne. Guztiek etxetik lan egiteko aukera dutela ziurtatu behar genuen. Ezinezkoa da halako horma bat apartamentu batean muntatzea (nire emaztea bereziki pozik egongo da), beraz, etxean ekarri eta muntatu daitekeen bertsio eramangarri bat sortzea erabaki dugu.

Konfigurazioarekin esperimentatzen hasi ginen. Gailu guztiak pantaila gutxiagotan egokitu behar genituen, beraz, monitorearen baldintza nagusia pixel dentsitate handia zen. Gure ingurunean eskuragarri dauden 4K monitoreetatik, Lenovo P27u-10 aukeratu dugu probak egiteko.

Ordenagailu eramangarrietatik, 16 hazbeteko MacBook Pro bat hartu genuen. Azpisistema grafiko nahiko indartsua du, beharrezkoa dena 4K pantaila batzuetan irudiak errendatzeko eta C motako lau konektore unibertsalak. Galdetuko duzu: zergatik ez mahaigainekoa? Ordenagailu eramangarri bat biltegiko berdinarekin ordezkatzea askoz errazagoa eta azkarragoa da sistema-unitate berdina muntatzea eta konfiguratzea baino. Eta bai, gutxiago pisatzen du.

Orain beharrezkoa zen ulertzea zenbat monitor konekta gaitezkeen ordenagailu eramangarri batera. Eta hemen arazoa ez da konektore kopurua, sistema muntaia gisa probatuz bakarrik jakin genezake.

Yandex-en txanda nola ebakuatu genuen

Testing

Diagrama eta alerta guztiak eroso jarri genituen lau monitoretan eta ordenagailu eramangarri batera ere konektatu genituen, baina arazo bat izan genuen. Konektatutako monitoreetan 4 Γ— 4K pixel errendatzeak bideo-txartela hainbeste kargatu zuen, non ordenagailu eramangarria deskargatu zen kargatzen ari zen bitartean ere. Zorionez, Lenovo ThinkPad Thunderbolt 3 Dock Gen 2 docking-estaren laguntzarekin konpondu zen arazoa. Monitorea, energia eta baita zure gogoko sagua eta teklatua akoplaziora konektatzea lortu genuen.

Baina berehala azaleratu zen beste arazo bat: GPUak hainbeste puztu zuen, non ordenagailu eramangarria gehiegi berotu zen, hau da, bateria ere berotu egin zela esan nahi du, eta, ondorioz, babes moduan sartu zen eta kargu hartzeari utzi zion. Oro har, egoera arriskutsuetatik babesten duen modu oso erabilgarria da. Zenbait kasutan, arazoa goi-teknologiako gailu baten laguntzarekin konpondu zen - ordenagailu eramangarriaren azpian jarritako boligrafo bat aireztapena hobetzeko. Baina honek ez zien guztiei lagundu, beraz, haizagailu estandarraren abiadura ere igo genuen.

Ezaugarri desatsegin bat gehiago zegoen. Diagrama eta alerta guztiak zorrozki zehaztutako leku batean jarri behar dira. Imajinatu hegazkin bat lurreratzeko pilotatzen ari zarela, eta orduan abiadura-adierazleak, altimetroak, bariometroak, horizonte artifizialak, iparrorratzak eta posizio-adierazleak tamaina aldatzen hasten dira eta leku ezberdinetan jauzi egiten hasten dira. Beraz, horretan lagunduko duen aplikazio bat egitea erabaki dugu. Arratsalde batean, Electron.js-en idatzi genuen, prest egindako bat hartuta API leihoak sortzeko eta kudeatzeko. Konfigurazio-kudeatzailea eta haien aldizkako eguneratzea gehitu dugu, baita monitore kopuru mugatu baterako laguntza ere. Pixka bat geroago, konfigurazio desberdinetarako laguntza gehitu zuten.

Muntaketa eta entrega

Astelehenerako, laguntza-guneko morroiek 40 monitore, hamar ordenagailu eramangarri eta atrakaleku kopuru bera lortu zituzten guretzat. Ez dakit nola egin zuten, baina eskerrik asko.

Yandex-en txanda nola ebakuatu genuen

Hori guztia guardiako administratzaileen apartamentuetara entregatzea geratzen zen. Eta hauek Moskuko hainbat tokitako hamar helbide dira: hegoaldean, ekialdean, erdialdean eta baita bulegotik 45 kilometrora dagoen Balashikha ere (bide batez, Serpukhov-eko bekadun bat ere gehitu zen geroago). Hori guztia pertsonen artean nolabait banatzea beharrezkoa zen, logistika eraikitzea.

Helbide guztiak sartu ditut gure Mapetan, oraindik puntu ezberdinen arteko ibilbidea optimizatzeko aukera dago (mezularientzako tresnaren doako beta bertsioa erabili dut). Gure taldea bi pertsonako lau talde independentetan banatu genuen, bakoitzak bere ibilbidea jaso zuen. Nire autoa zabalena izan zen, beraz, lau langileentzako ekipamendua hartu nuen aldi berean.

Yandex-en txanda nola ebakuatu genuen

Bidalketa osoak hiru orduko errekorra behar izan zuen. Astelehenean gaueko XNUMX:XNUMXetan irten ginen bulegotik. Goizeko ordu batean jada etxean nengoen. Gau hartan bertan ekipamendu berriarekin joan ginen lanean.

Emaitza duten

Diagnostiko-kontsola handi baten ordez, hamar bat eramangarri samarrak bildu genituen betebeharreko ofizial bakoitzaren apartamentuan. Jakina, oraindik gauza batzuk lisatzeko zeuden. Adibidez, aurretik jakinarazpenetarako funtzionarioaren "burdinazko" telefono bat genuen. Baldintza berrietan, honek ez zuen funtzionatu, eta, beraz, "telefono birtualak" sortu genituen guardian zeudenentzat (hain zuzen, mezularitzako kanalak). Beste aldaketa batzuk ere izan ziren. Baina gauza nagusia zera da: denbora errekor batean pertsonak ez ezik, infekzio arriskua murriztuz, gure lan guztia etxetik prozesuetan eta produktuen egonkortasunean kaltetu gabe transferitzea lortu genuen. Hilabete daramagu hori egiten.

Jarraian, gure laguntzaileen benetako lanen argazkiak aurkituko dituzu.

Yandex-en txanda nola ebakuatu genuen

Yandex-en txanda nola ebakuatu genuen

Yandex-en txanda nola ebakuatu genuen

Yandex-en txanda nola ebakuatu genuen

Yandex-en txanda nola ebakuatu genuen

Iturria: www.habr.com