Rrjeti-si-shërbim për një ndërmarrje të madhe: një rast jo standard

Rrjeti-si-shërbim për një ndërmarrje të madhe: një rast jo standard
Si të përditësoni pajisjet e rrjetit në një ndërmarrje të madhe pa ndalur prodhimin? Ai flet për një projekt në shkallë të gjerë në modalitetin "kirurgjia e zemrës së hapur". Menaxheri i menaxhimit të projektit Linxdatacenter Oleg Fedorov. 

Gjatë viteve të fundit, ne kemi vërejtur rritje të kërkesës së klientëve për shërbime që lidhen me komponentin e rrjetit të infrastrukturës së IT. Nevoja për lidhjen e sistemeve të TI-së, shërbimeve, aplikacioneve, monitorimit dhe detyrave operacionale të menaxhimit të biznesit në pothuajse çdo fushë po i detyrojnë kompanitë sot t'i kushtojnë vëmendje të shtuar rrjeteve.  

Gama e kërkesave varion nga sigurimi i tolerancës së gabimeve në rrjet deri te krijimi dhe administrimi i një sistemi autonom të klientit me blerjen e një blloku të adresave IP, vendosjen e protokolleve të rrugëtimit dhe menaxhimin e trafikut në përputhje me politikat organizative.

Ekziston gjithashtu një kërkesë në rritje për zgjidhje gjithëpërfshirëse për ndërtimin dhe mirëmbajtjen e infrastrukturës së rrjetit, kryesisht nga klientët, infrastruktura e rrjetit të të cilëve po krijohet nga e para ose është e vjetëruar, duke kërkuar modifikime serioze. 

Ky trend përkoi me periudhën e zhvillimit dhe kompleksitetit të infrastrukturës së rrjetit të vetë Linxdatacenter. Ne zgjeruam gjeografinë e pranisë sonë në Evropë duke u lidhur me site të largëta, gjë që kërkonte përmirësimin e infrastrukturës së rrjetit. 

Kompania ka nisur një shërbim të ri për klientët, Network-as-a-Service: ne kujdesemi për të gjitha problemet e rrjetit të klientëve, duke i lejuar ata të fokusohen në biznesin e tyre kryesor.

Në verën e vitit 2020 përfundoi projekti i parë i madh në këtë drejtim, për të cilin do të doja të flisja. 

Në fillim 

Një kompleks i madh industrial na u drejtua për të modernizuar pjesën e rrjetit të infrastrukturës në një nga ndërmarrjet e saj. Ishte e nevojshme të zëvendësoheshin pajisjet e vjetra me pajisje të reja, përfshirë bërthamën e rrjetit.

Modernizimi i fundit i pajisjeve në ndërmarrje u zhvillua rreth 10 vjet më parë. Menaxhmenti i ri i ndërmarrjes vendosi të përmirësojë lidhjen, duke filluar me përditësimin e infrastrukturës në nivelin më themelor, fizik. 

Projekti u nda në dy pjesë: përmirësimi i parkut të serverëve dhe pajisjet e rrjetit. Ne ishim përgjegjës për pjesën e dytë. 

Kërkesat themelore për punën përfshinin minimizimin e kohës së ndërprerjes së linjave të prodhimit të ndërmarrjes gjatë kryerjes së punës (dhe në disa zona, eliminimin e plotë të kohëzgjatjes së ndërprerjes). Çdo ndërprerje nënkupton humbje direkte financiare për klientin, gjë që nuk duhet të kishte ndodhur në asnjë rrethanë. Për shkak të mënyrës së funksionimit të objektit 24x7x365, si dhe duke marrë parasysh mungesën e plotë të periudhave të ndërprerjeve të planifikuara në praktikën e ndërmarrjes, na u dha detyra për të kryer në thelb një operacion në zemër të hapur. Kjo u bë tipari kryesor dallues i projektit.

Shko

Puna ishte planifikuar sipas parimit të lëvizjes nga nyjet e rrjetit të largëta nga bërthama në ato më të afërta, si dhe nga ato që ndikojnë më pak në punën e linjave të prodhimit tek ato që ndikojnë drejtpërdrejt në këtë punë. 

Për shembull, nëse marrim një nyje rrjeti në departamentin e shitjeve, atëherë një ndërprerje komunikimi si rezultat i punës në këtë departament nuk do të ndikojë në asnjë mënyrë në prodhim. Në të njëjtën kohë, një incident i tillë do të na ndihmojë, si kontraktues, të kontrollojmë korrektësinë e qasjes së zgjedhur për të punuar në njësi të tilla dhe, pas rregullimit të veprimeve, të punojmë në fazat e ardhshme të projektit. 

Është e nevojshme jo vetëm të zëvendësohen nyjet dhe telat në rrjet, por edhe të konfigurohen saktë të gjithë përbërësit për funksionimin e saktë të zgjidhjes në tërësi. Ishin konfigurimet që u testuan në këtë mënyrë: duke filluar punën larg nga thelbi, ne dukej se i jepnim vetes "të drejtën për të bërë gabime" pa vënë në rrezik zona kritike për funksionimin e ndërmarrjes. 

Ne identifikuam zonat që nuk ndikojnë në procesin e prodhimit, si dhe zonat kritike - punishtet, njësia e ngarkimit dhe shkarkimit, magazinat, etj. Në zonat kyçe, koha e pranueshme joproduktive për secilën nyje të rrjetit veç e veç u ra dakord me klientin: nga 1 në 15 minuta . Ishte e pamundur të shmangej plotësisht shkëputja e nyjeve individuale të rrjetit, pasi kablloja duhet të kalohet fizikisht nga pajisjet e vjetra në të reja, dhe gjatë procesit të kalimit është gjithashtu e nevojshme të zgjidhet "mjekra" e telave që u formuan gjatë disa viteve të funksionimit pa të duhur. kujdesi (një nga pasojat e kontraktimit të punës për instalimin e linjave kabllore).

Puna u nda në disa faza.

Faza 1 – Auditimi. Përgatitja dhe koordinimi i qasjes për planifikimin e punës dhe vlerësimi i gatishmërisë së ekipeve: klienti, kontraktori i instalimit dhe ekipi ynë.

Faza 2 – Zhvillimi i një formati për kryerjen e punës, me analizë dhe planifikim të thellë të detajuar. Ne zgjodhëm një format të listës së kontrollit me një tregues të saktë të rendit dhe sekuencës së veprimeve, deri në sekuencën e ndërrimit të kordonëve patch sipas portit.

Faza 3 – Kryerja e punimeve në kabinete që nuk cenojnë prodhimin. Vlerësimi dhe rregullimi i kohës joproduktive për fazat pasuese të punës.

Faza 4 – Kryerja e punëve në kabinete që ndikojnë drejtpërdrejt në prodhim. Vlerësimi dhe rregullimi i kohës së ndërprerjes për fazën përfundimtare të punës.

Faza 5 – Kryerja e punës në dhomën e serverit për ndërrimin e pajisjeve të mbetura. Nisni rrugën në kernelin e ri.

Faza 6 – Ndërrimi i njëpasnjëshëm i bërthamës së sistemit nga konfigurimet e vjetra të rrjetit në ato të reja për një tranzicion të qetë të të gjithë kompleksit të sistemit (VLAN, rrugëzim, etj.). Në këtë fazë, ne lidhëm të gjithë përdoruesit dhe transferuam të gjitha shërbimet në harduerin e ri, verifikuam që lidhja ishte e saktë, u siguruam që asnjë nga shërbimet e ndërmarrjes të mos ndalohej, siguruam që nëse do të ndodhte ndonjë problem, ato do të lidheshin drejtpërdrejt me kernelin, gjë që e bëri më të lehtë zgjidhjen e problemeve të mundshme dhe konfigurimin përfundimtar. 

Hairstyle me mjekër teli

Projekti doli i vështirë edhe për shkak të kushteve të vështira fillestare. 

Së pari, ekziston një numër i madh i nyjeve dhe seksioneve të rrjetit, me një topologji të ndërlikuar dhe klasifikim të telave sipas qëllimit të tyre. "Mjekra" të tilla duhej të nxirreshin nga dollapët dhe të "kreheshin" me kujdes, duke kuptuar se cili tel nga ku vinte dhe ku të çonte. 

Dukej diçka si kjo:

Rrjeti-si-shërbim për një ndërmarrje të madhe: një rast jo standard
si më poshtë:

Rrjeti-si-shërbim për një ndërmarrje të madhe: një rast jo standard
ose kështu: 

Rrjeti-si-shërbim për një ndërmarrje të madhe: një rast jo standard
Së dyti, për secilën detyrë të tillë ishte e nevojshme të përgatitej një skedar që përshkruante procesin. "Ne marrim telin X nga porti 1 i pajisjes së vjetër, e lidhim atë në portin 18 të pajisjes së re." Tingëllon e thjeshtë, por kur keni 48 porte plotësisht të bllokuara në të dhënat tuaja burimore dhe nuk ka asnjë opsion për ndërprerje (ne kujtojmë rreth 24x7x365), e vetmja rrugëdalje është të punoni në blloqe. Sa më shumë tela të mund të tërhiqni nga pajisjet e vjetra në të njëjtën kohë, aq më shpejt mund t'i krehni dhe t'i futni në pajisjen e re të rrjetit, duke shmangur dështimet dhe ndërprerjet në rrjet. 

Prandaj, në fazën përgatitore, ne e ndamë rrjetin në blloqe - secila prej tyre i përkiste një VLAN specifik. Çdo port (ose një nëngrup i tyre) në pajisjet e vjetra është një nga VLAN-të në topologjinë e re të rrjetit. Ne i grupuam ato kështu: portat e para të switch-it strehonin rrjetet e përdoruesve, në mes - rrjetet e prodhimit dhe të fundit - pikat e hyrjes dhe lidhjet. 

Kjo qasje bëri të mundur nxjerrjen dhe krehjen nga pajisjet e vjetra jo vetëm 1 tel, por 10-15, me një lëvizje. Kjo e përshpejtoi procesin e punës disa herë.  

Nga rruga, kjo është se si duken telat në kabinete pas krehjes: 

Rrjeti-si-shërbim për një ndërmarrje të madhe: një rast jo standard
ose, për shembull, si kjo: 

Rrjeti-si-shërbim për një ndërmarrje të madhe: një rast jo standard
Pas përfundimit të fazës së dytë, morëm një pushim për të analizuar gabimet dhe dinamikën e projektit. Për shembull, defekte të vogla u shfaqën menjëherë për shkak të pasaktësive në diagramet e rrjetit të ofruara për ne (lidhësi i pasaktë në diagram nënkupton patch kordonin e blerë të gabuar dhe nevojën për ta zëvendësuar). 

Pauza ishte e nevojshme, pasi kur punohej nga ana e serverit, edhe një defekt i vogël në proces ishte i papranueshëm. Nëse qëllimi ishte sigurimi i kohës së ndërprerjes në një seksion rrjeti jo më shumë se 5 minuta, atëherë nuk mund të tejkalohej. Çdo devijim i mundshëm nga orari duhej të ishte dakord me klientin. 

Megjithatë, planifikimi paraprak dhe ndarja e projektit në blloqe bëri të mundur plotësimin e kohës së planifikuar të joproduktive në të gjitha fushat dhe në shumicën e rasteve shmangien e tij krejtësisht. 

Sfida e kohës - një projekt nën COVID 

Megjithatë, nuk ishte pa vështirësi shtesë. Sigurisht, koronavirusi ishte një nga pengesat. 

Puna u ndërlikua nga fakti se filloi pandemia dhe ishte e pamundur që të gjithë specialistët e përfshirë në proces të ishin të pranishëm gjatë punës në vendin e klientit. Vetëm punonjësit e organizatës së instalimit u lejuan në vend, dhe kontrolli u krye përmes një dhome Zoom - në të kishte një inxhinier rrjeti nga Linxdatacenter, unë si menaxher projekti, një inxhinier rrjeti nga klienti përgjegjës për punën, dhe një ekip që kryen punë instalimi.

Gjatë punës u shfaqën probleme të pa llogaritura dhe rregullimet duhej të bëheshin menjëherë. Në këtë mënyrë, u bë e mundur të parandalohej shpejt ndikimi i faktorit njerëzor (gabime në qark, gabime në përcaktimin e statusit të aktivitetit të ndërfaqes, etj.).

Megjithëse formati i punës në distancë dukej i pazakontë në fillim të projektit, ne u përshtatëm shpejt me kushtet e reja dhe arritëm në fazën përfundimtare të punës. 

Kemi nisur një konfigurim të përkohshëm të cilësimeve të rrjetit për të lejuar që dy bërthama të rrjetit - të vjetra dhe të reja - të funksionojnë paralelisht për të arritur një tranzicion të qetë. Sidoqoftë, doli që një rresht shtesë nuk u hoq nga skedari i konfigurimit të kernelit të ri dhe kalimi nuk ndodhi. Kjo na detyroi të kalonim pak kohë për të kërkuar problemin. 

Doli që trafiku kryesor u transmetua saktë dhe trafiku i kontrollit nuk arriti në nyjen përmes bërthamës së re. Falë ndarjes së qartë të projektit në faza, u bë e mundur të identifikohej shpejt seksioni i rrjetit ku u shfaq problemi, të identifikohej problemi dhe të eliminohej. 

Dhe si rezultat

Rezultatet teknike të projektit 

Para së gjithash, u krijua një bërthamë e re e rrjetit të ri të ndërmarrjeve, për të cilën ndërtuam unaza fizike/logjike. Kjo bëhet në atë mënyrë që çdo ndërprerës në rrjet të ketë një "krah të dytë". Në rrjetin e vjetër, shumë ndërprerës ishin të lidhur me bërthamën përgjatë një rruge, një krahu (lidhja lart). Nëse prishej, çelësi bëhej plotësisht i paarritshëm. Dhe nëse disa ndërprerës do të lidheshin përmes një lidhjeje lart, atëherë aksidenti do të çaktivizonte një departament të tërë ose linjë prodhimi në ndërmarrje. 

Në një rrjet të ri, edhe një incident mjaft serioz i rrjetit, në asnjë skenar, nuk do të jetë në gjendje të rrëzojë të gjithë rrjetin ose një pjesë të rëndësishme të tij. 

90% e të gjitha pajisjeve të rrjetit janë përditësuar, konvertuesit e mediave (konvertuesit e mediave të përhapjes së sinjalit) janë dekomisionuar dhe nevoja për linja të dedikuara të energjisë për pajisjet e furnizimit me energji është eliminuar duke u lidhur me çelësat PoE, ku energjia furnizohet nëpërmjet telave Ethernet. 

Gjithashtu, të gjitha lidhjet optike në dhomën e serverit dhe në kabinetet e terrenit janë të shënuara - në të gjitha nyjet kryesore të komunikimit. Kjo bëri të mundur përgatitjen e një diagrami topologjik të pajisjeve dhe lidhjeve në rrjet, duke pasqyruar gjendjen aktuale të tij sot. 

Diagrami i rrjetit
Rrjeti-si-shërbim për një ndërmarrje të madhe: një rast jo standard
Rezultati më i rëndësishëm në aspektin teknik: puna e infrastrukturës në shkallë mjaft të gjerë u krye me shpejtësi, pa krijuar asnjë ndërhyrje në punën e ndërmarrjes dhe pothuajse pa u vënë re nga personeli i saj. 

Rezultatet e biznesit të projektit

Sipas mendimit tim, ky projekt është interesant kryesisht jo nga ana teknike, por nga ana organizative. Vështirësia qëndronte kryesisht në planifikimin dhe të menduarit përmes hapave për zbatimin e detyrave të projektit. 

Suksesi i projektit na lejon të themi se iniciativa jonë për të zhvilluar zonën e rrjetit brenda portofolit të shërbimit Linxdatacenter është zgjedhja e duhur për vektorin e zhvillimit të kompanisë. Një qasje e përgjegjshme ndaj menaxhimit të projektit, një strategji kompetente dhe një planifikim i qartë na lejuan të përfundonim punën në nivelin e duhur. 

Konfirmimi i cilësisë së punës është një kërkesë nga klienti për të vazhduar ofrimin e shërbimeve për modernizimin e rrjetit në vendet e tij të mbetura në Rusi.

Burimi: www.habr.com

Shto një koment