Network-as-a-Service para sa isang malaking enterprise: isang hindi karaniwang kaso

Network-as-a-Service para sa isang malaking enterprise: isang hindi karaniwang kaso
Paano i-update ang mga kagamitan sa network sa isang malaking negosyo nang hindi humihinto sa produksyon? Tungkol sa isang malakihang proyekto sa mode ng "open heart surgery" ay nagsasabi Ang manager ng pamamahala ng proyekto ng Linxdatacenter na si Oleg Fedorov. 

Sa nakalipas na ilang taon, napansin namin ang tumaas na pangangailangan ng customer para sa mga serbisyong nauugnay sa bahagi ng network ng imprastraktura ng IT. Ang pangangailangan para sa pagkakakonekta ng mga IT system, serbisyo, aplikasyon, pagsubaybay at pagpapatakbo ng mga gawain sa pamamahala ng negosyo sa halos anumang lugar ay nagpipilit sa mga kumpanya ngayon na bigyang pansin ang mga network.  

Ang hanay ng mga kahilingan ay mula sa pagtiyak sa network fault tolerance hanggang sa paggawa at pamamahala ng isang client autonomous system sa pagbili ng isang block ng mga IP address, pagse-set up ng mga routing protocol at pamamahala ng trapiko alinsunod sa mga patakaran ng organisasyon.

Mayroon ding lumalaking pangangailangan para sa mga komprehensibong solusyon para sa pagbuo at pagpapanatili ng imprastraktura ng network, pangunahin mula sa mga customer na ang imprastraktura ng network ay nilikha mula sa simula o hindi na ginagamit, na nangangailangan ng malubhang pagbabago. 

Ang trend na ito ay kasabay ng panahon ng pagbuo at pagiging kumplikado ng sariling imprastraktura ng network ng Linxdatacenter. Pinalawak namin ang heograpiya ng aming presensya sa Europe sa pamamagitan ng pagkonekta sa mga malalayong site, na nangangailangan naman ng pagpapabuti sa imprastraktura ng network. 

Ang kumpanya ay naglunsad ng bagong serbisyo para sa mga kliyente, Network-as-a-Service: inaalagaan namin ang lahat ng problema sa network ng mga kliyente, na nagpapahintulot sa kanila na tumuon sa kanilang pangunahing negosyo.

Noong tag-araw ng 2020, natapos ang unang malaking proyekto sa direksyong ito, na nais kong pag-usapan. 

Sa simula 

Isang malaking pang-industriyang complex ang bumaling sa amin upang gawing makabago ang bahagi ng network ng imprastraktura sa isa sa mga negosyo nito. Kinakailangang palitan ang mga lumang kagamitan ng mga bagong kagamitan, kabilang ang core ng network.

Ang huling modernisasyon ng kagamitan sa negosyo ay naganap mga 10 taon na ang nakalilipas. Nagpasya ang bagong pamamahala ng enterprise na pahusayin ang koneksyon, simula sa pag-update ng imprastraktura sa pinakapangunahing, pisikal na antas. 

Ang proyekto ay nahahati sa dalawang bahagi: pag-upgrade ng server park at network equipment. Kami ay responsable para sa ikalawang bahagi. 

Kasama sa mga pangunahing kinakailangan para sa trabaho ang pagliit ng downtime ng mga linya ng produksyon ng enterprise sa panahon ng pagpapatupad ng trabaho (at sa ilang mga lugar, ang kumpletong pag-aalis ng downtime). Ang anumang paghinto ay isang direktang pagkawala ng pera ng kliyente, na hindi dapat nangyari sa anumang sitwasyon. Kaugnay ng mode ng operasyon ng pasilidad na 24x7x365, pati na rin ang pagsasaalang-alang sa kumpletong kawalan ng mga panahon ng nakaplanong downtime sa pagsasanay ng negosyo, binigyan kami ng gawain, sa katunayan, upang magsagawa ng open-heart surgery. Ito ang naging pangunahing katangian ng proyekto.

Umalis na tayo

Ang gawain ay binalak ayon sa prinsipyo ng paggalaw mula sa mga node ng network na malayo mula sa core hanggang sa mas malapit, gayundin mula sa mga hindi gaanong nakakaimpluwensya sa gawain ng mga linya ng produksyon hanggang sa mga direktang nakakaimpluwensya sa gawaing ito. 

Halimbawa, kung kukuha tayo ng network node sa departamento ng pagbebenta, kung gayon ang pagkagambala ng komunikasyon bilang resulta ng trabaho sa departamentong ito ay hindi makakaapekto sa produksyon sa anumang paraan. Kasabay nito, ang ganitong insidente ay makakatulong sa amin, bilang isang kontratista, upang suriin ang kawastuhan ng napiling diskarte upang magtrabaho sa naturang mga yunit at, pagkatapos ayusin ang mga aksyon, magtrabaho sa mga susunod na yugto ng proyekto. 

Ito ay kinakailangan hindi lamang upang palitan ang mga node at wire sa network, kundi pati na rin upang i-configure nang tama ang lahat ng mga bahagi para sa tamang operasyon ng solusyon sa kabuuan. Ito ay ang mga pagsasaayos na nasubok sa ganitong paraan: simula sa trabaho na malayo sa core, tila binibigyan namin ang aming sarili ng "karapatan na magkamali" nang hindi inilalagay sa mga panganib na lugar na kritikal sa pagpapatakbo ng negosyo. 

Natukoy namin ang mga lugar na hindi nakakaapekto sa proseso ng produksyon, pati na rin ang mga kritikal na lugar - mga workshop, loading at unloading unit, warehouses, atbp. Sa mga pangunahing lugar, ang katanggap-tanggap na downtime para sa bawat network node nang hiwalay ay napagkasunduan sa kliyente: mula 1 hanggang 15 minuto. Imposibleng ganap na maiwasan ang pagdiskonekta ng mga indibidwal na node ng network, dahil ang cable ay dapat na pisikal na ilipat mula sa lumang kagamitan patungo sa bago, at sa panahon ng proseso ng paglipat, kinakailangan ding alisin ang "balbas" ng mga wire na nabuo sa loob ng ilang taon ng operasyon nang walang maayos. pangangalaga (isa sa mga kahihinatnan ng gawaing outsourcing para sa pag-install ng mga linya ng cable).

Ang gawain ay nahahati sa maraming yugto.

1 Stage – Pag-audit. Paghahanda at koordinasyon ng diskarte sa pagpaplano ng trabaho at pagtatasa ng kahandaan ng mga koponan: ang kliyente, ang kontratista sa pag-install, at ang aming koponan.

2 Stage – Pagbuo ng isang format para sa pagsasagawa ng trabaho, na may malalim na detalyadong pagsusuri at pagpaplano. Pumili kami ng format ng checklist na may tumpak na indikasyon ng pagkakasunud-sunod at pagkakasunud-sunod ng mga aksyon, hanggang sa pagkakasunud-sunod ng paglipat ng mga patch cord sa pamamagitan ng port.

3 Stage – Pagsasagawa ng trabaho sa mga cabinet na hindi nakakaapekto sa produksyon. Pagtatantya at pagsasaayos ng downtime para sa mga susunod na yugto ng trabaho.

4 Stage – Pagsasagawa ng trabaho sa mga cabinet na direktang nakakaapekto sa produksyon. Pagtataya at pagsasaayos ng downtime para sa huling yugto ng trabaho.

5 Stage – Nagsasagawa ng trabaho sa silid ng server upang ilipat ang natitirang kagamitan. Tumatakbo sa pagruruta sa isang bagong kernel.

6 Stage – Magkasunod na paglipat ng core ng system mula sa mga lumang configuration ng network patungo sa mga bago para sa isang maayos na paglipat ng buong system complex (VLAN, pagruruta, atbp.). Sa yugtong ito, ikinonekta namin ang lahat ng mga gumagamit at inilipat ang lahat ng mga serbisyo sa bagong hardware, na-verify na tama ang koneksyon, tinitiyak na wala sa mga serbisyo ng enterprise ang nahinto, tinitiyak na kung may anumang mga problema na nangyari, sila ay direktang konektado sa kernel, na nagpadali sa pag-troubleshoot ng posibleng pag-troubleshoot at panghuling pag-setup. 

Wire balbas hairstyle

Ang proyekto ay naging mahirap din dahil sa mahirap na mga paunang kondisyon. 

Una, mayroong isang malaking bilang ng mga node at mga seksyon ng network, na may isang masalimuot na topology at pag-uuri ng mga wire ayon sa kanilang layunin. Ang ganitong mga "balbas" ay kailangang alisin sa mga cabinet at maingat na "pagsuklay", inaalam kung aling wire ang nagmula kung saan at kung saan ito humantong. 

Ito ay tumingin ng katulad nito:

Network-as-a-Service para sa isang malaking enterprise: isang hindi karaniwang kaso
ganito:

Network-as-a-Service para sa isang malaking enterprise: isang hindi karaniwang kaso
o ganito: 

Network-as-a-Service para sa isang malaking enterprise: isang hindi karaniwang kaso
Pangalawa, para sa bawat ganoong gawain, kinakailangan na maghanda ng isang file na may paglalarawan ng proseso. "Kumuha kami ng wire X mula sa port 1 ng lumang kagamitan, isaksak ito sa port 18 ng bagong kagamitan." Mukhang simple, ngunit kapag mayroon kang 48 ganap na barado na mga port sa iyong pinagmulang data, at walang opsyon sa downtime (natatandaan namin ang tungkol sa 24x7x365), ang tanging paraan ay ang magtrabaho sa mga bloke. Kung mas maraming wire ang maaari mong alisin sa mga lumang kagamitan nang sabay-sabay, mas mabilis mong masusuklay ang mga ito at maipasok ang mga ito sa bagong hardware ng network, upang maiwasan ang mga pagkabigo at downtime sa network. 

Samakatuwid, sa yugto ng paghahanda, hinati namin ang network sa mga bloke - bawat isa sa kanila ay kabilang sa isang tiyak na VLAN. Ang bawat port (o isang subset ng mga ito) sa lumang kagamitan ay isa sa mga VLAN sa bagong topology ng network. Pinag-grupo namin ang mga ito tulad ng sumusunod: ang mga unang port ng switch ay naglalaman ng mga network ng gumagamit, sa gitna - mga network ng produksyon, at sa mga huli - mga access point at uplink. 

Ang diskarte na ito ay naging posible upang mabunot at magsuklay mula sa mga lumang kagamitan hindi lamang 1 wire, ngunit 10-15, nang sabay-sabay. Pinabilis nito ang daloy ng trabaho nang maraming beses.  

Sa pamamagitan ng paraan, ito ang hitsura ng mga wire sa mga cabinet pagkatapos magsuklay: 

Network-as-a-Service para sa isang malaking enterprise: isang hindi karaniwang kaso
o, halimbawa, tulad nito: 

Network-as-a-Service para sa isang malaking enterprise: isang hindi karaniwang kaso
Pagkatapos makumpleto ang 2nd stage, nagpahinga kami para pag-aralan ang mga error at dynamics ng proyekto. Halimbawa, ang mga maliliit na depekto ay agad na lumitaw dahil sa mga kamalian sa mga diagram ng network na ibinigay sa amin (ang ibig sabihin ng maling connector sa diagram ay hindi tamang binili na patch cord at ang pangangailangan na palitan ito). 

Ang pag-pause ay kinakailangan, dahil kapag nagtatrabaho mula sa gilid ng server, kahit isang maliit na glitch sa proseso ay hindi katanggap-tanggap. Kung ang layunin ay tiyakin ang downtime sa isang seksyon ng network na hindi hihigit sa 5 minuto, hindi ito maaaring lumampas. Ang anumang posibleng paglihis sa iskedyul ay kailangang sumang-ayon sa kliyente. 

Gayunpaman, ang maagang pagpaplano at pagharang ng proyekto ay naging posible upang matugunan ang nakaplanong downtime sa lahat ng mga site, at sa karamihan ng mga kaso, gawin nang wala ito. 

Hamon ng oras - isang proyekto sa ilalim ng COVID 

Gayunpaman, ito ay hindi nang walang karagdagang mga paghihirap. Siyempre, ang coronavirus ay isa sa mga hadlang. 

Ang trabaho ay kumplikado sa pamamagitan ng katotohanan na nagsimula ang isang pandemya, at imposibleng naroroon sa panahon ng trabaho sa site ng kliyente para sa lahat ng mga espesyalista na kasangkot sa proseso. Ang installer lang ang pinapayagang pumasok sa site, at ang kontrol ay sa pamamagitan ng Zoom room na kinabibilangan ng network engineer mula sa gilid ng Linxdatacenter, ako bilang project manager, isang network engineer mula sa panig ng kliyente na namamahala sa trabaho, at ang team na gumagawa ng gawain sa pag-install.

Ang hindi napapansin na mga problema ay lumitaw sa panahon ng trabaho, at ang mga pagsasaayos ay kailangang gawin kaagad. Sa ganitong paraan, posible na mabilis na maiwasan ang impluwensya ng kadahilanan ng tao (mga error sa circuit, mga error sa pagtukoy ng katayuan ng aktibidad ng interface, atbp.).

Bagama't tila hindi karaniwan ang format ng malayong trabaho sa simula ng proyekto, mabilis kaming umangkop sa mga bagong kundisyon at naabot ang huling yugto ng trabaho. 

Naglunsad kami ng pansamantalang pagsasaayos ng mga setting ng network upang payagan ang dalawang core ng network - luma at bago - na tumakbo nang magkatulad upang makamit ang isang maayos na paglipat. Gayunpaman, lumabas na ang isang dagdag na linya ay hindi tinanggal mula sa file ng pagsasaayos ng bagong kernel, at hindi naganap ang paglipat. Pinilit kaming gumugol ng ilang oras sa paghahanap ng problema. 

Ito ay lumabas na ang pangunahing trapiko ay naipadala nang tama, at ang kontrol na trapiko ay hindi nakarating sa node sa pamamagitan ng bagong core. Dahil sa malinaw na paghahati ng proyekto sa mga yugto, posible na mabilis na matukoy ang seksyon ng network kung saan lumitaw ang kahirapan, kilalanin ang problema at alisin ito. 

At bilang resulta

Teknikal na mga resulta ng proyekto 

Una sa lahat, nilikha ang isang bagong core ng bagong network ng enterprise, kung saan nagtayo kami ng mga pisikal/lohikal na singsing. Ginagawa ito sa paraang ang bawat switch sa network ay may "pangalawang braso". Sa lumang network, maraming switch ang nakakonekta sa core sa isang ruta, na may isang braso (uplink). Kung ito ay napunit, ang switch ay naging ganap na hindi naa-access. At kung maraming switch ang ikinonekta sa isang uplink, madi-disable ng aksidente ang isang buong departamento o linya ng produksyon sa enterprise. 

Sa bagong network, kahit na ang isang medyo seryosong insidente sa network sa ilalim ng anumang pagkakataon ay magagawang "ibagsak" ang buong network o ang makabuluhang seksyon nito. 

90% ng lahat ng kagamitan sa network ay na-update, ang mga media converter (signal propagation media converters) ay na-decommissioned, at ang pangangailangan para sa mga dedikadong linya ng kuryente para sa powering equipment ay inalis sa pamamagitan ng pagkonekta sa PoE switch, kung saan ang power ay ibinibigay sa pamamagitan ng Ethernet wires. 

Gayundin, ang lahat ng optical na koneksyon sa silid ng server at sa mga field cabinet ay minarkahan - sa lahat ng mga pangunahing node ng komunikasyon. Ginawa nitong posible na maghanda ng topological diagram ng mga kagamitan at koneksyon sa network, na sumasalamin sa aktwal na estado nito ngayon. 

Diagram ng network
Network-as-a-Service para sa isang malaking enterprise: isang hindi karaniwang kaso
Ang pinakamahalagang resulta sa mga teknikal na termino: ang medyo malakihang gawaing imprastraktura ay natupad nang mabilis, nang hindi lumilikha ng anumang pagkagambala sa gawain ng negosyo at halos hindi napapansin ng mga tauhan nito. 

Mga resulta ng negosyo ng proyekto

Sa palagay ko, ang proyektong ito ay kawili-wili lalo na hindi mula sa teknikal, ngunit mula sa panig ng organisasyon. Ang kahirapan ay pangunahin sa pagpaplano at pag-iisip sa mga hakbang upang maipatupad ang mga gawain sa proyekto. 

Ang tagumpay ng proyekto ay nagpapahintulot sa amin na sabihin na ang aming inisyatiba upang bumuo ng lugar ng networking sa loob ng portfolio ng serbisyo ng Linxdatacenter ay ang tamang pagpipilian para sa vector ng pag-unlad ng kumpanya. Ang isang responsableng diskarte sa pamamahala ng proyekto, isang karampatang diskarte, at malinaw na pagpaplano ay nagbigay-daan sa amin upang makumpleto ang gawain sa tamang antas. 

Ang kumpirmasyon ng kalidad ng trabaho ay isang kahilingan mula sa kliyente na magpatuloy sa pagbibigay ng mga serbisyo para sa modernisasyon ng network sa mga natitirang site nito sa Russia.

Pinagmulan: www.habr.com

Magdagdag ng komento