Reto-kiel-servo por granda entrepreno: ne-norma kazo

Reto-kiel-servo por granda entrepreno: ne-norma kazo
Kiel ĝisdatigi retajn ekipaĵojn en granda entrepreno sen ĉesigi produktadon? Li parolas pri grandskala projekto en la reĝimo "malferma korĥirurgio". Linxdatacenter projektadministradmanaĝero Oleg Fedorov. 

Dum la lastaj jaroj, ni rimarkis pliigitan klientan postulon pri servoj ligitaj al la reto-komponento de la IT-infrastrukturo. La bezono de konektebleco de IT-sistemoj, servoj, aplikoj, monitorado kaj operaciaj komercaj administradtaskoj en preskaŭ ajna areo devigas kompaniojn hodiaŭ pli grandan atenton al retoj.  

La gamo de petoj varias de certigado de reto-faŭltoleremo ĝis kreado kaj administrado de kliento aŭtonomia sistemo kun aĉetado de bloko de IP-adresoj, starigado de envojaj protokoloj kaj administrado de trafiko laŭ organizaj politikoj.

Estas ankaŭ kreskanta postulo je ampleksaj solvoj por konstrui kaj konservi retan infrastrukturon, ĉefe de klientoj, kies reto-infrastrukturo estas kreita de nulo aŭ malnoviĝinta, postulante seriozan modifon. 

Ĉi tiu tendenco koincidis kun la periodo de evoluo kaj komplekseco de la propra retinfrastrukturo de Linxdatacenter. Ni vastigis la geografion de nia ĉeesto en Eŭropo per konekto al foraj retejoj, kio siavice postulis plibonigi la retan infrastrukturon. 

La kompanio lanĉis novan servon por klientoj, Network-as-a-Service: ni prizorgas retajn problemojn de ĉiuj klientoj, permesante al ili koncentriĝi pri sia kerna komerco.

En la somero de 2020, la unua granda projekto en ĉi tiu direkto estis finita, pri kiu mi ŝatus paroli. 

Ĉe la komenco 

Granda industria komplekso turniĝis al ni por modernigi la retan parton de la infrastrukturo ĉe unu el ĝiaj entreprenoj. Necesis anstataŭigi malnovajn ekipaĵojn per novaj ekipaĵoj, inkluzive de la reto-kerno.

La lasta ekipaĵmodernigo ĉe la entrepreno okazis antaŭ ĉirkaŭ 10 jaroj. La nova administrado de la entrepreno decidis plibonigi konekteblecon, komencante ĝisdatigi la infrastrukturon ĉe la plej baza, fizika nivelo. 

La projekto estis dividita en du partojn: ĝisdatigo de la servila parko kaj reta ekipaĵo. Ni respondecis pri la dua parto. 

Bazaj postuloj por la laboro inkludis minimumigi malfunkcion de la produktadlinioj de la entrepreno dum la plenumo de laboro (kaj en kelkaj lokoj, tute eliminante malfunkcion). Ajna halto signifas rektajn financajn perdojn por la kliento, kio ne devus okazi sub neniuj cirkonstancoj. Pro la operacia reĝimo de la instalaĵo 24x7x365, same kiel konsiderante la kompletan foreston de periodoj de planita malfunkcio en la praktiko de la entrepreno, ni ricevis la taskon esence fari malferman koran kirurgion. Tio iĝis la ĉefa karakterizaĵo de la projekto.

Iru

La laboro estis planita laŭ la principo de movado de retaj nodoj malproksimaj de la kerno al pli proksimaj, same kiel de tiuj malpli influantaj la laboron de produktadlinioj ĝis tiuj rekte influantaj ĉi tiun laboron. 

Ekzemple, se ni prenas retan nodon en la venda fako, tiam komunikado interrompo kiel rezulto de laboro en ĉi tiu fako neniel influos produktadon. Samtempe, tia okazaĵo helpos nin, kiel entreprenisto, kontroli la ĝustecon de la elektita aliro por labori pri tiaj unuoj kaj, post ĝustigi la agojn, labori pri la sekvaj etapoj de la projekto. 

Necesas ne nur anstataŭigi nodojn kaj dratojn en la reto, sed ankaŭ ĝuste agordi ĉiujn komponantojn por la ĝusta funkciado de la solvo entute. Estis la agordoj kiuj estis provitaj tiamaniere: komencante laboron for de la kerno, ni ŝajnis doni al ni la "rajton fari erarojn" sen meti en riskajn areojn kritikajn por la funkciado de la entrepreno. 

Ni identigis areojn, kiuj ne influas la produktadprocezon, kaj ankaŭ kritikajn areojn - laborejojn, ŝarĝan kaj malŝarĝan unuon, stokejojn, ktp. En ŝlosilaj areoj, la akceptebla malfunkcio por ĉiu retnodo aparte estis interkonsentita kun la kliento: de 1 ĝis 15 minutoj. Estis neeble tute eviti malkonekti individuajn retajn nodojn, ĉar la kablo devas esti fizike ŝanĝita de malnova ekipaĵo al nova, kaj dum la ŝanĝprocezo ankaŭ necesas malimpliki la "barbon" de dratoj, kiuj formiĝis dum pluraj jaroj da funkciado sen taŭga. zorgo (unu el la sekvoj de subkontraktado de laboro por instalado de kablolinioj).

La laboro estis dividita en plurajn stadiojn.

Etapo 1 – Revizio. Preparado kaj kunordigo de la aliro al laborplanado kaj taksado de la preteco de la teamoj: la kliento, la instala entreprenisto, kaj nia teamo.

Etapo 2 – Disvolviĝo de formato por plenumi laboron, kun profunda detala analizo kaj planado. Ni elektis kontrollistformaton kun preciza indiko de la ordo kaj sekvenco de agoj, ĝis la sekvenco de ŝanĝado de flikŝnuroj laŭ haveno.

Etapo 3 – Efektivigado de laboroj en kabinetoj, kiuj ne influas produktadon. Takso kaj alĝustigo de malfunkcio por postaj etapoj de laboro.

Etapo 4 – Efektivigado de laboroj en kabinetoj, kiuj rekte influas produktadon. Takso kaj alĝustigo de malfunkcio por la fina etapo de laboro.

Etapo 5 – Farante laboron en la servila ĉambro por ŝanĝi la ceterajn ekipaĵojn. Lanĉu ĉe vojigo sur la nova kerno.

Etapo 6 – Sinsekva ŝanĝado de la sistemkerno de malnovaj retaj agordoj al novaj por glata transiro de la tuta sistema komplekso (VLAN, enrutado, ktp.). En ĉi tiu etapo, ni konektis ĉiujn uzantojn kaj transdonis ĉiujn servojn al la nova aparataro, kontrolis, ke la konekto estas ĝusta, certigis, ke neniu el la entreprenaj servoj estas haltigita, certigis, ke se okazos iuj problemoj, ili estos konektitaj rekte al la kerno, kio faciligis solvi eblajn problemojn kaj finan aranĝon. 

Drato-barba kombitaĵo

La projekto montriĝis malfacila ankaŭ pro la malfacilaj komencaj kondiĉoj. 

Unue, ekzistas grandega nombro da nodoj kaj sekcioj de la reto, kun komplika topologio kaj klasifiko de dratoj laŭ ilia celo. Tiaj "barboj" devis esti eltiritaj el la kabinetoj kaj pene "kombitaj", eltrovante, kiu drato venas de kie kaj kien ĝi kondukas. 

Ĝi aspektis tiel:

Reto-kiel-servo por granda entrepreno: ne-norma kazo
kiel tia:

Reto-kiel-servo por granda entrepreno: ne-norma kazo
aŭ tiel: 

Reto-kiel-servo por granda entrepreno: ne-norma kazo
Due, por ĉiu tia tasko necesis prepari dosieron priskribantan la procezon. "Ni prenas draton X de la haveno 1 de la malnova ekipaĵo, ŝtopas ĝin en la havenon 18 de la nova ekipaĵo." Ŝajnas simple, sed kiam vi havas 48 tute ŝtopitajn havenojn en viaj fontaj datumoj, kaj ne ekzistas opcio de malfunkcio (ni memoras pri 24x7x365), la sola eliro estas labori en blokoj. Ju pli da dratoj vi povas eltiri el malnovaj ekipaĵoj samtempe, des pli rapide vi povas kombi ilin kaj enigi ilin en novan retan aparataron, evitante misfunkciadojn kaj malfunkciojn en la reto. 

Tial, en la prepara stadio, ni dividis la reton en blokojn - ĉiu el ili apartenis al specifa VLAN. Ĉiu haveno (aŭ subaro de ili) sur malnova ekipaĵo estas unu el la VLANoj en la nova retotopologio. Ni grupigis ilin tiel: la unuaj havenoj de la ŝaltilo loĝigis uzantretojn, la mezajn - produktajn retojn, kaj la lastajn - alirpunktojn kaj suprenligojn. 

Ĉi tiu aliro ebligis eltiri kaj kombi el malnova ekipaĵo ne nur 1 draton, sed 10-15, unufoje. Ĉi tio plirapidigis la laborprocezon plurfoje.  

Cetere, jen kiel aspektas la dratoj en la kabinetoj post kombado: 

Reto-kiel-servo por granda entrepreno: ne-norma kazo
aŭ, ekzemple, jene: 

Reto-kiel-servo por granda entrepreno: ne-norma kazo
Fininte la 2-an etapon, ni faris paŭzon por analizi erarojn kaj projektdinamikon. Ekzemple, etaj difektoj tuj aperis pro eraroj en la retaj diagramoj provizitaj al ni (malĝusta konektilo sur la diagramo signifas malĝustan aĉetitan flikŝnuron kaj la bezonon anstataŭigi ĝin). 

La paŭzo estis necesa, ĉar dum laborado de la servilo, eĉ malgranda eraro en la procezo estis neakceptebla. Se la celo estis certigi malfunkcion en retsekcio de ne pli ol 5 minutoj, tiam ĝi ne povus esti superita. Ĉiu ebla devio de la horaro devis esti interkonsentita kun la kliento. 

Tamen, antaŭplanado kaj dividado de la projekto en blokoj ebligis renkonti la planitan malfunkcion en ĉiuj lokoj, kaj plejofte eviti ĝin entute. 

Defio de la tempoj - projekto sub COVID 

Tamen, ĝi ne estis sen pliaj malfacilaĵoj. Kompreneble, la koronavirus estis unu el la obstakloj. 

La laboro estis komplikita pro la fakto, ke la pandemio komenciĝis, kaj estis neeble por ĉiuj specialistoj implikitaj en la procezo ĉeesti dum la laboro ĉe la retejo de la kliento. Nur dungitoj de la instalaĵorganizo estis permesitaj en la retejon, kaj kontrolo estis farita per Zoom-ĉambro - en ĝi estis ret-inĝeniero de Linxdatacenter, mi mem kiel projektestro, ret-inĝeniero de la kliento respondeca pri la laboro, kaj teamo plenumanta installaboron.

Neklarigitaj problemoj ekestis dum la laboro, kaj alĝustigoj devis esti faritaj sur la flugo. Tiamaniere eblis rapide malhelpi la influon de la homa faktoro (eraroj en la cirkvito, eraroj en determini la statuson de interfaco, ktp.).

Kvankam la fora laborformato ŝajnis nekutima komence de la projekto, ni rapide adaptiĝis al la novaj kondiĉoj kaj atingis la finan fazon de laboro. 

Ni lanĉis provizoran agordon de retaj agordoj por permesi al du retaj kernoj - malnovaj kaj novaj - funkcii paralele por atingi glatan transiron. Tamen montriĝis, ke unu ekstra linio ne estis forigita de la agorda dosiero de la nova kerno, kaj la transiro ne okazis. Ĉi tio devigis nin pasigi iom da tempo serĉante la problemon. 

Montriĝis, ke la ĉefa trafiko estis ĝuste transdonita, kaj la kontrola trafiko ne atingis la nodon tra la nova kerno. Danke al la klara divido de la projekto en etapoj, eblis rapide identigi la sekcion de la reto, kie la problemo ekestis, identigi la problemon kaj ripari ĝin. 

Kaj kiel rezulto

Teknikaj rezultoj de la projekto 

Antaŭ ĉio, nova kerno de la nova entreprena reto estis kreita, por kiu ni konstruis fizikajn/logikajn ringojn. Ĉi tio estas farita tiel, ke ĉiu ŝaltilo en la reto havas "duan brakon". En la malnova reto, multaj ŝaltiloj estis konektitaj al la kerno laŭ unu itinero, unu brako (suprenligo). Se ĝi rompiĝis, la ŝaltilo fariĝis tute neatingebla. Kaj se pluraj ŝaltiloj estus konektitaj per unu suprenligo, tiam la akcidento malŝaltus tutan fakon aŭ produktan linion ĉe la entrepreno. 

En nova reto, eĉ sufiĉe grava reta incidento ne povos, laŭ iu ajn scenaro, detrui la tutan reton aŭ signifan sekcion de ĝi. 

90% de ĉiuj retaj ekipaĵoj estis ĝisdatigitaj, amaskomunikilaj konvertiloj (signalaj disvastigaj amaskomunikilaj konvertiloj) estis malmenditaj, kaj la bezono de diligentaj kurentkonduktiloj por funkciigi ekipaĵon estis forigita per konekto al PoE-ŝaltiloj, kie potenco estas liverita per Eterretaj dratoj. 

Ankaŭ ĉiuj optikaj konektoj en la servila ĉambro kaj en kabinetoj estas markitaj - ĉe ĉiuj ŝlosilaj komunikaj nodoj. Tio ebligis prepari topologian diagramon de ekipaĵo kaj ligoj en la reto, reflektante ĝian faktan staton hodiaŭ. 

Reta diagramo
Reto-kiel-servo por granda entrepreno: ne-norma kazo
La plej grava rezulto en teknikaj terminoj: sufiĉe grandskala infrastruktura laboro estis farita rapide, sen krei ajnan enmiksiĝon en la laboro de la entrepreno kaj preskaŭ nerimarkita de ĝia dungitaro. 

Komercaj rezultoj de la projekto

Laŭ mi, ĉi tiu projekto estas interesa ĉefe ne el la teknika, sed el la organiza flanko. La malfacileco kuŝis ĉefe en planado kaj pripensado de la paŝoj por efektivigi projektajn taskojn. 

La sukceso de la projekto permesas al ni diri, ke nia iniciato evoluigi la retan areon ene de la serva biletujo de Linxdatacenter estas la ĝusta elekto por la disvolva vektoro de la kompanio. Respondeca aliro al projekt-administrado, kompetenta strategio kaj klara planado permesis al ni kompletigi la laboron sur la taŭga nivelo. 

Konfirmo de la kvalito de laboro estas peto de la kliento daŭrigi provizi servojn por reto-modernigo ĉe ĝiaj ceteraj lokoj en Rusio.

fonto: www.habr.com

Aldoni komenton