Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Re thehile moralo oa marang-rang oa setsi sa data o lumellang ho romelloa ha lihlopha tsa likhomphutha tse kholo ho feta li-server tse likete tse 100 tse nang le lebelo le holimo la li-bandwidth tse fetang petabyte e le 'ngoe motsotsoana.

Ho tsoa tlalehong ea Dmitry Afanasyev u tla ithuta ka melao-motheo ea moralo o mocha, ho phahamisa li-topology, mathata a hlahang ka sena, likhetho tsa ho li rarolla, likarolo tsa ho tsamaisa le ho lekanya mesebetsi ea sefofane sa ho fetisa lisebelisoa tsa marang-rang tsa sejoale-joale "tse hokahaneng haholo" li-topology tse nang le palo e kholo ea litsela tsa ECMP. Ho phaella moo, Dima o buile ka bokhutšoanyane ka mokhatlo o hlophisitsoeng oa khokahanyo ea ka ntle, lesela la 'mele, tsamaiso ea cabling le litsela tsa ho eketsa bokhoni.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

- Dumelang bohle! Lebitso la ka ke Dmitry Afanasyev, ke setsebi sa marang-rang sa Yandex mme haholo-holo ke rala marang-rang a setsi sa data.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Pale ea ka e tla ba mabapi le marang-rang a ntlafalitsoeng a litsi tsa data tsa Yandex. Ke phetoho e kholo ea moralo oo re neng re e-na le oona, empa ka nako e ts'oanang ho na le lintlha tse ncha. Ena ke tlhaloso ea kakaretso hobane ho ne ho e-na le boitsebiso bo bongata bo lokelang ho kenngoa ka nako e nyenyane. Re tla qala ka ho khetha topology e utloahalang. Joale ho tla ba le kakaretso ea sefofane sa taolo le mathata a sefofane sa data scalability, khetho ea se tla etsahala boemong ba 'mele,' me re tla sheba likarolo tse ling tsa lisebelisoa. Ha re ameng hanyane ka se etsahalang setsing sa data se nang le MPLS, seo re buileng ka sona nakong e fetileng.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Kahoo, Yandex ke eng mabapi le meroalo le litšebeletso? Yandex ke hyperscaler e tloaelehileng. Ha re sheba basebelisi, re sebetsana le likopo tsa basebelisi. Hape lits'ebeletso tse fapaneng tsa phallo le phetiso ea data, hobane re boetse re na le lits'ebeletso tsa polokelo. Haeba e le haufi le backend, joale meroalo ea litšebeletso le lits'ebeletso li hlaha moo, joalo ka polokelo ea lintho tse abuoang, phetisetso ea data le, ehlile, mela e tsitsitseng. E 'ngoe ea mefuta ea mantlha ea meroalo ea mosebetsi ke MapReduce le litsamaiso tse ts'oanang, ts'ebetso ea melapo, ho ithuta ka mochini, jj.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Meaho ea motheo e ka holim'a eona e etsahala joang? Hape, re hyperscaler e tloaelehileng, leha mohlomong re le haufi hanyane le lehlakore le tlase la hyperscaler ea sebono. Empa re na le litšobotsi tsohle. Re sebelisa lisebelisoa tsa thepa le sekala se otlolohileng hohle moo ho khonehang. Re na le lisebelisoa tse feletseng tsa ho kopanya: ha re sebetse le mechine e ikemetseng, li-racks tsa motho ka mong, empa re li kopanya ho ba letamo le leholo la lisebelisoa tse fapanyetsanoang le litšebeletso tse ling tse eketsehileng tse sebetsanang le moralo le kabo, 'me re sebetsa le letamo lena kaofela.

Kahoo re na le boemo bo latelang - sistimi e sebetsang maemong a sehlopha sa komporo. Ho bohlokoa haholo hore re laole ka botlalo pokello ea theknoloji eo re e sebelisang. Re laola li-endpoints (mabotho), marang-rang le stack ea software.

Re na le litsi tse ngata tse kholo tsa data Russia le kantle ho naha. Li kopantsoe ke mokokotlo o sebelisang theknoloji ea MPLS. Meaho ea rona ea ka hare e batla e hahiloe ka ho feletseng ho IPv6, empa kaha re hloka ho fana ka sephethephethe sa kantle se ntseng se tla haholo-holo ka IPv4, re tlameha ka tsela e itseng ho fana ka likōpo tse tlang ka IPv4 ho li-server tse ka pele, 'me ho feta ho feta IPv4- Internet - bakeng sa mohlala, bakeng sa indexing.

Liphetoho tse 'maloa tsa ho qetela tsa meralo ea marang-rang ea setsi sa data li sebelisitse li-topology tse ngata tsa Clos mme ke L3-feela. Re tlohile L2 nakoana e fetileng mme re hemela holimo. Qetellong, lisebelisoa tsa rona li kenyelletsa likete tse makholo tsa liketsahalo tsa compute (server). Boholo bo boholo ba sehlopha nakong e fetileng e ne e le li-server tse ka bang likete tse 10. Sena se bakoa haholo ke hore na lits'ebetso tse ts'oanang tsa boemo ba li-cluster-level, li-schedule, kabo ea lisebelisoa, joalo-joalo li ka sebetsa joang. Kaha tsoelo-pele e etsahetse ka lehlakoreng la software ea meaho, boholo ba sepheo ke li-server tse ka bang likete tse 100 sehlopheng se le seng sa komporo, 'me Re na le mosebetsi - ho khona ho aha lifeme tsa marang-rang tse lumellang ho kopanya lisebelisoa ka katleho sehlopheng se joalo.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Re batla eng ho tsoa ho marang-rang a setsi sa data? Pele ho tsohle, ho na le li-bandwidth tse ngata tse theko e tlaase le tse ajoang ka mokhoa o ts'oanang. Hobane marang-rang ke mokokotlo oo ka oona re ka kopanyang lisebelisoa. Boholo ba sepheo se secha ke li-server tse ka bang likete tse 100 sehlopheng se le seng.

Hape, ehlile, re batla sefofane sa taolo se senyehileng le se tsitsitseng, hobane lits'ebetsong tse kholo joalo hlooho e ngata e hlaha esita le liketsahalong tse sa reroang, 'me ha re batle hore sefofane sa taolo se re tlisetse hlooho hape. Ka nako e ts'oanang, re batla ho fokotsa mmuso ho eona. Ha boemo bo le bonyenyane, ntho e 'ngoe le e' ngoe e ntle le e tsitsitseng e sebetsa, 'me ho bonolo ho e hlahloba.

Ha e le hantle, re hloka boiketsetso, hobane ho ke ke ha khoneha ho laola lisebelisoa tse joalo ka letsoho, 'me ha hoa khoneha ka nako e itseng. Re hloka tšehetso ea ts'ebetso ka hohle kamoo ho ka khonehang le tšehetso ea CI/CD ho isa moo e ka fanoang.

Ka boholo bo joalo ba litsi tsa data le lihlopha, mosebetsi oa ho tšehetsa phallo e ntseng e eketseha le katoloso ntle le tšitiso ea litšebeletso e se e le boima haholo. Haeba ka lihlopha tsa boholo ba mechine e sekete, mohlomong haufi le mechine e likete tse leshome, li ntse li ka fetisoa e le ts'ebetso e le 'ngoe - ke hore, re rera ho atolosoa ha lisebelisoa,' me mechine e likete tse 'maloa e eketsoa e le ts'ebetso e le' ngoe. joale sehlopha sa boholo ba mechine e likete tse lekholo ha se hlahe hang-hang tjena, se hahoa ka nako e itseng. ‘Me ke ntho e lakatsehang hore nako ena kaofela se seng se pompetsoe, lintlafatso tse seng li kentsoe, li be teng.

'Me tlhokahalo e le' ngoe eo re neng re e-na le eona le ho e siea: tšehetso bakeng sa multitenancy, ke hore, virtualization kapa segmentation ea marang-rang. Hona joale ha ho hlokahale hore re etse sena boemong ba lesela la marang-rang, hobane sharding e tsamaile ho mabotho, 'me sena se entse hore ho be bonolo haholo ho rona. Ka lebaka la IPv6 le sebaka se seholo sa liaterese, re ne re sa hloke ho sebelisa liaterese tse peli lits'ebetsong tsa ka hare; liaterese tsohle li ne li se li ikhethile. 'Me ka lebaka la hore re nkile karolo ea ho sefa le ea marang-rang ho mabotho, ha ho hlokahale hore re thehe mekhatlo efe kapa efe ea marang-rang ho marang-rang a setsi sa data.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Ntho ea bohlokoa haholo ke seo re sa se hlokeng. Haeba mesebetsi e meng e ka tlosoa marang-rang, sena se etsa hore bophelo bo be bonolo haholoanyane, 'me, e le molao, se eketsa khetho ea lisebelisoa tse fumanehang le software, ho etsa hore tlhahlobo e be bonolo haholo.

Kahoo, ke eng eo re sa e hlokeng, re khonne ho tela eng, eseng kamehla ka thabo nakong eo e etsahetseng, empa ka phomolo e kholo ha ts'ebetso e phethoa?

Pele ho tsohle, ho lahla L2. Ha re hloke L2, leha e le ea 'nete kapa e etsisoa. Ha e sebelisoe haholo-holo ka lebaka la hore re laola stack ea kopo. Likopo tsa rona li horizontally scalable, li sebetsa le L3 addressing, ha li tšoenyehe haholo ka hore ho na le sekheo se seng se tsoile, ba mpa ba ntša se secha, ha se hloke hore se thehoe atereseng ea khale, hobane ho na le boemo bo arohaneng ba ho sibolla litšebeletso le ho beha leihlo mechini e fumanehang sehlopheng. Ha re fane ka mosebetsi ona ho marang-rang. Mosebetsi oa marang-rang ke ho tsamaisa lipakete ho tloha ntlheng ea A ho ea ho B.

Hape ha re na maemo ao liaterese li tsamaeang ka har'a marang-rang, 'me sena se hloka ho hlahlojoa. Meralong e mengata sena se hlokahala hangata ho ts'ehetsa motsamao oa VM. Ha re sebelise ho sisinyeha ha mechine ea sebele meahong ea ka hare ea Yandex e kholo, 'me, ho feta moo, re lumela hore le haeba sena se etsoa, ​​​​ha sea lokela ho etsahala ka tšehetso ea marang-rang. Haeba e hlile e hloka ho etsoa, ​​​​e tlameha ho etsoa boemong ba moamoheli, 'me u sutume liaterese tse ka fallelang ho li-overlays, e le hore li se ke tsa ama kapa tsa etsa liphetoho tse ngata tse matla ho tsamaiso ea tsamaiso ea underlay ka boeona (marang-rang a lipalangoang) .

Theknoloji e 'ngoe eo re sa e sebeliseng ke multicast. Haeba u batla, nka u bolella ka botlalo hore na ke hobane'ng. Sena se etsa hore bophelo bo be bobebe haholo, hobane haeba motho a kile a sebetsana le eona mme a sheba hantle hore na sefofane sa taolo ea multicast se shebahala joang, ho tsohle ntle le lits'ebetso tse bonolo, sena ke hlooho e bohloko. Ho feta moo, ho thata ho fumana ts'ebetsong ea mohloli o bulehileng o sebetsang hantle, mohlala.

Qetellong, re rala marang-rang a rona hore a se ke a fetoha haholo. Re ka itšetleha ka taba ea hore ho phalla ha liketsahalo tsa ka ntle ho tsamaiso ea litsela ho nyenyane.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Ke mathata afe a hlahang 'me ke lithibelo life tse lokelang ho nkoa ha re hlahisa marang-rang a setsi sa data? Litšenyehelo, ehlile. Scalability, boemo boo re batlang ho hola ho bona. Tlhokahalo ea ho atolosa ntle le ho emisa tšebeletso. Bandwidth, ho fumaneha. Ponahalo ea se etsahalang marang-rang bakeng sa mekhoa ea ho shebella, bakeng sa lihlopha tse sebetsang. Ts'ehetso ea boiketsetso - hape, ka hohle kamoo ho ka khonehang, kaha mesebetsi e fapaneng e ka rarolloa maemong a fapaneng, ho kenyelletsa le ho kenyelletsa likarolo tse ling. Che, eseng [mohlomong] ho itšetleha ka barekisi. Le hoja linakong tse fapaneng tsa histori, ho itšetlehile ka hore na u sheba karolo efe, boipuso bona bo ne bo le bonolo kapa bo le thata ho bo finyella. Haeba re nka karolo e fapaneng ea lisebelisoa tsa lisebelisoa tsa marang-rang, joale ho fihlela morao tjena ho ne ho e-na le maemo a mangata ho bua ka boipuso ho barekisi, haeba re ne re boetse re batla li-chips tse nang le phallo e phahameng.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Ke topology efe e utloahalang eo re tla e sebelisa ho aha marang-rang a rona? Ena e tla ba Clos ea maemo a mangata. Ha e le hantle, ha ho na mekhoa e meng ea sebele hona joale. 'Me topology ea Clos e ntle haholo, leha e bapisoa le li-topology tse fapaneng tse tsoetseng pele tse sebakeng sa thahasello ea thuto hona joale, haeba re na le li-switches tse kholo tsa radix.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Marang-rang a mangata a Clos a hlophisitsoe joang, 'me likarolo tse fapaneng li bitsoa eng ho eona? Pele ho tsohle, moea o ile oa phahama, hore u lebe moo u leng teng leboea, moo boroa, moo bochabela, moo bophirimela. Marang-rang a mofuta ona hangata a hahiloe ke ba nang le sephethephethe se seholo haholo sa bophirima-bochabela. Ha e le likarolo tse setseng, ka holimo ho na le switjha ea sebele e kopantsoeng ho tloha ho li-switches tse nyenyane. Ona ke mohopolo oa mantlha oa kaho e iphetang ea marang-rang a Clos. Re nka likarolo tse nang le mofuta o itseng oa radix ebe re li hokahanya e le hore seo re se fumanang se ka nkoa e le phetoho e nang le radix e kholoanyane. Haeba o hloka ho feta, mokhoa ona o ka phetoa.

Maemong, ka mohlala, ka li-Clos tse peli, ha ho khoneha ho khetholla ka ho hlaka likarolo tse otlolohileng setšoantšong sa ka, hangata li bitsoa lifofane. Haeba re ne re ka haha ​​Clos ka mekhahlelo e meraro ea li-switches tsa mokokotlo (tseo kaofela ha tsona e seng li-switch kapa ToR tse sebelisoang feela bakeng sa lipalangoang), joale lifofane li ne li tla shebahala li rarahane haholoanyane; tse peli tse nang le maemo a mabeli li shebahala hantle joalo. Re bitsa block ea ToR kapa li-switches tsa makhasi le li-switches tsa lesapo la mokokotlo tse amanang le tsona Pod. Li-switches tsa mokokotlo oa lesapo la mokokotlo-1 holimo ho Pod ke bokaholimo ba Pod, bokaholimo ba Pod. Li-switches tse ka holimo ho fektheri eohle ke karolo e ka holimo ea fektheri, Holimo ea lesela.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Ehlile, ho hlaha potso: Marang-rang a Clos a se a hahiloe nako e telele; mohopolo ka boeona o tsoa mehleng ea khale ea mohala, marang-rang a TDM. Mohlomong ho hlahile ho hong ho molemo, mohlomong ho na le ho ka etsoang hamolemo? Ee le che. Ka khopolo e, ka ts'ebetsong nakong e tlang ho hang ha ho joalo. Hobane ho na le li-topology tse ngata tse thahasellisang, tse ling tsa tsona li bile li sebelisoa tlhahisong, mohlala, Dragonfly e sebelisoa lits'ebetsong tsa HPC; Ho boetse ho na le li-topology tse khahlisang tse kang Xpander, FatClique, Jellyfish. Haeba u sheba litlaleho likopanong tse kang SIGCOMM kapa NSDI morao tjena, u ka fumana palo e kholo ea mesebetsi ea li-topology tse ling tse nang le thepa e ntle (e 'ngoe kapa e' ngoe) ho feta Clos.

Empa li-topology tsena kaofela li na le thepa e le 'ngoe e khahlisang. E thibela ts'ebetsong ea bona ho marang-rang a setsi sa data, seo re lekang ho se haha ​​​​ho lisebelisoa tsa thepa le tse jang chelete e lekaneng. Ho tsena tsohle tse ling tsa topologies, boholo ba bandwidth ka bomalimabe ha bo fumanehe ka litsela tse khutšoane. Ka hona, hang-hang re lahleheloa ke monyetla oa ho sebelisa sefofane sa taolo ea setso.

Ka khopolo, tharollo ea bothata e tsejoa. Tsena ke, ka mohlala, liphetoho tsa boemo ba lihokelo ho sebelisa k-shortest tsela, empa, hape, ha ho na liprothokholo tse joalo tse tla kengoa ts'ebetsong tlhahisong le ho fumaneha ka bongata lisebelisoa.

Ho feta moo, kaha boholo ba bokhoni ha bo fumanehe ka litsela tse khutšoanyane, re hloka ho fetola ho feta feela sefofane sa taolo ho khetha litsela tseo kaofela ('me ka tsela, sena ke boemo bo bongata haholo sefofaneng sa taolo). Re ntse re hloka ho fetola sefofane sa ho fetisa, 'me, e le molao, bonyane ho hlokahala likarolo tse peli tse eketsehileng. Bona ke bokhoni ba ho etsa liqeto tsohle mabapi le ho fetisa liphutheloana ka nako e le 'ngoe, mohlala, ho moamoheli. Ha e le hantle, sena ke mokhoa oa ho tsamaisa mohloli, ka linako tse ling libukeng tsa marang-rang a marang-rang sena se bitsoa liqeto tsa ho fetisa hang-hang. 'Me ho ikamahanya le maemo ke mosebetsi oo re o hlokang ho likarolo tsa marang-rang, tse theohang, ka mohlala, ho ea ka taba ea hore re khetha hop e latelang e thehiloeng boitsebisong bo mabapi le mojaro o monyenyane moleng. Ka mohlala, likhetho tse ling lia khoneha.

Kahoo, tataiso e thahasellisa, empa, bomalimabe, re ke ke ra e sebelisa hona joale.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Ho lokile, re ile ra lula ho Clos logical topology. Re tla e phahamisa joang? A re boneng hore na e sebetsa joang le hore na ho ka etsoa eng.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Ho marang-rang a Clos ho na le li-parameter tse peli tse ka sehloohong tseo ka tsela e itseng re ka li fapaneng 'me ra fumana liphello tse itseng: radix ea likarolo le palo ea maemo a marang-rang. Ke na le sets'oants'o sa moralo oa hore na bobeli bo ama boholo joang. Ha e le hantle, re kopanya ka bobeli.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Ho ka bonoa hore bophara ba ho qetela ba marang-rang a Clos ke sehlahisoa sa maemo ohle a li-switches tsa mokokotlo oa radix e ka boroa, hore na re na le li-link tse kae tse theohileng, hore na li makala joang. Ke kamoo re lekanya boholo ba marang-rang.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Mabapi le bokhoni, haholo ho li-switches tsa ToR, ho na le likhetho tse peli tsa ho lekanya. Re ka khona, ha re ntse re boloka topology e akaretsang, ra sebelisa likhokahano tse potlakileng, kapa re ka eketsa lifofane tse ling.

Haeba u sheba mofuta o atolositsoeng oa marang-rang oa Clos (ka lehlakoreng le ka tlase le letona) 'me u khutlele setšoantšong sena ka marang-rang a Clos ka tlase...

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

... joale ena ke topology e ts'oanang hantle, empa holim'a slide ena e putlama haholoanyane 'me lifofane tsa fektheri li tobane le tse ling. Hoa tšoana.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Ho lekanya marang-rang a Clos ho shebahala joang ka lipalo? Mona ke fana ka lintlha tsa hore na marang-rang a ka fumanoa ka bophara bo bokae, palo e kholo ea li-racks, li-switches tsa ToR kapa li-switches tsa makhasi, haeba li se ka li-racks, re ka li fumana ho itšetlehile ka hore na re sebelisa radix ea li-switches bakeng sa maemo a mokokotlo, le re sebelisa maemo a makae.

Mona ke hore na re ka ba le liraka tse kae, ke li-server tse kae le hore na sena sohle se ka sebelisa bokae ho latela 20 kW ka rack. Pejana ke boletse hore re ikemiselitse ho fumana boholo ba sehlopha sa li-server tse ka bang likete tse 100.

Ho ka bonoa hore moralong ona kaofela, likhetho tse peli le halofo li na le thahasello. Ho na le khetho e nang le mekhahlelo e 'meli ea li-spines le li-switches tsa 64-port, tse oelang hanyenyane. Ebe ho na le likhetho tse loketseng hantle bakeng sa 128-port (e nang le radix 128) li-switches tsa mokokotlo tse nang le maemo a mabeli, kapa li-switches tse nang le radix 32 tse nang le maemo a mararo. 'Me maemong' ohle, moo ho nang le li-radixes le lihlopha tse ngata, u ka etsa marang-rang a maholo haholo, empa haeba u sheba tšebeliso e lebeletsoeng, hangata ho na le li-gigawatts. Hoa khoneha ho kenya thapo, empa ha ho bonolo hore re fumane motlakase o mongata hakana sebakeng se le seng. Haeba u sheba lipalo-palo le lintlha tsa sechaba ka litsi tsa data, u ka fumana litsi tse fokolang haholo tsa data tse nang le bokhoni bo hakanyetsoang ba ho feta 150 MW. Tse kholoanyane hangata ke likhamphani tsa data center, litsi tse ngata tse kholo tsa data tse haufi haholo.

Ho na le parameter e 'ngoe ea bohlokoa. Haeba u sheba ka lehlakoreng le letšehali, bandwidth e ka sebelisoang e thathamisitsoe moo. Ho bonolo ho bona hore marang-rang a Clos karolo e kholo ea likou e sebelisoa ho hokahanya li-switches ho tse ling. Bophahamo ba motlakase bo ka sebelisoang, mohala o sebetsang, ke ntho e ka fanoang kantle ho li-server. Ka tlhaho, ke bua ka likou tsa maemo le ka ho khetheha ka sehlopha. E le molao, li-link tse ka hare ho marang-rang li potlakile ho feta li-link tse lebisang ho li-server, empa ka yuniti ea bandwidth, ka hohle kamoo re ka e romellang thepa ea rona ea seva, ho ntse ho e-na le bandwidth e itseng ka har'a marang-rang ka boeona. 'Me ha maemo a ntse a eketseha, litšenyehelo tse khethehileng tsa ho fana ka mola ona ho tsoa kantle.

Ho feta moo, esita le sehlopha sena se eketsehileng ha se tšoane hantle. Le hoja li-spans li le khutšoanyane, re ka sebelisa ntho e kang DAC (ho kopanya koporo ka ho toba, ke hore, lithapo tsa twinax), kapa li-multimode optics, tse jang chelete e ngata kapa e fokolang haholo. Hang ha re fallela libakeng tse telele - e le molao, tsena ke li-optics tsa mokhoa o le mong, 'me litšenyehelo tsa bandwidth ena e eketsehileng li eketseha ka mokhoa o hlokomelehang.

Hape, ha re khutlela ho slide e fetileng, haeba re theha marang-rang a Clos ntle le ho ngolisoa ho feta tekano, ho bonolo ho sheba setšoantšo, ho bona hore na marang-rang a hahiloe joang - ho eketsa boemo bo bong le bo bong ba li-switches tsa mokokotlo, re pheta sekhahla sohle se neng se le teng. tlase. Boemo bo eketsehileng - hammoho le sehlopha se le seng, palo e lekanang ea likou tsa li-switches tse neng li le teng boemong bo fetileng, le palo e tšoanang ea li-transceivers. Ka hona, ke ntho e lakatsehang haholo ho fokotsa palo ea maemo a li-switches tsa mokokotlo.

Ho ipapisitsoe le setšoantšo sena, ho hlakile hore re hlile re batla ho haha ​​​​holima ntho e kang li-switches tse nang le radix ea 128.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Mona, ha e le hantle, ntho e 'ngoe le e' ngoe e tšoana le seo ke sa tsoa se bua; sena ke slide e lokelang ho nahanoa hamorao.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Ho na le likhetho life tseo re ka li khethang joalo ka li-switches tse joalo? Ke litaba tse monate haholo ho rona hore joale marang-rang a joalo a ka qetella a hahiloe ka li-switches tsa single-chip. 'Me sena se monate haholo, se na le likarolo tse ngata tse ntle. Ka mohlala, ba batla ba se na sebopeho sa ka hare. Sena se bolela hore ba robeha habonolo. Li robeha ka mefuta eohle ea litsela, empa ka lehlohonolo li robeha ka ho feletseng. Lisebelisoa tsa modular ho na le liphoso tse ngata (tse sa thabiseng haholo), ha ho tloha ponong ea baahelani le sefofane sa taolo se bonahala se sebetsa, empa, ka mohlala, karolo ea lesela e lahlehile 'me ha e sebetse. ka botlalo. 'Me sephethephethe ho sona se leka-lekana ho latela taba ea hore se sebetsa ka botlalo,' me re ka imeloa.

Kapa, ​​​​ka mohlala, mathata a hlaha ka mokokotlo oa mokokotlo, hobane ka hare ho sesebelisoa sa modular ho boetse ho na le li-SerDes tse lebelo - e hlile e rarahane ka hare. E ka 'na eaba matšoao a pakeng tsa likarolo tsa ho fetisa a amahanngoa kapa ha a lumellane. Ka kakaretso, sesebelisoa leha e le sefe se hlahisang modular se nang le palo e kholo ea likarolo, joalo ka molao, se na le marang-rang a tšoanang a Clos ka hare ho eona, empa ho thata haholo ho e fumana. Hangata ho thata ho esita le morekisi ka boeena hore a hlahlobe.

'Me e na le palo e kholo ea maemo a ho hlōleha moo sesebelisoa se senyang, empa ha se tsoe ho topology ka ho feletseng. Kaha marang-rang a rona a maholo, ho leka-lekanya pakeng tsa lintho tse tšoanang ho sebelisoa ka mafolofolo, marang-rang a tloaelehile haholo, ke hore, tsela e le 'ngoe eo ntho e' ngoe le e 'ngoe e hlophisitsoeng ka eona ha e fapane le tsela e' ngoe, ho molemo ho feta hore re lahleheloe ke tse ling tsa tsona. lisebelisoa tse tsoang ho topology ho feta ho qetella boemong boo ba bang ba bona ba bonahalang ba sebetsa, empa ba bang ba bona ha ba etse joalo.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Ntho e latelang e ntle ea lisebelisoa tsa single-chip ke hore li fetoha hantle le ho potlaka. Hape ba atisa ho ba le bokhoni bo betere. Haeba re nka meaho e meholo e kopaneng eo re nang le eona ka selikalikoe, joale matla a rack unit bakeng sa likou tsa lebelo le ts'oanang a batla a le habeli ho feta a lisebelisoa tsa modular. Lisebelisoa tse hahelletsoeng ka har'a chip e le 'ngoe li theko e tlase ho feta tsa modular mme li sebelisa matla a fokolang.

Empa, ha e le hantle, sena sohle ke ka lebaka, ho boetse ho na le mefokolo. Taba ea pele, radix e batla e le nyane ho feta ea lisebelisoa tsa modular. Haeba re ka fumana sesebelisoa se hahiloeng ho potoloha chip e le 'ngoe e nang le likou tsa 128, joale re ka fumana modular e nang le likou tse makholo a' maloa hona joale ntle le mathata.

Ena ke boholo bo nyane haholo ba litafole tsa ho fetisa, 'me joalo ka molao, ntho e ngoe le e ngoe e amanang le scalability ea sefofane sa data. Li-buffers tse sa tebang. 'Me, e le molao, ho e-na le ts'ebetso e fokolang. Empa ho ile ha fumaneha hore haeba u tseba lithibelo tsena 'me u hlokomela ka nako ho li qoba kapa ho li ela hloko, joale sena ha se tšose hakaalo. Taba ea hore radix e nyane ha e sa le bothata ho lisebelisoa tse nang le radix ea 128 tse qetelle li hlahile morao tjena; re ka haha ​​​​ka likarolo tse peli tsa mokokotlo. Empa ho ntse ho sa khonehe ho haha ​​​​ntho e nyenyane ho feta tse peli tse thahasellisang ho rona. Ka boemo bo le bong, lihlopha tse nyenyane haholo li fumanoa. Esita le liqapi le litlhoko tsa rona tsa pele li ne li ntse li li feta.

Ha e le hantle, haeba ka tšohanyetso tharollo e le kae-kae moeling, ho ntse ho e-na le mokhoa oa ho lekanya. Kaha boemo ba ho qetela (kapa ba pele), bo tlase haholo moo li-server li hokahaneng ke li-switches tsa ToR kapa li-switches tsa makhasi, ha ho hlokahale hore re hokele rack e le 'ngoe ho tsona. Ka hona, haeba tharollo e fokotseha ka hoo e ka bang halofo, u ka nahana ka ho sebelisa sesebelisoa se nang le radix e kholo ka tlaase le ho kopanya, mohlala, li-racks tse peli kapa tse tharo ho sesebelisoa se le seng. Hona hape ke khetho, e na le litšenyehelo tsa eona, empa e sebetsa hantle ebile e ka ba tharollo e ntle ha o hloka ho fihlela boholo ba habeli.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Ho akaretsa, re haha ​​holim'a topology e nang le mekhahlelo e 'meli ea mokokotlo, e nang le likarolo tse robeli tsa fektheri.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Ho tla etsahala'ng ka fisiks? Lipalo tse bonolo haholo. Haeba re e-na le mekhahlelo e 'meli ea mokokotlo, joale re na le li-switches tse tharo feela,' me re lebeletse hore ho tla ba le likarolo tse tharo tsa cable marang-rang: ho tloha ho li-server ho ea ho li-switches tsa lekhasi, ho ea mokokotlong oa 1, ho ea mokokotlong oa 2. Likhetho tseo re ka li khonang tšebeliso ke - tsena ke twinax, multimode, mokhoa o le mong. Mme mona re hloka ho nahana ka hore na ho na le strip e feng, e tla bitsa bokae, hore na boholo ba 'mele ke bofe, hore na re ka koahela likarolo life, le hore na re tla ntlafatsa joang.

Mabapi le litšenyehelo, ntho e 'ngoe le e' ngoe e ka hlophisoa. Li-twinaxes li theko e tlaase haholo ho feta li-optics tse sebetsang, li theko e tlaase ho feta li-transceivers tsa multimode, haeba u li nka ka sefofane ho tloha qetellong, li batla li le theko e tlaase ho feta 100-gigabit switch port. 'Me, ka kopo hlokomela, ho na le litšenyehelo tse fokolang ho feta mokhoa o le mong oa optics, hobane lifofaneng moo mokhoa o le mong o hlokahalang, litsing tsa data ka mabaka a mangata hoa utloahala ho sebelisa CWDM, ha mokhoa o tšoanang o le mong (PSM) o sa tšoanelehe haholo ho sebetsa. ka, lipakete tse kholo haholo li fumanoa likhoele, 'me haeba re tsepamisa maikutlo ho litheknoloji tsena, re fumana boholo ba theko e latelang.

Tlhokomeliso e 'ngoe hape: ka bomalimabe, ha ho khonehe ho sebelisa likou tsa multimode tse 100 ho isa ho tse 4x25. Ka lebaka la likarolo tsa moralo oa li-transceivers tsa SFP28, ha e theko e tlase haholo ho feta 28 Gbit QSFP100. 'Me disassembly ena ea multimode ha e sebetse hantle haholo.

Moeli o mong ke hore ka lebaka la boholo ba lihlopha tsa likhomphutha le palo ea li-server, litsi tsa rona tsa data li fetoha tse kholo 'meleng. Sena se bolela hore bonyane sefofane se le seng se tla tlameha ho etsoa ka singlemod. Hape, ka lebaka la boholo ba 'mele oa li-Pods, ho ke ke ha khoneha ho tsamaisa li-span tse peli tsa twinax (lithapo tsa koporo).

Ka lebaka leo, haeba re ntlafatsa ka theko 'me re nahanela geometry ea moqapi ona, re fumana nako e le' ngoe ea twinax, nako e le 'ngoe ea multimode le nako e le' ngoe ea singlemode e sebelisang CWDM. Sena se kenyelletsa mekhoa ea ntlafatso e ka bang teng.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Sena ke tsela eo e shebahalang ka eona haufinyane, moo re lebileng teng le hore na ho ka khoneha. Ho hlakile, bonyane, mokhoa oa ho ea ho 50-Gigabit SerDes bakeng sa multimode le singlemode. Ho feta moo, haeba u sheba se ka har'a li-transceivers tsa mode e le 'ngoe hona joale le nakong e tlang bakeng sa 400G, hangata esita le ha 50G SerDes e fihla ho tloha lehlakoreng la motlakase, 100 Gbps ka lane e ka se e ea ho optics. Ka hona, ho ka etsahala hore ho e-na le ho fallela ho 50, ho tla ba le phetoho ho 100 Gigabit SerDes le 100 Gbps ka tsela, hobane ho ea ka litšepiso tsa barekisi ba bangata, ho fumaneha ha bona ho lebeletsoe haufinyane. Nako eo ka eona 50G SerDes e neng e le lebelo ka ho fetisisa, ho bonahala eka e ke ke ea e-ba nako e telele haholo, hobane likopi tsa pele tsa 100G SerDes li ntse li tsoela pele hoo e ka bang selemong se tlang. 'Me ka mor'a nako e itseng ka mor'a moo mohlomong li tla ba tsa bohlokoa ka chelete e lekaneng.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Ntho e 'ngoe hape mabapi le khetho ea fisiks. Ha e le hantle, re ka se re sebelisa likou tsa 400 kapa 200 tsa Gigabit re sebelisa 50G SerDes. Empa hoa etsahala hore sena ha se utloahale haholo, hobane, joalo ka ha ke boletse pejana, re batla radix e kholo ho li-switches, ka lebaka, ehlile. Re batla 128. 'Me haeba re e-na le bokhoni bo fokolang ba chip' me re eketsa lebelo la khokahanyo, joale radix e fokotseha ka tlhaho, ha ho na mehlolo.

'Me re ka eketsa bokhoni bohle re sebelisa lifofane,' me ha ho na litšenyehelo tse khethehileng; re ka eketsa palo ea lifofane. 'Me haeba re lahleheloa ke radix, re tla tlameha ho hlahisa boemo bo eketsehileng, kahoo boemong ba hona joale, ka tekanyo e phahameng ea hona joale e fumanehang ka chip, ho bonahala eka ho sebetsa hantle ho sebelisa likou tsa 100-gigabit, hobane li u lumella. ho fumana radix e kholoanyane.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Potso e latelang ke hore na fisiks e hlophisitsoe joang, empa ho ea ka pono ea lisebelisoa tsa cable. Hoa fumaneha hore e hlophisitsoe ka mokhoa o qabolang. Ho kopanya pakeng tsa li-switches tsa makhasi le li-spines tsa boemo ba pele - ha ho na lihokelo tse ngata moo, ntho e 'ngoe le e' ngoe e hahiloe ka mokhoa o bonolo. Empa haeba re nka sefofane se le seng, se etsahalang ka hare ke hore re hloka ho hokahanya li-spines tsohle tsa boemo ba pele le likhahla tsohle tsa boemo ba bobeli.

Ho feta moo, e le molao, ho na le litakatso tse ling tsa hore na li lokela ho shebahala joang ka har'a setsi sa data. Ka mohlala, re ne re hlile re batla ho kopanya lithapo hore e be ngatana ebe re li hula e le hore phanele e le 'ngoe e nang le matla a holimo e kenelle ka ho feletseng phanele e le 'ngoe, e le hore ho se ke ha e-ba le zoo ho latela bolelele. Re khonne ho rarolla bothata bona. Haeba qalong u sheba topology e utloahalang, u ka bona hore lifofane li ikemetse, sefofane se seng le se seng se ka hahoa se le seng. Empa ha re eketsa pokello e joalo 'me re batla ho hula karolo eohle ea patch ka har'a phanele ea patch, re tlameha ho kopanya lifofane tse fapaneng ka har'a sephutheloana se le seng ebe re kenya sebopeho sa mahareng ka sebopeho sa li-optical cross-connections ho li paka hape ho tloha kamoo li neng li bokane. karolong e 'ngoe, kamoo li tla bokelloa karolong e 'ngoe. Ka lebaka la sena, re fumana tšobotsi e ntle: phetoho eohle e rarahaneng ha e fetele ka nģ'ane ho li-racks. Ha o hloka ho kopanya ntho e matla haholo, "hlakola lifofane," joalo ka ha ka linako tse ling e bitsoa marang-rang a Clos, kaofela li tsepamisitsoe ka har'a rack e le 'ngoe. Ha re na li-disassembled tse ngata, ho ea ho lihokelo tsa motho ka mong, ho chencha lipakeng tsa liraka.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Ena ke tsela eo e shebahalang ka eona ho ea ka pono ea mokhatlo o hlophisitsoeng oa lisebelisoa tsa cable. Setšoantšong se ka ho le letšehali, li-blocks tse mebala-bala li bontša li-switches tsa lesapo la mokokotlo tsa boemo ba pele, likotoana tse robeli ka 'ngoe, le lithapo tse 'ne tsa likhoele tse tsoang ho tsona, tse tsamaeang le ho hokana le mekotla e tsoang libolokong tsa spine-2 switch. .

Masekoere a manyenyane a bontša mateano. Ka holimo ka ho le letšehali ke ho senyeha ha mateano a litsela tse joalo, ha e le hantle ke 512 by 512 port cross-connect module e khutlisetsang likhoele e le hore li tle ka ho feletseng ka har'a raka e le 'ngoe, moo ho nang le sefofane se le seng feela sa mokokotlo oa 2. 'Me ka ho le letona, setšoantšo sa setšoantšo sena se na le lintlha tse qaqileng haholoanyane mabapi le li-Pods tse' maloa boemong ba mokokotlo oa 1, le hore na se phuthetsoe joang ka har'a khokahanyo ea sefapano, hore na ho fihla joang boemong ba mokokotlo-2.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Sena ke kamoo se shebahalang kateng. Sebaka se e-s'o bokelloe ka botlalo sa mokokotlo-2 se ema (ka ho le letšehali) le sethala sa sefapano. Ka bomalimabe, ha ho na lintho tse ngata tseo u ka li bonang moo. Sebopeho sena sohle se ntse se sebelisoa hona joale ho se seng sa litsi tsa rona tse kholo tsa data tse ntseng li atolosoa. Ona ke mosebetsi o ntseng o tsoela pele, o tla shebahala o le motle, o tla tlatsoa hantle.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Potso ea bohlokoa: re khethile topology e utloahalang mme ra haha ​​​​fisiks. Ho tla etsahala'ng ka sefofane sa taolo? Ho tsebahala haholo ho tsoa ho boiphihlelo ba ts'ebetso, ho na le litlaleho tse 'maloa tse hokahanyang liprothokholo tsa mmuso, ho monate ho sebetsa le tsona, empa, ka bomalimabe, ha li atlehe holima topology e hokahaneng haholo. 'Me ho na le ntlha e le' ngoe e ka sehloohong e thibelang sena - ke kamoo likhohola li sebetsang kateng ho li-protocol tsa naha. Haeba u ka nka algorithm ea likhohola 'me u sheba kamoo marang-rang a rona a hlophisitsoeng kateng, u ka bona hore ho tla ba le fanout e kholo haholo mohatong o mong le o mong,' me e tla phalla sefofane sa taolo ka lisebelisoa. Haholo-holo, li-topology tse joalo li tsoakana hampe haholo le algorithm e tloaelehileng ea likhohola ho li-protocol tsa naha.

Khetho ke ho sebelisa BGP. Mokhoa oa ho e lokisa ka nepo o hlalositsoe ho RFC 7938 mabapi le ts'ebeliso ea BGP litsing tse kholo tsa data. Mehopolo ea mantlha e bonolo: palo e tlase ea li-prefixes ka mong'a moamoheli 'me ka kakaretso palo e nyane ea li-prefixes marang-rang, sebelisa ho kopanya ha ho khoneha, 'me u hatelle ho tsoma ha litsela. Re batla kabo e hlokolosi haholo, e laoloang haholo ea liapdeite, se bitsoang phula ea mahala. Re batla hore lintlafatso li sebelisoe hang ha li feta marang-rang. Haeba li hlaha ka tlaase, li nyoloha, li sa phutholoha ho feta hang. Ha hoa lokela ho ba le li-zigzag. Li-zigzag li mpe haholo.

Ho etsa sena, re sebelisa moralo o bonolo ho lekana ho sebelisa mekhoa ea motheo ea BGP. Ka mantsoe a mang, re sebelisa eBGP e sebetsang ho lihokelo tsa lehae, 'me litsamaiso tse ikemetseng li abetsoe ka tsela e latelang: sistimi e ikemetseng ho ToR, sistimi e ikemetseng holim'a boloko bohle ba li-switches tsa spine-1 tsa Pod e le' ngoe, le sistimi e ikemetseng e ikemetseng kaholimo ho tsohle. ea Lesela. Ha ho thata ho sheba le ho bona hore esita le boitšoaro bo tloaelehileng ba BGP bo re fa kabo ea lisebelisoa tseo re li batlang.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Ka tlhaho, ho kopanngoa ha liaterese le liaterese li tlameha ho raloa e le hore li tsamaisane le tsela eo routing e hahiloeng ka eona, e le hore e netefatse botsitso ba sefofane sa taolo. L3 e sebetsanang le lipalangoang e hokahane le topology, hobane ntle le sena ho ke ke ha khoneha ho finyella ho kopanya; ntle le sena, liaterese tsa motho ka mong li tla kena tsamaisong ea litsela. 'Me ntho e' ngoe hape ke hore aggregation, ka bomalimabe, ha e kopane hantle le litsela tse ngata, hobane ha re e-na le litsela tse ngata 'me re e-na le aggregation, ntho e' ngoe le e 'ngoe e ntle, ha marang-rang kaofela a phetse hantle, ha ho na liphoso ho eona. Ka bomalimabe, hang ha ho hloleha ho hlaha marang-rang 'me symmetry ea topology e lahlehile, re ka fihla moo ho ileng ha phatlalatsoa yuniti, eo re ke keng ra tsoela pele ho ea moo re lokelang ho ea teng. Ka hona, ho molemo ho kopanya moo ho se nang litsela tse ngata, molemong oa rona tsena ke li-switches tsa ToR.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Ha e le hantle, hoa khoneha ho kopanya, empa ka hloko. Haeba re ka etsa disaggregation e laoloang ha ho hlōleha ha marang-rang ho etsahala. Empa ona ke mosebetsi o boima haholo, re bile re ipotsa hore na ho ka khoneha ho etsa sena, hore na ho ka khoneha ho eketsa mochine o ikemetseng, le mechine e fokolang ea boemo bo tla raha BGP ka nepo ho fumana boitšoaro bo lakatsehang. Ka bomalimabe, ho sebetsa linyeoe tsa sekhutlo ha ho bonahale ebile ho rarahane, 'me mosebetsi ona ha o rarolloe hantle ka ho hokela lihokelo tsa kantle ho BGP.

Mosebetsi o khahlisang haholo mabapi le sena o entsoe ka har'a moralo oa protocol ea RIFT, e tla tšohloa tlalehong e latelang.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Ntho e 'ngoe ea bohlokoa ke hore na lifofane tsa data li fihla joang ka li-topology tse teteaneng, moo re nang le litsela tse ngata tse fapaneng. Tabeng ena, ho sebelisoa mekhoa e mengata ea boitsebiso bo eketsehileng: lihlopha tsa ECMP, tseo le tsona li hlalosang lihlopha tsa Next Hop.

Ka marang-rang a tloaelehileng a sebetsang, ntle le ho hloleha, ha re nyolohela ho Clos topology, ho lekane ho sebelisa sehlopha se le seng feela, hobane ntho e 'ngoe le e' ngoe e seng ea sebakeng seo e hlalosoa ka ho sa feleng, re ka nyoloha. Ha re tloha holimo ho ea tlase ho ea ka boroa, joale litsela tsohle ha se ECMP, ke litsela tse le 'ngoe. Tsohle di lokile. Bothata ke hore, 'me ntho e ikhethang ea Clos topology ea khale ke hore haeba re sheba ka holimo ho lesela, nthong efe kapa efe, ho na le tsela e le' ngoe feela ea ntho efe kapa efe e ka tlase. Haeba ho hloleha ho etsahala tseleng ena, ntho ena e kaholimo ho fektheri e fetoha e sa sebetseng hantle bakeng sa li-prefixes tse ka morao ho tsela e robehileng. Empa ho tse ling e nepahetse, 'me re tlameha ho arola lihlopha tsa ECMP le ho hlahisa naha e ncha.

scalability ea data plane e shebahala joang lisebelisoa tsa sejoale-joale? Haeba re etsa LPM (e telele ka ho fetisisa prefix match), ntho e 'ngoe le e' ngoe e ntle haholo, ho feta 100k prefixes. Haeba re bua ka lihlopha tse latelang tsa Hop, joale ntho e 'ngoe le e' ngoe e mpe le ho feta, tse likete tse 2-4. Haeba re bua ka tafole e nang le tlhaloso ea Next Hops (kapa adjacencies), joale sena ke kae-kae ho tloha 16k ho 64k. 'Me sena se ka fetoha bothata. 'Me mona re fihla khefutsong e khahlisang: ho etsahetse'ng ka MPLS litsing tsa data? Ha e le hantle, re ne re batla ho e etsa.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Ho ile ha etsahala lintho tse peli. Re entse karohano e nyane ho mabotho; re ne re se re sa hloke ho e etsa marang-rang. E ne e se ntle haholo ka tšehetso e tsoang ho barekisi ba fapaneng, mme le ho feta ka ts'ebetsong e bulehileng mabokoseng a masoeu a nang le MPLS. Mme MPLS, bonyane ts'ebetsong ea eona ea setso, ka bomalimabe, e kopana hampe haholo le ECMP. Mme ke ka baka leo.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Sena ke seo sebopeho sa phepelo ea ECMP bakeng sa IP se shebahalang ka sona. Palo e kholo ea li-prefixes e ka sebelisa sehlopha se le seng le thibelo e tšoanang ea Next Hops (kapa li-adjacencies, sena se ka bitsoa ka tsela e fapaneng litokomaneng tse fapaneng bakeng sa lisebelisoa tse fapaneng). Taba ke hore sena se hlalosoa e le boema-kepe bo tsoang le hore na u ka ngolla aterese ea MAC ho eng e le hore u fihle ho Next Hop e nepahetseng. Bakeng sa IP ntho e 'ngoe le e' ngoe e shebahala e le bonolo, u ka sebelisa palo e kholo haholo ea li-prefixes bakeng sa sehlopha se le seng, thibela e tšoanang ea Next Hops.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Moralo oa khale oa MPLS o fana ka maikutlo a hore, ho ipapisitse le sebopeho se hlahang, leibole e ka ngoloa bocha ho boleng bo fapaneng. Ka hona, re hloka ho boloka sehlopha le boloko ba Next Hops bakeng sa leibole e 'ngoe le e 'ngoe ea ho kenya. 'Me sena, ka bomalimabe, ha se kholoe.

Ho bonolo ho bona hore moqapong oa rona re ne re hloka li-switches tsa 4000 ToR, bophara bo boholo e ne e le litsela tsa 64 ECMP, haeba re tloha ho tloha mokokotlong-1 ho ea mokokotlong-2. Ha re kene tafoleng e le 'ngoe ea lihlopha tsa ECMP, haeba feela sehlomathiso se le seng se nang le ToR se tsamaea,' me ha re kene tafoleng ea Next Hops ho hang.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Ha se tsohle tse hlokang tšepo, hobane meralo e kang Segment Routing e kenyelletsa mangolo a lefats'e. Hajoale, ho ka khonahala ho putlama liboloko tsena tsohle tsa Next Hops hape. Ho etsa sena, o hloka ts'ebetso ea mofuta oa karete e hlaha: nka lengolo 'me u le ngole hape ho lona ntle le boleng bo itseng. Empa ka bomalimabe, sena ha se teng haholo lits'ebetsong tse fumanehang.

'Me qetellong, re hloka ho tlisa sephethephethe sa kantle ho setsi sa data. Joang ho e etsa? Pejana, sephethephethe se ile sa kenngoa marang-rang a Clos ho tloha holimo. Ke hore, ho ne ho e-na le li-routers tse ka thōko tse neng li amana le lisebelisoa tsohle tse ka holimo ho lesela. Tharollo ena e sebetsa hantle ho tse nyane ho isa ho tse mahareng. Ka bomalimabe, e le hore re romele sephethephethe sa symmetrically ho marang-rang kaofela ka tsela ena, re lokela ho fihla ka nako e le 'ngoe likarolong tsohle tsa Top ea lesela,' me ha ho na le tse fetang lekholo tsa tsona, hoa bonahala hore re boetse re hloka lesela le leholo. radix ho li-routers tse haufi. Ka kakaretso, sena se hloka chelete, hobane li-router tse bohale li sebetsa haholoanyane, likou tse ho tsona li tla ba theko e boima haholo, 'me moqapi ha o motle haholo.

Kgetho e 'ngoe ke ho qala sephethephethe se joalo ho tloha ka tlase. Ho bonolo ho netefatsa hore topology ea Clos e hahiloe ka tsela eo sephethephethe se tsoang ka tlase, ke hore, ho tloha ka lehlakoreng la ToR, se ajoa ka ho lekana har'a maemo ho pholletsa le Top eohle ea lesela ka makhetlo a mabeli, ho kenya marang-rang kaofela. Ka hona, re hlahisa mofuta o khethehileng oa Pod, Edge Pod, e fanang ka khokahanyo ea kantle.

Ho na le khetho e 'ngoe hape. Sena ke seo Facebook e se etsang, mohlala. Ba e bitsa Fabric Aggregator kapa HGRID. Boemo bo eketsehileng ba mokokotlo bo ntse bo hlahisoa ho hokahanya litsi tse ngata tsa data. Moqapi ona o ka khoneha haeba re se na mesebetsi e eketsehileng kapa liphetoho tsa encapsulation ho li-interfaces. Haeba e le lintlha tse eketsehileng tsa ho ama, ho thata. Ka tloaelo, ho na le mesebetsi e mengata le mofuta oa lera o arolang likarolo tse fapaneng tsa setsi sa data. Ha ho na thuso ea ho etsa lera le joalo le leholo, empa haeba le hlile le hlokahala ka lebaka le itseng, joale hoa utloahala ho nahana ka monyetla oa ho e tlosa, ho etsa hore e be bophara ka hohle kamoo ho ka khonehang le ho e fetisetsa ho mabotho. Sena se etsoa, ​​ka mohlala, ke basebetsi ba bangata ba maru. Li na le li-overlays, li qala ho tsoa ho mabotho.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Ke menyetla efe ea tsoelopele eo re e bonang? Pele ho tsohle, ho ntlafatsa tšehetso bakeng sa phaephe ea CI/CD. Re batla ho fofa ka tsela eo re lekang ka eona le ho leka tsela eo re fofang ka eona. Sena ha se sebetse hantle, hobane lisebelisoa tsa motheo li kholo 'me ha ho khonehe ho li qopitsa bakeng sa liteko. U hloka ho utloisisa mokhoa oa ho hlahisa likarolo tsa tlhahlobo lits'ebetsong tsa tlhahiso ntle le ho li lahla.

Lisebelisoa tse betere le ho beha leihlo hantle ha ho mohla ho hlokang kelello. Potso eohle ke ho leka-lekanya boiteko le ho khutla. Haeba u ka e eketsa ka boikitlaetso bo loketseng, e ntle haholo.

Bula mekhoa ea ho sebetsa bakeng sa lisebelisoa tsa marang-rang. Liprothokholo tse betere le litsamaiso tse betere tsa ho tsamaisa, joalo ka RIFT. Ho boetse hoa hlokahala lipatlisiso mabapi le ts'ebeliso ea maano a betere a taolo ea tšubuhlellano, mohlomong le kenyelletso, bonyane lintlheng tse ling, ea tšehetso ea RDMA ka har'a sehlopha.

Ha re sheba nako e tlang, re hloka li-topology tse tsoetseng pele mme mohlomong le marang-rang a sa sebeliseng holimo haholo. Har'a lintho tse ncha, haufinyane ho bile le lingoliloeng tse mabapi le theknoloji ea masela bakeng sa HPC Cray Slingshot, e thehiloeng ho thepa ea Ethernet, empa ka khetho ea ho sebelisa lihlooho tse khutšoanyane haholo. Ka lebaka leo, boleng bo phahameng bo fokotseha.

Mokhoa oa ho lekanya litsi tsa data. Tlaleho ea Yandex

Ntho e 'ngoe le e' ngoe e lokela ho bolokoa e le bonolo ka hohle kamoo ho ka khonehang, empa e se bonolo. Ho rarahana ke sera sa scalability. Mehaho e bonolo le e tloaelehileng ke metsoalle ea rona. Haeba u ka khona ho etsa sekhahla kae kae, etsa joalo. 'Me ka kakaretso, ho monate ho kenya letsoho ho thekenoloji ea marang-rang hona joale. Ho na le lintho tse ngata tse khahlisang tse etsahalang. Kea leboha.

Source: www.habr.com

Eketsa ka tlhaloso