Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Namolavola rafitra tambajotra ivom-pamokarana izahay izay mamela ny fametrahana ireo cluster computing lehibe kokoa noho ny mpizara 100 arivo miaraka amin'ny bandwidth bisection faratampony mihoatra ny iray petabyte isan-tsegondra.

Avy amin'ny tatitra nataon'i Dmitry Afanasyev dia hianatra momba ny fitsipika fototra amin'ny famolavolana vaovao ianao, ny topologie scaling, ny olana mitranga amin'izany, ny safidy amin'ny famahana azy ireo, ny endri-javatra amin'ny routing sy ny fampitomboana ny fiasan'ny fiaramanidina mandroso amin'ny fitaovana tambajotra maoderina amin'ny "fampifandraisan-davitra" topologies misy lalana ECMP marobe. Ankoatra izany, Dima niresaka fohifohy momba ny fandaminana ny fifandraisana ivelany, ny ara-batana sosona, ny cabling rafitra sy ny fomba hampitomboana bebe kokoa fahafahana.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

- Salama daholo! Dmitry Afanasyev no anarako, mpanao mari-trano ao amin'ny Yandex aho ary mamolavola tambajotra ivom-pamokarana voalohany indrindra.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Ny tantarako dia momba ny tambajotra nohavaozina amin'ny tobim-pamokarana Yandex. Evolisiona tanteraka amin'ny endrika nanananay izany, saingy misy singa vaovao ihany koa. Ity dia famelabelarana amin'ny ankapobeny satria be dia be ny fampahalalana tokony hofenoina ao anatin'ny fotoana fohy. Hanomboka amin'ny fisafidianana topologie lojika isika. Avy eo dia hisy ny topimaso momba ny fiaramanidina fanaraha-maso sy ny olana amin'ny scalability ny fiaramanidina data, ny safidy amin'ny zavatra hitranga amin'ny sehatra ara-batana, ary hojerentsika ny endri-javatra sasany amin'ireo fitaovana. Andeha isika hikasika kely ny zava-mitranga ao amin'ny foibe data miaraka amin'ny MPLS, izay noresahintsika taloha.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Noho izany, inona no Yandex amin'ny resaka entana sy serivisy? Yandex dia hyperscaler mahazatra. Raha mijery ny mpampiasa izahay, ny fangatahan'ny mpampiasa no ataonay voalohany indrindra. Ny serivisy streaming sy ny famindrana data isan-karazany ihany koa, satria manana serivisy fitahirizana ihany koa izahay. Raha akaiky kokoa ny backend, dia miseho eo ny entana sy serivisy fotodrafitrasa, toy ny fitehirizana zavatra zaraina, ny replication ny angona ary mazava ho azy, filaharana maharitra. Ny iray amin'ireo karazana enta-mavesatra lehibe dia ny MapReduce sy ny rafitra mitovy, ny fanodinana stream, ny fianarana milina, sns.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Manao ahoana ny fotodrafitrasa ambonin’izany rehetra izany? Averina indray, hyperscaler mahazatra isika, na dia mety ho akaiky kokoa amin'ny lafiny hyperscaler kely kokoa amin'ny spectrum aza. Fa manana ny toetra rehetra isika. Mampiasa fitaovana entam-barotra sy scaling marindrano izahay raha azo atao. Manana famoriam-bola feno izahay: tsy miara-miasa amin'ny milina tsirairay, racks tsirairay, fa manambatra azy ireo ho dobo lehibe misy loharano azo ovaina miaraka amin'ny serivisy fanampiny sasany mifandraika amin'ny drafitra sy ny fizarana, ary miara-miasa amin'ity dobo ity manontolo.

Noho izany dia manana ny ambaratonga manaraka isika - ny rafitra miasa amin'ny ambaratonga cluster computing. Tena zava-dehibe ny hifehezantsika tanteraka ny fitambaran'ny teknolojia ampiasaintsika. Manara-maso ny teboka farany (hosts), tambajotra ary logiciel stack izahay.

Manana foibe data lehibe maromaro any Rosia sy any ivelany izahay. Izy ireo dia miray tsikombakomba amin'ny hazondamosina izay mampiasa ny teknolojia MPLS. Ny fotodrafitrasa anatiny dia saika vita amin'ny IPv6 avokoa, saingy noho isika mila manolotra fifamoivoizana ivelany izay mbola tonga indrindra amin'ny IPv4, dia tsy maintsy mandefa ny fangatahana avy amin'ny IPv4 mankany amin'ny lohamilina eo amin'ny lohany isika, ary mandehana kely kokoa amin'ny IPv4- Internet ivelany - mba Ohatra, ho an'ny indexing.

Ny famerimberenana vitsivitsy farany amin'ny famolavolana tambajotra ivotoerana dia nampiasa topologie Clos misy sosona maromaro ary L3 ihany. Niala tao amin'ny L2 izahay kelikely lasa izay ary nisento kely. Farany, ny fotodrafitrasanay dia ahitana ohatra (server) an'hetsiny. Ny haben'ny kluster ambony indrindra taloha dia teo amin'ny mpizara 10 arivo. Izany dia noho ny fomba fiasan'ireo rafitra miasa amin'ny ambaratonga cluster, mpandrindra, fizarana loharano, sns. Koa satria nisy ny fandrosoana teo amin'ny lafiny rindrambaikon'ny fotodrafitrasa, dia eo amin'ny 100 arivo eo ho eo izao ny haben'ny kendrena ao anatin'ny cluster informatika iray, ary Manana andraikitra izahay - ny hahay hanorina orinasa tambajotra izay ahafahana manangona loharano mahomby amin'ny cluster toy izany.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Inona no tadiavintsika amin'ny tambajotran'ny ivontoerana data? Voalohany indrindra, be dia be ny bandwidth mora vidy ary zaraina mitovy. Satria ny tambajotra no hazondamosina ahafahantsika manangona loharano. Ny haben'ny kendrena vaovao dia mpizara 100 arivo eo ho eo ao anaty cluster iray.

Isika ihany koa, mazava ho azy, dia maniry fiaramanidina fanaraha-maso azo esorina sy marin-toerana, satria amin'ny fotodrafitrasa lehibe toy izany dia maro ny aretin'andoha mipoitra na dia avy amin'ny zava-mitranga kisendrasendra fotsiny aza, ary tsy tiantsika ny hahatongavan'ny fiaramanidina mifehy antsika koa. Etsy andanin’izay dia tiana ny hanamaivana ny fanjakana ao anatiny. Arakaraky ny kely kokoa ny toe-javatra, ny tsara kokoa sy milamina kokoa ny zava-drehetra, ary mora kokoa ny mamantatra.

Mazava ho azy fa mila automatique isika, satria tsy azo atao ny mitantana fotodrafitrasa toy izany amin'ny tanana, ary tsy azo atao izany nandritra ny fotoana ela. Mila fanohanana ara-pahombiazana araka izay azo atao ary fanohanana CI/CD araka izay azo omena azy.

Miaraka amin'ny haben'ny ivom-pahitalavitra sy cluster toy izany, ny asa hanohanana ny fametrahana sy ny fanitarana mitombo tsy misy fahatapahana amin'ny serivisy dia nanjary tena mafy. Raha ao amin'ny cluster misy milina arivo, angamba milina efa ho iray alina, dia mbola azo navoaka ho toy ny fandidiana iray - izany hoe, mikasa ny fanitarana ny fotodrafitrasa izahay, ary milina an'arivony no ampiana ho asa iray, dia tsy mipoitra avy hatrany tahaka izao ny fitambarana milina mirefy iray hetsy, fa aorina mandritra ny fotoana maharitra. Ary irariana ny hisian’izay efa navotsotra, ny fotodrafitrasa napetraka.

Ary fepetra iray izay nanananay sy navelanay: fanohanana ho an'ny multitenancy, izany hoe virtoaly na fizarana tambajotra. Amin'izao fotoana izao dia tsy mila manao izany amin'ny haavon'ny lamban-tambajotra isika, satria lasa any amin'ny mpampiantrano ny sharding, ary izany dia nanamora ny fanamafisam-peo ho antsika. Noho ny IPv6 sy ny habaka adiresy midadasika, dia tsy nila nampiasa adiresy dika mitovy amin'ny fotodrafitrasa anatiny izahay; efa tokana ny adiresy rehetra. Ary noho ny fanivanana sy ny fizarazarana tambajotra ho an'ny mpampiantrano, dia tsy mila mamorona sampana tambajotra virtoaly ao amin'ny tambajotran'ny data center izahay.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Ny tena zava-dehibe dia izay tsy ilaintsika. Raha azo esorina amin'ny tambajotra ny fiasa sasany, dia manamora kokoa ny fiainana izany, ary, amin'ny ankapobeny, manitatra ny safidin'ny fitaovana sy rindrambaiko misy, manao diagnostika tena tsotra.

Noho izany, inona no tsy ilaintsika, inona no nafointsika, tsy tamim-pifaliana foana tamin’ny fotoana nitrangan’izany, fa tamin’ny fanamaivanana lehibe rehefa vita ny dingana?

Voalohany indrindra, mandao ny L2. Tsy mila L2 isika, na tena izy na alaina. Tsy ampiasaina amin'ny ankapobeny noho ny fifehezana ny stack fampiharana. Ny fampiharana ataontsika dia mitsivalana mitsivalana, miasa miaraka amin'ny adiresy L3 izy ireo, tsy dia manahy loatra izy ireo fa misy ohatra iray no mivoaka, mamoaka vaovao fotsiny izy ireo, tsy mila avoaka amin'ny adiresy taloha, satria misy ambaratonga misaraka amin'ny fahitana serivisy sy fanaraha-maso ireo milina hita ao amin'ny cluster. Tsy atolotray amin'ny tambajotra izany asa izany. Ny asan'ny tambajotra dia ny manatitra fonosana manomboka amin'ny teboka A mankany amin'ny teboka B.

Tsy manana toe-javatra iasan'ny adiresy ao anatin'ny tambajotra ihany koa izahay, ary mila arahi-maso izany. Amin'ny endrika maro dia ilaina izany mba hanohanana ny fivezivezena VM. Tsy mampiasa ny fihetsehan'ny milina virtoaly izahay amin'ny fotodrafitrasa anatiny ao amin'ny Yandex lehibe, ary, ankoatra izany, mino izahay fa na dia vita aza izany, dia tsy tokony hitranga amin'ny fanohanana tambajotra izany. Raha tena mila manao izany ianao, dia mila manao izany amin'ny ambaratonga mpampiantrano, ary manosika adiresy mety hifindra any amin'ny overlay, mba tsy hikasika na hanao fanovana mavitrika be loatra amin'ny rafitra zotra amin'ny underlay mihitsy (tambajotra fitaterana). .

Ny teknolojia iray hafa tsy ampiasainay dia multicast. Raha tianao dia afaka milaza aminao amin'ny antsipiriany ny antony aho. Manamora kokoa ny fiainana izany, satria raha misy olona miatrika izany ary mijery tsara ny endrik'ilay fiaramanidina fanaraha-maso multicast, amin'ny rehetra afa-tsy ny fametrahana tsotra indrindra, dia aretin'andoha lehibe izany. Ary ankoatra izany, sarotra ny mahita fampiharana open source miasa tsara, ohatra.

Farany, mamolavola ny tambajotranay izahay mba tsy hiova be loatra. Afaka miantehitra amin'ny zava-misy fa kely ny fikorianan'ny hetsika ivelany ao amin'ny rafitra routing.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Inona no olana mipoitra ary inona no fameperana tsy maintsy raisina rehefa mamolavola tamba-jotra foibe data? Ny vidiny, mazava ho azy. Scalability, ny haavon'ny tiantsika hitombo. Ilaina ny fanitarana tsy mitsahatra ny serivisy. Bandwidth, fahafahana. Ny fahitana ny zava-mitranga amin'ny tambajotra ho an'ny rafitra fanaraha-maso, ho an'ny ekipa miasa. Fanohanana automatique - indray, araka izay azo atao, satria ny asa samihafa dia azo voavaha amin'ny ambaratonga samihafa, anisan'izany ny fampidirana sosona fanampiny. Eny, tsy [mety] miankina amin'ny mpivarotra. Na dia tamin'ny vanim-potoana ara-tantara samihafa aza, miankina amin'ny fizarana inona no jerenao, dia mora kokoa na sarotra tratrarina io fahaleovantena io. Raha maka ampahany amin'ny tsipika fitaovana tambajotra isika, dia hatramin'ny vao haingana dia tena nisy fepetra ny miresaka momba ny fahaleovan-tena amin'ny mpivarotra, raha mila chips miaraka amin'ny throughput avo lenta ihany koa isika.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Inona no topolojia lojika hampiasaintsika hananganana ny tambajotrantsika? Ity dia ho Clos misy ambaratonga maromaro. Raha ny marina, tsy misy safidy tena izy amin'izao fotoana izao. Ary ny topology Clos dia tena tsara, na dia ampitahaina amin'ny topologies mandroso isan-karazany izay bebe kokoa amin'ny sehatry ny fahalianana akademika ankehitriny, raha manana switch radix lehibe isika.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Ahoana ny fomba firafitry ny tambajotra Clos misy ambaratonga maromaro ary inona no iantsoana ireo singa samihafa ao anatiny? Voalohany indrindra, niakatra ny rivotra, mba hitodika amin'ny tenanao hoe aiza ny avaratra, aiza ny atsimo, aiza ny atsinanana, aiza ny andrefana. Ny tambajotra toy izany dia matetika ataon'ireo izay manana fifamoivoizana miankandrefana midadasika be. Raha ny sisa tavela, eo an-tampony dia misy switch virtoaly miangona avy amin'ny switch kely kokoa. Ity no hevi-dehibe amin'ny fananganana recursive ny tambajotra Clos. Maka singa misy karazana radix isika ary mampifandray azy ireo mba ho azo raisina ho toy ny switch misy radix lehibe kokoa ny zavatra azontsika. Raha mila bebe kokoa ianao, dia azo averina ny fomba fiasa.

Amin'ny tranga, ohatra, miaraka amin'ny Clos avo roa heny, rehefa azo atao ny mamantatra mazava tsara ireo singa mitsangana ao amin'ny diagrama, dia matetika izy ireo no antsoina hoe fiaramanidina. Raha manangana Clos miaraka amin'ny switch spine telo isika (izay rehetra tsy sisintany na switch ToR ary ampiasaina amin'ny fitaterana fotsiny), dia ho saro-takarina kokoa ny fiaramanidina; mitovy amin'izany ny ambaratonga roa. Antsoinay hoe bloc ToR na switch leaf ary Pod ny fihodinan'ny hazondamosina ambaratonga voalohany mifandray amin'izy ireo. Ny fihodinan'ny hazondamosina amin'ny haavon'ny hazondamosina-1 eo an-tampon'ny Pod dia ny tampon'ny Pod, ny tampon'ny Pod. Ny switch izay hita eny an-tampon'ny orinasa iray manontolo dia ny sosona ambony amin'ny orinasa, Top of fabric.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Mazava ho azy fa mipoitra ny fanontaniana: Efa ela no naorina ny tambajotra Clos; ny hevitra dia matetika avy amin'ny vanim-potoanan'ny telefaona mahazatra, tambajotra TDM. Angamba nisy zavatra tsara kokoa niseho, mety misy azo atao tsara kokoa? Eny ary tsia. Ara-teorika eny, amin'ny fampiharana tsy ho ela. Satria misy topoolojia mahaliana maromaro, ny sasany amin'izy ireo dia ampiasaina amin'ny famokarana, ohatra, ny Dragonfly dia ampiasaina amin'ny fampiharana HPC; Misy ihany koa ny topologie mahaliana toy ny Xpander, FatClique, Jellyfish. Raha mijery ny tatitra amin'ny fihaonambe toa ny SIGCOMM na NSDI vao haingana ianao dia afaka mahita asa be dia be amin'ny topologies hafa izay manana fananana tsara kokoa (iray na iray hafa) noho ny Clos.

Saingy ireo topologie rehetra ireo dia manana fananana mahaliana iray. Izy io dia manakana ny fampiharana azy ireo amin'ny tambajotra ivotoerana data, izay ezahinay atao amin'ny fitaovana entam-barotra ary mitentina vola mirary. Amin'ireo topologies hafa rehetra ireo, ny ankamaroan'ny bandwidth dia indrisy fa tsy azo idirana amin'ny lalana fohy indrindra. Noho izany, very avy hatrany ny fahafahana mampiasa ny fiaramanidina fanaraha-maso nentim-paharazana.

Ara-teorika dia fantatra ny vahaolana amin'ny olana. Ireo dia, ohatra, ny fanovana ny fanjakana rohy amin'ny alàlan'ny lalana k-fohy indrindra, saingy, indray, tsy misy protocols toy izany izay hampiharina amin'ny famokarana ary azo ampiasaina betsaka amin'ny fitaovana.

Ankoatr'izay, satria ny ankamaroan'ny fahafaha-manao dia tsy azo idirana amin'ny alàlan'ny lalana fohy indrindra, mila manova mihoatra noho ny fiaramanidina fanaraha-maso fotsiny isika mba hisafidianana ireo lalana rehetra ireo (ary raha ny marina, izany dia fanjakana lehibe kokoa amin'ny fiaramanidina fanaraha-maso). Mbola mila manova ny fiaramanidina mandroso isika, ary, raha ny fitsipika, dia mila endri-javatra fanampiny roa farafahakeliny. Izany no fahafahana mandray fanapahan-kevitra rehetra momba ny fandefasana fonosana indray mandeha, ohatra, amin'ny mpampiantrano. Raha ny marina, izany dia loharanon-dàlana, indraindray ao amin'ny literatiora momba ny tambajotram-pifandraisana dia antsoina hoe fanapahan-kevitra fandefasana rehetra. Ary ny routing adaptive dia asa ilaintsika amin'ny singa tambajotra, izay midina, ohatra, amin'ny fisafidianana ny hop manaraka mifototra amin'ny fampahalalana momba ny entana kely indrindra amin'ny filaharana. Ohatra, misy safidy hafa azo atao.

Noho izany, mahaliana ny tari-dalana, saingy, indrisy, tsy afaka mampihatra izany isika amin'izao fotoana izao.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Okay, nipetraka tamin'ny topologie lojika Clos izahay. Ahoana no handrefesantsika azy? Andeha hojerentsika ny fomba fiasa sy ny azo atao.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Ao amin'ny tambajotra Clos dia misy masontsivana roa lehibe ahafahantsika miovaova sy mahazo valiny sasantsasany: ny radix misy singa sy ny isan'ny ambaratonga ao amin'ny tambajotra. Manana kisary schematic momba ny fiantraikan'izy roa amin'ny habeny aho. Ny tsara indrindra dia atambatra izy roa.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Hita fa ny sakany farany amin'ny tambajotra Clos dia vokatry ny ambaratonga rehetra amin'ny radix atsimo, ny isan'ny rohy ananantsika, ny fomba sampana. Toy izao ny fandrefesana ny haben'ny tambajotra.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Mikasika ny fahaiza-manao, indrindra amin'ny switch ToR, dia misy safidy scaling roa. Na afaka mampiasa rohy haingana kokoa isika, raha mitazona ny topolojia ankapobeny, na afaka manampy fiaramanidina bebe kokoa.

Raha mijery ny dikan-teny miitatra amin'ny tambajotra Clos ianao (eo amin'ny zoro ambany havanana) ary miverina amin'ity sary ity miaraka amin'ny tambajotra Clos etsy ambany...

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

... dia mitovy tanteraka amin'ny topologie izany, fa amin'ity slide ity dia mirodana kokoa izy io ary mifanipaka ny fiaramanidina amin'ny orinasa. Toy izany koa.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Manao ahoana ny fampitomboana ny tambajotra Clos amin'ny isa? Eto aho dia manome angon-drakitra momba ny sakany ambony indrindra azo alaina amin'ny tamba-jotra iray, firy ny isan'ny racks, switch ToR na switch switch, raha tsy ao anaty racks izy ireo, dia azontsika miankina amin'ny radix switch ampiasainay amin'ny spine-levels, ary firy niveau ampiasainay.

Ity ny isan'ny racks azontsika ananana, ny isan'ny mpizara ary ny ohatrinona izany rehetra izany dia mety ho lanin'ny 20 kW isaky ny rack. Talohan'izay dia nilaza aho fa mikendry ny haben'ny cluster misy mpizara 100 arivo eo ho eo izahay.

Hita fa amin'ity famolavolana manontolo ity dia mahaliana ny safidy roa sy sasany. Misy safidy miaraka amin'ny tsipika roa sosona sy switch 64-port, izay latsaka kely. Avy eo dia misy safidy mety tsara ho an'ny 128-port (miaraka amin'ny radix 128) misy haavo roa, na switch miaraka amin'ny radix 32 misy ambaratonga telo. Ary amin'ny toe-javatra rehetra, izay misy radix bebe kokoa sy sosona maro, dia afaka manao tambajotra lehibe, fa raha mijery ny andrasana ny fanjifàna, matetika misy gigawatts. Azo atao ny mametraka tariby, saingy tsy dia azo atao ny mahazo herinaratra be toy izany amin'ny toerana iray. Raha mijery ny antontan'isa sy ny angon-drakitra ho an'ny daholobe momba ny foibe angona ianao, dia afaka mahita ivon-toeram-baovao vitsivitsy izay tombanana ho 150 MW mahery. Ny lehibe kokoa dia matetika tobim-pianarana data center, foibe data lehibe maromaro mifanakaiky.

Misy paramètre manan-danja iray hafa. Raha mijery ny tsanganana ankavia ianao dia voatanisa ao ny bandwidth azo ampiasaina. Mora ny mahita fa ao amin'ny tambajotra Clos dia ampahany lehibe amin'ny seranana no ampiasaina hampifandraisana ireo switch. Ny bandwidth azo ampiasaina, tady mahasoa, dia zavatra azo omena any ivelany, mankany amin'ireo mpizara. Mazava ho azy, miresaka momba ny seranan-tsambo misy fepetra aho ary indrindra momba ny tarika. Amin'ny maha-fitsipika, ny rohy ao anatin'ny tambajotra dia haingana kokoa noho ny rohy mankany amin'ny mpizara, fa isaky ny tarika bandwidth, araka izay azontsika alefa any amin'ny fitaovan'ny mpizara, dia mbola misy ihany ny bandwidth ao anatin'ny tambajotra. Ary arakaraka ny ambaratonga ataontsika no lehibe kokoa ny vidiny manokana amin'ny fanomezana an'io tsipika io ho any ivelany.

Ankoatra izany, na ity tarika fanampiny ity aza dia tsy mitovy. Na dia fohy aza ny elanelam-potoana, dia afaka mampiasa zavatra toy ny DAC (varahina mipetaka mivantana, izany hoe tariby twinax), na optika multimode, izay mitentina vola mihoampampana kokoa na latsaka. Raha vantany vao mifindra amin'ny elanelam-potoana lava kokoa isika - amin'ny ankapobeny, ireo dia optique tokana tokana, ary mitombo be ny vidin'ity bandwidth fanampiny ity.

Ary indray, miverina amin'ny slide teo aloha, raha mamorona tamba-jotra Clos tsy misy famandrihana tafahoatra, dia mora ny mijery ny kisary, jereo ny fomba nanamboarana ny tamba-jotra - manampy ny haavon'ny hazondamosina tsirairay, averinay ny takelaka manontolo izay teo amin'ny ambany. Ambaratonga fanampiny - miampy tarika iray ihany, mitovy ny isan'ny seranan-tsambo amin'ny switch toy ny teo amin'ny ambaratonga teo aloha, ary mitovy ny isan'ny transceiver. Noho izany dia tena ilaina ny manamaivana ny isan'ny haavon'ny fifindran'ny hazondamosina.

Miorina amin'ity sary ity dia mazava fa tena te hanorina zavatra toy ny switch misy radix 128 isika.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Eto, amin'ny ankapobeny, ny zava-drehetra dia mitovy amin'ny nolazaiko teo, ity dia slide hodinihina any aoriana.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Inona avy ireo safidy azontsika isafidianana ho toy izany? Vaovao mahafaly ho anay fa amin'izao fotoana izao dia azo aorina amin'ny switch-chip tokana ihany ny tambajotra toy izany. Ary tena mahafinaritra izany, manana endri-javatra mahafinaritra maro izy ireo. Saika tsy misy rafitra anatiny, ohatra, izy ireo. Midika izany fa mora vaky izy ireo. Manimba amin'ny fomba rehetra izy ireo, saingy soa ihany fa tapaka tanteraka. Ao amin'ny fitaovana modular dia misy lesoka be dia be (tena tsy mahafinaritra), rehefa avy amin'ny fomba fijerin'ny mpifanolo-bodirindrina sy ny fiaramanidina fanaraha-maso dia toa miasa, fa, ohatra, ny ampahany amin'ny lamba dia very ary tsy mandeha. amin'ny fahafaha-manao feno. Ary ny fifamoivoizana mankany aminy dia voalanjalanja mifototra amin'ny zava-misy fa miasa tanteraka izy io, ary mety ho be loatra isika.

Na, ohatra, misy olana amin'ny backplane, satria ao anatin'ny fitaovana modular dia misy ihany koa ny SerDes haingam-pandeha - tena sarotra ny anatiny. Na ny famantarana eo anelanelan'ny singa fampitaovana dia mirindra na tsy mirindra. Amin'ny ankapobeny, misy fitaovana modular mamokatra misy singa marobe, toy ny fitsipika, dia misy tambajotra Clos mitovy ao anatiny, saingy sarotra ny mamantatra. Matetika dia sarotra ho an'ny mpivarotra mihitsy aza ny mamantatra.

Ary manana toe-javatra tsy fahombiazana be dia be izy io izay manimba ny fitaovana, fa tsy miala amin'ny topologie tanteraka. Koa satria lehibe ny tambajotra misy antsika, ny fifandanjana eo amin'ny singa mitovy dia ampiasaina mavitrika, ny tambajotra dia tena tsy tapaka, izany hoe, ny lalana iray izay milamina ny zava-drehetra dia tsy misy hafa amin'ny lalana hafa, mahasoa kokoa ho antsika ny mamoy ny sasany fotsiny. ny fitaovana avy amin'ny topology noho ny hiafara amin'ny toe-javatra izay toa ny sasany miasa, fa ny sasany tsy miasa.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Ny endri-javatra mahafinaritra manaraka amin'ny fitaovana chip tokana dia ny fivoatrany tsara kokoa sy haingana kokoa. Izy ireo koa dia manana fahafahana tsara kokoa. Raha maka ireo rafitra mivondrona lehibe izay ananantsika amin'ny faribolana isika, dia saika avo roa heny noho ny an'ny fitaovana modular ny fahafaha-manao isaky ny vondrona ho an'ny seranana mitovy hafainganam-pandeha. Ny fitaovana namboarina manodidina ny puce tokana dia hita fa mora kokoa noho ny fitaovana modular ary mandany angovo kely kokoa.

Saingy, mazava ho azy, izany rehetra izany dia noho ny antony, misy ihany koa ny fatiantoka. Voalohany, ny radix dia saika kely kokoa noho ny an'ny fitaovana modular. Raha afaka mahazo fitaovana namboarina manodidina ny puce iray misy seranan-tsambo 128 isika, dia afaka mahazo iray modular misy seranan-tsambo an-jatony ankehitriny tsy misy olana.

Ity dia habe lehibe kokoa amin'ny latabatra fandefasana ary, amin'ny ankapobeny, ny zava-drehetra mifandraika amin'ny scalability fiaramanidina data. Buffers marivo. Ary, toy ny fitsipika, fa voafetra ny asany. Saingy hita fa raha fantatrao ireo fameperana ireo ary mitandrina ara-potoana mba hialana amin'izy ireo na horaisinao fotsiny, dia tsy dia mampatahotra loatra izany. Ny zava-misy fa kely kokoa ny radix dia tsy olana intsony amin'ny fitaovana misy radix 128 izay niseho vao haingana; afaka manangana hazo roa sosona isika. Saingy mbola tsy azo atao ny manorina zavatra kely kokoa noho ny roa izay mahaliana antsika. Amin'ny ambaratonga iray dia azo ny clusters kely dia kely. Na ny endrika sy ny fepetra takianay teo aloha aza dia mbola nihoatra azy ireo.

Raha ny marina, raha tampoka ny vahaolana dia any amin'ny sisin-tany, dia mbola misy fomba mizana. Koa satria ny farany (na voalohany), ny ambaratonga ambany indrindra izay mifandray amin'ny mpizara dia ny ToR switch na leaf switch, dia tsy voatery hampifandray rack iray amin'izy ireo isika. Noho izany, raha lavo eo amin'ny antsasany ny vahaolana, dia azonao atao ny mieritreritra momba ny fampiasana fotsiny ny switch misy radix lehibe amin'ny ambaratonga ambany ary mampifandray, ohatra, roa na telo racks amin'ny switch iray. Safidy ihany koa ity, manana ny vidiny, saingy miasa tsara ary mety ho vahaolana tsara rehefa mila mahatratra avo roa heny ny habeny.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Raha fintinina dia manangana topolojia misy hazondamosina roa izahay, misy sosona orinasa valo.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Inona no hitranga amin'ny fizika? Kajy tena tsotra. Raha manana hazondamosina roa ambaratonga isika, dia tsy manana afa-tsy ambaratonga telo ihany isika, ary antenainay fa hisy fizarana tariby telo ao amin'ny tambajotra: avy amin'ny mpizara mankany amin'ny switch leaf, mankany amin'ny hazondamosina 1, mankany amin'ny hazondamosina 2. Ny safidy azontsika atao Ny fampiasana dia - ireo dia twinax, multimode, fomba tokana. Ary eto isika dia mila mandinika hoe inona ny strip azo alaina, ohatrinona ny vidiny, inona ny refy ara-batana, inona ny halavany azontsika sarona, ary ahoana no hanatsarantsika.

Eo amin'ny lany dia azo alahatra ny zava-drehetra. Ny Twinaxes dia mora kokoa noho ny optika mavitrika, mora kokoa noho ny transceiver multimode, raha raisinao isaky ny sidina manomboka amin'ny farany, somary mora kokoa noho ny seranan-tsambo 100-gigabit. Ary, azafady, mariho fa latsa-danja noho ny optika fomba tokana izy io, satria amin'ny sidina izay takiana amin'ny fomba tokana, ao amin'ny foibe angon-drakitra noho ny antony maromaro dia misy dikany ny fampiasana CWDM, raha toa ka tsy dia mety loatra ny miasa amin'ny fomba tokana parallel (PSM). miaraka amin'ny, fonosana lehibe dia azo avy amin'ny fibre, ary raha mifantoka amin'ireo teknolojia ireo isika dia mahazo ny ambaratongam-bidy manaraka.

Fanamarihana iray hafa: indrisy, tsy azo atao ny mampiasa ports multimode 100 ka hatramin'ny 4x25 efa voarava. Noho ny endri-javatra famolavolana ny SFP28 transceiver, dia tsy dia mora kokoa noho ny 28 Gbit QSFP100. Ary ity disassembly ho an'ny multimode ity dia tsy mandeha tsara.

Famerana iray hafa dia noho ny haben'ny kluster informatika sy ny isan'ny mpizara dia mivadika ho lehibe ara-batana ny ivon-tsarimihetsika. Midika izany fa farafahakeliny sidina iray dia tsy maintsy atao amin'ny singlemod. Averina indray, noho ny haben'ny Pods ara-batana, dia tsy ho azo atao ny mampandeha roa twinax (tariby varahina).

Vokatr'izany, raha manatsara ny vidiny isika ary mandinika ny jeometrika amin'ity famolavolana ity, dia mahazo tsipika twinax iray, iray amin'ny multimode ary iray amin'ny singlemode mampiasa CWDM. Izany dia mihatra amin'ny lalana mety ho fanavaozana.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Toy izao ny endriny vao haingana, ho aiza ary inona no azo atao. Mazava, farafaharatsiny, ny fomba hifindra mankany amin'ny 50-Gigabit SerDes ho an'ny multimode sy singlemode. Ankoatra izany, raha mijery izay ao amin'ny transceiver tokana tokana ianao amin'izao fotoana izao sy amin'ny ho avy ho an'ny 400G, matetika na dia tonga avy amin'ny lafiny elektrika aza ny 50G SerDes, 100 Gbps isaky ny lalana dia efa afaka mankany amin'ny optika. Noho izany dia azo heverina fa raha tokony hiakatra ho 50, dia hisy ny tetezamita ho 100 Gigabit SerDes sy 100 Gbps isaky ny lalana, satria araka ny fampanantenan’ny mpivarotra maro dia andrasana tsy ho ela ny fisian’izy ireo. Ny vanim-potoana izay 50G SerDes no haingana indrindra, toa tsy ho ela loatra, satria ny dika voalohan'ny 100G SerDes dia hivoaka amin'ny taona manaraka. Ary rehefa afaka kelikely aorian'izany dia mety ho mendrika ny vola azo antoka izy ireo.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Nuance iray hafa momba ny safidin'ny fizika. Amin'ny ankapobeny, efa afaka mampiasa seranan-tsambo 400 na 200 Gigabit isika amin'ny fampiasana 50G SerDes. Saingy hita fa tsy misy dikany izany, satria, araka ny nolazaiko teo aloha, dia mila radix somary lehibe amin'ny switch isika, mazava ho azy. Tianay ny 128. Ary raha voafetra ny fahafahan'ny chip ary mampitombo ny hafainganam-pandehan'ny rohy, dia mihena ho azy ny radix, tsy misy fahagagana.

Ary azontsika atao ny mampitombo ny fahafaha-manao amin'ny fampiasana fiaramanidina, ary tsy misy vidiny manokana; afaka manampy ny isan'ny fiaramanidina. Ary raha very ny radix isika, dia tsy maintsy mampiditra ambaratonga fanampiny, ka amin'ny toe-javatra ankehitriny, miaraka amin'ny fahafaha-manao ambony indrindra isaky ny chip, dia hita fa mahomby kokoa ny fampiasana seranan-tsambo 100-gigabit, satria mamela anao izy ireo. mba hahazoana radix lehibe kokoa.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Ny fanontaniana manaraka dia ny fomba fandaminana ny fizika, fa avy amin'ny fomba fijerin'ny fotodrafitrasa cable. Hita fa somary mampihomehy ihany ny fandaminana azy. Cabling eo anelanelan'ny raviny sy ny hazondamosina ambaratonga voalohany - tsy misy rohy maro ao, ny zava-drehetra dia namboarina tsotra fotsiny. Fa raha maka fiaramanidina iray isika, ny mitranga ao anatiny dia mila mampifandray ny hazondamosina rehetra amin'ny ambaratonga voalohany amin'ny hazondamosina rehetra amin'ny ambaratonga faharoa.

Fanampin'izay, amin'ny maha-fitsipika, misy faniriana sasany momba ny tokony hijerena azy ao anatin'ny foibe data. Ohatra, tena tianay ny hanambatra ny telegrama ao anaty amboara iray ary hisintona azy ireo mba hidirana tanteraka ao anatin'ny tontonana patch iray ny tontonana paty avo lenta iray, mba tsy hisian'ny zoo amin'ny halavany. Nahavita namaha ity olana ity izahay. Raha mijery ny topologie lojika ianao amin'ny voalohany, dia ho hitanao fa mahaleo tena ny fiaramanidina, ny fiaramanidina tsirairay dia azo amboarina samirery. Saingy rehefa ampidirintsika ny fehezam-boninkazo toy izany ary te-hisintona ny tontolon'ny patch iray manontolo ho ao anaty tontonana patch, dia tsy maintsy mampifangaro fiaramanidina samihafa ao anaty fonosana iray isika ary mampiditra rafitra mpanelanelana amin'ny endrika fifandraisana cross optika mba hamerenana azy ireo amin'ny fomba nanangona azy. amin'ny fizarana iray, amin'ny fomba hanangonana azy ireo amin'ny fizarana iray hafa. Noho izany dia mahazo endri-javatra mahafinaritra isika: ny fifindran'ny sarotra rehetra dia tsy mihoatra ny racks. Rehefa mila mampifamatotra zavatra mafy dia mafy ianao, "avelao ny fiaramanidina", araka ny iantsoana azy indraindray amin'ny tambajotra Clos, dia mifikitra ao anaty vata iray izany. Tsy manana tena disassembled izahay, midina amin'ny rohy tsirairay, mifamadika eo amin'ny racks.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Toy izany ny fijery avy amin'ny fomba fijery ny lojika fandaminana ny tariby foto-drafitrasa. Ao amin'ny sary eo amin'ny ankavia, ny blocs miloko maro dia mampiseho ny blocs amin'ny sehatra voalohany amin'ny hazondamosina, valo isaky ny tsirairay, ary tariby efatra avy amin'izy ireo, izay mandeha sy mifanelanelana amin'ireo amboara avy amin'ny blocs spine-2. .

Ny efamira kely dia manondro ny fihaonan-dalana. Eo amin'ny ankavia ankavia dia misy ny fahatapahan'ny sampanan-dàlana tsirairay, ity dia 512 amin'ny 512 port cross-connect module izay mamerina ny telegrama mba hidirana tanteraka amin'ny rack iray, izay tsy misy afa-tsy fiaramanidina-2. Ary eo amin'ny ankavanana, ny scan amin'ity sary ity dia misy antsipiriany bebe kokoa mifandraika amin'ny Pods maromaro amin'ny haavon'ny hazondamosina-1, ary ny fomba fandrafetana azy amin'ny fifandraisana cross, ny fomba hahatongavana amin'ny haavon'ny hazondamosina-2.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Toy izao ny endriny. Ny hazondamosina-2 tsy mbola tafavory tanteraka (eo amin'ny ankavia) sy ny fijoroana cross-connect. Indrisy anefa fa tsy dia betsaka ny hita any. Ity rafitra iray manontolo ity dia apetraka amin'izao fotoana izao ao amin'ny iray amin'ireo ivom-pahalalana lehibe izay miitatra. Asa an-dalam-pandrosoana ity, ho tsara tarehy kokoa, hofenoina tsara kokoa.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Fanontaniana manan-danja: nisafidy ny topolojia lojika izahay ary nanangana ny fizika. Inona no hitranga amin'ny fiaramanidina mifehy? Fantatra tsara avy amin'ny traikefa miasa, misy tatitra maromaro fa tsara ny protocoles mifandray amin'ny fanjakana, mahafinaritra ny miara-miasa amin'izy ireo, saingy, indrisy, tsy mirefy tsara izy ireo amin'ny topolojia mifandray. Ary misy antony lehibe iray manakana an'izany - izany no fomba fiasan'ny tondra-drano amin'ny protocole fanjakana. Raha raisinao fotsiny ny algorithm momba ny tondra-drano ary mijery ny fomba firafitry ny tambazotrantsika dia ho hitanao fa hisy fanout lehibe be isaky ny dingana, ary hanafotra ny fiaramanidina fanaraha-maso fotsiny amin'ny fanavaozana. Amin'ny ankapobeny, ny topologies toy izany dia mifangaro tsara amin'ny algorithm tondra-drano nentim-paharazana amin'ny protocole fanjakana rohy.

Ny safidy dia ny mampiasa BGP. Ny fomba hanomanana azy araka ny tokony ho izy dia voalaza ao amin'ny RFC 7938 momba ny fampiasana BGP amin'ny foibe data lehibe. Tsotra ny hevitra fototra: isan'ny prefix kely indrindra isaky ny mpampiantrano ary amin'ny ankapobeny ny isan'ny prefix fara-fahakeliny ao amin'ny tambajotra, ampiasao ny fitambarana raha azo atao, ary esory ny fihazana lalana. Mila fitsinjarana fanavaozam-baovao tena mitandrina sy voafehy, ilay antsoina hoe tsy misy lohasaha. Tianay apetraka indray mandeha ny fanavaozana rehefa mandalo amin'ny tambajotra izy ireo. Raha avy any amin'ny farany ambany izy ireo, dia miakatra, mivelatra tsy mihoatra ny indray mandeha. Tsy tokony hisy zigzags. Tena ratsy ny zigzags.

Mba hanaovana izany dia mampiasa endrika tsotra izahay mba hampiasana ireo rafitra BGP fototra. Izany hoe, mampiasa eBGP mandeha amin'ny rohy eo an-toerana izahay, ary ny rafitra autonomous dia voatendry toy izao manaraka izao: rafitra autonomous amin'ny ToR, rafitra autonomous amin'ny blocs spine-1 manontolo amin'ny Pod iray, ary rafitra autonomous ankapobeny amin'ny Top manontolo. ny Lamba. Tsy sarotra ny mijery sy mahita fa na ny fitondran-tena mahazatra an'ny BGP aza dia manome antsika ny fizarana fanavaozana izay tadiavintsika.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Mazava ho azy, ny fampiarahana ny adiresy sy ny adiresin'ny adiresy dia tsy maintsy natao mba hifanaraka amin'ny fomba fananganana zotra, mba hiantohana ny fahamarinan'ny fiaramanidina fanaraha-maso. Ny adiresy L3 amin'ny fitaterana dia mifamatotra amin'ny topologie, satria raha tsy misy izany dia tsy azo atao ny manangana; raha tsy misy izany, ny adiresy tsirairay dia hiditra ao amin'ny rafitra zotra. Ary ny zavatra iray hafa dia ny hoe aggregation, indrisy, tsy mitambatra tsara amin'ny multi-path, satria rehefa manana multi-path isika ary manana aggregation dia tsara ny zava-drehetra, rehefa salama ny tambazotra iray manontolo dia tsy misy lesoka ao. Indrisy anefa, raha vao miseho ny tsy fahombiazana ao amin'ny tambajotra ary very ny symmetry amin'ny topologie, dia afaka tonga amin'ny toerana nanambarana ilay vondrona isika, izay tsy afaka mandeha lavitra any amin'izay tokony haleha. Noho izany, tsara kokoa ny manambatra izay tsy misy lalana maro hafa, amin'ny tranga misy antsika dia ireo switch ToR.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Raha ny marina, azo atao ny mitambatra, fa amim-pitandremana. Raha afaka manao disaggregation voafehy isika rehefa misy ny tsy fahombiazan'ny tambajotra. Saingy asa sarotra tokoa izany, nanontany tena mihitsy aza izahay raha azo atao ve ny manao izany, na azo atao ve ny manampy automatique fanampiny, ary milina fanjakana voafetra izay handika tsara ny BGP mba hahazoana ny fihetsika irina. Indrisy anefa fa tena tsy miharihary sy saro-pantarina ny fikarakarana raharaha an-joron-trano, ary tsy voavaha tsara io asa io amin'ny fametahana ireo fametahana ivelany amin'ny BGP.

Ny asa tena mahaliana momba izany dia natao tao anatin'ny rafitry ny protocol RIFT, izay horesahina amin'ny tatitra manaraka.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Ny zava-dehibe iray hafa dia ny fomba fampitomboana ny fiaramanidina data amin'ny topologie matevina, izay ananantsika lalana maro hafa. Amin'ity tranga ity dia misy rafitra data fanampiny maromaro ampiasaina: vondrona ECMP, izay mamaritra ny vondrona Next Hop.

Amin'ny tambajotra miasa mahazatra, tsy misy tsy fahombiazana, rehefa miakatra ny topology Clos dia ampy ny mampiasa vondrona iray ihany, satria ny zavatra rehetra tsy eo an-toerana dia voafaritra amin'ny alàlan'ny default, afaka miakatra isika. Rehefa avy ambony ka hatrany ambany mianatsimo isika dia tsy ECMP ny lalana rehetra fa lalana tokana. Tsara ny zava-drehetra. Ny olana dia ary ny mampiavaka ny topologie Clos mahazatra dia ny hoe raha mijery ny tampon'ny lamba isika, amin'ny singa rehetra, dia tsy misy afa-tsy lalana iray mankany amin'ny singa etsy ambany. Raha toa ka misy tsy fahombiazana eo amin'io lalana io dia lasa tsy manan-kery io singa manokana ao an-tampon'ny orinasa io ho an'ireo prefix izay ao ambadiky ny lalana tapaka. Fa ho an'ny ambiny dia manan-kery izany, ary tsy maintsy manara-maso ireo vondrona ECMP isika ary mampiditra fanjakana vaovao.

Inona no endrik'ilay scalability amin'ny fiaramanidina data amin'ny fitaovana maoderina? Raha manao LPM (famehana prefix lava indrindra) isika, dia tsara ny zava-drehetra, mihoatra ny 100k ny prefix. Raha miresaka momba ny vondrona Next Hop isika, dia ratsy kokoa ny zava-drehetra, 2-4 arivo. Raha miresaka latabatra misy famaritana ny Next Hops (na adjacencies) isika, dia eo amin'ny 16k ka hatramin'ny 64k izany. Ary mety ho lasa olana izany. Ary eto isika dia tonga amin'ny digression mahaliana: inona no nitranga tamin'ny MPLS tao amin'ny foibe data? Amin'ny ankapobeny, te-hanao izany izahay.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Zavatra roa no nitranga. Nanao fizarana micro izahay tamin'ny mpampiantrano; tsy mila manao izany intsony izahay amin'ny tambajotra. Tsy dia tsara loatra izany tamin'ny fanohanan'ny mpivarotra samihafa, ary vao mainka izany tamin'ny fampiharana misokatra amin'ny boaty fotsy misy MPLS. Ary ny MPLS, farafaharatsiny, ny fampiharana nentim-paharazana, indrisy, dia mitambatra amin'ny ECMP. Ary izay no antony.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Toy izao ny endriky ny rafitra fandefasana ECMP ho an'ny IP. Ny prefix be dia be dia afaka mampiasa vondrona iray ihany sy ny sakana Next Hops mitovy (na mifanakaiky, mety hafa ny fiantsoana azy amin'ny antontan-taratasy samihafa ho an'ny fitaovana samihafa). Ny tiana holazaina dia ity no voalaza ho seranana mivoaka ary inona no tokony hamerenana ny adiresy MAC mba hahatongavana amin'ny Next Hop marina. Ho an'ny IP dia toa tsotra daholo ny zava-drehetra, azonao atao ny mampiasa prefix be dia be ho an'ny vondrona iray ihany, ilay sakana Next Hops mitovy.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Ny maritrano MPLS mahazatra dia midika fa, miankina amin'ny interface ivelany, ny marika dia azo soratana amin'ny soatoavina samihafa. Noho izany, mila mitazona vondrona sy sakana Next Hops isika isaky ny marika fampidirana. Ary izany, indrisy, tsy mizana.

Mora ny mahita fa ao amin'ny famolavolanay dia mila switch 4000 ToR izahay, ny sakany ambony indrindra dia lalana 64 ECMP, raha miala amin'ny hazondamosina-1 mankany amin'ny hazondamosina-2 isika. Zara raha miditra amin'ny latabatra iray amin'ny vondrona ECMP isika, raha misy tovana iray miaraka amin'ny ToR miala, ary tsy miditra amin'ny tabilao Next Hops mihitsy.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Tsy misy antenaina izany rehetra izany, satria ny maritrano toy ny Segment Routing dia misy marika manerantany. Amin'ny fomba ofisialy, azo atao ny mirodana indray ireo sakana Next Hops rehetra ireo. Mba hanaovana izany dia mila fandidiana karazana karatra wild ianao: maka marika ary avereno soratana amin'ilay iray tsy misy sanda manokana. Saingy indrisy fa tsy dia misy izany amin'ny fampiharana azo ampiasaina.

Ary farany, mila mitondra fifamoivoizana ivelany mankany amin'ny foibe data isika. Ahoana no hanaovana izany? Teo aloha, nampidirina tao amin'ny tambajotra Clos avy any ambony ny fifamoivoizana. Izany hoe, nisy router sisiny izay mifandray amin'ny fitaovana rehetra eo an-tampon'ny lamba. Ity vahaolana ity dia miasa tsara amin'ny habe kely ka hatramin'ny antonony. Indrisy anefa, mba handefasana fifamoivoizana symmetrically amin'ny tambajotra manontolo amin'izany fomba izany, dia mila tonga amin'ny singa Top rehetra amin'ny lamba miaraka isika, ary rehefa misy mihoatra ny zato amin'izy ireo dia hita fa mila radix lehibe ihany koa isika. ny edge routers. Amin'ny ankapobeny, mandany vola izany, satria ny router sisiny dia miasa kokoa, ny seranana amin'izy ireo dia ho lafo kokoa, ary ny famolavolana dia tsy dia tsara loatra.

Safidy iray hafa ny manomboka ny fifamoivoizana toy izany avy any ambany. Mora ny manamarina fa ny topologie Clos dia naorina amin'ny fomba izay ahafahan'ny fifamoivoizana avy any ambany, izany hoe, avy amin'ny lafiny ToR, dia zaraina mitovy amin'ny ambaratonga manerana ny tampon'ny lamba amin'ny iterations roa, mameno ny tambajotra manontolo. Noho izany, manolotra karazana Pod manokana izahay, Edge Pod, izay manome fifandraisana ivelany.

Misy safidy iray hafa. Izany no ataon'ny Facebook, ohatra. Antsoin'izy ireo hoe Fabric Aggregator na HGRID. Ampidirina ny haavon'ny hazondamosina fanampiny mba hampifandraisana ivon-toerana maromaro. Ity famolavolana ity dia azo atao raha tsy manana fiasa fanampiny na fanovana encapsulation amin'ny interface. Raha teboka fikasihana fanampiny izy ireo dia sarotra izany. Amin'ny ankapobeny dia misy fiasa bebe kokoa sy karazana membrane manasaraka ny faritra samihafa amin'ny foibe data. Tsy misy dikany ny manao fonon-tanana toy izany ho lehibe, fa raha tena ilaina izany noho ny antony iray, dia misy dikany ny mandinika ny mety hanesorana azy, manao azy malalaka araka izay azo atao ary mamindra izany amin'ny mpampiantrano. Manao izany, ohatra, ny mpandraharaha rahona maro. Manana overlay izy ireo, manomboka amin'ny mpampiantrano.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Inona avy ireo fahafaha-manao fampandrosoana hitantsika? Voalohany indrindra, fanatsarana ny fanohanana ny fantsona CI/CD. Te-hanidina amin'ny fomba fitsapana sy fitsapana ny fomba sidinay izahay. Tsy mandeha tsara izany, satria lehibe ny fotodrafitrasa ary tsy azo atao ny mandika izany amin'ny fitsapana. Mila mahatakatra ny fomba fampidirana singa fitsapana ao amin'ny fotodrafitrasa famokarana ianao nefa tsy manary azy.

Ny fitaovana tsara kokoa sy ny fanaraha-maso tsara kokoa dia saika tsy ilaina. Ny fanontaniana rehetra dia ny fifandanjana amin'ny ezaka sy ny fiverenana. Raha azonao atao ny manampy azy amin'ny ezaka mitombina, tena tsara.

Sokafy ny rafitra miasa ho an'ny fitaovana tambajotra. Ny protocols tsara kokoa sy ny rafitra fitaterana tsara kokoa, toy ny RIFT. Ilaina ihany koa ny fikarohana amin'ny fampiasana tetika mifehy ny fitohanana tsara kokoa ary angamba ny fampidirana, farafaharatsiny amin'ny lafiny sasany, ny fanohanan'ny RDMA ao anatin'ny cluster.

Raha mijery ny ho avy isika dia mila topologie avo lenta ary mety ho tambajotra izay mampiasa ambony kokoa. Amin'ireo zavatra vaovao, vao haingana no nisy ny famoahana momba ny teknolojian'ny lamba ho an'ny HPC Cray Slingshot, izay mifototra amin'ny Ethernet entana, saingy misy safidy amin'ny fampiasana lohapejy fohy kokoa. Vokatr'izany dia mihena ny overhead.

Ahoana ny fandrefesana ny foibe data. Yandex tatitra

Tokony hatao tsotra araka izay azo atao ny zava-drehetra, fa tsy tsotra kokoa. Ny fahasarotana dia fahavalon'ny scalability. Ny fahatsorana sy ny rafitra ara-dalàna no namantsika. Raha afaka manao scaling any amin'ny toerana iray ianao dia ataovy izany. Ary amin'ny ankapobeny, mahafinaritra ny mandray anjara amin'ny teknolojian'ny tambajotra ankehitriny. Betsaka ny zavatra mahaliana mitranga. Misaotra anao.

Source: www.habr.com

Add a comment