د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

موږ د ډیټا سنټر شبکې ډیزاین رامینځته کړی چې د 100 زره سرورونو څخه لوی کمپیوټري کلسترونو ځای په ځای کولو ته اجازه ورکوي چې په یوه ثانیه کې له یو پیټابایټ څخه ډیر د لوړ دوه اړخیز بینډ ویت سره.

د دیمیتري افاناسیف له راپور څخه تاسو به د نوي ډیزاین د اساساتو اصولو په اړه زده کړئ، د توپولوژی اندازه کول، هغه ستونزې چې له دې سره رامینځته کیږي، د حل کولو اختیارونه، د عصري شبکې وسیلو د لیږدونکي الوتکې د روټینګ او اندازه کولو ځانګړتیاوې په "کثافت سره تړل شوي" کې. ټوپولوژی د ECMP لوی شمیر لارو سره. سربیره پردې، دیما په لنډه توګه د بهرني ارتباط تنظیم، فزیکي پرت، د کیبل کولو سیسټم او د ظرفیت لوړولو لارو چارو په اړه خبرې وکړې.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

- ماسپښین ټولو ته ښه راغلاست! زما نوم دیمیتري افاناسیف دی، زه په Yandex کې د شبکې معمار یم او په اصل کې د ډیټا مرکز شبکې ډیزاین کوم.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

زما کیسه به د Yandex ډیټا مرکزونو تازه شوي شبکې په اړه وي. دا د ډیزاین خورا ډیر پرمختګ دی چې موږ یې درلود، مګر په ورته وخت کې ځینې نوي عناصر شتون لري. دا یو عمومي پریزنټشن دی ځکه چې دلته ډیر معلومات شتون لري چې په لږ وخت کې پیکل شي. موږ به د منطقي ټوپولوژي په غوره کولو سره پیل وکړو. بیا به د کنټرول الوتکې عمومي کتنه وي او د ډیټا الوتکې توزیع کولو سره ستونزې وي ، د هغه انتخاب چې په فزیکي کچه به څه پیښ شي ، او موږ به د وسیلو ځینې ځانګړتیاوې وګورو. راځئ چې د MPLS سره د ډیټا مرکز کې څه پیښیږي په اړه لږ څه اړیکه ونیسو ، کوم چې موږ یو څه دمخه په اړه خبرې وکړې.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

نو، د بارونو او خدماتو شرایطو کې Yandex څه شی دی؟ Yandex یو عادي هایپرسکلر دی. که موږ کاروونکو ته وګورو، موږ په ابتدايي توګه د کاروونکو غوښتنې پروسس کوو. همدارنګه مختلف سټیمینګ خدمات او د ډیټا لیږد ، ځکه چې موږ د ذخیره کولو خدمات هم لرو. که شاته پای ته نږدې وي ، نو د زیربنا بار او خدمات هلته څرګندیږي ، لکه د توزیع شوي توکي ذخیره کول ، د معلوماتو نقل کول او البته ، دوامداره کتارونه. د کاري بارونو یو له اصلي ډولونو څخه دی MapReduce او ورته سیسټمونه، د جریان پروسس کول، د ماشین زده کړه، او نور.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

زیربنا څنګه ده چې په سر کې دا ټول پیښیږي؟ یوځل بیا ، موږ یو ښکلی عادي هایپرسکلر یو ، که څه هم موږ شاید د سپیکٹرم لږ هایپرسکلر اړخ ته یو څه نږدې یو. مګر موږ ټول ځانګړتیاوې لرو. موږ هرچیرې چې امکان ولري د اجناسو هارډویر او افقی پیمانه کاروو. موږ د سرچینو بشپړ کول لرو: موږ د انفرادي ماشینونو ، انفرادي ریکونو سره کار نه کوو ، مګر دوی د تبادلې وړ سرچینو لوی حوض کې د ځینې اضافي خدماتو سره یوځای کوو چې د پلان کولو او تخصیص سره معامله کوي ، او د دې ټول حوض سره کار کوي.

نو موږ بله کچه لرو - د کمپیوټري کلستر په کچه عملیاتي سیسټم. دا خورا مهمه ده چې موږ د ټیکنالوژۍ سټیک په بشپړ ډول کنټرول کړو چې موږ یې کاروو. موږ پای ټکي (میزبان)، شبکه او د سافټویر سټیک کنټرول کوو.

موږ په روسیه او بهر کې ډیری لوی ډیټا مرکزونه لرو. دوی د ملا له خوا متحد دي چې د MPLS ټیکنالوژي کاروي. زموږ داخلي زیربنا تقریبا په بشپړ ډول په IPv6 کې جوړه شوې ده، مګر له دې امله چې موږ اړتیا لرو چې بهرني ټرافیک ته خدمت وکړو چې لاهم په عمده توګه د IPv4 څخه راځي، موږ باید په یو ډول د IPv4 څخه د فرنټ انډ سرورونو ته غوښتنې وړاندې کړو، او یو څه نور بهرني IPv4 ته لاړ شو - انټرنیټ - لپاره د بیلګې په توګه، د لیست کولو لپاره.

د ډیټا سنټر شبکې ډیزاینونو وروستي څو تکرارونه د څو پرت Clos توپولوژی کارولي او یوازې L3 دي. موږ یو څه موده دمخه L2 پریښود او د آرام ساه مو واخیسته. په نهایت کې ، زموږ زیربنا کې په سلګونو زره کمپیوټري (سرور) مثالونه شامل دي. د کلستر اعظمي اندازه څه موده دمخه شاوخوا 10 زره سرورونه وه. دا په لویه کچه د دې له امله دی چې څنګه ورته ورته کلستر په کچه عملیاتي سیسټمونه، مهالویشونکي، د سرچینو تخصیص او نور کار کولی شي. له هغه وخته چې د زیربنا سافټویر په اړخ کې پرمختګ شوی، د هدف اندازه اوس په یوه کمپیوټري کلستر کې شاوخوا 100 زره سرورونه دي، او موږ دنده لرو - د دې وړتیا ولرو چې د شبکې فابریکې رامینځته کړو چې په داسې کلستر کې د مؤثره سرچینو راټولولو ته اجازه ورکړي.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

موږ د معلوماتو مرکز شبکې څخه څه غواړو؟ له هرڅه دمخه ، دلته خورا ارزانه او عادلانه توزیع شوي بینډ ویت شتون لري. ځکه چې شبکه هغه ملا ده چې له لارې یې موږ کولی شو سرچینې راټول کړو. د نوي هدف اندازه په یوه کلستر کې شاوخوا 100 زره سرورونه دي.

البته موږ هم د توزیع وړ او باثباته کنټرول الوتکه غواړو ، ځکه چې په دومره لوی زیربنا کې ډیری سر دردونه حتی د تصادفي پیښو څخه رامینځته کیږي ، او موږ نه غواړو د کنټرول الوتکه موږ ته هم سر دردونه راوړي. په ورته وخت کې، موږ غواړو چې په دې کې دولت کم کړو. څومره چې حالت کوچنی وي، هومره ښه او باثباته هرڅه کار کوي، او تشخیص یې اسانه وي.

البته، موږ اتومات ته اړتیا لرو، ځکه چې دا ناشونې ده چې دا ډول زیربنا په لاسي ډول اداره شي، او دا د یو څه وخت لپاره ناممکن و. موږ د امکان تر حده عملیاتي ملاتړ او د CI/CD ملاتړ ته اړتیا لرو تر هغه حده چې دا چمتو کیدی شي.

د ډیټا مرکزونو او کلسترونو دا ډول اندازې سره، د خدماتو مداخلې پرته د زیاتیدونکي ګمارنې او پراختیا مالتړ کولو دنده خورا ګړندۍ شوې. که چیرې د زرو ماشینونو په کلسترونو کې، شاید د لسو زرو ماشینونو سره نږدې وي، دوی لاهم د یو عملیات په توګه پلي کیدی شي - دا دی، موږ د زیربنا پراختیا پالن کوو، او څو زره ماشینونه د یو عملیات په توګه اضافه شوي، بیا د سل زره ماشینونو د اندازې کلستر په سمدستي توګه نه رامینځته کیږي، دا د وخت په اوږدو کې جوړیږي. او دا د پام وړ ده چې دا ټول هغه څه چې دمخه پمپ شوي ، هغه زیربناوې چې ګمارل شوي باید شتون ولري.

او یوه اړتیا چې موږ درلوده او پریښودل: د ملټيټیننسی ملاتړ، دا دی، مجازی کول یا د شبکې ویشل. اوس موږ اړتیا نلرو دا د شبکې فابریک په کچه ترسره کړو ، ځکه چې شارډینګ کوربه ته تللی ، او دې زموږ لپاره اندازه کول خورا اسانه کړي دي. د IPv6 او د لوی پته ځای څخه مننه، موږ په داخلي زیربنا کې د نقل پتې کارولو ته اړتیا نه درلوده؛ ټول پته لا دمخه ځانګړې وه. او د دې حقیقت څخه مننه چې موږ کوربه ته د فلټر کولو او د شبکې قطع کول په لاره اچولي دي ، موږ اړتیا نلرو د ډیټا سینټر شبکې کې کوم مجازی شبکې ادارې رامینځته کړو.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

یو خورا مهم شی هغه څه دي چې موږ ورته اړتیا نه لرو. که چیرې ځینې دندې د شبکې څخه لیرې شي، دا ژوند خورا اسانه کوي، او د یوې قاعدې په توګه، د شته تجهیزاتو او سافټویر انتخاب پراخوي، تشخیص خورا ساده کوي.

نو، هغه څه دي چې موږ ورته اړتیا نلرو، موږ څه توان لرو چې پریږدو، نه تل په خوښۍ سره د هغه وخت په وخت کې چې دا پیښیږي، مګر کله چې پروسه بشپړه شي د لوی راحت سره؟

لومړی، د L2 پریښودل. موږ L2 ته اړتیا نلرو ، نه ریښتیني او نه تقلید. نه کارول شوي په لویه کچه د دې حقیقت له امله چې موږ د غوښتنلیک سټیک کنټرول کوو. زموږ غوښتنلیکونه په افقی ډول د توزیع وړ دي، دوی د L3 پته سره کار کوي، دوی ډیر اندیښمن نه دي چې ځینې انفرادي مثالونه بهر شوي، دوی په ساده ډول یو نوی راوباسي، دا اړتیا نلري چې په زاړه پته کې ودرول شي، ځکه چې دلته شتون لري. په کلستر کې د ماشینونو د کشف او څارنې جلا کچه. موږ دا دنده شبکې ته نه سپارو. د شبکې دنده دا ده چې پاکټونه له A نقطې B نقطې ته ورسوي.

موږ داسې شرایط هم نلرو چې پتې په شبکه کې حرکت وکړي، او دا باید وڅیړل شي. په ډیری ډیزاینونو کې دا معمولا د VM خوځښت ملاتړ کولو ته اړتیا لري. موږ د لوی Yandex داخلي زیربنا کې د مجازی ماشینونو خوځښت نه کاروو، او سربیره پردې، موږ باور لرو چې حتی که دا ترسره شي، دا باید د شبکې مالتړ سره پیښ نشي. که تاسو واقعیا دا کولو ته اړتیا لرئ ، نو تاسو اړتیا لرئ دا د کوربه په کچه ترسره کړئ ، او پتې فشار ورکړئ چې کولی شي په پوښونو کې مهاجر شي ، نو د دې لپاره چې پخپله د زیرمې روټینګ سیسټم کې ډیر متحرک بدلونونه لمس یا رامینځته نشي (د ټرانسپورټ شبکه) .

بله ټیکنالوژي چې موږ یې نه کاروو ملټي کاسټ دی. که تاسو غواړئ، زه کولی شم تاسو ته په تفصیل سره ووایم چې ولې. دا ژوند خورا اسانه کوي ، ځکه چې که یو څوک ورسره معامله وکړي او دقیقا هغه څه وګوري چې د ملټي کاسټ کنټرول الوتکه ورته ښکاري ، مګر په ساده تاسیساتو کې ، دا یو لوی سر درد دی. او نور څه دي، د مثال په توګه د خلاصې سرچینې پلي کولو ښه فعالیت موندل ګران دي.

په پای کې، موږ خپلې شبکې ډیزاین کوو ترڅو دوی ډیر بدلون ونه کړي. موږ کولی شو په دې حقیقت باندې حساب وکړو چې د روټینګ سیسټم کې د بهرنیو پیښو جریان کوچنی دی.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

کومې ستونزې رامینځته کیږي او کوم محدودیتونه باید په پام کې ونیول شي کله چې موږ د ډیټا مرکز شبکه رامینځته کوو؟ لګښت، البته. توزیع کول، هغه کچه چې موږ غواړو وده وکړو. د خدمت بندولو پرته پراخولو ته اړتیا. بانډ ویت، شتون. د نظارت سیسټمونو لپاره په شبکه کې د عملیاتي ټیمونو لپاره د هغه څه لید لید. د اتوماتیک ملاتړ - بیا ، څومره چې امکان ولري ، ځکه چې مختلف دندې په مختلف کچو حل کیدی شي ، پشمول د اضافي پرتونو معرفي کول. ښه، نه [احتمالي] په پلورونکو پورې تړاو لري. که څه هم په مختلفو تاریخي دورو کې، د دې پورې اړه لري چې تاسو کومې برخې ته ګورئ، دا خپلواکي ترلاسه کول اسانه یا ډیر ستونزمن وو. که موږ د شبکې وسیلې چپس کراس برخه واخلو ، نو تر دې وروستیو پورې دا خورا مشروط و چې د پلورونکو څخه د خپلواکۍ په اړه وغږیږو ، که موږ هم د لوړې کچې سره چپس غواړو.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

موږ به د خپلې شبکې د جوړولو لپاره کوم منطقي ټوپولوژي وکاروو؟ دا به د څو سطحې Clos وي. په حقیقت کې، اوس مهال هیڅ ریښتیني بدیلونه شتون نلري. او د Clos ټوپولوژي خورا ښه ده، حتی کله چې د مختلفو پرمختللو ټوپولوژیو په پرتله چې اوس د اکادمیک ګټو په ساحه کې ډیر دي، که موږ لوی ریډیکس سویچونه ولرو.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

د ملټي لیول Clos شبکه څه ډول جوړښت لري او مختلف عناصر په کې څه ویل کیږي؟ تر ټولو لومړی، باد راپورته شو، ترڅو خپل ځان متوجه کړي چې شمال چیرته دی، سویل چیرته دی، ختیځ چیرته دی، لویدیځ چیرته دی. د دې ډول شبکې معمولا د هغو کسانو لخوا رامینځته کیږي چې لوی لوی لویدیز ختیځ ترافیک لري. لکه څنګه چې د پاتې عناصرو لپاره، په پورتنۍ برخه کې یو مجازی سویچ دی چې د کوچنیو سویچونو څخه راټول شوی. دا د Clos شبکو د تکراري جوړښت اصلي نظر دی. موږ عناصر د یو ډول ریډیکس سره اخلو او دوی سره وصل کوو ترڅو هغه څه چې موږ ترلاسه کوو د لوی ریډیکس سره د سویچ په توګه وګڼل شي. که تاسو نور اړتیا ته اړتیا لرئ، پروسیجر بیا تکرار کیدی شي.

په قضیو کې، د بیلګې په توګه، د دوه سطحې Clos سره، کله چې دا ممکنه وي چې په واضح ډول هغه برخې وپیژني چې زما په ډیاګرام کې عمودي وي، دوی معمولا د الوتکو په نوم یادیږي. که موږ د نخاعي سویچونو د دریو کچو سره Clos جوړ کړو (چې ټول یې حد یا د ToR سویچونه ندي او یوازې د لیږد لپاره کارول کیږي) ، نو الوتکې به خورا پیچلې ښکاري؛ دوه سطحې ورته ورته ښکاري. موږ د ToR یا د پاڼی سویچونو بلاک او د دوی سره تړلی د لومړۍ درجې نخاع سویچونو ته پوډ وایو. د Pod په سر کې د نخاعي -1 کچې د نخاع سویچونه د پوډ پورتنۍ برخه ده، د پوډ پورتنۍ برخه. هغه سویچونه چې د ټولې فابریکې په پورتنۍ برخه کې موقعیت لري د فابریکې پورتنۍ طبقه ده ، د ټوکر ټاپ.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

البته، پوښتنه راپورته کیږي: د Clos شبکې د یو څه وخت لپاره رامینځته شوي؛ نظر پخپله عموما د کلاسیک تلیفوني ، TDM شبکو له وخت څخه راځي. شاید یو څه ښه څرګند شوی وي، شاید یو څه ښه ترسره شي؟ هو او نه. په نظري توګه هو، په عمل کې په نږدې راتلونکي کې یقینا نه. ځکه چې دلته یو شمیر په زړه پورې ټوپولوژي شتون لري، ځینې یې حتی په تولید کې کارول کیږي، د بیلګې په توګه، ډریګن فلای د HPC غوښتنلیکونو کې کارول کیږي؛ دلته په زړه پورې ټوپولوژي هم شتون لري لکه Xpander، FatClique، Jellyfish. که تاسو په دې وروستیو کې د SIGCOMM یا NSDI په څیر کنفرانسونو کې راپورونه وګورئ، تاسو کولی شئ د بدیل ټوپولوژیو په اړه خورا لوی شمیر کارونه ومومئ چې د Clos په پرتله غوره ملکیتونه (یو یا بل) لري.

مګر دا ټول ټوپولوژي یو په زړه پورې ملکیت لري. دا د ډیټا سنټر شبکې کې د دوی پلي کولو مخه نیسي ، کوم چې موږ هڅه کوو د اجناسو هارډویر جوړ کړو او کوم چې خورا مناسب پیسې لګښت لري. په دې ټولو بدیل ټوپولوژیو کې، ډیری بینډ ویت له بده مرغه د لنډو لارو له لارې د لاسرسي وړ ندي. له همدې امله، موږ سمدلاسه د دودیز کنټرول الوتکې کارولو فرصت له لاسه ورکوو.

په نظرياتي توګه، د ستونزې د حل لاره معلومه ده. دا د مثال په توګه د k-shortest لارې په کارولو سره د لینک حالت تعدیلات دي، مګر، بیا، هیڅ داسې پروتوکول شتون نلري چې په تولید کې پلي شي او په تجهیزاتو کې په پراخه کچه شتون ولري.

سربیره پردې، ځکه چې ډیری ظرفیت د لنډو لارو له لارې د لاسرسي وړ ندي، موږ اړتیا لرو چې یوازې د کنټرول الوتکې څخه ډیر څه بدل کړو ترڅو دا ټولې لارې غوره کړو (او په هرصورت، دا د کنټرول الوتکې کې د پام وړ ډیر حالت دی). موږ لاهم اړتیا لرو چې د لیږدونکي الوتکې ترمیم کړو، او د یوې قاعدې په توګه، لږترلږه دوه اضافي ځانګړتیاو ته اړتیا ده. دا د دې وړتیا ده چې د بسته بندۍ په اړه ټولې پریکړې یو ځل ترسره کړي، د بیلګې په توګه، په کوربه کې. په حقیقت کې، دا د سرچینې لاره ده، ځینې وختونه د ارتباطي شبکو په ادبياتو کې دې ته په یو وخت کې د لیږد پریکړې ویل کیږي. او تطابق روټینګ یو فنکشن دی چې موږ یې د شبکې عناصرو ته اړتیا لرو، کوم چې د بیلګې په توګه، د دې حقیقت لپاره چې موږ په قطار کې د لږترلږه بار په اړه د معلوماتو پراساس راتلونکی هپ غوره کوو. د مثال په توګه، نور انتخابونه ممکن دي.

په دې توګه، سمت په زړه پورې دی، مګر، افسوس، موږ نشو کولی دا اوس پلي کړو.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

ښه، موږ د Clos منطقي ټوپولوژي کې میشته شو. موږ به یې څنګه اندازه کړو؟ راځئ وګورو چې دا څنګه کار کوي او څه شی کیدی شي.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

په Clos شبکه کې دوه اصلي پیرامیټونه شتون لري چې موږ کولی شو یو څه توپیر وکړو او ځینې پایلې ترلاسه کړو: د عناصرو ریډیکس او په شبکه کې د کچو شمیر. زه یو سکیماتیک ډیاګرام لرم چې څنګه دواړه په اندازې اغیزه کوي. په مثالي توګه، موږ دواړه یوځای کوو.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

دا لیدل کیدی شي چې د Clos شبکې وروستی عرض د سویلي ریډیکس د نخاعي سویچونو د ټولو کچو محصول دی، موږ څومره لینکونه لرو، دا څنګه څانګې لري. دا څنګه موږ د شبکې اندازه اندازه کوو.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

د ظرفیت په اړه، په ځانګړې توګه د TOR سویچونو کې، د اندازه کولو دوه اختیارونه شتون لري. یا موږ کولی شو، د عمومي ټاپوولوژي ساتلو په وخت کې، چټک لینکونه وکاروو، یا موږ کولی شو نور الوتکې اضافه کړو.

که تاسو د Clos شبکې پراخه شوې نسخه وګورئ (په ښکته ښیې کونج کې) او لاندې د Clos شبکې سره دې عکس ته راستون شئ ...

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

... بیا دا په سمه توګه ورته ټوپولوژي ده، مګر په دې سلایډ کې دا په ډیر پیچلي توګه نسکوره شوې او د فابریکې الوتکې یو بل باندې سپر شوي دي. همداسې ده.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

د Clos شبکې اندازه کول په شمیرو کې څه ډول ښکاري؟ دلته زه د دې په اړه معلومات وړاندې کوم چې د شبکې څومره پراخوالی ترلاسه کیدی شي، د ریکونو اعظمي شمیره، د ToR سویچونو یا لیف سویچونو، که دوی په ریکونو کې نه وي، موږ کولی شو د سویچونو ریډیکس پورې اړه ولرو چې موږ د نخاعي کچې لپاره کاروو، او موږ څومره کچې کاروو.

دلته دا دي چې موږ څومره ریکونه لرو، څومره سرورونه او نږدې څومره چې دا ټول د 20 kW په هر ریک کې مصرف کولی شي. یو څه دمخه ما یادونه وکړه چې موږ د شاوخوا 100 زره سرورونو کلستر اندازې لپاره هدف یو.

دا لیدل کیدی شي چې په دې ټول ډیزاین کې، دوه نیم انتخابونه په زړه پورې دي. دلته یو اختیار شتون لري د دوه پرتونو نخاعو او 64-پورټ سویچونو سره ، کوم چې یو څه لنډ راځي. بیا د 128 پورټ (د ریډیکس 128 سره) د نخاعي سویچونو لپاره د دوه کچو سره سم مناسب انتخابونه شتون لري ، یا د ریډیکس 32 سره د دریو کچو سره سویچونه. او په ټولو قضیو کې ، چیرې چې ډیر ریډیکسونه او ډیر پرتونه شتون لري ، تاسو کولی شئ خورا لوی شبکه رامینځته کړئ ، مګر که تاسو تمه شوي مصرف ته ګورئ ، معمولا ګیګاواټونه شتون لري. دا ممکنه ده چې کیبل واچول شي، مګر موږ امکان نه لرو چې په یوه سایټ کې دومره بریښنا ترلاسه کړو. که تاسو د ډیټا مرکزونو احصایې او عامه معلوماتو ته ګورئ ، تاسو کولی شئ ډیر لږ ډیټا مرکزونه ومومئ چې اټکل شوي ظرفیت له 150 میګاواټو څخه ډیر وي. لوی یې معمولا د ډیټا مرکز کیمپسونه دي ، ډیری لوی ډیټا مرکزونه یو بل ته نږدې موقعیت لري.

یو بل مهم پیرامیټر شتون لري. که تاسو کیڼ کالم ته وګورئ، د کار وړ بینډ ویت هلته لیست شوی. دا په اسانۍ سره لیدل کیږي چې د Clos شبکې کې د بندرونو یوه مهمه برخه د یو بل سره د سویچونو د نښلولو لپاره کارول کیږي. د کار وړ بینډ ویت، یو ګټور پټه، هغه څه دي چې د سرورونو په لور، بهر ورکول کیدی شي. په طبیعي توګه، زه د مشروط بندرونو او په ځانګړې توګه د بډ په اړه خبرې کوم. د یوې قاعدې په توګه، په شبکه کې لینکونه د سرورونو په لور د اړیکو په پرتله ګړندي دي، مګر د بینډ ویت په هر واحد کې، څومره چې موږ کولی شو دا زموږ د سرور تجهیزاتو ته واستوو، په شبکه کې لاهم یو څه بینډ ویت شتون لري. او هرڅومره چې موږ جوړ کړو ، په بهر کې د دې پټې چمتو کولو ځانګړي لګښت خورا لوی دی.

سربیره پردې ، حتی دا اضافي بینډ په بشپړ ډول ورته ندي. پداسې حال کې چې سپانونه لنډ دي، موږ کولی شو د DAC په څیر یو څه وکاروو (مستقیم مسو، دا د Twinax کیبلونه)، یا ملټي موډ اپټیکس، چې حتی ډیر یا لږ مناسب پیسې لګښت لري. هرڅومره ژر چې موږ اوږدې مودې ته ځو - د یوې قاعدې په توګه ، دا د واحد موډ آپټیکس دي ، او د دې اضافي بینډ ویت لګښت د پام وړ لوړیږي.

او یوځل بیا ، مخکیني سلایډ ته بیرته راګرځو ، که موږ د څارنې پرته د Clos شبکه جوړه کړو ، نو دا اسانه ده چې ډیاګرام وګورئ ، وګورئ چې شبکه څنګه جوړه شوې - د هرې کچې د نخاعي سویچونو اضافه کول ، موږ ټوله پټه تکرار کوو چې لاندې پلس کچه - جمع ورته بانډ، په سویچونو کې د بندرونو ورته شمیر لکه څنګه چې په پخوانۍ کچه کې وو، او ورته شمیر لیږدونکي. له همدې امله، دا خورا مطلوب دی چې د نخاعي سویچونو کچه کمه کړي.

د دې عکس پراساس ، دا روښانه ده چې موږ واقعیا غواړو د 128 ریډیکس سره سویچ په څیر یو څه جوړ کړو.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

دلته، په اصولو کې، هرڅه د هغه څه په څیر دي چې ما یوازې وویل؛ دا وروسته د غور لپاره یو سلایډ دی.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

کوم اختیارونه شتون لري چې موږ کولی شو د ورته سویچونو په توګه غوره کړو؟ دا زموږ لپاره خورا خوندور خبر دی چې اوس دا ډول شبکې په پای کې په واحد چپ سویچونو کې رامینځته کیدی شي. او دا خورا ښه دی، دوی ډیرې ښې ځانګړتیاوې لري. د مثال په توګه، دوی تقریبا هیڅ داخلي جوړښت نلري. دا پدې مانا ده چې دوی په اسانۍ سره ماتوي. دوی په هر ډول ډول ماتوي، مګر خوشبختانه دوی په بشپړه توګه ماتوي. په ماډلر وسیلو کې ډیری نیمګړتیاوې شتون لري (ډیر ناخوښه)، کله چې د ګاونډیو او د کنټرول الوتکې له نظره داسې ښکاري چې کار کوي، مګر، د بیلګې په توګه، د ټوکر یوه برخه ورکه شوې او دا کار نه کوي. په بشپړ ظرفیت. او دې ته ترافیک د دې حقیقت پراساس متوازن دی چې دا په بشپړ ډول فعال دی ، او موږ کولی شو ډیر بار ولرو.

یا، د بیلګې په توګه، د شاتنۍ الوتکې سره ستونزې رامنځته کیږي، ځکه چې د ماډلر وسیلې دننه هم د تیز سرعت سرډونه شتون لري - دا واقعیا دننه پیچلې ده. یا د فارورډ کولو عناصرو ترمینځ نښې همغږي شوي یا همغږي شوي ندي. په عموم کې، هر تولیدي ماډلر وسیله چې ډیری عناصر لري، د قاعدې په توګه، په خپل ځان کې ورته Clos شبکه لري، مګر دا تشخیص کول خورا ستونزمن دي. ډیری وختونه دا ستونزمن وي چې حتی د پلورونکي پخپله تشخیص وکړي.

او دا د ناکامۍ لوی شمیر سناریوګانې لري په کوم کې چې وسیله تخریب کیږي ، مګر په بشپړ ډول د ټوپولوژي څخه نه راوتلی. څرنګه چې زموږ شبکه لویه ده، د ورته عناصرو ترمنځ توازن په فعاله توګه کارول کیږي، شبکه خورا منظمه ده، دا دا ده چې یوه لاره چې هر څه په ترتیب سره وي د بلې لارې څخه توپیر نلري، دا زموږ لپاره خورا ګټور دی چې یوازې یو څه له لاسه ورکړو. د ټوپولوژي څخه وسایل په داسې حالت کې پای ته رسیږي چیرې چې ځینې یې کار کوي، مګر ځینې یې نه کوي.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

د واحد چپ وسیلو راتلونکی ښه ځانګړتیا دا ده چې دوی ښه او ګړندي وده کوي. دوی هم د ښه ظرفیت درلودونکي دي. که موږ لوی راټول شوي جوړښتونه واخلو چې موږ یې په دایره کې لرو، نو د ورته سرعت بندرونو لپاره د هر ریک واحد ظرفیت د ماډلر وسیلو په پرتله نږدې دوه چنده ښه دی. د یو واحد چپ شاوخوا جوړ شوي وسایل د ماډلرونو په پرتله د پام وړ ارزانه دي او لږ انرژي مصرفوي.

مګر، البته، دا ټول د یو دلیل لپاره دي، زیانونه هم شتون لري. لومړی، ریډیکس تقریبا تل د ماډلر وسیلو په پرتله کوچنی وي. که موږ وکولی شو د 128 بندرونو سره شاوخوا یو چپ جوړ شوی وسیله ترلاسه کړو ، نو موږ کولی شو پرته له کومې ستونزې پرته د څو سوو بندرونو سره ماډلر ترلاسه کړو.

دا د پام وړ کوچنۍ اندازې د فارورډ کولو میزونو او د یوې قاعدې په توګه، د ډیټا الوتکې اندازه کولو پورې اړوند هرڅه دي. کم بفرونه. او، د یوې قاعدې په توګه، د فعالیت محدودیت. مګر دا معلومه شوه چې که تاسو دا محدودیتونه پیژنئ او په وخت سره یې د مخنیوي لپاره پاملرنه وکړئ یا په ساده ډول یې په پام کې ونیسئ ، نو دا دومره ویره نلري. دا حقیقت چې ریډیکس کوچنی دی نور د 128 ریډیکس سره په وسیلو کې کومه ستونزه نده چې په پای کې پدې وروستیو کې څرګند شوي؛ موږ کولی شو د نخاع په دوه پرتونو کې جوړ کړو. مګر دا لاهم ناممکن ده چې له دوه څخه کوچني څه رامینځته کړئ چې زموږ لپاره په زړه پوري وي. د یوې کچې سره، خورا کوچني کلسترونه ترلاسه کیږي. حتی زموږ پخوانۍ ډیزاینونه او اړتیاوې لاهم له دوی څخه زیاتې وې.

په حقیقت کې، که ناڅاپه حل په کوم ځای کې وي، د اندازې کولو لپاره لاهم لاره شتون لري. له وروستي (یا لومړی) راهیسې ، ترټولو ټیټه کچه چیرې چې سرورونه وصل دي د ToR سویچونه یا پاڼي سویچونه دي ، موږ اړتیا نلرو چې یو ریک له دوی سره وصل کړو. له همدې امله ، که حل شاوخوا نیمایي ته راټیټ شي ، تاسو کولی شئ په ټیټه کچه د لوی ریډیکس سره د سویچ کارولو او وصل کولو په اړه فکر وکړئ ، د مثال په توګه ، دوه یا درې ریکونه په یوه سویچ کې. دا یو اختیار هم دی، دا خپل لګښتونه لري، مګر دا خورا ښه کار کوي او یو ښه حل کیدی شي کله چې تاسو اړتیا لرئ شاوخوا دوه ځله اندازې ته ورسیږئ.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

د لنډیز کولو لپاره، موږ د اتو فابریکو پرتونو سره، د دوو کچو د نخاعو سره د ټوپولوژي جوړوو.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

په فزیک کې به څه پیښ شي؟ خورا ساده محاسبه. که موږ د نخاع دوه درجې ولرو، نو موږ یوازې د درې کچې سویچونه لرو، او موږ تمه لرو چې په شبکه کې به د کیبل درې برخې وي: له سرور څخه د پاڼی سویچ ته، د نخاع 1، نخاع 2 ته. هغه اختیارونه چې موږ یې کولی شو. کارول دي - دا twinax، multimode، single mode دي. او دلته موږ باید په پام کې ونیسو چې کومه پټه شتون لري، دا به څومره لګښت ولري، فزیکي اړخونه څه دي، کوم ډولونه چې موږ یې پوښلی شو، او موږ به څنګه لوړ کړو.

د لګښت په شرایطو کې، هرڅه په قطار کې کیدی شي. Twinaxes د فعال آپټیکس په پرتله خورا ارزانه دي ، د ملټي موډ ټرانسیسیورونو څخه ارزانه دي ، که تاسو دا د پای څخه هره الوتنه واخلئ ، د 100 ګیګابایټ سویچ پورټ څخه یو څه ارزانه. او، مهرباني وکړئ په یاد ولرئ، دا د واحد موډ آپټیکس څخه لږ لګښت لري، ځکه چې په الوتنو کې چیرې چې واحد موډ ته اړتیا وي، د ډیټا مرکزونو کې د یو شمیر دلیلونو لپاره د CWDM کارول معنی لري، پداسې حال کې چې موازي واحد حالت (PSM) د کار کولو لپاره خورا مناسب نه دی. سره، خورا لوی پیکونه فایبر ترلاسه کوي، او که موږ په دې ټیکنالوژیو تمرکز وکړو، موږ نږدې د لاندې قیمت درجه بندي ترلاسه کوو.

یو بل یادونه: له بده مرغه، دا خورا ممکنه نه ده چې له 100 څخه تر 4x25 ملټي موډ بندرونو څخه جلا کړئ. د SFP28 ټرانسیسیورونو ډیزاین ځانګړتیاو له امله، دا د 28 Gbit QSFP100 څخه ډیر ارزانه ندي. او دا د ملټي موډ لپاره بې ځایه کول خورا ښه کار نه کوي.

بل محدودیت دا دی چې د کمپیوټري کلسترونو اندازې او د سرورونو شمیر له امله، زموږ د معلوماتو مرکزونه په فزیکي توګه لوی دي. دا پدې مانا ده چې لږترلږه یو الوتنه باید د واحد موډ سره ترسره شي. یوځل بیا ، د پوډونو فزیکي اندازې له امله ، دا به امکان ونلري چې د ټوینیکس دوه سپانونه (د مسو کیبلونه) پرمخ بوځي.

د پایلې په توګه، که موږ د قیمت لپاره غوره کړو او د دې ډیزاین جیومیټري په پام کې ونیسو، موږ د CWDM په کارولو سره د ټوینیکس یو سپان، د ملټي موډ یو span او یو واحد موډ ترلاسه کوو. دا د ممکنه نوي کولو لارې په پام کې نیسي.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

دا هغه څه دي چې په دې وروستیو کې ښکاري، موږ چیرته روان یو او څه امکان لري. دا روښانه ده، لږترلږه، د ملټي موډ او واحد موډ دواړو لپاره د 50-ګیګابایټ سیرډس په لور څنګه حرکت کول. سربیره پردې ، که تاسو وګورئ چې اوس او په راتلونکي کې د 400G لپاره په واحد حالت کې څه دي ، ډیری وختونه حتی کله چې 50G SerDes د بریښنایی اړخ څخه راځي ، په هر لین کې 100 Gbps دمخه آپټیکس ته ځي. له همدې امله ، دا خورا امکان لري چې 50 ته د تللو پرځای ، د 100 ګیګابایټ SerDes او 100 Gbps په هر لین کې لیږد وي ، ځکه چې د ډیری پلورونکو ژمنو سره سم ، د دوی شتون ډیر ژر تمه کیږي. هغه دوره چې د 50G SerDes ترټولو ګړندۍ وه، داسې بریښي چې ډیر اوږد نه وي، ځکه چې د 100G SerDes لومړنۍ کاپي نږدې راتلونکي کال کې خپریږي. او د یو څه وخت وروسته وروسته دوی به شاید د مناسبو پیسو ارزښت ولري.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

د فزیک انتخاب په اړه یو بل مهم ټکی. په اصل کې، موږ کولی شو دمخه د 400 یا 200 ګیګابایټ بندرونه د 50G SerDes په کارولو سره وکاروو. مګر دا معلومه شوه چې دا ډیر معنی نلري، ځکه چې لکه څنګه چې ما مخکې وویل، موږ په سویچونو کې یو کافي لوی ریډیکس غواړو، البته، په دلیل کې. موږ غواړو 128. او که موږ محدود چپ ظرفیت ولرو او موږ د لینک سرعت زیات کړو، نو ریډیکس په طبیعي توګه کمیږي، هیڅ معجزه شتون نلري.

او موږ کولی شو د الوتکو په کارولو سره ټول ظرفیت لوړ کړو، او هیڅ ځانګړي لګښت نلري؛ موږ کولی شو د الوتکو شمیر اضافه کړو. او که موږ ریډیکس له لاسه ورکړو ، نو موږ به اضافي کچه معرفي کړو ، نو په اوسني وضعیت کې ، په هر چپ اوسني اعظمي موجود ظرفیت سره ، دا معلومه شوه چې دا د 100 ګیګابایټ بندرونو کارول خورا مؤثر دي ، ځکه چې دوی تاسو ته اجازه درکوي. د لوی ریډیکس ترلاسه کولو لپاره.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

بله پوښتنه دا ده چې فزیک څنګه تنظیم شوی، مګر د کیبل زیربنا له نظره. دا معلومه شوه چې دا په زړه پورې ډول تنظیم شوی. د پاڼی سویچونو او د لومړۍ درجې نخاعو ترمنځ کیبل کول - دلته ډیری لینکونه شتون نلري، هرڅه په نسبتا ساده ډول جوړ شوي. مګر که موږ یوه الوتکه واخلو ، نو دننه څه پیښیږي هغه دا دي چې موږ اړتیا لرو د لومړۍ درجې ټولې نخاعې د دوهمې درجې ټولو ریښو سره وصل کړو.

برسیره پردې، د یوې قاعدې په توګه، د دې لپاره ځینې هیلې شتون لري چې دا باید د ډیټا مرکز دننه وګوري. د مثال په توګه، موږ واقعیا غوښتل چې کیبلونه په بنډل کې سره یوځای کړو او دوی یې راوباسئ ترڅو یو د لوړ کثافت پیچ پینل په بشپړ ډول یو پیچ پینل ته لاړ شي، نو د اوږدوالي له مخې هیڅ ژوبڼ شتون نلري. موږ دا ستونزه حل کړه. که تاسو په پیل کې منطقي ټوپولوژي وګورئ، تاسو کولی شئ وګورئ چې الوتکې خپلواکې دي، هره الوتکه په خپله جوړه کیدی شي. مګر کله چې موږ دا ډول بنډل اضافه کړو او غواړو چې ټول پیچ پینل په پیچ پینل کې راوباسئ، موږ باید مختلف الوتکې د یو بنډل دننه مخلوط کړو او د نظری کراس اتصالاتو په بڼه یو منځنی جوړښت معرفي کړو ترڅو دوی بیرته راټول کړي. په یوه برخه کې، په بله برخه کې به دوی څنګه راټول شي. د دې څخه مننه، موږ یو ښه ځانګړتیا ترلاسه کوو: ټول پیچلي سویچنګ د ریکونو څخه بهر نه ځي. کله چې تاسو اړتیا لرئ یو څه په کلکه سره وصل کړئ ، "الوتکې خلاص کړئ" لکه څنګه چې ځینې وختونه د کلوس شبکې کې ویل کیږي ، دا ټول په یوه ریک کې متمرکز کیږي. موږ په لوړه کچه جلا شوي نه یو، د انفرادي لینکونو لاندې، د ریکونو ترمنځ بدلول.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

دا د کیبل زیربنا د منطقي تنظیم له نظره دا څنګه ښکاري. په ښي خوا کې په انځور کې، څو رنګه بلاکونه د لومړي درجې د نخاعي سویچونو بلاکونه انځوروي، هر یو اته ټوټې، او د کیبلونو څلور بنډلونه چې له دوی څخه راځي، چې د نخاع - 2 سویچونو بلاکونو څخه راځي د بنډلونو سره تیریږي. .

کوچنۍ چوکۍ تقاطع په ګوته کوي. په پورتنۍ ښي خوا کې د ورته هر تقاطع ماتول دی، دا په حقیقت کې د 512 په واسطه د 512 پورټ کراس کنیک ماډل دی چې کیبلونه بیا ډکوي ترڅو دوی په بشپړ ډول په یوه ریک کې راشي، چیرې چې یوازې یو سپین - 2 الوتکه شتون لري. او په ښي خوا کې ، د دې عکس سکین د نخاع - 1 کچې کې د څو پوډونو په اړه یو څه نور تفصیل لري ، او دا څنګه په کراس کنیک کې بسته شوي ، دا څنګه د نخاع -2 کچې ته راځي.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

دا هغه څه دي چې داسې ښکاري. لا تر اوسه په بشپړه توګه نه دی راټول شوی سپین - 2 سټینډ (کیڼ اړخ ته) او د کراس سره وصل موقف. له بده مرغه، هلته د لیدلو لپاره ډیر څه شتون نلري. دا ټول جوړښت همدا اوس زموږ په یو لوی ډیټا مرکزونو کې ځای په ځای شوی چې پراخیږي. دا یو کار په پرمختګ کې دی، دا به ښه ښکاري، دا به ښه ډک شي.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

یوه مهمه پوښتنه: موږ منطقي ټوپولوژي غوره کړه او فزیک مو جوړ کړ. د کنټرول الوتکې به څه وي؟ دا د عملیاتي تجربې څخه خورا ښه پیژندل شوی، یو شمیر راپورونه شتون لري چې د دولتي پروتوکولونو لینکونه ښه دي، دا د خوښۍ خبره ده چې د دوی سره کار وکړي، مګر، له بده مرغه، دوی په یوه کثافاتو سره تړل شوي ټوپولوژي کې ښه اندازه نه کوي. او یو اصلي فاکتور شتون لري چې د دې مخه نیسي - دا څنګه د لینک ریاست پروتوکولونو کې سیلاب کار کوي. که تاسو یوازې د سیلاب الګوریتم واخلئ او وګورئ چې زموږ شبکه څنګه جوړښت لري، تاسو کولی شئ وګورئ چې په هر ګام کې به خورا لوی فینوټ وي، او دا به په ساده ډول د کنټرول الوتکه د تازه معلوماتو سره سیلاب کړي. په ځانګړې توګه، دا ډول ټوپولوژي د لینک ریاست پروتوکولونو کې د دودیز سیلاب الګوریتم سره خورا خراب مخلوط کوي.

انتخاب د BGP کارول دي. دا څنګه په سمه توګه چمتو کول په RFC 7938 کې د لوی ډیټا مرکزونو کې د BGP کارولو په اړه تشریح شوي. بنسټیز نظرونه ساده دي: په هر کوربه کې لږ تر لږه د مخکیني شمیره او په عمومي توګه په شبکه کې د مخکینیو شمیر لږ تر لږه، د امکان په صورت کې د راټولولو څخه کار واخلئ، او د لارې ښکار فشار کړئ. موږ د تازه معلوماتو خورا محتاط ، خورا کنټرول شوي توزیع غواړو ، هغه څه ته چې ویلی وړیا ویل کیږي. موږ غواړو چې تازه معلومات په سمه توګه یوځل ځای په ځای شي کله چې دوی د شبکې له لارې تیریږي. که دوی په ښکته کې پیل شي، دوی پورته ځي، له یو ځل څخه زیات نه ښکاره کیږي. باید هیڅ zigzags نه وي. Zigzags ډیر بد دي.

د دې کولو لپاره، موږ یو ډیزاین کاروو چې د BGP اصلي میکانیزمونو کارولو لپاره خورا ساده وي. دا دی، موږ eBGP کاروو چې په سیمه ایز لینک کې روان دي، او خودمختاره سیسټمونه په لاندې ډول ګمارل شوي دي: په ToR کې یو خودمختاره سیسټم، د یو پوډ د نخاع - 1 سویچونو په ټول بلاک کې یو خپلواکه سیسټم، او په ټول سر کې یو عمومي خودمختاره سیسټم. د ټوکر. دا ستونزمنه نده چې وګورئ او وګورئ چې حتی د BGP نورمال چلند موږ ته د تازه معلوماتو توزیع راکوي چې موږ یې غواړو.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

په طبيعي توګه، د پتې او پتې راټولول باید داسې ډیزاین شي چې دا د جوړ شوي لارې سره مطابقت ولري، ترڅو دا د کنټرول الوتکې ثبات یقیني کړي. په ټرانسپورټ کې د L3 پته د ټوپولوژي سره تړلې ده، ځکه چې له دې پرته دا ناشونې ده چې راټول شي؛ پرته له دې، انفرادي پتې به د روټینګ سیسټم ته ځي. او بله خبره دا ده چې مجموعه، له بده مرغه، د کثیر لارې سره ډیر ښه نه مخلوط کیږي، ځکه چې کله موږ څو لارې ولرو او جمعیت ولرو، هرڅه سم دي، کله چې ټوله شبکه صحي وي، هیڅ ناکامي شتون نلري. له بده مرغه، هرڅومره ژر چې په شبکه کې ناکامۍ څرګندې شي او د ټوپولوژي همغږي له لاسه ورکړي، موږ کولی شو هغه ځای ته ورسیږو چې یونټ اعلان شوی و، له هغه ځایه موږ نشو کولی نور هغه ځای ته لاړ شو چې موږ ورته اړتیا لرو. نو ځکه، دا غوره ده چې راټول کړئ چیرې چې نور څو اړخیزه لاره شتون نلري، زموږ په قضیه کې دا د ToR سویچونه دي.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

په حقیقت کې، دا ممکنه ده چې راټول شي، مګر په احتیاط سره. که موږ وکولی شو کنټرول شوي توپیر ترسره کړو کله چې د شبکې ناکامي پیښیږي. مګر دا خورا ستونزمن کار دی ، موږ حتی حیران یو چې ایا دا به امکان ولري چې دا کار وکړي ، ایا دا ممکنه وه چې اضافي اتومات اضافه کړئ ، او محدود دولتي ماشینونه چې د مطلوب چلند ترلاسه کولو لپاره به BGP په سمه توګه وغورځوي. له بده مرغه، د کونج قضیو پروسس کول خورا غیر څرګند او پیچلي دي، او دا کار د BGP سره د بهرنیو ضمیمو ضمیمه کولو سره ښه نه حل کیږي.

پدې برخه کې خورا په زړه پوري کار د RIFT پروتوکول په چوکاټ کې ترسره شوی ، چې په راتلونکي راپور کې به یې بحث وشي.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

بله مهمه خبره دا ده چې څنګه د ډیټا الوتکې په کثافاتو کې پیمانه کوي، چیرې چې موږ ډیری بدیل لارې لرو. پدې حالت کې، ډیری اضافي ډیټا جوړښتونه کارول کیږي: د ECMP ګروپونه، کوم چې په پایله کې د Next Hop ګروپونه تشریح کوي.

په نورمال ډول کار کولو شبکه کې، پرته له ناکامۍ، کله چې موږ د Clos Topology پورته کوو، دا یوازې د یوې ډلې کارولو لپاره کافي ده، ځکه چې هر څه چې محلي نه وي د ډیفالټ لخوا تشریح شوي، موږ کولی شو پورته لاړ شو. کله چې موږ له پورته څخه ښکته سویل ته ځو، نو ټولې لارې ECMP نه دي، دوی د واحد لارې لارې دي. هر څه سم دي. ستونزه دا ده، او د کلاسیک کلوس ټوپولوژي ځانګړتیا دا ده چې که موږ د ټوکر ټاپ ته وګورو، په هر عنصر کې، لاندې هر عنصر ته یوازې یوه لاره شتون لري. که د دې لارې په اوږدو کې ناکامۍ رامینځته شي، نو د فابریکې په پورتنۍ برخه کې دا ځانګړی عنصر د هغه مخکینیو لپاره چې د مات شوي لارې شاته پروت دی په سمه توګه غلط کیږي. مګر د پاتې لپاره دا معتبر دی، او موږ باید د ECMP ګروپونه تجزیه کړو او یو نوی دولت معرفي کړو.

په عصري وسایلو کې د ډیټا الوتکې اندازه کول څه ډول ښکاري؟ که موږ LPM ترسره کړو (تر ټولو اوږد مخکینۍ لوبه)، هرڅه خورا ښه دي، له 100k څخه ډیر مخکیني. که موږ د Next Hop ګروپونو په اړه وغږیږو، نو بیا هرڅه خراب دي، 2-4 زره. که موږ د یو میز په اړه وغږیږو چې د Next Hops (یا نږدې والیتونو) توضیحات لري، نو دا د 16k څخه تر 64k پورې دی. او دا کیدای شي یوه ستونزه شي. او دلته موږ په زړه پورې تحلیل ته راځو: د ډیټا مرکزونو کې MPLS ته څه پیښ شوي؟ په اصل کې، موږ غوښتل چې دا ترسره کړو.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

دوه شیان پیښ شول. موږ په کوربه توب مایکرو سیګمینټیشن ترسره کړ؛ موږ نور اړتیا نلرو چې دا په شبکه کې ترسره کړو. دا د مختلف پلورونکو ملاتړ سره خورا ښه نه و ، او حتی د MPLS سره په سپینو بکسونو کې د خلاص پلي کولو سره. او MPLS، لږترلږه د هغې دودیز تطبیقونه، له بده مرغه، د ECMP سره خورا کمزوري ترکیب کوي. او له همدې امله.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

دا هغه څه دي چې د IP لپاره د ECMP فارورډینګ جوړښت داسې ښکاري. لوی شمیر مختګونه کولی شي ورته ګروپ او ورته Next Hops بلاک وکاروي (یا نږدې ځایونه ، دا ممکن د مختلف وسیلو لپاره په مختلف اسنادو کې په مختلف ډول ویل کیږي). نقطه دا ده چې دا د وتلو بندر په توګه بیان شوی او د سم راتلونکي هپ ته د رسیدو لپاره د MAC پته څه لیکل کیږي. د IP لپاره هرڅه ساده ښکاري ، تاسو کولی شئ د ورته ګروپ لپاره خورا لوی شمیر مخکینۍ وکاروئ ، ورته Next Hops بلاک.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

د کلاسیک MPLS جوړښت پدې معنی دی چې د وتلو انٹرفیس پورې اړه لري ، لیبل مختلف ارزښتونو ته بیا لیکل کیدی شي. له همدې امله، موږ اړتیا لرو چې د هر ان پټ لیبل لپاره یوه ډله او یو بل هپس بلاک وساتو. او دا، افسوس، اندازه نه کوي.

دا په اسانۍ سره لیدل کیږي چې زموږ په ډیزاین کې موږ شاوخوا 4000 ToR سویچونو ته اړتیا درلوده، اعظمي پلنوالی 64 ECMP لارې وې، که موږ د نخاع -1 څخه د نخاع -2 په لور حرکت وکړو. موږ په سختۍ سره د ECMP ګروپونو یو جدول ته ورسیږو، که چیرې د ToR سره یوازې یو مخکینۍ لاړ شي، او موږ په هیڅ ډول د راتلونکي هپس جدول ته نه رسیږو.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

دا ټول نا امید نه دي، ځکه چې د سیګمینټ روټینګ په څیر جوړښتونه نړیوال لیبلونه شاملوي. په رسمی توګه، دا به ممکنه وي چې دا ټول راتلونکی هپس بلاکونه بیا سقوط وکړي. د دې کولو لپاره، تاسو د وحشي کارت ډول عملیاتو ته اړتیا لرئ: یو لیبل واخلئ او د ځانګړي ارزښت پرته ورته ورته بیا ولیکئ. مګر له بده مرغه، دا په موجوده تطبیقونو کې خورا شتون نلري.

او په نهایت کې ، موږ اړتیا لرو د ډیټا مرکز ته بهرني ترافیک راوړو. دا څنګه وکړو؟ مخکې، ټرافيک له پورته څخه د Clos شبکې ته معرفي شوی و. دا دی، د څنډې روټرونه وو چې د ټوکر په پورتنۍ برخه کې ټولو وسیلو سره وصل شوي. دا حل په کوچنیو او منځنیو اندازو کې خورا ښه کار کوي. له بده مرغه، په دې توګه ټولې شبکې ته د ټرافیک په سمه توګه لیږلو لپاره، موږ باید په ورته وخت کې د ټاپ فابریک ټولو عناصرو ته ورسیږو، او کله چې له سلو څخه ډیر وي، نو دا معلومه شوه چې موږ هم یو لوی ته اړتیا لرو. radix on the edge routers. په عموم کې، دا پیسې مصرفوي، ځکه چې د څنډې روټرونه ډیر فعال دي، په دوی کې بندرونه به ډیر ګران وي، او ډیزاین خورا ښکلی نه وي.

بله لاره دا ده چې دا ډول ترافیک له لاندې څخه پیل کړئ. دا تصدیق کول اسانه دي چې د Clos ټوپولوژي په داسې ډول جوړه شوې چې ترافیک له لاندې څخه راځي ، دا د ToR اړخ څخه دی ، په مساوي ډول په دوه تکرارونو کې د ټول فابریک د ټاپ ټول سطحو په کچه ویشل کیږي ، ټوله شبکه پورته کوي. له همدې امله، موږ یو ځانګړی ډول پوډ، ایج پوډ معرفي کوو، کوم چې بهرنی ارتباط چمتو کوي.

یو بل اختیار هم شتون لري. دا هغه څه دي چې فیسبوک یې کوي، د بیلګې په توګه. دوی ورته د فیبریک ایگریګیټر یا HGRID په نوم یادوي. د ډیری ډیټا مرکزونو سره وصل کولو لپاره د نخاع اضافي کچه معرفي کیږي. دا ډیزاین ممکنه ده که چیرې موږ په انٹرفیسونو کې اضافي دندې یا د کیپسولیشن بدلونونه ونه لرو. که دوی اضافي ټچ ټکي وي، دا ستونزمنه ده. په عموم ډول، د معلوماتو د مرکز مختلفې برخې جلا کول ډیر فعالیتونه او یو ډول غشا شتون لري. د دې ډول غشا لوی جوړول هیڅ معنی نلري ، مګر که چیرې واقعیا د کوم دلیل لپاره اړتیا وي ، نو دا معنی لري چې د لیرې کولو امکان یې په پام کې ونیول شي ، د امکان تر حده پراخه کول او کوربه ته یې لیږدول. دا ترسره کیږي، د بیلګې په توګه، د ډیری کلاوډ آپریټرانو لخوا. دوی پوښونه لري، دوی د کوربه څخه پیل کوي.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

موږ د پرمختګ کوم فرصتونه ګورو؟ تر ټولو لومړی، د CI/CD پایپ لاین لپاره د ملاتړ ښه کول. موږ غواړو په هغه لاره الوتنه وکړو چې موږ یې ازموینه کوو او هغه لاره چې موږ پرواز کوو. دا خورا ښه کار نه کوي، ځکه چې زیربنا لویه ده او د ازموینو لپاره یې نقل کول ناممکن دي. تاسو اړتیا لرئ پوه شئ چې څنګه د تولید زیربنا ته د ازموینې عناصر معرفي کول پرته له دې چې پریږدي.

غوره وسیلې او غوره څارنه تقریبا هیڅکله بې ځایه نه وي. ټوله پوښتنه د هڅو او راستنیدو توازن دی. که تاسو کولی شئ دا د معقول هڅو سره اضافه کړئ، ډیر ښه.

د شبکې وسیلو لپاره عملیاتي سیسټمونه خلاص کړئ. غوره پروتوکولونه او غوره روټینګ سیسټمونه، لکه RIFT. څیړنې ته هم اړتیا ده چې د ګنجشن کنټرول غوره سکیمونو څخه کار واخلي او شاید په کلستر کې د RDMA مالتړ لږ تر لږه په ځینو ټکو کې معرفي شي.

راتلونکي ته په کتلو سره، موږ پرمختللو ټوپولوژیو او احتمالي شبکو ته اړتیا لرو چې لږ سرې کاروي. د تازه شیانو څخه ، پدې وروستیو کې د HPC کری سلینګ شاټ لپاره د پارچه ټیکنالوژۍ په اړه خپرونې شتون لري ، کوم چې د اجناسو ایترنیټ پراساس دی ، مګر د خورا لنډ سرلیکونو کارولو اختیار سره. د پایلې په توګه، سر ټیټ شوی.

د معلوماتو مرکزونو اندازه کولو څرنګوالی. د Yandex راپور

هر څه باید د امکان تر حده ساده وساتل شي، مګر ساده نه. پیچلتیا د توزیع کولو دښمن دی. سادگي او منظم جوړښتونه زموږ ملګري دي. که تاسو په کوم ځای کې اندازه کولی شئ، دا وکړئ. او په عموم کې ، دا خورا ښه دی چې اوس د شبکې ټیکنالوژیو کې دخیل اوسئ. ډیر په زړه پوری شیان روان دي. له تاسو مننه.

سرچینه: www.habr.com

Add a comment