د ناورین مقاومت لرونکی بادل: دا څنګه کار کوي

اې حبره!

د نوي کال رخصتیو وروسته، موږ د دوو سایټونو پر بنسټ د ناورین پروف کلاوډ بیا پیل کړ. نن ورځ موږ به تاسو ته ووایو چې دا څنګه کار کوي او وښایه چې د پیرودونکي مجازی ماشینونو سره څه پیښیږي کله چې د کلستر انفرادي عناصر ناکام شي او ټول سایټ خراب شي (سپویلر - هرڅه د دوی سره سم دي).

د ناورین مقاومت لرونکی بادل: دا څنګه کار کوي
په OST سایټ کې د ناورین په وړاندې مقاومت لرونکي بادل ذخیره کولو سیسټم.

دننه څه دي

د هوډ لاندې، کلستر د VMware ESXi هایپروایسر سره د Cisco UCS سرورونه لري، دوه INFINIDAT InfiniBox F2240 ذخیره کولو سیسټمونه، د سیسکو Nexus شبکې تجهیزات، او همدارنګه د بروکاډ SAN سویچونه. کلستر په دوه سایټونو ویشل شوی - OST او NORD، د بیلګې په توګه هر ډیټا مرکز د تجهیزاتو ورته سیټ لري. په حقیقت کې، دا هغه څه دي چې د ناورین په وړاندې مقاومت کوي.

په یوه سایټ کې، اصلي عناصر هم نقل شوي دي (میزبان، SAN سویچونه، شبکه کول).
دواړه سایټونه د وقف شوي فایبر آپټیک لارو لخوا وصل شوي ، هم خوندي دي.

د ذخیره کولو سیسټمونو په اړه یو څو خبرې. موږ په NetApp کې د ناورین پروف کلاوډ لومړۍ نسخه جوړه کړه. دلته موږ INFINIDAT غوره کړ، او دلته یې ولې:

  • د فعال - فعال نقل کولو اختیار. دا مجازی ماشین ته اجازه ورکوي چې فعال پاتې شي حتی که د ذخیره کولو سیسټمونو څخه یو په بشپړ ډول ناکام شي. زه به تاسو ته وروسته د نقل په اړه نور معلومات درکړم.
  • د سیسټم غلطی زغم زیاتولو لپاره درې ډیسک کنټرولرونه. معمولا دوه شتون لري.
  • چمتو حل. موږ یو دمخه راټول شوی ریک ترلاسه کړ چې یوازې د شبکې سره وصل او تنظیم کولو ته اړتیا لري.
  • د پاملرنې تخنیکي ملاتړ. د INFINIDAT انجنیران په دوامداره توګه د ذخیره کولو سیسټم لاګونه او پیښې تحلیلوي، د نوي فرم ویئر نسخې نصبوي، او د ترتیب سره مرسته کوي.

دلته د پیک کولو څخه ځینې عکسونه دي:

د ناورین مقاومت لرونکی بادل: دا څنګه کار کوي

د ناورین مقاومت لرونکی بادل: دا څنګه کار کوي

دا څنګه کار کوي؟

بادل لا دمخه په خپل ځان کې د خطا زغمونکی دی. دا پیرودونکي د واحد هارډویر او سافټویر ناکامیو څخه ساتي. د ناورین په وړاندې مقاومت به په یوه سایټ کې د لویو ناکامیو په وړاندې ساتنه کې مرسته وکړي: د بیلګې په توګه، د ذخیره کولو سیسټم ناکامي (یا د SDS کلستر، چې ډیری وختونه پیښیږي 🙂)، د ذخیره کولو شبکه کې لویې غلطۍ، او داسې نور. ښه، او تر ټولو مهم: دا ډول بادل خوندي کوي کله چې د اور، بلیک آوټ، برید کونکي نیولو، یا د اجنبی لینډینګ له امله ټوله سایټ د لاسرسي وړ نه وي.

پدې ټولو قضیو کې ، د پیرودونکي مجازی ماشینونه کار ته دوام ورکوي ، او دلته یې ولې.

د کلستر ډیزاین ډیزاین شوی ترڅو د مراجعینو مجازی ماشینونو سره هر ESXi کوربه کولی شي د دوو ذخیره کولو سیسټمونو څخه هر یو ته لاسرسی ومومي. که په OST سایټ کې د ذخیره کولو سیسټم ناکام شي، مجازی ماشینونه به کار ته دوام ورکړي: هغه کوربه چې دوی یې پرمخ وړي د معلوماتو لپاره به د NORD ذخیره کولو سیسټم ته لاسرسی ومومي.

د ناورین مقاومت لرونکی بادل: دا څنګه کار کوي
دا هغه څه دي چې په کلستر کې د پیوستون ډیاګرام داسې ښکاري.

دا د دې حقیقت له امله ممکنه ده چې د انټر سویچ لینک د دوه سایټونو د SAN فابریکو ترمنځ ترتیب شوی دی: د فیبرک A OST SAN سویچ د فیبرک A نورډ SAN سویچ سره وصل دی ، او ورته ورته د فیبرک B SAN سویچونو لپاره.

ښه، د دې لپاره چې د SAN فابریکې دا ټول پیچلتیاوې درک کړي، د فعال فعال نقل نقل د دوو ذخیره کولو سیسټمونو ترمنځ ترتیب شوی دی: معلومات تقریبا په ورته وخت کې محلي او لیرې ذخیره سیسټمونو ته لیکل شوي، RPO = 0. دا معلومه شوه چې اصلي معلومات په یوه ذخیره سیسټم کې زیرمه شوي، او د هغې نقل په بل کې زیرمه شوی. ډاټا د ذخیره کولو حجمونو په کچه نقل شوي، او د VM ډاټا (د دې ډیسکونه، د ترتیب فایل، سویپ فایل، او نور) په دوی کې زیرمه شوي.

د ESXi کوربه لومړني حجم او د هغې نقل د یو ډیسک وسیله (د ذخیره کولو وسیله) په توګه ګوري. د ESXi کوربه څخه هر ډیسک وسیلې ته 24 لارې شتون لري:

12 لارې دا د ځایی ذخیره کولو سیسټم (غوره لارې) سره وصل کوي، او پاتې 12 د لیرې ذخیره کولو سیسټم سره (غیر غوره لارې). په نورمال حالت کې، ESXi د "غوره" لارو په کارولو سره د محلي ذخیره کولو سیسټم معلوماتو ته لاسرسی لري. کله چې دا ذخیره کولو سیسټم ناکام شي، ESXi غوره لارې له لاسه ورکوي او "غیر مطلوب" ته بدلوي. دا هغه څه دي چې دا په ډیاګرام کې ښکاري.

د ناورین مقاومت لرونکی بادل: دا څنګه کار کوي
د ناورین ضد کلستر سکیم.

د مشتریانو ټولې شبکې د یوې ګډې شبکې له لارې له دواړو سایټونو سره وصل دي. هر سایټ د چمتو کونکي څنډه (PE) پرمخ وړي، په کوم کې چې د پیرودونکي شبکې پای ته رسیږي. PEs په یو عام کلستر کې متحد شوي دي. که چیرې PE په یوه سایټ کې ناکام شي، ټول ټرافیک دویم سایټ ته لیږدول کیږي. له دې څخه مننه، د سایټ څخه مجازی ماشینونه د PE پرته پاتې دي د شبکې له لارې پیرودونکي ته د لاسرسي وړ دي.

راځئ چې اوس وګورو چې د مختلف ناکامیو پرمهال به د پیرودونکي مجازی ماشینونو سره څه پیښ شي. راځئ چې د روښانه انتخابونو سره پیل وکړو او د خورا جدي سره پای ته ورسوو - د ټول سایټ ناکامي. په مثالونو کې، اصلي پلیټ فارم به OST وي، او د بیک اپ پلیټ فارم، د ډیټا نقلونو سره به NORD وي.

د پیرودونکي مجازی ماشین سره څه پیښیږي که ...

د نقل کولو لینک ناکام شو. د دوو سایټونو د ذخیره کولو سیسټمونو ترمنځ نقل ودریږي.
ESXi به یوازې د محلي ډیسک وسیلو سره کار وکړي (د غوره لارو له لارې).
مجازی ماشینونه کار ته دوام ورکوي.

د ناورین مقاومت لرونکی بادل: دا څنګه کار کوي

ISL (Inter-Switch Link) ماتیږي. قضیه ناشونې ده. پرته لدې چې ځینې لیوني کیندونکي په یوځل کې څو نظری لارې راوباسي ، کوم چې په خپلواکو لارو تیریږي او د مختلف معلوماتو له لارې سایټونو ته راوړل کیږي. خو په هر صورت. پدې حالت کې، د ESXi کوربه نیمایي لارې له لاسه ورکوي او یوازې د دوی محلي ذخیره کولو سیسټمونو ته لاسرسی کولی شي. نقلونه راټول شوي، مګر کوربه به دوی ته لاسرسی ونلري.

مجازی ماشینونه په نورمال ډول کار کوي.

د ناورین مقاومت لرونکی بادل: دا څنګه کار کوي

د SAN سویچ په یو سایټ کې ناکام شو. د ESXi کوربه د ذخیره کولو سیسټم ته ځینې لارې له لاسه ورکوي. په دې حالت کې، کوربه په هغه سایټ کې چیرې چې سویچ ناکام شوی یوازې د دوی د HBAs له لارې کار کوي.

مجازی ماشینونه په نورمال ډول کار کولو ته دوام ورکوي.

د ناورین مقاومت لرونکی بادل: دا څنګه کار کوي

په یوه سایټ کې ټول SAN سویچونه ناکام دي. راځئ چې ووایو دا ډول ناورین د OST سایټ کې پیښ شوی. پدې حالت کې، پدې سایټ کې د ESXi کوربه به د دوی ډیسک وسیلو ته ټولې لارې له لاسه ورکړي. معیاري VMware vSphere HA میکانیزم پلی کیږي: دا به په NORD کې د OST سایټ ټول مجازی ماشینونه په اعظمي 140 ثانیو کې بیا پیل کړي.

مجازی ماشینونه چې د NORD سایټ کوربه کې روان دي په نورمال ډول کار کوي.

د ناورین مقاومت لرونکی بادل: دا څنګه کار کوي

د ESXi کوربه په یوه سایټ کې ناکام شو. دلته د vSphere HA میکانیزم بیا کار کوي: د ناکام کوربه څخه مجازی ماشینونه په نورو کوربه توب بیا پیل کیږي - په ورته یا لیرې سایټ کې. د مجازی ماشین بیا پیل کولو وخت تر 1 دقیقو پورې دی.

که په OST سایټ کې د ESXi ټول کوربه ناکام شي، هیڅ اختیار شتون نلري: VMs په یو بل کې بیا پیل کیږي. د بیا پیل کولو وخت ورته دی.

د ناورین مقاومت لرونکی بادل: دا څنګه کار کوي

د ذخیره کولو سیسټم په یوه سایټ کې ناکام شو. راځئ چې ووایو د ذخیره کولو سیسټم د OST سایټ کې ناکام شو. بیا د OST سایټ ESXi کوربه په NORD کې د ذخیره کولو نقلونو سره کار کولو ته لاړ. وروسته له دې چې د ذخیره کولو ناکام سیسټم خدمت ته راستون شو، جبري نقل به واقع شي او د ESXi OST کوربه به بیا د محلي ذخیره کولو سیسټم ته لاسرسی پیل کړي.

مجازی ماشینونه دا ټول وخت په نورمال ډول کار کوي.

د ناورین مقاومت لرونکی بادل: دا څنګه کار کوي

یو له سایټونو څخه ناکام دی. په دې حالت کې، ټول مجازی ماشینونه به د بیک اپ سایټ کې د vSphere HA میکانیزم له لارې بیا پیل شي. د VM بیا پیل کولو وخت 140 ثانیې دی. پدې حالت کې ، د مجازی ماشین ټولې شبکې تنظیمات به خوندي شي ، او دا په شبکه کې پیرودونکي ته د لاسرسي وړ پاتې کیږي.

د دې لپاره چې ډاډ ترلاسه شي چې په بیک اپ سایټ کې د ماشینونو بیا پیل کول په اسانۍ سره پرمخ ځي، هر سایټ یوازې نیمایي ډک دی. دویمه نیمه یوه زیرمه ده که چیرې ټول مجازی ماشینونه له دوهم ، زیانمن شوي سایټ څخه حرکت وکړي.

د ناورین مقاومت لرونکی بادل: دا څنګه کار کوي

د دوه ډیټا مرکزونو پراساس د ناورین په وړاندې مقاومت لرونکی بادل د ورته ناکامیو پروړاندې ساتي.

دا خوښي ارزانه نده ، ځکه چې د اصلي سرچینو سربیره ، په دوهم سایټ کې ریزرو ته اړتیا ده. له همدې امله، د سوداګرۍ مهم خدمتونه په داسې بادل کې ځای پر ځای شوي، د اوږدې مودې ځنډ چې د لوی مالي او شهرت زیانونو لامل کیږي، یا که د معلوماتو سیسټم د تنظیم کونکو یا داخلي شرکت مقرراتو لخوا د ناورین مقاومت اړتیاو تابع وي.

سرچینې:

  1. www.infinidat.com/sites/default/files/resource-pdfs/DS-INFBOX-190331-US_0.pdf
  2. support.infinidat.com/hc/en-us/articles/207057109-InfiniBox-best-practices-guides

سرچینه: www.habr.com

Add a comment