د SDS جوړښت لنډ پرتله کول یا د سم ذخیره کولو پلیټ فارم موندل (GlusterVsCephVsVirtuozzoStorage)

دا مقاله د دې لپاره لیکل شوې وه چې تاسو سره د خپل ځان لپاره سم حل غوره کړئ او د SDS لکه ګلسټر ، سیف او ویسټوریج (Virtuozzo) ترمینځ توپیرونه پوه کړئ.

متن د مقالو لپاره لینکونه کاروي چې د ځینې ستونزو تفصيلي افشاء کولو سره وي، نو توضیحات به د امکان تر حده لنډ وي، پرته له غیر ضروري فلف او ابتدايي معلوماتو څخه د کلیدي ټکو په کارولو سره چې تاسو کولی شئ، که تاسو وغواړئ، په خپلواکه توګه په انټرنیټ کې ترلاسه کړئ.

په واقعیت کې، البته، پورته شوي موضوعات د متن ټونونو ته اړتیا لري، مګر په عصري نړۍ کې ډیر خلک د لوستلو نه خوښوي)))، نو تاسو کولی شئ ژر تر ژره ولولئ او انتخاب وکړئ، او که یو څه وي. روښانه نه ده، لینکونه تعقیب کړئ یا د ګوګل ناڅرګند ټکي)))، او دا مقاله د دې ژورو موضوعاتو لپاره د شفاف ریپر په څیر ده، ډکول ښیې - د هرې پریکړې اصلي کلیدي ټکي.

ګلوسټر

راځئ چې د ګلسټر سره پیل وکړو، کوم چې په فعاله توګه د SDS سره د هایپر کنورګډ پلیټ فارمونو جوړونکو لخوا د مجازی چاپیریال لپاره د خلاصې سرچینې پراساس کارول کیږي او د ذخیره کولو برخه کې د RedHat ویب پاڼې کې موندل کیدی شي، چیرې چې تاسو کولی شئ د دوو SDS اختیارونو څخه غوره کړئ: ګلستر یا سیف.

ګلسټر د ژباړونکو له سټک څخه جوړ دی - هغه خدمتونه چې د فایلونو توزیع کولو ټول کارونه ترسره کوي ، او داسې نور. برک یو خدمت دی چې یو ډیسک خدمت کوي ، حجم یو حجم (حوض) دی چې دا خښتې سره متحد کوي. بل د DHT (توزیع شوي هش میز) فنکشن په کارولو سره ډلو ته د فایلونو توزیع کولو خدمت راځي. موږ به په تفصیل کې د شارډینګ خدمت شامل نه کړو ځکه چې لاندې لینکونه به ورسره تړلې ستونزې بیان کړي.

د SDS جوړښت لنډ پرتله کول یا د سم ذخیره کولو پلیټ فارم موندل (GlusterVsCephVsVirtuozzoStorage)

کله چې لیکل کیږي، ټوله فایل په خښتو کې زیرمه کیږي او د هغې کاپي په ورته وخت کې په دویم سرور کې په خښتو لیکل کیږي. بیا، دویمه فایل به په مختلفو سرورونو کې د دوو خښتو (یا ډیرو) دویم ګروپ ته ولیکل شي.

که فایلونه تقریبا ورته اندازه وي او حجم یوازې یو ګروپ ولري، نو هرڅه سم دي، مګر د نورو شرایطو لاندې به د توضیحاتو څخه لاندې ستونزې رامینځته شي:

  • په ګروپونو کې ځای په غیر مساوي توګه کارول کیږي، دا د فایلونو په اندازې پورې اړه لري او که چیرې په ګروپ کې د فایل لیکلو لپاره کافي ځای شتون ونلري، تاسو به یوه تېروتنه ترلاسه کړئ، فایل به نه لیکل کیږي او بل ګروپ ته به نه ویشل کیږي. ;
  • کله چې یو فایل لیکئ، IO یوازې یوې ډلې ته ځي، پاتې نور بې کاره دي؛
  • تاسو نشئ کولی د ټول حجم IO ترلاسه کړئ کله چې یوه فایل لیکل؛
  • او عمومي مفهوم په بلاکونو کې د ډیټا ویش نشتوالي له امله لږ ګټور ښکاري، چیرې چې د یونیفورم ویش ستونزه توازن او حل کول اسانه دي، او نه دا چې اوس ټوله فایل بلاک ته ځي.

د رسمي توضیحاتو څخه معمارۍ موږ هم په غیر ارادي ډول پوهیږو چې ګلسټر د کلاسیک هارډویر RAID په سر کې د فایل ذخیره کولو په توګه کار کوي. په بلاکونو کې د فایلونو د پرې کولو (شارډینګ) پراختیا هڅې شوي ، مګر دا ټول هغه اضافه دي چې دمخه موجود معماري کړنالرې کې د فعالیت زیانونه رامینځته کوي ، او د فیوز په څیر د فعالیت محدودیتونو سره د داسې آزاده توزیع شوي اجزاو کارول. د میټاډاټا خدمتونه شتون نلري، کوم چې د ذخیره کولو فعالیت او د غلطۍ زغم وړتیا محدودوي کله چې فایلونه په بلاکونو ویشل کیږي. د غوره فعالیت شاخصونه د "توزیع شوي نقل شوي" ترتیب سره لیدل کیدی شي او د نوډونو شمیر باید لږترلږه 6 وي ترڅو د غوره بار توزیع سره د اعتبار وړ ریپلیکا 3 تنظیم کړي.

دا موندنې د کاروونکي تجربې تشریح سره هم تړاو لري ګلوسټر او کله چې پرتله کیږي سیف، او د تجربې تشریح هم شتون لري چې د دې ډیر ګټور او ډیر باوري تشکیلاتو پوهیدو لامل کیږي "تکرار شوی توزیع شوی".
د SDS جوړښت لنډ پرتله کول یا د سم ذخیره کولو پلیټ فارم موندل (GlusterVsCephVsVirtuozzoStorage)

عکس د دوه فایلونو لیکلو پرمهال د بار توزیع ښیې ، چیرې چې د لومړۍ فایل کاپي په لومړیو دریو سرورونو کې توزیع کیږي ، کوم چې د حجم 0 ګروپ کې یوځای شوي ، او د دوهم فایل درې کاپي د دوهم ګروپ حجم 1 کې ځای په ځای شوي. سرورونه هر سرور یو ډیسک لري.

عمومي پایله دا ده چې تاسو کولی شئ ګلسټر وکاروئ ، مګر پدې پوهیدو سره چې د فعالیت او غلطۍ زغم کې به محدودیتونه شتون ولري چې د هایپر کنورډ حل ځینې شرایطو لاندې ستونزې رامینځته کوي ، چیرې چې سرچینې د مجازی چاپیریالونو کمپیوټري بارونو لپاره هم اړین دي.

د ګلستر فعالیت شاخصونه هم شتون لري چې د ځانګړو شرایطو لاندې ترلاسه کیدی شي، محدود دي د خطا زغم.

سیف

اوس راځئ چې د معمارۍ توضیحاتو څخه سیف ته وګورو چې زه یې وړ وم موندل په منځ کې یو پرتله هم شتون لري ګلسترفس او سیف، چیرې چې تاسو سمدلاسه پوهیدلی شئ چې دا مشوره کیږي چې په جلا سرورونو کې سیف ځای په ځای کړئ ، ځکه چې د دې خدمات د بار لاندې ټولې هارډویر سرچینې ته اړتیا لري.

معمارۍ سیف د ګلسټر په پرتله خورا پیچلي او دلته خدمتونه شتون لري لکه د میټاډاټا خدمتونه ، مګر د اجزاو ټول سټیک خورا پیچلی دی او د مجازی کولو حل کې د کارولو لپاره خورا انعطاف وړ ندي. معلومات په بلاکونو کې زیرمه شوي، کوم چې ډیر ګټور ښکاري، مګر د ټولو خدماتو (برخو) په درجه بندي کې، د ځینې بارونو او بیړنیو شرایطو لاندې ضایعات او ځنډ شتون لري، د بیلګې په توګه لاندې مقاله

د معمارۍ له توضیحاتو څخه ، زړه CRUSH دی ، له دې امله مننه چې د معلوماتو ذخیره کولو ځای غوره شوی. بل PG راځي - دا د پوهیدو لپاره خورا ستونزمن خلاصون (منطقي ګروپ) دی. PGs ته اړتیا ده ترڅو CRUSH ډیر اغیزمن کړي. د PG اصلي هدف د شیانو ګروپ کول دي ترڅو د سرچینو مصرف کم کړي ، فعالیت او توزیع وړتیا لوړه کړي. په مستقیم ډول د شیانو په نښه کول، په انفرادي توګه، پرته له دې چې په PG کې یې یوځای کړي خورا ګران وي. OSD د هر انفرادي ډیسک لپاره خدمت دی.

د SDS جوړښت لنډ پرتله کول یا د سم ذخیره کولو پلیټ فارم موندل (GlusterVsCephVsVirtuozzoStorage)

د SDS جوړښت لنډ پرتله کول یا د سم ذخیره کولو پلیټ فارم موندل (GlusterVsCephVsVirtuozzoStorage)

یو کلستر کولی شي یو یا ډیری ډیټا پولونه د مختلف موخو لپاره او د مختلف ترتیباتو سره ولري. حوضونه د ځای په ځای کولو ګروپونو ویشل شوي دي. د ځای پرځای کولو ګروپونه هغه شیان ذخیره کوي چې پیرودونکي ورته لاسرسی لري. دا هغه ځای دی چې منطقي کچه پای ته رسیږي، او فزیکي کچه پیل کیږي، ځکه چې د ځای پرځای کولو هرې ډلې ته یو اصلي ډیسک او څو ریپلیکا ډیسک ګمارل شوي (څومره په ریښتیا د حوض د نقل کولو فاکتور پورې اړه لري). په بل عبارت، په منطقي کچه اعتراض په یو ځانګړي ځای پر ځای کولو ګروپ کې زیرمه شوی، او په فزیکي کچه - په هغه ډیسکونو کې چې ورته ټاکل شوي. په دې حالت کې، ډیسکونه په فزیکي توګه په مختلفو نوډونو یا حتی په مختلفو ډیټا مرکزونو کې موقعیت لري.

په دې سکیم کې، د ځای پرځای کولو ګروپونه د ټول حل د انعطاف لپاره د یوې اړینې کچې په څیر ښکاري، مګر په ورته وخت کې، پدې سلسله کې د اضافي لینک په توګه، کوم چې په غیر ارادي توګه د تولید د ضایع کیدو وړاندیز کوي. د مثال په توګه، کله چې ډاټا لیکل کیږي، سیسټم اړتیا لري چې دا په دې ګروپونو ویشل شي او بیا په فزیکي کچه اصلي ډیسک او ډیسکونو کې د نقلونو لپاره. یعنی د هش فنکشن د څیز د لټولو او داخلولو په وخت کی کار کوی، خو یو طرفه عوارض هم لری - دا د هش په بیا جوړولو باندی ډیر لوړ لګښتونه او محدودیتونه دی (کله چی د ډیسک اضافه کول یا حذف کول). د هش بله ستونزه د ډیټا په روښانه ډول کیل شوي موقعیت دی چې نشي بدلیدلی. دا دی ، که چیرې په یو ډول ډیسک د ډیر بار لاندې وي ، نو سیسټم فرصت نلري چې دې ته ونه لیکي (د بل ډیسک په غوره کولو سره) ، د هش فنکشن مکلف کوي چې ډیټا د قاعدې سره سم موقعیت ولري ، مهمه نده چې څومره خراب وي. ډیسک دی، نو Ceph د ځان درملنې یا د ذخیره کولو زیاتوالي په صورت کې د PG بیا رغولو پر مهال ډیره حافظه خوري. پایله دا ده چې سیف ښه کار کوي (که څه هم ورو وي)، مګر یوازې کله چې هیڅ اندازه کول، بیړني حالت، یا تازه معلومات شتون نلري.

البته، د کیچ کولو او کیچ شریکولو له لارې د فعالیت زیاتولو لپاره اختیارونه شتون لري، مګر دا ښه هارډویر ته اړتیا لري او بیا هم زیانونه شتون لري. مګر په ټولیز ډول، Ceph د تولید لپاره د ګلستر څخه ډیر زړه راښکونکی ښکاري. همچنان ، کله چې دا محصولات وکاروئ ، نو اړینه ده چې یو مهم فاکتور په پام کې ونیسئ - دا د لوړې کچې وړتیا ، تجربه او مسلکيتوب دی چې په لینکس باندې خورا ټینګار کوي ، ځکه چې دا خورا مهم دي چې هرڅه په سمه توګه ځای په ځای کړئ ، تنظیم او ملاتړ وکړئ ، کوم چې په مدیر باندې لا ډیر مسؤلیت او بار اچوي.

Vstorage

معماري نوره هم په زړه پوري ښکاري Virtuozzo ذخیره (Vstorage)، کوم چې په ورته نوډونو کې د هایپروایزر سره په ګډه کارول کیدی شي غده، مګر دا خورا مهم دي چې د ښه فعالیت ترلاسه کولو لپاره هرڅه په سمه توګه تنظیم کړئ. دا ، د جوړښت سره سم وړاندیزونو په پام کې نیولو پرته په هر ترتیب کې د بکس څخه د داسې محصول ځای په ځای کول به خورا اسانه وي ، مګر ګټور نه وي.

د kvm-qemu هایپروایزر خدماتو سره سم د ذخیره کولو لپاره څه شی شتون لري، او دا یوازې یو څو خدمتونه دي چیرې چې د اجزاو مناسبه درجه بندي موندل شوې ده: د پیرودونکي خدمت د FUSE له لارې نصب شوی (بدل شوی، نه خلاصې سرچینې)، د MDS میټاډاټا خدمت (د میټاډاټا خدمت) ، د خدمت چنک خدمت ډیټا بلاکس ، کوم چې په فزیکي کچه د یو ډیسک سره مساوي دی او بس. د سرعت په شرایطو کې ، البته ، دا غوره ده چې د دوه عکسونو سره د غلطۍ زغمونکي سکیم وکاروئ ، مګر که تاسو په SSD ډرایو کې کیشینګ او لاګ وکاروئ ، نو د غلطۍ زغمونکي کوډینګ (د کوډینګ پاکول یا raid6) کولی شي په خورا ښه ډول په ډیر کلیک سره بند شي. هایبرډ سکیم یا حتی په ټول فلش کې غوره. د EC سره یو څه نیمګړتیا شتون لري (د کوډ کولو پاکول): کله چې د ډیټا بلاک بدلول ، نو اړینه ده چې د برابرۍ مقدار بیا محاسبه کړئ. د دې عملیاتو سره تړلي زیانونو څخه د مخنیوي لپاره ، Ceph په ځنډ سره EC ته لیکي او د فعالیت ستونزې د یوې ځانګړې غوښتنې په جریان کې رامینځته کیدی شي ، کله چې د مثال په توګه ، ټول بلاکونه لوستلو ته اړتیا لري ، او د Virtuozzo ذخیره کولو په حالت کې ، د بدل شوي بلاکونو لیکل ترسره کیږي. د "لاګ جوړښت شوي فایل سیسټم" طریقې کارول، کوم چې د برابري محاسبې لګښتونه کموي. د EC سره او پرته د کار ګړندي کولو سره نږدې اختیارونه اټکل کولو لپاره ، شتون لري محاسبه کونکی - ارقام د تجهیزاتو جوړونکي د دقت ضمیمه پورې اړه لري اټکل کیدی شي ، مګر د محاسبې پایله د تنظیم کولو پلان کولو کې ښه مرسته ده.

د ذخیره کولو اجزاو ساده ډیاګرام پدې معنی ندي چې دا اجزا جذب نه کوي د اوسپنې سرچینې مګر که تاسو مخکې له مخکې ټول لګښتونه محاسبه کړئ، تاسو کولی شئ د هایپروایزر سره په همکارۍ باندې حساب وکړئ.
د Ceph او Virtuozzo ذخیره کولو خدماتو لخوا د هارډویر سرچینو مصرف پرتله کولو لپاره سکیم شتون لري.

د SDS جوړښت لنډ پرتله کول یا د سم ذخیره کولو پلیټ فارم موندل (GlusterVsCephVsVirtuozzoStorage)

که دمخه دا ممکنه وه چې د زړو مقالو په کارولو سره ګلسټر او سیف پرتله کړئ ، له دوی څخه خورا مهم لینونه په کارولو سره ، بیا د ویرټوزو سره دا خورا ستونزمن دی. پدې محصول کې ډیری مقالې شتون نلري او معلومات یوازې د اسنادو څخه راټول کیدی شي په انګلیسي کې یا په روسی کې که موږ Vstorage د ذخیره کولو په توګه په پام کې ونیسو لکه په شرکتونو کې په ځینو هایپر کنورډ حلونو کې کارول کیږي Rosplatforma او اکرونیس.

زه به هڅه وکړم چې د دې معمارۍ په توضیحاتو کې مرسته وکړم ، نو دلته به یو څه نور متن وي ، مګر دا پخپله د اسنادو پوهیدل ډیر وخت نیسي ، او موجوده اسناد یوازې د میز په بیاکتنه سره د حوالې په توګه کارول کیدی شي. د منځپانګې یا د کلیدي کلمې لټون.

راځئ چې د پورته بیان شوي اجزاو سره د هایبرډ هارډویر ترتیب کې د ثبت کولو پروسه په پام کې ونیسو: ثبت کول هغه نوډ ته ځي چې پیرودونکي یې پیل کړي (د FUSE ماونټ پوائنټ خدمت) ، مګر د میټاډاټا خدمت (MDS) ماسټر برخه به یقینا. پیرودونکي مستقیم د مطلوب برخې خدمت (د ذخیره کولو خدمت CS بلاکس) ته لارښود کړئ ، دا دی ، MDS د ثبت کولو پروسې کې برخه نه اخلي ، مګر په ساده ډول خدمت اړین برخې ته لارښود کوي. په عموم کې، موږ کولی شو په بیرل کې د اوبو اچولو سره ریکارډ کولو ته ورته والی ورکړو. هر بیرل د 256MB ډیټا بلاک دی.

د SDS جوړښت لنډ پرتله کول یا د سم ذخیره کولو پلیټ فارم موندل (GlusterVsCephVsVirtuozzoStorage)

دا دی، یو ډیسک د داسې بیرلونو یو مشخص شمیر دی، دا دی، د ډیسک حجم د 256MB لخوا ویشل شوی. هر کاپي په یو نوډ کې ویشل کیږي، دویمه تقریبا د بل نوډ سره موازي وي، او نور... که موږ درې نقلونه ولرو او د کیچ لپاره SSD ډیسکونه شتون ولري (د لوستلو او لیکلو لاګونو لپاره)، نو د لیکلو تایید به د لیکلو وروسته واقع شي. SSD ته لاګ ، او د SSD څخه موازي ریسیټ به په HDD کې دوام ومومي ، لکه څنګه چې په شالید کې وي. د دریو نقلونو په صورت کې، ریکارډ به د دریم نوډ SSD څخه تایید وروسته ژمن وي. داسې ښکاري چې د دریو SSDs د لیکلو سرعت مجموعه په دریو ویشل کیدی شي او موږ به د یو نقل لیکلو سرعت ترلاسه کړو، مګر کاپيونه په موازي ډول لیکل شوي او د شبکې د ځنډ سرعت معمولا د SSD څخه لوړ وي، او په حقیقت کې د لیکلو فعالیت به په شبکه پورې اړه ولري. پدې اړه ، د ریښتیني IOPS لیدو لپاره ، تاسو اړتیا لرئ په سمه توګه ټول Vstorage پورته کړئ میتودولوژي، دا د اصلي بار ازموینه ده ، نه د حافظې او کیچ ، چیرې چې دا اړینه ده چې د سم ډیټا بلاک اندازه ، د تارونو شمیر او داسې نور په پام کې ونیول شي.

په SSD کې د پورته ذکر شوي ثبت کولو لاګ په داسې ډول کار کوي چې هرڅومره ژر چې ډیټا دې ته راشي ، سمدلاسه د خدمت لخوا لوستل کیږي او HDD ته لیکل کیږي. په هر کلستر کې ډیری میټاډاټا خدمتونه (MDS) شتون لري او د دوی شمیره د کورم لخوا ټاکل کیږي، کوم چې د Paxos الګوریتم سره سم کار کوي. د مراجعینو له نظره، د FUSE ماونټ نقطه د کلستر ذخیره کولو فولډر دی چې په یو وخت کې په کلستر کې ټولو نوډونو ته لیدل کیږي، هر نوډ د دې اصولو سره سم یو نصب شوی مراجع لري، نو دا ذخیره هر نوډ ته شتون لري.

د پورته ذکر شوي هرې کړنالرې د ترسره کولو لپاره، دا خورا مهم دي، د پالن کولو او پلي کولو په مرحله کې، د شبکې په سمه توګه تنظیم کول، چیرې چې د راټولولو او په سمه توګه د شبکې چینل بینډ ویت په سمه توګه غوره شوي له امله به توازن وي. په مجموعه کې، دا مهمه ده چې د سم هاشینګ حالت او د چوکاټ اندازه غوره کړئ. د پورته بیان شوي SDS څخه خورا قوي توپیر هم شتون لري ، دا د Virtuozzo ذخیره کې د ګړندي لارې ټیکنالوژۍ سره فیوز دی. کوم چې د عصري شوي فیوز سربیره، د نورو خلاصې سرچینې حلونو برعکس، د پام وړ IOPS زیاتوي او تاسو ته اجازه درکوي چې د افقی یا عمودی اندازه کولو لخوا محدود نه وي. په عموم کې، د پورته ذکر شوي جوړښتونو په پرتله، دا یو ډیر پیاوړی ښکاري، مګر د داسې خوښۍ لپاره، البته، تاسو اړتیا لرئ چې جواز واخلئ، د Ceph او Gluster برعکس.

د لنډیز کولو لپاره، موږ کولی شو د دریو څخه پورته روښانه کړو: د Virtuozzo ذخیره د جوړښت د فعالیت او اعتبار له مخې لومړی ځای نیسي، سیف دویم ځای نیسي، او ګلستر دریم ځای نیسي.

هغه معیارونه چې له مخې یې Virtuozzo Storage غوره شوی و: دا د معمارۍ اجزاو غوره سیټ دی، د دې فیوز طریقې لپاره د چټکې لارې سره عصري شوی، د هارډویر ترتیبونو انعطاف وړ سیټ، د سرچینو لږ مصرف او د کمپیوټر سره د شریکولو وړتیا (کمپیوټینګ / مجازی کول)، دا دی، دا په بشپړ ډول د هایپر کنورډ حل لپاره مناسب دی، کوم چې هغه برخه ده. دوهم ځای Ceph دی ځکه چې دا د ګلسټر په پرتله خورا ګټور جوړښت دی ، په بلاکونو کې د دې عملیاتو له امله ، په بیله بیا ډیر انعطاف منونکي سناریوګانې او په لویو کلسترونو کې د کار کولو وړتیا.

داسې پلانونه شتون لري چې د VSAN، Space Direct Storage، Vstorage او Nutanix Storage ترمنځ پرتله کول، په HPE او Huawei تجهیزاتو کې د Vstorage ازموینه، او همدارنګه د بهرني هارډویر ذخیره کولو سیسټمونو سره د Vstorage ادغام لپاره سناریوګانې، نو که تاسو مقاله خوښ کړئ، نو دا به وي. ستاسو څخه د فیډبیک ترلاسه کول خوښ دي ، کوم چې کولی شي ستاسو نظرونو او هیلو په پام کې نیولو سره د نوي مقالو لپاره هڅونه زیاته کړي.

سرچینه: www.habr.com

Add a comment