Cymhariaeth fer o bensaernïaeth SDS neu ddod o hyd i'r llwyfan storio cywir (GlusterVsCephVsVirtuozzoStorage)

Ysgrifennwyd yr erthygl hon i'ch helpu i ddewis yr ateb cywir i chi'ch hun a deall y gwahaniaethau rhwng SDS fel Gluster, Ceph a Vstorage (Virtuozzo).

Mae'r testun yn defnyddio dolenni i erthyglau gyda datgeliad manylach o rai problemau, felly bydd y disgrifiadau mor gryno â phosibl, gan ddefnyddio pwyntiau allweddol heb fflwff diangen a gwybodaeth ragarweiniol y gallwch, os dymunwch, ei chael yn annibynnol ar y Rhyngrwyd.

Mewn gwirionedd, wrth gwrs, mae'r pynciau a godir yn gofyn am arlliwiau'r testun, ond yn y byd modern nid yw mwy a mwy o bobl yn hoffi darllen llawer))), felly gallwch chi ddarllen yn gyflym a gwneud dewis, ac os oes rhywbeth. ddim yn glir, dilynwch y dolenni neu google geiriau aneglur))), ac mae'r erthygl hon fel deunydd lapio tryloyw ar gyfer y pynciau dwfn hyn, gan ddangos y llenwad - prif bwyntiau allweddol pob penderfyniad.

Glwster

Gadewch i ni ddechrau gyda Gluster, sy'n cael ei ddefnyddio'n weithredol gan weithgynhyrchwyr llwyfannau hyperconverged gyda SDS yn seiliedig ar ffynhonnell agored ar gyfer amgylcheddau rhithwir ac sydd i'w gael ar wefan RedHat yn yr adran storio, lle gallwch ddewis o ddau opsiwn SDS: Gluster neu Ceph.

Mae Gluster yn cynnwys pentwr o gyfieithwyr - gwasanaethau sy'n cyflawni'r holl waith o ddosbarthu ffeiliau, ac ati. Mae brics yn wasanaeth sy'n gwasanaethu un ddisg, Cyfrol yw cyfaint (pwll) sy'n uno'r brics hyn. Nesaf daw'r gwasanaeth ar gyfer dosbarthu ffeiliau i grwpiau gan ddefnyddio'r swyddogaeth DHT (tabl hash dosbarthedig). Ni fyddwn yn cynnwys y gwasanaeth Rhannu yn y disgrifiad gan y bydd y dolenni isod yn disgrifio'r problemau sy'n gysylltiedig ag ef.

Cymhariaeth fer o bensaernïaeth SDS neu ddod o hyd i'r llwyfan storio cywir (GlusterVsCephVsVirtuozzoStorage)

Wrth ysgrifennu, mae'r ffeil gyfan yn cael ei storio mewn brics ac mae ei gopi yn cael ei ysgrifennu ar yr un pryd i frics ar yr ail weinydd. Nesaf, bydd yr ail ffeil yn cael ei ysgrifennu i'r ail grŵp o ddau fricsen (neu fwy) ar wahanol weinyddion.

Os yw'r ffeiliau tua'r un maint a bod y gyfrol yn cynnwys un grŵp yn unig, yna mae popeth yn iawn, ond o dan amodau eraill bydd y problemau canlynol yn codi o'r disgrifiadau:

  • defnyddir gofod mewn grwpiau yn anwastad, mae'n dibynnu ar faint y ffeiliau ac os nad oes digon o le yn y grŵp i ysgrifennu ffeil, byddwch yn derbyn gwall, ni fydd y ffeil yn cael ei ysgrifennu ac ni fydd yn cael ei hailddosbarthu i grŵp arall ;
  • wrth ysgrifennu un ffeil, mae IO yn mynd i un grŵp yn unig, mae'r gweddill yn segur;
  • ni allwch gael IO y gyfrol gyfan wrth ysgrifennu un ffeil;
  • ac mae'r cysyniad cyffredinol yn edrych yn llai cynhyrchiol oherwydd diffyg dosbarthiad data i mewn i flociau, lle mae'n haws cydbwyso a datrys problem dosbarthiad unffurf, ac nid fel nawr mae'r ffeil gyfan yn mynd i mewn i floc.

O'r disgrifiad swyddogol pensaernïaeth rydym hefyd yn dod i'r ddealltwriaeth yn anwirfoddol bod gluster yn gweithio fel storfa ffeiliau ar ben RAID caledwedd clasurol. Bu ymdrechion datblygu i dorri (Rhannu) ffeiliau yn flociau, ond mae hyn i gyd yn ychwanegiad sy'n gosod colledion perfformiad ar y dull pensaernïol sydd eisoes yn bodoli, ynghyd â defnyddio cydrannau sydd wedi'u dosbarthu'n rhydd gyda chyfyngiadau perfformiad fel Fuse. Nid oes unrhyw wasanaethau metadata, sy'n cyfyngu ar berfformiad a galluoedd goddef diffygion y storfa wrth ddosbarthu ffeiliau i flociau. Gellir arsylwi gwell dangosyddion perfformiad gyda'r cyfluniad “Dosbarthedig Dyblygedig” a dylai nifer y nodau fod o leiaf 6 i drefnu replica dibynadwy 3 gyda'r dosbarthiad llwyth gorau posibl.

Mae'r canfyddiadau hyn hefyd yn gysylltiedig â'r disgrifiad o brofiad y defnyddiwr Glwster ac o'i gymharu â Ceff, ac mae yna hefyd ddisgrifiad o'r profiad sy'n arwain at ddealltwriaeth o'r cyfluniad mwy cynhyrchiol a mwy dibynadwy hwn “Dosbarthwyd Dyblygu”.
Cymhariaeth fer o bensaernïaeth SDS neu ddod o hyd i'r llwyfan storio cywir (GlusterVsCephVsVirtuozzoStorage)

Mae'r llun yn dangos y dosbarthiad llwyth wrth ysgrifennu dwy ffeil, lle mae copïau o'r ffeil gyntaf yn cael eu dosbarthu ar draws y tri gweinydd cyntaf, sy'n cael eu cyfuno i'r grŵp cyfaint 0, a gosodir tri chopi o'r ail ffeil ar yr ail grŵp cyfrol1 o dri gweinyddion. Mae gan bob gweinydd un ddisg.

Y casgliad cyffredinol yw y gallwch chi ddefnyddio Gluster, ond gyda'r ddealltwriaeth y bydd cyfyngiadau mewn perfformiad a goddefgarwch namau sy'n creu anawsterau o dan amodau penodol o ddatrysiad hypergydgyfeiriol, lle mae angen adnoddau hefyd ar gyfer llwythi cyfrifiadurol amgylcheddau rhithwir.

Mae yna hefyd rai dangosyddion perfformiad Gluster y gellir eu cyflawni o dan amodau penodol, yn gyfyngedig i goddefgarwch fai.

Ceff

Nawr gadewch i ni edrych ar Ceph o'r disgrifiadau pensaernïaeth roeddwn i'n gallu dod o hyd. Mae cymhariaeth hefyd rhwng Glusterfs a Ceph, lle gallwch ddeall ar unwaith ei bod yn ddoeth defnyddio Ceph ar weinyddion ar wahân, gan fod angen yr holl adnoddau caledwedd dan lwyth ar ei wasanaethau.

pensaernïaeth Ceph yn fwy cymhleth na Gluster ac mae yna wasanaethau fel gwasanaethau metadata, ond mae'r pentwr cyfan o gydrannau yn eithaf cymhleth ac nid yw'n hyblyg iawn i'w ddefnyddio mewn datrysiad rhithwiroli. Mae'r data'n cael ei storio mewn blociau, sy'n edrych yn fwy cynhyrchiol, ond yn hierarchaeth yr holl wasanaethau (cydrannau), mae colledion a hwyrni o dan rai llwythi ac amodau brys, er enghraifft y canlynol erthygl.

O'r disgrifiad o'r bensaernïaeth, mae'r galon yn CRUSH, diolch i'r hyn y dewisir y lleoliad ar gyfer storio data. Nesaf daw PG - dyma'r tynnu (grŵp rhesymegol) anoddaf i'w ddeall. Mae angen PGs i wneud CRUSH yn fwy effeithiol. Prif bwrpas PG yw grwpio gwrthrychau i leihau'r defnydd o adnoddau, cynyddu perfformiad a scalability. Byddai mynd i'r afael â gwrthrychau yn uniongyrchol, yn unigol, heb eu cyfuno â PG yn ddrud iawn. Mae OSD yn wasanaeth ar gyfer pob disg unigol.

Cymhariaeth fer o bensaernïaeth SDS neu ddod o hyd i'r llwyfan storio cywir (GlusterVsCephVsVirtuozzoStorage)

Cymhariaeth fer o bensaernïaeth SDS neu ddod o hyd i'r llwyfan storio cywir (GlusterVsCephVsVirtuozzoStorage)

Gall clwstwr gael un neu lawer o gronfeydd data at wahanol ddibenion a chyda gwahanol leoliadau. Rhennir pyllau yn grwpiau lleoliad. Mae grwpiau lleoli yn storio gwrthrychau y mae cleientiaid yn eu cyrchu. Dyma lle mae'r lefel resymegol yn dod i ben, ac mae'r lefel gorfforol yn dechrau, oherwydd bod pob grŵp lleoliad yn cael un prif ddisg a sawl replica o ddisgiau (faint sy'n dibynnu'n union ar ffactor dyblygu'r pwll). Mewn geiriau eraill, ar y lefel resymegol mae'r gwrthrych yn cael ei storio mewn grŵp lleoliad penodol, ac ar y lefel gorfforol - ar y disgiau sy'n cael eu neilltuo iddo. Yn yr achos hwn, gellir lleoli'r disgiau'n gorfforol ar wahanol nodau neu hyd yn oed mewn gwahanol ganolfannau data.

Yn y cynllun hwn, mae grwpiau lleoli yn edrych fel lefel angenrheidiol ar gyfer hyblygrwydd yr ateb cyfan, ond ar yr un pryd, fel cyswllt ychwanegol yn y gadwyn hon, sy'n awgrymu'n anwirfoddol golli cynhyrchiant. Er enghraifft, wrth ysgrifennu data, mae angen i'r system ei rannu'n grwpiau hyn ac yna ar y lefel ffisegol i'r brif ddisg a disgiau ar gyfer atgynyrchiadau. Hynny yw, mae swyddogaeth Hash yn gweithio wrth chwilio a mewnosod gwrthrych, ond mae sgîl-effaith - mae'n gostau uchel iawn a chyfyngiadau ar ailadeiladu'r hash (wrth ychwanegu neu dynnu disg). Problem hash arall yw lleoliad data sydd wedi'i hoelio'n glir na ellir ei newid. Hynny yw, os yw'r ddisg dan lwyth cynyddol rywsut, yna nid oes gan y system gyfle i beidio ag ysgrifennu ato (trwy ddewis disg arall), mae'r swyddogaeth hash yn gorfodi'r data i gael ei leoli yn ôl y rheol, ni waeth pa mor ddrwg y ddisg yw, felly mae Ceph yn bwyta llawer o gof wrth ailadeiladu'r PG rhag ofn hunan-iachau neu gynyddu storio. Y casgliad yw bod Ceph yn gweithio'n dda (er ei fod yn araf), ond dim ond pan nad oes unrhyw raddfa, sefyllfaoedd brys, na diweddariadau.

Mae yna, wrth gwrs, opsiynau ar gyfer cynyddu perfformiad trwy caching a rhannu cache, ond mae hyn yn gofyn am galedwedd da a bydd colledion o hyd. Ond yn gyffredinol, mae Ceph yn edrych yn fwy demtasiwn na Gluster ar gyfer cynhyrchiant. Hefyd, wrth ddefnyddio'r cynhyrchion hyn, mae angen ystyried ffactor pwysig - mae hwn yn lefel uchel o gymhwysedd, profiad a phroffesiynoldeb gyda phwyslais mawr ar Linux, gan ei bod yn bwysig iawn defnyddio, ffurfweddu a chynnal popeth yn gywir, sy'n gosod hyd yn oed mwy o gyfrifoldeb a baich ar y gweinyddwr.

Vstorage

Mae'r bensaernïaeth yn edrych hyd yn oed yn fwy diddorol Storfa virtuozzo (Vstorage), y gellir ei ddefnyddio ar y cyd â hypervisor ar yr un nodau, ar yr un peth chwarren, ond mae'n bwysig iawn ffurfweddu popeth yn gywir i gyflawni perfformiad da. Hynny yw, bydd yn hawdd iawn defnyddio cynnyrch o'r fath o'r blwch ar unrhyw ffurfweddiad heb ystyried yr argymhellion yn unol â'r bensaernïaeth, ond nid yn gynhyrchiol.

Beth all gydfodoli ar gyfer storio wrth ymyl gwasanaethau'r hypervisor kvm-qemu, a dyma ychydig o wasanaethau yn unig lle darganfuwyd hierarchaeth gryno o gydrannau: gwasanaeth cleient wedi'i osod trwy FUSE (wedi'i addasu, nid ffynhonnell agored), gwasanaeth metadata MDS (Gwasanaeth metadata), gwasanaeth blociau data gwasanaeth Chunk, sydd ar y lefel gorfforol yn hafal i un ddisg a dyna i gyd. O ran cyflymder, wrth gwrs, mae'n well defnyddio cynllun sy'n goddef namau gyda dau atgynhyrchiad, ond os ydych chi'n defnyddio caching a logiau ar yriannau SSD, yna gellir gor-glocio'n weddus codio sy'n gallu goddef gwallau (codio dileu neu raid6) ar a cynllun hybrid neu hyd yn oed yn well ar bob fflach. Mae rhywfaint o anfantais gyda EC (codio dileu): wrth newid un bloc data, mae angen ailgyfrifo'r symiau cydraddoldeb. Er mwyn osgoi'r colledion sy'n gysylltiedig â'r llawdriniaeth hon, mae Ceph yn ysgrifennu at EC yn ohiriedig a gall problemau perfformiad ddigwydd yn ystod cais penodol, pan, er enghraifft, mae angen darllen yr holl flociau, ac yn achos Virtuozzo Storage, ysgrifennir blociau wedi'u newid. defnyddio'r dull “system ffeiliau strwythur log”, sy'n lleihau costau cyfrifo cydraddoldeb. I amcangyfrif yn fras yr opsiynau gyda chyflymu gwaith gyda'r EC a hebddo, mae yna cyfrifiannell. - gall y ffigurau fod yn fras yn dibynnu ar gyfernod cywirdeb gwneuthurwr yr offer, ond mae canlyniad y cyfrifiadau yn help da wrth gynllunio'r cyfluniad.

Nid yw diagram syml o gydrannau storio yn golygu nad yw'r cydrannau hyn yn amsugno adnoddau haearn, ond os ydych chi'n cyfrifo'r holl gostau ymlaen llaw, gallwch chi ddibynnu ar gydweithio wrth ymyl yr hypervisor.
Mae cynllun ar gyfer cymharu defnydd o adnoddau caledwedd gan wasanaethau storio Ceph a Virtuozzo.

Cymhariaeth fer o bensaernïaeth SDS neu ddod o hyd i'r llwyfan storio cywir (GlusterVsCephVsVirtuozzoStorage)

Os oedd yn bosibl cymharu Gluster a Ceph gan ddefnyddio hen erthyglau, gan ddefnyddio'r llinellau pwysicaf ohonynt, yna gyda Virtuozzo mae'n anoddach. Nid oes llawer o erthyglau ar y cynnyrch hwn a dim ond o'r ddogfennaeth ymlaen y gellir cael gwybodaeth yn Saesneg neu yn Rwsieg os ydym yn ystyried Vstorage fel storfa a ddefnyddir mewn rhai datrysiadau hyperconverged mewn cwmnïau fel Rosplatforma ac Acronis.

Byddaf yn ceisio helpu gyda disgrifiad o'r bensaernïaeth hon, felly bydd ychydig mwy o destun, ond mae'n cymryd llawer o amser i ddeall y ddogfennaeth eich hun, a dim ond trwy adolygu'r tabl y gellir defnyddio'r ddogfennaeth bresennol fel cyfeiriad. o gynnwys neu chwilio yn ôl allweddair.

Gadewch i ni ystyried y broses recordio mewn cyfluniad caledwedd hybrid gyda'r cydrannau a ddisgrifir uchod: mae'r recordiad yn dechrau mynd i'r nod y cychwynnodd y cleient ohono (gwasanaeth pwynt gosod FUSE), ond bydd prif gydran y Gwasanaeth Metadata (MDS) wrth gwrs. cyfeirio'r cleient yn uniongyrchol at y gwasanaeth talp a ddymunir (blociau CS gwasanaeth storio), hynny yw, nid yw MDS yn cymryd rhan yn y broses recordio, ond yn syml yn cyfeirio'r gwasanaeth at y darn gofynnol. Yn gyffredinol, gallwn roi cyfatebiaeth i gofnodi ag arllwys dŵr i casgenni. Mae pob casgen yn floc data 256MB.

Cymhariaeth fer o bensaernïaeth SDS neu ddod o hyd i'r llwyfan storio cywir (GlusterVsCephVsVirtuozzoStorage)

Hynny yw, mae un ddisg yn nifer benodol o gasgenni o'r fath, hynny yw, cyfaint y ddisg wedi'i rannu â 256MB. Mae pob copi yn cael ei ddosbarthu i un nod, yr ail bron yn gyfochrog â nod arall, ac ati... Os oes gennym dri atgynhyrchiad a bod disgiau SSD ar gyfer storfa (ar gyfer darllen ac ysgrifennu logiau), yna bydd cadarnhad o'r ysgrifennu yn digwydd ar ôl ysgrifennu bydd y log i'r SSD, ac ailosod cyfochrog o'r SSD yn parhau ar y HDD, fel pe bai yn y cefndir. Yn achos tri atgynhyrchiad, bydd y cofnod yn cael ei ymrwymo ar ôl cadarnhad gan yr SSD o'r trydydd nod. Gall ymddangos y gellir rhannu cyfanswm cyflymder ysgrifennu tri SSD â thri a byddwn yn cael cyflymder ysgrifennu un atgynhyrchiad, ond mae'r copïau wedi'u hysgrifennu ochr yn ochr ac mae cyflymder hwyrni'r rhwydwaith fel arfer yn uwch na chyflymder yr SSD, ac mewn gwirionedd bydd y perfformiad ysgrifennu yn dibynnu ar y rhwydwaith. Yn hyn o beth, er mwyn gweld IOPS go iawn, mae angen i chi lwytho'r Vstorage cyfan yn gywir erbyn methodoleg, hynny yw, profi'r llwyth go iawn, ac nid cof a storfa, lle mae angen ystyried maint y bloc data cywir, nifer yr edafedd, ac ati.

Mae'r log recordio uchod ar yr SSD yn gweithio yn y fath fodd fel bod y gwasanaeth yn ei ddarllen ar unwaith ac yn cael ei ysgrifennu i'r HDD cyn gynted ag y bydd data'n dod i mewn iddo. Mae yna nifer o wasanaethau metadata (MDS) fesul clwstwr ac mae eu nifer yn cael ei bennu gan gworwm, sy'n gweithio yn unol ag algorithm Paxos. O safbwynt y cleient, mae pwynt mowntio FUSE yn ffolder storio clwstwr sydd ar yr un pryd yn weladwy i bob nod yn y clwstwr, mae gan bob nod gleient wedi'i osod yn unol â'r egwyddor hon, felly mae'r storfa hon ar gael i bob nod.

Ar gyfer perfformiad unrhyw un o'r dulliau a ddisgrifir uchod, mae'n bwysig iawn, ar y cam cynllunio a defnyddio, i ffurfweddu'r rhwydwaith yn gywir, lle bydd cydbwyso oherwydd agregu a lled band sianel rhwydwaith a ddewiswyd yn gywir. Gyda'i gilydd, mae'n bwysig dewis y modd stwnsio cywir a'r meintiau ffrâm. Mae gwahaniaeth cryf iawn hefyd o'r SDS a ddisgrifir uchod, mae hyn yn ffiws gyda thechnoleg llwybr cyflym yn Virtuozzo Storage. Sydd, yn ychwanegol at y ffiws modern, yn wahanol i atebion ffynhonnell agored eraill, yn cynyddu IOPS yn sylweddol ac yn caniatáu ichi beidio â chael eich cyfyngu gan raddio llorweddol neu fertigol. Yn gyffredinol, o'i gymharu â'r pensaernïaeth a ddisgrifir uchod, mae'r un hon yn edrych yn fwy pwerus, ond ar gyfer pleser o'r fath, wrth gwrs, mae angen i chi brynu trwyddedau, yn wahanol i Ceph a Gluster.

I grynhoi, gallwn dynnu sylw at frig y tri: mae Virtuozzo Storage yn digwydd yn gyntaf o ran perfformiad a dibynadwyedd y bensaernïaeth, mae Ceph yn ail, ac mae Gluster yn drydydd.

Y meini prawf a ddefnyddiwyd i ddewis Virtuozzo Storage: mae'n set optimaidd o gydrannau pensaernïol, wedi'i moderneiddio ar gyfer y dull Fuse hwn gyda llwybr cyflym, set hyblyg o ffurfweddiadau caledwedd, llai o ddefnydd o adnoddau a'r gallu i rannu gyda chyfrifiadura (cyfrifiadura / rhithwiroli), hynny yw, mae'n gwbl addas ar gyfer datrysiad hyperconverged , y mae'n rhan ohono. Yn ail yw Ceph oherwydd ei fod yn bensaernïaeth fwy cynhyrchiol o'i gymharu â Gluster, oherwydd ei weithrediad mewn blociau, yn ogystal â senarios mwy hyblyg a'r gallu i weithio mewn clystyrau mwy.

Mae yna gynlluniau i ysgrifennu cymhariaeth rhwng vSAN, Space Direct Storage, Vstorage a Nutanix Storage, profi Vstorage ar offer HPE a Huawei, yn ogystal â senarios ar gyfer integreiddio Vstorage â systemau storio caledwedd allanol, felly os oeddech chi'n hoffi'r erthygl, byddai'n braf cael adborth gennych chi , a allai gynyddu cymhelliant ar gyfer erthyglau newydd, gan ystyried eich sylwadau a'ch dymuniadau.

Ffynhonnell: hab.com

Ychwanegu sylw