Tqabbil fil-qosor tal-arkitettura SDS jew is-sejba tal-pjattaforma tal-ħażna t-tajba (GlusterVsCephVsVirtuozzoStorage)

Dan l-artikolu nkiteb biex jgħinek tagħżel is-soluzzjoni t-tajba għalik innifsek u tifhem id-differenzi bejn SDS bħal Gluster, Ceph u Vstorage (Virtuozzo).

It-test juża links għal artikoli bi żvelar aktar dettaljat ta 'ċerti problemi, għalhekk id-deskrizzjonijiet se jkunu fil-qosor kemm jista' jkun, bl-użu ta 'punti ewlenin mingħajr tentix bla bżonn u informazzjoni introduttorja li tista', jekk tixtieq, tikseb b'mod indipendenti fuq l-Internet.

Fil-fatt, ovvjament, is-suġġetti mqajma jeħtieġu t-toni tat-test, iżda fid-dinja moderna aktar u aktar nies ma jħobbux jaqraw ħafna))), sabiex tkun tista 'taqra malajr u tagħmel għażla, u jekk xi ħaġa tkun mhux ċar, segwi l-links jew google kliem mhux ċar))), u dan l-artikolu huwa bħal tgeżwir trasparenti għal dawn is-suġġetti profondi, li juri l-mili - il-punti ewlenin ewlenin ta 'kull deċiżjoni.

gluster

Nibdew b'Gluster, li tintuża b'mod attiv mill-manifatturi ta 'pjattaformi iperkonverġenti b'SDS ibbażati fuq sors miftuħ għal ambjenti virtwali u tista' tinstab fuq il-websajt RedHat fit-taqsima tal-ħażna, fejn tista 'tagħżel minn żewġ għażliet SDS: Gluster jew Ceph.

Gluster jikkonsisti minn munzell ta 'tradutturi - servizzi li jwettqu x-xogħol kollu ta' distribuzzjoni ta 'fajls, eċċ. Brick huwa servizz li jservi disk wieħed, Volum huwa volum (pool) li jgħaqqad dawn il-briks. Wara jiġi s-servizz għad-distribuzzjoni tal-fajls fi gruppi bl-użu tal-funzjoni DHT (tabella hash distribwit). Aħna mhux se ninkludu s-servizz Sharding fid-deskrizzjoni peress li l-links hawn taħt se jiddeskrivu l-problemi assoċjati miegħu.

Tqabbil fil-qosor tal-arkitettura SDS jew is-sejba tal-pjattaforma tal-ħażna t-tajba (GlusterVsCephVsVirtuozzoStorage)

Meta tikteb, il-fajl kollu jinħażen fi briks u l-kopja tiegħu tinkiteb fl-istess ħin fuq briks fuq it-tieni server. Sussegwentement, it-tieni fajl se jinkiteb lit-tieni grupp ta 'żewġ briks (jew aktar) fuq servers differenti.

Jekk il-fajls huma bejn wieħed u ieħor tal-istess daqs u l-volum jikkonsisti minn grupp wieħed biss, allura kollox huwa tajjeb, iżda taħt kundizzjonijiet oħra se jinqalgħu l-problemi li ġejjin mid-deskrizzjonijiet:

  • l-ispazju fi gruppi jiġi utilizzat b'mod irregolari, jiddependi fuq id-daqs tal-fajls u jekk ma jkunx hemm biżżejjed spazju fil-grupp biex tikteb fajl, tirċievi żball, il-fajl mhux se jinkiteb u mhux se jiġi distribwit mill-ġdid lil grupp ieħor ;
  • meta tikteb fajl wieħed, IO tmur biss għal grupp wieħed, il-bqija huma idle;
  • ma tistax tikseb IO tal-volum kollu meta tikteb fajl wieħed;
  • u l-kunċett ġenerali jidher inqas produttiv minħabba n-nuqqas ta 'distribuzzjoni tad-dejta fi blokki, fejn huwa aktar faċli li tibbilanċja u ssolvi l-problema ta' distribuzzjoni uniformi, u mhux kif issa l-fajl kollu jidħol fi blokka.

Mid-deskrizzjoni uffiċjali arkitettura aħna wkoll involontarjament nifhmu li gluster jaħdem bħala ħażna ta 'fajls fuq RAID ta' hardware klassiku. Kien hemm tentattivi ta 'żvilupp biex jinqatgħu fajls (Sharding) fi blokki, iżda dan kollu huwa żieda li timponi telf ta' prestazzjoni fuq l-approċċ arkitettoniku diġà eżistenti, flimkien mal-użu ta 'komponenti mqassma liberament bħal dawn b'limitazzjonijiet ta' prestazzjoni bħal Fuse. M'hemm l-ebda servizzi ta 'metadata, li jillimitaw il-kapaċitajiet ta' prestazzjoni u tolleranza għall-ħsarat tal-ħażna meta jqassmu fajls fi blokki. Jistgħu jiġu osservati indikaturi ta 'prestazzjoni aħjar bil-konfigurazzjoni "Distributed Replicated" u n-numru ta' nodi għandu jkun mill-inqas 6 biex torganizza replika affidabbli 3 b'distribuzzjoni ottimali tat-tagħbija.

Dawn is-sejbiet huma wkoll relatati mad-deskrizzjoni tal-esperjenza tal-utent gluster u meta mqabbla ma ' ceph, u hemm ukoll deskrizzjoni tal-esperjenza li twassal għal fehim ta 'din il-konfigurazzjoni aktar produttiva u aktar affidabbli "Imqassam Replikat".
Tqabbil fil-qosor tal-arkitettura SDS jew is-sejba tal-pjattaforma tal-ħażna t-tajba (GlusterVsCephVsVirtuozzoStorage)

L-istampa turi d-distribuzzjoni tat-tagħbija meta tikteb żewġ fajls, fejn kopji tal-ewwel fajl huma mqassma fuq l-ewwel tliet servers, li huma kkombinati fil-grupp tal-volum 0, u tliet kopji tat-tieni fajl jitqiegħdu fuq it-tieni grupp volum1 ta 'tlieta. servers. Kull server għandu disk wieħed.

Il-konklużjoni ġenerali hija li tista 'tuża Gluster, iżda bil-fehim li se jkun hemm limitazzjonijiet fil-prestazzjoni u t-tolleranza tal-ħsarat li joħolqu diffikultajiet taħt ċerti kundizzjonijiet ta' soluzzjoni iperkonverġenti, fejn ir-riżorsi huma meħtieġa wkoll għat-tagħbijiet tal-kompjuters ta 'ambjenti virtwali.

Hemm ukoll xi indikaturi tal-prestazzjoni Gluster li jistgħu jinkisbu taħt ċerti kundizzjonijiet, limitati għal tolleranza għall-ħsarat.

ceph

Issa ejja nħarsu lejn Ceph mid-deskrizzjonijiet tal-arkitettura li stajt issib. Hemm ukoll paragun bejn Glusterfs u Ceph, fejn tista 'tifhem immedjatament li huwa rakkomandabbli li tuża Ceph fuq servers separati, peress li s-servizzi tiegħu jeħtieġu r-riżorsi kollha tal-hardware taħt tagħbija.

arkitettura Ceph aktar kumplessi minn Gluster u hemm servizzi bħal servizzi ta 'metadata, iżda l-munzell kollu ta' komponenti huwa pjuttost kumpless u mhux flessibbli ħafna biex jintuża f'soluzzjoni ta 'virtwalizzazzjoni. Id-dejta hija maħżuna fi blokki, li tidher aktar produttiva, iżda fil-ġerarkija tas-servizzi kollha (komponenti), hemm telf u latency taħt ċerti tagħbijiet u kundizzjonijiet ta 'emerġenza, pereżempju dan li ġej artikolu.

Mid-deskrizzjoni tal-arkitettura, il-qalb hija CRUSH, li grazzi għaliha jintgħażel il-post għall-ħażna tad-dejta. Li jmiss jiġi PG - din hija l-aktar astrazzjoni diffiċli (grupp loġiku) biex tifhem. Il-PGs huma meħtieġa biex jagħmlu CRUSH aktar effettiv. L-għan ewlieni tal-PG huwa li jiġbor oġġetti biex jitnaqqas il-konsum tar-riżorsi, tiżdied il-prestazzjoni u l-iskalabbiltà. L-indirizzar ta 'oġġetti direttament, individwalment, mingħajr ma jiġu kkombinati fi PG ikun jiswa ħafna. OSD huwa servizz għal kull disk individwali.

Tqabbil fil-qosor tal-arkitettura SDS jew is-sejba tal-pjattaforma tal-ħażna t-tajba (GlusterVsCephVsVirtuozzoStorage)

Tqabbil fil-qosor tal-arkitettura SDS jew is-sejba tal-pjattaforma tal-ħażna t-tajba (GlusterVsCephVsVirtuozzoStorage)

Cluster jista' jkollu ġabra ta' data waħda jew ħafna għal skopijiet differenti u b'settings differenti. Pools huma maqsuma fi gruppi ta 'tqegħid. Gruppi ta' tqegħid jaħżnu oġġetti li l-klijenti jkollhom aċċess. Dan huwa fejn jispiċċa l-livell loġiku, u jibda l-livell fiżiku, minħabba li kull grupp ta 'tqegħid huwa assenjat diska prinċipali waħda u diversi diski replika (kemm jiddependu eżattament fuq il-fattur ta' replikazzjoni tal-pool). Fi kliem ieħor, fil-livell loġiku l-oġġett huwa maħżun fi grupp speċifiku ta 'tqegħid, u fil-livell fiżiku - fuq id-diski li huma assenjati lilu. F'dan il-każ, id-diski jistgħu jkunu fiżikament lokalizzati fuq nodi differenti jew saħansitra f'ċentri tad-dejta differenti.

F'din l-iskema, il-gruppi ta 'tqegħid jidhru qishom livell meħtieġ għall-flessibbiltà tas-soluzzjoni kollha, iżda fl-istess ħin, bħala ħolqa żejda f'din il-katina, li b'mod involontarju tissuġġerixxi telf ta' produttività. Pereżempju, meta tikteb id-data, is-sistema teħtieġ li taqsamha f'dawn il-gruppi u mbagħad fil-livell fiżiku fid-diska prinċipali u d-diski għar-repliki. Jiġifieri, il-funzjoni Hash taħdem meta tfittex u ddaħħal oġġett, iżda hemm effett sekondarju - huwa spejjeż għoljin ħafna u restrizzjonijiet fuq il-bini mill-ġdid tal-hash (meta żżid jew tneħħi disk). Problema oħra tal-hash hija l-lokazzjoni ċara tad-data li ma tistax tinbidel. Jiġifieri, jekk b'xi mod id-diska tkun taħt tagħbija miżjuda, allura s-sistema ma jkollhiex l-opportunità li ma tiktebx lilha (billi tagħżel disk ieħor), il-funzjoni tal-hash tobbliga li d-data tkun tinsab skont ir-regola, tkun kemm hi ħażina id-diska hija, għalhekk Ceph jiekol ħafna memorja meta jibni mill-ġdid il-PG f'każ ta 'awto-fejqan jew iż-żieda tal-ħażna. Il-konklużjoni hija li Ceph jaħdem tajjeb (għalkemm bil-mod), iżda biss meta ma jkunx hemm skalar, sitwazzjonijiet ta 'emerġenza, jew aġġornamenti.

Hemm, ovvjament, għażliet biex tiżdied il-prestazzjoni permezz tal-caching u l-qsim tal-cache, iżda dan jeħtieġ ħardwer tajjeb u xorta se jkun hemm telf. Iżda b'mod ġenerali, Ceph jidher aktar jitħajjar minn Gluster għall-produttività. Ukoll, meta tuża dawn il-prodotti, huwa meħtieġ li jitqies fattur importanti - dan huwa livell għoli ta 'kompetenza, esperjenza u professjonaliżmu b'enfasi kbira fuq Linux, peress li huwa importanti ħafna li jiġi skjerat, kkonfigurat u miżmum kollox b'mod korrett, li jimponi saħansitra aktar responsabbiltà u piż fuq l-amministratur.

Vstorage

L-arkitettura tidher saħansitra aktar interessanti Ħażna Virtuozzo (Vstorage), li jista 'jintuża flimkien ma' hypervisor fuq l-istess nodi, fuq l-istess glandola, iżda huwa importanti ħafna li tikkonfigura kollox b'mod korrett biex tinkiseb prestazzjoni tajba. Jiġifieri, l-iskjerament ta 'tali prodott mill-kaxxa fuq kwalunkwe konfigurazzjoni mingħajr ma jitqiesu r-rakkomandazzjonijiet skont l-arkitettura se jkun faċli ħafna, iżda mhux produttiv.

X'jista' jikkoeżistu għall-ħażna ħdejn is-servizzi tal-hypervisor kvm-qemu, u dawn huma biss ftit servizzi fejn instabet ġerarkija ottimali kompatta ta' komponenti: servizz tal-klijent immuntat permezz tal-FUSE (modifikat, mhux open source), servizz ta' metadata MDS (Servizz ta 'Metadata), blokki tad-data tas-servizz tas-servizz Chunk, li fil-livell fiżiku huwa ugwali għal disk wieħed u dak kollu. F'termini ta 'veloċità, ovvjament, huwa ottimali li tuża skema li tollera l-ħsarat b'żewġ repliki, imma jekk tuża caching u zkuk fuq drives SSD, allura kodifikazzjoni tolleranti għall-iżbalji (tħassir kodifikazzjoni jew raid6) tista' tkun overclocked b'mod deċenti fuq a. skema ibrida jew saħansitra aħjar fuq il-flash kollha. Hemm xi żvantaġġ bl-EC (tħassir kodifikazzjoni): meta tinbidel blokka tad-dejta waħda, huwa meħtieġ li jiġu kkalkolati mill-ġdid l-ammonti tal-parità. Biex tevita t-telf assoċjat ma 'din l-operazzjoni, Ceph jikteb lill-EC b'mod differit u jistgħu jseħħu problemi ta' prestazzjoni waqt ċertu talba, meta, pereżempju, il-blokki kollha jridu jinqraw, u fil-każ ta 'Virtuozzo Storage, titwettaq il-kitba ta' blokki mibdula bl-użu tal-approċċ ta '"sistema ta' fajl strutturat bil-log", li jimminimizza l-ispejjeż tal-kalkolu tal-parità. Biex jiġi stmat bejn wieħed u ieħor l-għażliet b'aċċelerazzjoni tax-xogħol bil-KE u mingħajr, hemm kalkulatur. – iċ-ċifri jistgħu jkunu approssimattivi skont il-koeffiċjent ta 'preċiżjoni tal-manifattur tat-tagħmir, iżda r-riżultat tal-kalkoli huwa ta' għajnuna tajba fl-ippjanar tal-konfigurazzjoni.

Dijagramma sempliċi tal-komponenti tal-ħażna ma tfissirx li dawn il-komponenti ma jassorbux riżorsi tal-ħadid, imma jekk tikkalkula l-ispejjeż kollha bil-quddiem, tista 'toqgħod fuq kollaborazzjoni ħdejn l-hypervisor.
Hemm skema biex jitqabbel il-konsum tar-riżorsi tal-ħardwer mis-servizzi tal-ħażna Ceph u Virtuozzo.

Tqabbil fil-qosor tal-arkitettura SDS jew is-sejba tal-pjattaforma tal-ħażna t-tajba (GlusterVsCephVsVirtuozzoStorage)

Jekk qabel kien possibbli li jitqabblu Gluster u Ceph bl-użu ta 'artikoli qodma, bl-użu tal-linji l-aktar importanti minnhom, allura ma' Virtuozzo huwa aktar diffiċli. M'hemmx ħafna artikoli dwar dan il-prodott u l-informazzjoni tista' tinġabar biss mid-dokumentazzjoni fuq bl-Ingliż jew bir-Russu jekk inqisu Vstorage bħala ħażna użata f'xi soluzzjonijiet hyperconverged f'kumpaniji bħal Rosplatforma u Acronis.

Nipprova ngħin b'deskrizzjoni ta' din l-arkitettura, għalhekk se jkun hemm ftit aktar test, iżda tieħu ħafna ħin biex tifhem id-dokumentazzjoni lilek innifsek, u d-dokumentazzjoni eżistenti tista' tintuża biss bħala referenza billi tirrevedi t-tabella tal-kontenut jew tiftix bil-kelma prinċipali.

Ejja nikkunsidraw il-proċess ta 'reġistrazzjoni f'konfigurazzjoni ta' ħardwer ibridu bil-komponenti deskritti hawn fuq: ir-reġistrazzjoni tibda tmur għan-node li minnu l-klijent beda dan (is-servizz tal-punt tal-muntaġġ FUSE), iżda l-komponent prinċipali tas-Servizz tal-Metadata (MDS) naturalment se jidderieġi lill-klijent direttament lejn is-servizz tal-biċċa mixtieqa (blokki CS tas-servizz tal-ħażna), jiġifieri, MDS ma tipparteċipax fil-proċess ta 'reġistrazzjoni, iżda sempliċement tidderieġi s-servizz lejn il-biċċa meħtieġa. B'mod ġenerali, nistgħu nagħtu analoġija għar-reġistrazzjoni bit-tferrigħ tal-ilma fil-btieti. Kull barmil huwa blokk tad-data ta '256MB.

Tqabbil fil-qosor tal-arkitettura SDS jew is-sejba tal-pjattaforma tal-ħażna t-tajba (GlusterVsCephVsVirtuozzoStorage)

Jiġifieri, disk wieħed huwa ċertu numru ta 'btieti bħal dawn, jiġifieri, il-volum tad-diska diviż b'256MB. Kull kopja titqassam f'node wieħed, it-tieni kważi b'mod parallel ma' nodu ieħor, eċċ... Jekk ikollna tliet repliki u hemm diski SSD għall-cache (għall-qari u l-kitba ta' zkuk), allura l-konferma tal-kitba sseħħ wara l-kitba il-log għall-SSD, u reset parallel mill-SSD se jkompli fuq l-HDD, bħallikieku fl-isfond. Fil-każ ta 'tliet repliki, ir-rekord se jiġi kommess wara konferma mill-SSD tat-tielet nodu. Jista 'jidher li s-somma tal-veloċità tal-kitba ta' tliet SSDs tista 'tinqasam bi tlieta u se nġibu l-veloċità tal-kitba ta' replika waħda, iżda l-kopji jinkitbu b'mod parallel u l-veloċità tal-Latency tan-netwerk hija ġeneralment ogħla minn dik tal-SSD, u fil-fatt il-prestazzjoni tal-kitba se tiddependi fuq in-netwerk. F'dan ir-rigward, sabiex tara IOPS reali, għandek bżonn tgħabbi b'mod korrett il-Vstorage kollu minn metodoloġija, jiġifieri, l-ittestjar tat-tagħbija reali, u mhux il-memorja u l-cache, fejn huwa meħtieġ li jittieħed kont tad-daqs korrett tal-blokka tad-dejta, in-numru ta 'ħjut, eċċ.

Ir-reġistru tar-reġistrazzjoni msemmi hawn fuq fuq l-SSD jaħdem b'tali mod li hekk kif id-dejta tidħol fih, tinqara immedjatament mis-servizz u tinkiteb fuq l-HDD. Hemm diversi servizzi ta' metadejta (MDS) għal kull cluster u n-numru tagħhom huwa determinat minn kworum, li jaħdem skont l-algoritmu Paxos. Mill-perspettiva tal-klijent, il-punt ta 'muntaġġ FUSE huwa folder ta' ħażna ta 'cluster li huwa simultanjament viżibbli għan-nodi kollha fil-cluster, kull node għandu klijent immuntat skond dan il-prinċipju, għalhekk din il-ħażna hija disponibbli għal kull node.

Għall-prestazzjoni ta 'kwalunkwe wieħed mill-approċċi deskritti hawn fuq, huwa importanti ħafna, fl-istadju tal-ippjanar u l-iskjerament, li jiġi kkonfigurat b'mod korrett in-netwerk, fejn se jkun hemm ibbilanċjar minħabba l-aggregazzjoni u l-bandwidth tal-kanal tan-netwerk magħżul b'mod korrett. Fl-aggregazzjoni, huwa importanti li tagħżel il-mod ta 'hashing it-tajjeb u d-daqsijiet tal-qafas. Hemm ukoll differenza qawwija ħafna mill-SDS deskritt hawn fuq, dan huwa fjus b'teknoloġija ta 'passaġġ mgħaġġel fil-Ħżin Virtuozzo. Li, minbarra l-fjus modernizzat, b'differenza għal soluzzjonijiet oħra ta 'sors miftuħ, iżid b'mod sinifikanti l-IOPS u jippermettilek li ma tkunx limitat minn skalar orizzontali jew vertikali. B'mod ġenerali, meta mqabbla mal-arkitetturi deskritti hawn fuq, din tidher aktar qawwija, iżda għal pjaċir bħal dan, ovvjament, għandek bżonn tixtri liċenzji, b'differenza Ceph u Gluster.

Fil-qosor, nistgħu nenfasizzaw il-quċċata tat-tlieta: Virtuozzo Storage jieħu l-ewwel post f'termini ta 'prestazzjoni u affidabbiltà tal-arkitettura, Ceph jieħu t-tieni post, u Gluster jieħu t-tielet post.

Il-kriterji li bihom intgħażlet Virtuozzo Storage: huwa sett ottimali ta 'komponenti arkitettoniċi, modernizzat għal dan l-approċċ Fuse b'passaġġ mgħaġġel, sett flessibbli ta' konfigurazzjonijiet ta 'hardware, inqas konsum tar-riżorsi u l-abbiltà li jaqsmu ma' komputazzjoni (kompjuters/virtwalizzazzjoni), jiġifieri, huwa kompletament adattat għal soluzzjoni iperkonverġenti , li huwa parti minnha. It-tieni post huwa Ceph minħabba li hija arkitettura aktar produttiva meta mqabbla ma 'Gluster, minħabba l-operat tagħha fi blokki, kif ukoll xenarji aktar flessibbli u l-abbiltà li taħdem fi clusters akbar.

Hemm pjanijiet biex tikteb paragun bejn vSAN, Space Direct Storage, Vstorage u Nutanix Storage, tittestja Vstorage fuq tagħmir HPE u Huawei, kif ukoll xenarji għall-integrazzjoni ta 'Vstorage ma' sistemi ta 'ħażna ta' ħardwer esterni, għalhekk jekk għoġbok l-artiklu, ikun sbieħ li tikseb feedback mingħandek, li jista 'jżid il-motivazzjoni għal artikoli ġodda, b'kont meħud tal-kummenti u x-xewqat tiegħek.

Sors: www.habr.com

Żid kumment