Ne argumentojmë në detaje se çfarë e bën OceanStor Dorado 18000 V6 një sistem magazinimi vërtet të nivelit të lartë me një rezervë të mirë për vitet e ardhshme. Në të njëjtën kohë, ne shpërndajmë frikën e zakonshme për ruajtjen e të gjithë Flash-it dhe tregojmë se si Huawei nxjerr maksimumin prej tyre: NVMe nga fundi në fund, memorie shtesë në SCM dhe një mori zgjidhjesh të tjera.


Peizazh i ri i të dhënave - ruajtja e re e të dhënave
Intensiteti i të dhënave është në rritje në të gjitha industritë. Dhe sektori bankar është një ilustrim i qartë i kësaj. Gjatë viteve të fundit, numri i transaksioneve bankare është rritur më shumë se dhjetë herë. Siç tregon , vetëm në Rusi në periudhën nga 2010 deri në 2018 numri i transaksioneve pa para duke përdorur kartat plastike tregoi një rritje më shumë se tridhjetëfish - nga 5,8 në 172 për person në vit. Para së gjithash, triumfi i mikropagesave: shumica prej nesh janë lidhur me bankingun online, dhe banka tani është në majë të gishtave - në telefon.
Infrastruktura IT e një institucioni krediti duhet të jetë gati për një sfidë të tillë. Dhe kjo është vërtet një sfidë. Ndër të tjera, nëse më parë banka kishte nevojë të siguronte disponueshmërinë e të dhënave vetëm gjatë orarit të saj të punës, tani është 24/7. Deri kohët e fundit, 5 ms konsiderohej një shkallë e pranueshme e vonesës, pra çfarë? Tani edhe 1 ms është e tepërt. Për një sistem modern ruajtjeje, objektivi është 0,5 ms.
E njëjta gjë me besueshmërinë: në vitet 2010, u formua një kuptim empirik se mjafton për të sjellë nivelin e tij në "pesë dhjetëra" - 99,999%. Vërtetë, ky kuptim është bërë i vjetëruar. Në vitin 2020, është absolutisht normale që një biznes të kërkojë 99,9999% për ruajtje dhe 99,99999% për arkitekturën e përgjithshme. Dhe kjo nuk është aspak një trill, por një nevojë urgjente: ose nuk ka afat kohor për mirëmbajtjen e infrastrukturës, ose është e vogël.

Për qartësi, është e përshtatshme që këta tregues të projektohen në planin e parave. Mënyra më e lehtë është në shembullin e institucioneve financiare. Grafiku i mësipërm tregon se sa fiton secila nga 10 bankat më të mira në botë në orë. Vetëm për Bankën Industriale dhe Tregtare të Kinës, kjo është jo më pak se 5 milionë dollarë. Kjo është saktësisht sa do të kushtojë një orë ndërprerje e infrastrukturës së IT të organizatës më të madhe të kreditit në Kinë (dhe vetëm fitimet e humbura merren parasysh në llogaritja!). Nga ky këndvështrim, është e qartë se reduktimi i kohës së ndërprerjes dhe rritja e besueshmërisë, jo vetëm me disa përqind, por edhe me fraksione të përqindjes, janë plotësisht të justifikuara në mënyrë racionale. Jo vetëm për arsye të rritjes së konkurrencës, por thjesht për hir të ruajtjes së pozicioneve në treg.
Ndryshime të krahasueshme po ndodhin në industri të tjera. Për shembull, në transportin ajror: para pandemisë, udhëtimi ajror po fitonte vrull nga viti në vit dhe shumë filluan ta përdorin atë pothuajse si një taksi. Sa i përket modeleve të konsumatorëve, zakoni i disponueshmërisë totale të shërbimeve ka zënë rrënjë në shoqëri: pas mbërritjes në aeroport, duhet të lidhemi me Wi-Fi, akses në shërbimet e pagesave, akses në një hartë të zonës, etj. si rezultat, ngarkesa në infrastrukturë dhe shërbime në hapësirat publike u rrit shumëfish. Dhe ato qasje për infrastrukturën e saj, ndërtimin, të cilat i konsideronim të pranueshme edhe një vit më parë, po vjetrohen me shpejtësi.

A është shumë herët për të kaluar në All-Flash?
Për të zgjidhur problemet e përmendura më lart, për sa i përket performancës, AFA - vargje të tëra flash, domethënë vargje të ndërtuara plotësisht në flash - janë përshtatshmëria më e mirë. Përveç nëse, deri vonë, kishte dyshime nëse ato janë të krahasueshme në besueshmëri me ato të mbledhura në bazë të HDD-ve dhe atyre hibride. Në fund të fundit, memoria flash në gjendje të ngurtë ka një metrikë të quajtur koha mesatare midis dështimeve ose MTBF (koha mesatare midis dështimeve). Degradimi i qelizave për shkak të operacioneve I/O, mjerisht, është i dhënë.
Pra, perspektivat për All-Flash u errësuan nga pyetja se si të parandalohet humbja e të dhënave në rast se SSD urdhëron të jetojë për një kohë të gjatë. Rezervimi është një opsion i njohur, vetëm koha e rikuperimit do të ishte e papranueshme e madhe bazuar në kërkesat moderne. Një tjetër rrugëdalje është vendosja e një niveli të dytë të ruajtjes në disqet e gishtave, megjithatë, me një skemë të tillë, disa nga avantazhet e një sistemi "rreptësisht flash" humbasin.
Megjithatë, numrat thonë të kundërtën: statistikat e gjigantëve të ekonomisë dixhitale, përfshirë Google, vitet e fundit tregojnë se flashi është disa herë më i besueshëm se hard disqet. Për më tepër, si në një periudhë të shkurtër kohore ashtu edhe në një periudhë të gjatë: mesatarisht, kalojnë katër deri në gjashtë vjet përpara se disqet flash të dështojnë. Për sa i përket besueshmërisë së ruajtjes së të dhënave, ato nuk janë në asnjë mënyrë inferiore ndaj disqeve në disqet magnetike me gisht, apo edhe i tejkalojnë ato.

Një tjetër argument tradicional në favor të ngasjeve me gisht është përballueshmëria e tyre. Pa dyshim, kostoja e ruajtjes së një terabajti në një hard disk është ende relativisht e ulët. Dhe nëse merrni parasysh vetëm koston e pajisjeve, është më e lirë të mbani një terabajt në një makinë gishti sesa në një SSD. Sidoqoftë, në kuadrin e planifikimit financiar, nuk ka rëndësi vetëm sa është blerë një pajisje e veçantë, por edhe cila është kostoja totale e posedimit të saj për një kohë të gjatë - nga tre deri në shtatë vjet.
Nga ky kënd, është krejtësisht ndryshe. Edhe nëse injorojmë dedulikimin dhe ngjeshjen, të cilat, si rregull, përdoren në grupet flash dhe e bëjnë funksionimin e tyre më fitimprurës ekonomikisht, mbeten karakteristika të tilla si hapësira e raftit të zënë nga media, shpërndarja e nxehtësisë dhe konsumi i energjisë. Dhe sipas tyre, flush i kalon paraardhësit. Si rezultat, TCO e sistemeve të ruajtjes së flashit, duke marrë parasysh të gjithë parametrat, shpesh është pothuajse gjysma më e madhe se në rastin e vargjeve në disqet me gisht ose hibride.
Sipas raporteve të ESG, sistemet e ruajtjes Dorado V6 All-Flash mund të arrijnë një ulje të kostos së pronësisë deri në 78% gjatë një intervali pesë-vjeçar, duke përfshirë përmes heqjes dhe kompresimit efikas, si dhe për shkak të konsumit të ulët të energjisë dhe shpërndarjes së nxehtësisë. Kompania analitike gjermane DCIG gjithashtu i rekomandon për përdorim si më të mirat për sa i përket TCO-së që disponohet sot.
Përdorimi i disqeve në gjendje të ngurtë bën të mundur kursimin e hapësirës së përdorshme, zvogëlimin e numrit të dështimeve, zvogëlimin e kohës për mirëmbajtjen e solucionit, zvogëlimin e konsumit të energjisë dhe shpërndarjen e nxehtësisë së sistemeve të ruajtjes. Dhe rezulton se AFA është të paktën ekonomikisht e krahasueshme me grupet tradicionale në disqet e gishtave, dhe shpesh madje i tejkalon ato.

Huawei Royal Flush
Ndër magazinimet tona All-Flash, vendi i parë i takon sistemit hi-end OceanStor Dorado 18000 V6. Dhe jo vetëm në mesin tonë: në përgjithësi, në industri, ajo mban rekordin e shpejtësisë - deri në 20 milionë IPOS në konfigurimin maksimal. Përveç kësaj, është jashtëzakonisht i besueshëm: edhe nëse dy kontrollues fluturojnë menjëherë, ose deri në shtatë kontrollues njëri pas tjetrit, ose një motor i tërë menjëherë, të dhënat do të mbijetojnë. Përparësi të konsiderueshme të "tetëmbëdhjetë mijëshe" jepen nga AI-ja e lidhur në të, duke përfshirë fleksibilitetin në menaxhimin e proceseve të brendshme. Le të shohim se si arrihet kjo.

Në pjesën më të madhe, Huawei ka një fillim të mirë sepse është i vetmi prodhues në treg që prodhon vetë sistemet e ruajtjes - plotësisht dhe plotësisht. Ne kemi qarkun tonë, mikrokodin tonë, shërbimin tonë.
Kontrolluesi nĂ« sistemet OceanStor Dorado Ă«shtĂ« ndĂ«rtuar mbi njĂ« procesor tĂ« dizajnit dhe prodhimit tĂ« vetĂ« Huawei - Kunpeng 920. Ai pĂ«rdor modulin e kontrollit Inteligjent tĂ« Kontrolluesit tĂ« Menaxhimit tĂ« Baseboard (iBMC), gjithashtu i yni. Ăipat e AI, pĂ«rkatĂ«sisht Ascend 310, tĂ« cilĂ«t optimizojnĂ« parashikimet e dĂ«shtimit dhe bĂ«jnĂ« rekomandime pĂ«r cilĂ«simet, janĂ« gjithashtu Huawei, si dhe bordet I/O - moduli Smart I/O. SĂ« fundi, kontrollorĂ«t nĂ« SSD janĂ« projektuar dhe prodhuar nga ne. E gjithĂ« kjo krijoi bazĂ«n pĂ«r tĂ« bĂ«rĂ« njĂ« zgjidhje integrale tĂ« balancuar dhe me performancĂ« tĂ« lartĂ«.

Gjatë vitit të kaluar, ne kemi zbatuar një projekt për të prezantuar këtë, sistemin tonë më të lartë të magazinimit, në një nga bankat më të mëdha ruse. Si rezultat, më shumë se 40 njësi OceanStor Dorado 18000 V6 në grupin e metrosë tregojnë performancë të qëndrueshme: më shumë se një milion IOPS mund të hiqen nga secili sistem, dhe kjo po merr parasysh vonesat për shkak të distancës.

NVMe nga fundi në fund
Sistemet mĂ« tĂ« fundit tĂ« ruajtjes sĂ« Huawei mbĂ«shtesin NVMe nga fundi nĂ« fund, tĂ« cilin e theksojmĂ« pĂ«r njĂ« arsye. Protokollet e pĂ«rdorura tradicionalisht pĂ«r aksesimin e disqeve u zhvilluan nĂ« lashtĂ«sinĂ« e TI-sĂ«: ato bazohen nĂ« komandat SCSI (pĂ«rshĂ«ndetje, vitet 1980!), TĂ« cilat tĂ«rheqin shumĂ« funksione pĂ«r tĂ« siguruar pajtueshmĂ«rinĂ« e prapambetur. Cilado qoftĂ« mĂ«nyra e aksesit qĂ« tĂ« pĂ«rdorni, sipĂ«rmarrja e protokollit nĂ« kĂ«tĂ« rast Ă«shtĂ« kolosale. Si rezultat, pĂ«r hapĂ«sirat ruajtĂ«se qĂ« pĂ«rdorin protokolle tĂ« lidhura me SCSI, vonesa nĂ« I/O nuk mund tĂ« jetĂ« mĂ« e ulĂ«t se 0,4â0,5 ms. Nga ana tjetĂ«r, duke qenĂ« njĂ« protokoll i krijuar pĂ«r tĂ« punuar me memorie flash dhe i çliruar nga paterica pĂ«r hir tĂ« pĂ«rputhshmĂ«risĂ« famĂ«keqe tĂ« prapambetur, NVMe - Non-Volatile Memory Express - ul vonesĂ«n nĂ« 0,1 ms, pĂ«r mĂ« tepĂ«r, jo nĂ« sistemin e ruajtjes, por nĂ« i gjithĂ« pirgu, nga hosti tek disqet. Jo çuditĂ«risht, NVMe Ă«shtĂ« nĂ« pĂ«rputhje me tendencat e zhvillimit tĂ« ruajtjes sĂ« tĂ« dhĂ«nave pĂ«r tĂ« ardhmen e parashikueshme. Ne gjithashtu u mbĂ«shtetĂ«m nĂ« NVMe - dhe gradualisht po largohemi nga SCSI. TĂ« gjitha sistemet e ruajtjes Huawei tĂ« prodhuara sot, duke pĂ«rfshirĂ« linjĂ«n Dorado, mbĂ«shtesin NVMe (megjithatĂ«, si nga fundi nĂ« fund ai zbatohet vetĂ«m nĂ« modelet e avancuara tĂ« serisĂ« Dorado V6).

FlashLink: Një grusht teknologjish
Teknologjia e gurthemelit për të gjithë linjën OceanStor Dorado është FlashLink. Më saktësisht, është një term që kombinon një grup integral teknologjish që shërbejnë për të siguruar performancë dhe besueshmëri të lartë. Kjo përfshin teknologjitë e deduifikimit dhe kompresimit, funksionimin e sistemit të shpërndarjes së të dhënave RAID 2.0+, ndarjen e të dhënave "të ftohta" dhe "të nxehta", regjistrimin e të dhënave vijuese me shirita të plotë (shkrimet e rastësishme, me të dhëna të reja dhe të ndryshuara, grumbullohen në një grumbull i madh dhe i shkruar në mënyrë sekuenciale, gjë që rrit shpejtësinë e leximit-shkrimit).
Ndër të tjera, FlashLink përfshin dy komponentë të rëndësishëm - Wear Leveling dhe Global Garbage Collection. Ato duhet të trajtohen veçmas.
NĂ« fakt, çdo makinĂ« nĂ« gjendje tĂ« ngurtĂ« Ă«shtĂ« njĂ« sistem ruajtjeje nĂ« miniaturĂ«, me njĂ« numĂ«r tĂ« madh blloqesh dhe njĂ« kontrollues qĂ« siguron disponueshmĂ«rinĂ« e tĂ« dhĂ«nave. Dhe sigurohet ndĂ«r tĂ« tjera edhe pĂ«r faktin se tĂ« dhĂ«nat nga qelitĂ« e âvrarĂ«veâ kalojnĂ« te âjo i vrarĂ«â. Kjo siguron qĂ« ato tĂ« mund tĂ« lexohen. EkzistojnĂ« algoritme tĂ« ndryshme pĂ«r njĂ« transferim tĂ« tillĂ«. NĂ« rastin e pĂ«rgjithshĂ«m, kontrolluesi pĂ«rpiqet tĂ« balancojĂ« konsumin e tĂ« gjitha qelizave tĂ« ruajtjes. Kjo qasje ka njĂ« anĂ« negative. Kur tĂ« dhĂ«nat zhvendosen brenda SSD-sĂ«, numri i operacioneve I/O qĂ« ai kryen zvogĂ«lohet nĂ« mĂ«nyrĂ« dramatike. Tani pĂ«r tani, Ă«shtĂ« njĂ« e keqe e domosdoshme.
Kështu, nëse ka shumë SSD në sistem, një "sharrë" shfaqet në grafikun e performancës, me ulje-ngritje të mprehta. Problemi është se një makinë nga grupi mund të fillojë migrimin e të dhënave në çdo kohë, dhe performanca e përgjithshme hiqet në të njëjtën kohë nga të gjitha SSD-të në grup. Por inxhinierët e Huawei kuptuan se si të shmangnin "sharrën".
Për fat të mirë, si kontrollorët në disqet, ashtu edhe kontrolluesi i ruajtjes, dhe firmware-i i Huawei janë "vendas", këto procese në OceanStor Dorado 18000 V6 nisen në mënyrë qendrore, në mënyrë sinkrone në të gjitha disqet në grup. Për më tepër, me komandën e kontrolluesit të ruajtjes, dhe pikërisht kur nuk ka ngarkesë të rëndë I/O.
Ăipi i inteligjencĂ«s artificiale Ă«shtĂ« gjithashtu i pĂ«rfshirĂ« nĂ« zgjedhjen e momentit tĂ« duhur pĂ«r transferimin e tĂ« dhĂ«nave: bazuar nĂ« statistikat e goditjeve pĂ«r muajt e mĂ«parshĂ«m, ai Ă«shtĂ« nĂ« gjendje tĂ« parashikojĂ« me probabilitetin mĂ« tĂ« lartĂ« nĂ«se do tĂ« presim hyrje / dalje aktive nĂ« tĂ« ardhmen e afĂ«rt, dhe nĂ«se pĂ«rgjigja Ă«shtĂ« negative dhe ngarkesa nĂ« sistem nĂ« momentin aktual Ă«shtĂ« e vogĂ«l, atĂ«herĂ« kontrolluesi komandon tĂ« gjitha disqet: ata qĂ« kanĂ« nevojĂ« pĂ«r Nivelimin e Veshjes duhet ta bĂ«jnĂ« atĂ« menjĂ«herĂ« dhe nĂ« mĂ«nyrĂ« sinkronike.
Plus, kontrolluesi i sistemit sheh se çfarë po ndodh në secilën qelizë të diskut, ndryshe nga sistemet e ruajtjes së prodhuesve konkurrues: ata janë të detyruar të blejnë media të gjendjes së ngurtë nga shitësit e palëve të treta, kjo është arsyeja pse detajet e nivelit të celularit nuk janë të disponueshme për kontrollorët e magazinave të tilla.
Si rezultat, OceanStor Dorado 18000 V6 ka një periudhë shumë të shkurtër degradimi të performancës në funksionin Wear Leveling dhe kryhet kryesisht kur nuk ndërhyn me asnjë proces tjetër. Kjo jep performancë të lartë të qëndrueshme në baza të vazhdueshme.

ĂfarĂ« e bĂ«n OceanStor Dorado 18000 V6 tĂ« besueshĂ«m
Ekzistojnë katër nivele të besueshmërisë në sistemet moderne të ruajtjes së të dhënave:
- harduer, në nivel disku;
- arkitektonike, në nivelin e pajisjeve;
- arkitektonike së bashku me pjesën softuerike;
- kumulative, që lidhet me zgjidhjen në tërësi.
Meqenëse, kujtojmë, kompania jonë projekton dhe prodhon vetë të gjithë komponentët e sistemit të ruajtjes, ne ofrojmë besueshmëri në secilin nga katër nivelet, me aftësinë për të monitoruar plotësisht atë që po ndodh në cilin prej tyre në këtë moment.

Besueshmëria e disqeve garantohet kryesisht nga Wear Leveling dhe Global Garbage Collection të përshkruara më parë. Kur një SSD duket si një kuti e zezë për sistemin, ai nuk e ka idenë se si saktësisht konsumohen qelizat në të. Për OceanStor Dorado 18000 V6, disqet janë transparente, gjë që bën të mundur balancimin e barabartë në të gjithë disqet në grup. Kështu, rezulton të zgjasë ndjeshëm jetën e SSD dhe të sigurojë një nivel të lartë të besueshmërisë së funksionimit të tyre.

Gjithashtu, besueshmëria e diskut ndikohet nga qeliza shtesë të tepërta në të. Dhe së bashku me një rezervë të thjeshtë, sistemi i ruajtjes përdor të ashtuquajturat qeliza DIF, të cilat përmbajnë kontrolle, si dhe kode shtesë për të mbrojtur çdo bllok nga një gabim i vetëm, përveç mbrojtjes në nivelin e grupit RAID.

ĂelĂ«si i besueshmĂ«risĂ« arkitekturore Ă«shtĂ« zgjidhja SmartMatrix. Me pak fjalĂ«, kĂ«ta janĂ« katĂ«r kontrollues qĂ« ulen nĂ« njĂ« plan tĂ« pasmĂ« pasiv si pjesĂ« e njĂ« motori (motori). Dy nga kĂ«ta motorĂ« - pĂ«rkatĂ«sisht, me tetĂ« kontrollues - janĂ« tĂ« lidhur me raftet e zakonshme me ngasje. FalĂ« SmartMatrix, edhe nĂ«se shtatĂ« nga tetĂ« kontrollues pushojnĂ« sĂ« funksionuari, qasja nĂ« tĂ« gjitha tĂ« dhĂ«nat, si pĂ«r lexim ashtu edhe pĂ«r shkrim, do tĂ« mbetet. Dhe me humbjen e gjashtĂ« nga tetĂ« kontrollues, madje do tĂ« jetĂ« e mundur tĂ« vazhdohen operacionet e memorizimit.

Pllakat I/O në të njëjtin plan prapa pasiv janë të disponueshme për të gjithë kontrollorët, si në pjesën e përparme ashtu edhe në pjesën e pasme. Me një skemë të tillë lidhjeje me rrjetë të plotë, pavarësisht se çfarë dështon, qasja në disqet ruhet gjithmonë.

ĂshtĂ« mĂ« e pĂ«rshtatshme tĂ« flasim pĂ«r besueshmĂ«rinĂ« e njĂ« arkitekture nĂ« kontekstin e mĂ«nyrave tĂ« dĂ«shtimit nga tĂ« cilat sistemi i ruajtjes Ă«shtĂ« nĂ« gjendje tĂ« mbrojĂ«.
Magazinimi do t'i mbijetojë situatës pa humbje nëse dy kontrollues "bien", duke përfshirë në të njëjtën kohë. Një stabilitet i tillë arrihet për shkak të faktit se çdo bllok i cache sigurisht që ka dy kopje të tjera në kontrollues të ndryshëm, domethënë, në total ekziston në tre kopje. Dhe të paktën njëri është në një motor tjetër. Kështu, edhe nëse i gjithë motori ndalon së punuari - me të katër kontrolluesit e tij - është e garantuar që të gjitha informacionet që ishin në memorien e memories do të ruhen, sepse cache do të dublikohet në të paktën një kontrollues nga motori i mbetur. Më në fund, me një lidhje serike, mund të humbni deri në shtatë kontrollues, dhe edhe nëse ato eliminohen në blloqe me dy, - dhe përsëri, të gjitha I/O dhe të gjitha të dhënat nga cache do të ruhen.

Kur krahasohet me ruajtjen e nivelit të lartë nga prodhues të tjerë, mund të shihet se vetëm Huawei ofron mbrojtje të plotë të të dhënave dhe disponueshmëri të plotë edhe pas vdekjes së dy kontrollorëve ose të gjithë motorit. Shumica e shitësve përdorin një skemë me të ashtuquajturat çifte kontrolluesish me të cilët lidhen disqet. Fatkeqësisht, në këtë konfigurim, nëse dy kontrollues dështojnë, ekziston rreziku i humbjes së aksesit I/O në disk.

Mjerisht, dështimi i një komponenti të vetëm nuk përjashtohet objektivisht. Në këtë rast, performanca do të bjerë për ca kohë: është e nevojshme që shtigjet të rindërtohen dhe qasja për operacionet I/O të rifillojë në lidhje me ato blloqe që ose erdhën për të shkruar, por nuk janë shkruar ende, ose u është kërkuar të të lexohen. OceanStor Dorado 18000 V6 ka një kohë mesatare rindërtimi prej afërsisht një sekondë, dukshëm më pak se analogu më i afërt në industri (4 s). Kjo arrihet falë të njëjtit plan të pasëm pasiv: kur kontrolluesi dështon, pjesa tjetër shikon menjëherë hyrjen / daljen e tij, dhe veçanërisht në cilin bllok të të dhënave nuk është shkruar; si rezultat, kontrolluesi më i afërt e merr procesin. Prandaj aftësia për të rivendosur performancën në vetëm një sekondë. Më duhet të shtoj, intervali është i qëndrueshëm: një sekondë për një kontrollues, një sekondë për një tjetër, etj.

NĂ« planin e pasĂ«m pasiv tĂ« OceanStor Dorado 18000 V6, tĂ« gjitha bordet janĂ« tĂ« disponueshme pĂ«r tĂ« gjithĂ« kontrollorĂ«t pa ndonjĂ« adresim shtesĂ«. Kjo do tĂ« thotĂ« qĂ« çdo kontrollues Ă«shtĂ« nĂ« gjendje tĂ« marrĂ« I/O nĂ« çdo port. ĂfarĂ«do porti frontend I/O hyn nĂ«, kontrolluesi do tĂ« jetĂ« gati pĂ«r ta pĂ«rpunuar atĂ«. Prandaj - numri minimal i transfertave tĂ« brendshme dhe njĂ« thjeshtim i dukshĂ«m i balancimit.
Balancimi i frontendit kryhet duke përdorur drejtuesin e shumë rrugëve, dhe balancimi shtesë kryhet brenda vetë sistemit, pasi të gjithë kontrollorët shohin të gjitha portat I / O.

Tradicionalisht, të gjitha grupet Huawei janë krijuar në atë mënyrë që të mos kenë një pikë të vetme dështimi. Ndërrimi i nxehtë, pa rindezjen e sistemit, i jepet vetes të gjithë komponentëve të tij: kontrollorët, modulet e energjisë, modulet e ftohjes, tabelat I/O, etj.

Rrit besueshmërinë e sistemit në tërësi dhe teknologjisë si RAID-TP. Ky është emri i një grupi RAID, i cili ju lejon të siguroheni nga dështimi i njëkohshëm i deri në tre disqe. Dhe një rindërtim 1 TB zgjat vazhdimisht më pak se 30 minuta. Rezultati më i mirë i regjistruar është tetë herë më i shpejtë se sa me të njëjtën sasi të dhënash në boshtin. Kështu, është e mundur të përdorni disqe jashtëzakonisht të mëdha, të themi 7,68 ose edhe 15 TB, dhe të mos shqetësoheni për besueshmërinë e sistemit.
ĂshtĂ« e rĂ«ndĂ«sishme qĂ« rindĂ«rtimi tĂ« kryhet jo nĂ« njĂ« makinĂ« rezervĂ«, por nĂ« njĂ« hapĂ«sirĂ« âârezervĂ« - njĂ« kapacitet rezervĂ«. Ădo disk ka hapĂ«sirĂ« ââtĂ« dedikuar tĂ« pĂ«rdorur pĂ«r rikuperimin e tĂ« dhĂ«nave pas njĂ« dĂ«shtimi. KĂ«shtu, rikuperimi kryhet jo sipas skemĂ«s "shumĂ« nĂ« njĂ«", por sipas skemĂ«s "shumĂ« nĂ« shumĂ«", pĂ«r shkak tĂ« sĂ« cilĂ«s Ă«shtĂ« e mundur qĂ« procesi tĂ« pĂ«rshpejtohet ndjeshĂ«m. Dhe pĂ«r sa kohĂ« qĂ« ka kapacitet tĂ« lirĂ«, rikuperimi mund tĂ« vazhdojĂ«.

Duhet të përmendim gjithashtu besueshmërinë e një zgjidhjeje nga disa depo - në një grup metro, ose, në terminologjinë e Huawei, HyperMetro. Skema të tilla mbështeten në të gjithë gamën e modeleve të sistemeve tona të ruajtjes së të dhënave dhe lejojnë aksesin në skedarë dhe në bllok. Për më tepër, në një bllok, ai funksionon si përmes Fiber Channel ashtu edhe përmes Ethernetit (përfshirë përmes iSCSI).
Në thelb, ne po flasim për replikim dydrejtimësh nga një sistem ruajtjeje në tjetrin, në të cilin LUN-it të përsëritur i jepet i njëjti LUN-ID si ai kryesor. Teknologjia funksionon kryesisht për shkak të konsistencës së cache-ve nga dy sisteme të ndryshme. Kështu, për hostin nuk ka rëndësi se në cilën anë është: si këtu ashtu edhe atje sheh të njëjtën makinë logjike. Si rezultat, asgjë nuk ju pengon nga vendosja e një grupi failover që përfshin dy sajte.
Për kuorumin përdoret kuorumi fizik ose virtual. Linux-makinë. Mund të vendoset në një vendndodhje të tretë dhe kërkesat e saj për burime janë modeste. Një skenar i zakonshëm është të marrësh me qira një vendndodhje virtuale ekskluzivisht për të pritur një VM të kuorumit.
Teknologjia gjithashtu lejon zgjerimin: dy depo - në një grup metro, një vend shtesë - me riprodhim asinkron.

Historikisht, shumë klientë kanë formuar një "kopsht zoologjik të magazinimit": një grumbull sistemesh magazinimi nga prodhues të ndryshëm, modele të ndryshme, gjenerata të ndryshme, me funksionalitete të ndryshme. Sidoqoftë, numri i hosteve mund të jetë mbresëlënës dhe shpesh ato virtualizohen. Në rrethana të tilla, një nga prioritetet e administrimit është ofrimi i shpejtë, i njëtrajtshëm dhe i përshtatshëm i disqeve logjike për hostet, mundësisht në një mënyrë që të mos thellohet se ku ndodhen fizikisht këta disqe. Kjo është ajo për të cilën është krijuar zgjidhja jonë e softuerit OceanStor DJ, e cila mund të menaxhojë njëzëri sisteme të ndryshme ruajtjeje dhe të ofrojë shërbime prej tyre pa u lidhur me një model specifik ruajtjeje.

E njëjta AI
Siç është përmendur tashmë, OceanStor Dorado 18000 V6 ka procesorë të integruar me algoritme të inteligjencës artificiale - Ascend. Ato përdoren, së pari, për të parashikuar dështimet, dhe së dyti, për të formuar rekomandime për akordim, gjë që gjithashtu rrit performancën dhe besueshmërinë e ruajtjes.
Horizonti i parashikimit është dy muaj: makineritë e AI supozojnë se çfarë do të ndodhë me një probabilitet të lartë gjatë kësaj kohe, nëse është koha për t'u zgjeruar, për të ndryshuar politikat e aksesit, etj. Rekomandimet lëshohen paraprakisht, gjë që ju lejon të planifikoni dritaret për mirëmbajtjen e sistemit përpara të kohës.

Faza tjetër e zhvillimit të AI nga Huawei është ta sjellë atë në nivelin global. Gjatë mirëmbajtjes së shërbimit - dështimi ose rekomandimet - Huawei grumbullon informacione nga sistemet e regjistrimit nga të gjitha depot e klientëve tanë. Bazuar në informacionin e mbledhur, bëhet një analizë e dështimeve të ndodhura ose të mundshme dhe bëhen rekomandime globale - bazuar jo në funksionimin e një sistemi specifik ruajtjeje apo edhe një duzinë, por në atë që po ndodh dhe ka ndodhur me mijëra të tillë pajisje. Mostra është e madhe, dhe bazuar në të, algoritmet e AI fillojnë të mësojnë jashtëzakonisht shpejt, kjo është arsyeja pse saktësia e parashikimeve rritet ndjeshëm.
Pajtueshmëri

Në 2019-2020, pati shumë insinuata për ndërveprimin e pajisjeve tona me produktet VMware. Për t'i ndaluar përfundimisht ata, ne deklarojmë me përgjegjësi: VMware është partner i Huawei. Të gjitha testet e mundshme janë kryer për përputhshmërinë e harduerit tonë me softuerin e tij, dhe si rezultat, në faqen e internetit të VMware, fleta e përputhshmërisë së harduerit liston sistemet e ruajtjes aktualisht të disponueshme të prodhimit tonë pa asnjë rezervë. Me fjalë të tjera, me mjedisin e softuerit VMware, mund të përdorni hapësirën ruajtëse të Huawei, duke përfshirë Dorado V6, me mbështetje të plotë.

E njëjta gjë vlen edhe për bashkëpunimin tonë me Brocade. Ne vazhdojmë të ndërveprojmë dhe testojmë produktet tona për pajtueshmërinë dhe mund të deklarojmë me besim se sistemet tona të ruajtjes janë plotësisht të pajtueshme me çelësat më të fundit të Brocade FC.

Ăka mĂ« tej?
Ne vazhdojmë të zhvillojmë dhe përmirësojmë procesorët tanë: ata bëhen më të shpejtë, më të besueshëm, performanca e tyre rritet. Ne po përmirësojmë gjithashtu çipat e inteligjencës artificiale - në bazë të tyre prodhohen edhe module që përshpejtojnë deduifikimin dhe kompresimin. Ata që kanë akses në konfiguruesin tonë mund të kenë vënë re se këto karta janë tashmë të disponueshme për porosi në modelet Dorado V6.
Ne po shkojmë gjithashtu drejt ruajtjes së memories shtesë në kujtesën e klasës së ruajtjes - memorie jo e paqëndrueshme me vonesë veçanërisht të ulët, rreth dhjetë mikrosekonda për lexim. Ndër të tjera, SCM jep një rritje të performancës, kryesisht kur punon me të dhëna të mëdha dhe kur zgjidh detyrat OLTP. Pas përditësimit tjetër, kartat SCM duhet të bëhen të disponueshme për porosi.
Dhe sigurisht, funksionaliteti i aksesit në skedar do të zgjerohet në të gjithë gamën e ruajtjes së të dhënave Huawei - qëndroni të sintonizuar për përditësimet tona.
Burimi: www.habr.com
