Kā izvēlēties glabātuvi, neieÅ”aujot sev kājā

Ievads

Ir pienācis laiks iegādāties krātuvi. Kuru ņemt, kuru klausÄ«ties? Pārdevējs A runā par pārdevēju B, un tad ir integrators C, kurÅ” stāsta pretējo un konsultē pārdevēju D. Šādā situācijā pat pieredzējuÅ”am krātuves arhitektam sagriezÄ«sies galva, Ä«paÅ”i ar visiem jaunajiem pārdevējiem un SDS un hiperkonverÄ£enci, kas ir modē. Å”odien.

Tātad, kā to visu izdomāt un nekļūt par muļķi? Mēs (AntonVirtual Antons Žbankovs un corp Jevgeņijs Elizarovs) mēģināsim par to runāt vienkārŔā krievu valodā.
Rakstam ir daudz lÄ«dzÄ«bu, un tas faktiski ir paplaÅ”inājums "Virtualizēts datu centra dizainsā€ attiecÄ«bā uz uzglabāŔanas sistēmu izvēli un uzglabāŔanas tehnoloÄ£iju pārskatÄ«Å”anu. ÄŖsi apskatÄ«sim vispārējo teoriju, taču iesakām izlasÄ«t arÄ« Å”o rakstu.

Kāpēc

Bieži var redzēt situāciju, kad uz kādu forumu vai specializētu tērzÄ“Å”anu, piemēram, Storage Discussions, ierodas jauns cilvēks un uzdod jautājumu: ā€œÅ”eit viņi man piedāvā divas uzglabāŔanas iespējas - ABC SuperStorage S600 un XYZ HyperOcean 666v4, ko jÅ«s ieteiktu ?ā€

Un sākas apjukums par to, kam ir kādas Å”ausmÄ«gu un nesaprotamu iezÄ«mju Ä«stenoÅ”anas iezÄ«mes, kas nesagatavotam cilvēkam ir pilnÄ«gi Ä·Ä«niskas.

Tātad galvenais un pats pirmais jautājums, kas jums jāuzdod sev ilgi pirms specifikāciju salÄ«dzināŔanas komerciālos priekÅ”likumos, ir KĀPĒC? Kāpēc Ŕī uzglabāŔanas sistēma ir nepiecieÅ”ama?

Kā izvēlēties glabātuvi, neieÅ”aujot sev kājā

Atbilde bÅ«s negaidÄ«ta un ļoti Tonija Robinsa stilā ā€“ uzglabāt datus. Paldies, kaptein! Un tomēr dažreiz mēs tik ļoti iedziļināmies detaļu salÄ«dzināŔanā, ka aizmirstam, kāpēc mēs to visu darām.

Tātad datu uzglabāŔanas sistēmas uzdevums ir saglabāt un nodroÅ”ināt piekļuvi DATIEM ar noteiktu veiktspēju. Sāksim ar datiem.

Dati

Datu tips

Kāda veida datus mēs plānojam uzglabāt? Ä»oti svarÄ«gs jautājums, kas var izslēgt daudzas uzglabāŔanas sistēmas no vienmērÄ«gas izskatÄ«Å”anas. Piemēram, plānojat saglabāt videoklipus un fotoattēlus. JÅ«s varat nekavējoties izsvÄ«trot sistēmas, kas paredzētas nejauÅ”ai piekļuvei mazos blokos, vai sistēmas ar patentētām saspieÅ”anas/dedublikācijas funkcijām. Tās var bÅ«t vienkārÅ”i lieliskas sistēmas, mēs nevēlamies teikt neko sliktu. Bet Å”ajā gadÄ«jumā viņu stiprās puses kļūs vājas (video un fotoattēli netiek saspiesti), vai arÄ« vienkārÅ”i ievērojami palielinās sistēmas izmaksas.

Un otrādi, ja paredzētais lietojums ir aizņemta darÄ«jumu DBVS, tad lieliskas multivides straumÄ“Å”anas sistēmas, kas spēj nodroÅ”ināt gigabaitus sekundē, bÅ«s slikta izvēle.

Datu apjoms

Cik daudz datu mēs plānojam uzglabāt? Kvantitāte vienmēr pārvērÅ”as kvalitātē; to nekad nevajadzētu aizmirst, jo Ä«paÅ”i mÅ«sdienās, kad datu apjoms strauji pieaug. Petabaitu klases sistēmas vairs nav nekas neparasts, taču, jo lielāka ir petabaitu ietilpÄ«ba, jo sistēma kļūst specifiskāka, jo mazāk pieejama bÅ«s mazo un vidējo brÄ«vpiekļuves sistēmu ierastā funkcionalitāte. Tas ir triviāli, jo tikai bloku piekļuves statistikas tabulas kļūst lielākas par kontrolieros pieejamo RAM apjomu. Nemaz nerunājot par saspieÅ”anu/lÄ«meņu noteikÅ”anu. Pieņemsim, ka mēs vēlamies pārslēgt saspieÅ”anas algoritmu uz jaudÄ«gāku un saspiest 20 petabaitus datu. Cik ilgi tas prasÄ«s: seÅ”us mēneÅ”us, gadu?

No otras puses, kāpēc uztraukties, ja jums ir jāuzglabā un jāapstrādā 500 GB datu? Tikai 500. Šāda izmēra mājsaimniecÄ«bas SSD (ar zemu DWPD) nemaksā neko. Kāpēc bÅ«vēt Fibre Channel rÅ«pnÄ«cu un pirkt augstas klases ārējās uzglabāŔanas sistēmas, kas maksā lÄ«dzvērtÄ«gi čuguna tiltam?

Cik procentu no kopējā apjoma ir karstie dati? Cik nevienmērÄ«ga ir slodze datu apjoma ziņā? Å eit daudzpakāpju uzglabāŔanas tehnoloÄ£ija vai Flash Cache var bÅ«t ļoti noderÄ«ga, ja karsto datu apjoms ir niecÄ«gs salÄ«dzinājumā ar kopējo. Vai otrādi, ar vienmērÄ«gu slodzi visā skaļumā, kas bieži sastopama straumÄ“Å”anas sistēmās (videonovēroÅ”ana, dažas analÄ«tikas sistēmas), Ŕādas tehnoloÄ£ijas neko nesniegs un tikai palielinās sistēmas izmaksas/sarežģītÄ«bu.

IP

Otra datu puse ir informācijas sistēma, kas izmanto datus. IS ir prasÄ«bu kopa, kas pārmanto datus. Papildinformāciju par IS skatiet sadaļā ā€œVirtualizēta datu centra dizainsā€.

Izturības/pieejamības prasības

Prasības par kļūdu toleranci / datu pieejamību tiek mantotas no IS, kas tos izmanto, un ir izteiktas trīs skaitļos - RPO, OTR, pieejamība.

PieejamÄ«ba ā€” daļa par noteiktu laika periodu, kurā dati ir pieejami darbam ar tiem. Parasti izsaka kā skaitli 9. Piemēram, divi deviņi gadā nozÄ«mē, ka pieejamÄ«ba ir 99%, vai citādi ir atļautas 95 stundas nepieejamÄ«bas gadā. TrÄ«s deviņi - 9,5 stundas gadā.

RPO / RTO nav kopējie rādÄ«tāji, bet gan par katru incidentu (avāriju), atŔķirÄ«bā no pieejamÄ«bas.

RPO ā€” negadÄ«juma laikā zaudēto datu apjoms (stundās). Piemēram, ja dublējumkopijas tiek veiktas vienu reizi dienā, tad RPO = 24 stundas. Tie. Katastrofas un pilnÄ«gas uzglabāŔanas sistēmas zuduma gadÄ«jumā var tikt zaudēti dati lÄ«dz 24 stundām (no dublÄ“Å”anas brīža). Pamatojoties uz IS norādÄ«to RPO, piemēram, tiek rakstÄ«ti rezerves noteikumi. Turklāt, pamatojoties uz RPO, jÅ«s varat saprast, cik daudz sinhronas/asinhronas datu replikācijas ir nepiecieÅ”amas.

OTR ā€” laiks, lai atjaunotu pakalpojumu (piekļuvi datiem) pēc katastrofas. Pamatojoties uz doto RTO vērtÄ«bu, mēs varam saprast, vai ir nepiecieÅ”ams metro klasteris, vai arÄ« pietiek ar vienvirziena replikāciju. Vai jums ir nepiecieÅ”ama augstākās klases vairāku kontrolieru uzglabāŔanas sistēma?

Kā izvēlēties glabātuvi, neieÅ”aujot sev kājā

Veiktspējas prasības

Lai gan tas ir ļoti acīmredzams jautājums, tas ir vieta, kur rodas lielākā daļa grūtību. Atkarībā no tā, vai jums jau ir kāda veida infrastruktūra vai nav, tiks izveidoti veidi, kā savākt nepiecieŔamo statistiku.

Jums jau ir uzglabāŔanas sistēma un jÅ«s meklējat nomaiņu vai vēlaties iegādāties citu paplaÅ”ināŔanai. Å eit viss ir vienkārÅ”i. JÅ«s saprotat, kādi pakalpojumi jums jau ir un kurus plānojat ieviest tuvākajā nākotnē. Pamatojoties uz paÅ”reizējiem pakalpojumiem, jums ir iespēja apkopot veiktspējas statistiku. Izlemiet par paÅ”reizējo IOPS skaitu un paÅ”reizējo latentumu ā€” kādi ir Å”ie rādÄ«tāji un vai ar tiem pietiek jÅ«su uzdevumu veikÅ”anai? To var izdarÄ«t gan paŔā datu glabāŔanas sistēmā, gan no resursdatoriem, kas ir savienoti ar to.

Turklāt jums ir jāskatās ne tikai uz paÅ”reizējo slodzi, bet arÄ« noteiktā laika posmā (vēlams mēnesÄ«). Paskaties, kādi ir maksimālie maksimumi dienas laikā, kādu slodzi rada rezerves kopija utt. Ja jÅ«su krātuves sistēma vai tās programmatÅ«ra nenodroÅ”ina pilnu Å”o datu komplektu, varat izmantot bezmaksas RRDtool, kas var darboties ar lielāko daļu populārāko uzglabāŔanas sistēmu un slēdžu un var sniegt detalizētu veiktspējas statistiku. Ir arÄ« vērts aplÅ«kot to saimniekdatoru slodzi, kas strādā ar Å”o krātuves sistēmu, konkrētām virtuālajām maŔīnām vai kas tieÅ”i darbojas Å”ajā resursdatorā.

Kā izvēlēties glabātuvi, neieÅ”aujot sev kājā

AtseviŔķi ir vērts atzÄ«mēt, ka, ja sējuma un datu krātuves, kas atrodas Å”ajā sējumā, aizkaves diezgan bÅ«tiski atŔķiras, jums vajadzētu pievērst uzmanÄ«bu savam SAN tÄ«klam, pastāv liela varbÅ«tÄ«ba, ka ar to ir problēmas un pirms jauna iegādes. sistēmu, ir vērts izpētÄ«t Å”o jautājumu, jo pastāv ļoti liela iespējamÄ«ba, ka paÅ”reizējās sistēmas veiktspēja palielināsies.

JÅ«s veidojat infrastruktÅ«ru no nulles vai iegādājaties sistēmu kādam jaunam pakalpojumam, kura slodzes jÅ«s nezināt. Ir vairākas iespējas: sazināties ar kolēģiem par specializētiem resursiem, lai mēģinātu noskaidrot un paredzēt slodzi, sazināties ar integratoru, kuram ir pieredze lÄ«dzÄ«gu pakalpojumu ievieÅ”anā un kurÅ” var aprēķināt slodzi jÅ«su vietā. Un treŔā iespēja (parasti visgrÅ«tākā, it Ä«paÅ”i, ja runa ir par paÅ”rakstÄ«tām vai retām lietojumprogrammām) ir mēģināt noskaidrot veiktspējas prasÄ«bas no sistēmas izstrādātājiem.

Un, lÅ«dzu, ņemiet vērā, ka no praktiskā pielietojuma viedokļa vispareizākais variants ir paÅ”reizējā aprÄ«kojuma izmēģinājums vai aprÄ«kojums, ko pārdevējs/integrators nodroÅ”ina testÄ“Å”anai.

ÄŖpaÅ”as prasÄ«bas

ÄŖpaÅ”as prasÄ«bas ir viss, kas neatbilst prasÄ«bām par veiktspēju, kļūdu toleranci un funkcionalitāti tieÅ”ai datu apstrādei un sniegÅ”anai.

Vienu no vienkārŔākajām Ä«paÅ”ajām prasÄ«bām datu uzglabāŔanas sistēmai var saukt par "atsavināmu datu nesēju". Un uzreiz kļūst skaidrs, ka Å”ajā datu glabāŔanas sistēmā ir jāiekļauj lentes bibliotēka vai vienkārÅ”i lentes diskdzinis, uz kura tiek izmesta rezerves kopija. Pēc tam speciāli apmācÄ«ts cilvēks paraksta lenti un lepni nes to uz speciālu seifu.
Vēl viens Ä«paÅ”as prasÄ«bas piemērs ir aizsargāts triecienizturÄ«gs dizains.

Kur

Otra galvenā sastāvdaļa konkrētas uzglabāŔanas sistēmas izvēlē ir informācija par to, KUR Ŕī uzglabāŔanas sistēma atradÄ«sies. Sākot no Ä£eogrāfijas vai klimatiskajiem apstākļiem un beidzot ar personālu.

Klients

Kam Ŕī uzglabāŔanas sistēma ir paredzēta? Jautājumam ir Ŕādi iemesli:

Valdības klients/komerciāls.
Komerciālajam pasÅ«tÄ«tājam nav nekādu ierobežojumu un viņam pat nav pienākuma rÄ«kot konkursus, izņemot saskaņā ar saviem iekŔējiem noteikumiem.

Valdības klients ir cita lieta. 44 Federālais likums un citi prieki ar piedāvājumiem un tehniskajām specifikācijām, kuras var apstrīdēt.

Klientam ir piemērotas sankcijas
Nu, jautājums Å”eit ir ļoti vienkārÅ”s ā€“ izvēli ierobežo tikai konkrētajam klientam pieejamie piedāvājumi.

IekŔējie noteikumi / pārdevēji / modeļi atļauts iegādāties
Arī jautājums ir ārkārtīgi vienkārŔs, taču jums tas ir jāatceras.

Kur fiziski

Šajā daļā tiek apskatīti visi jautājumi par ģeogrāfiju, sakaru kanāliem un mikroklimatu naktsmītnes telpās.

personāls

Kas strādās ar Å”o uzglabāŔanas sistēmu? Tas ir ne mazāk svarÄ«gi par to, ko spēj pati uzglabāŔanas sistēma.
NeatkarÄ«gi no tā, cik daudzsoloÅ”a, forÅ”a un brÄ«niŔķīga ir pārdevēja A uzglabāŔanas sistēma, visticamāk, nav jēgas to instalēt, ja darbinieki zina, kā strādāt tikai ar pārdevēju B, un nav plānoti turpmāki pirkumi un pastāvÄ«ga sadarbÄ«ba ar A.

Un, protams, jautājuma otra puse ir par to, cik apmācÄ«ts personāls ir pieejams konkrētajā Ä£eogrāfiskajā vietā tieÅ”i uzņēmumā un, iespējams, darba tirgÅ«. ReÄ£ioniem, izvēloties uzglabāŔanas sistēmas ar vienkārÅ”iem interfeisiem vai iespēju attālināti centralizēt pārvaldÄ«bu, var bÅ«t liela nozÄ«me. Pretējā gadÄ«jumā kādā brÄ«dÄ« tas var kļūt necieÅ”ami sāpÄ«gs. Internets ir pilns ar stāstiem par to, kā jauns darbinieks, kurÅ” ieradās, vakardienas students, konfigurēja tādu lietu, ka viss birojs tika iznÄ«cināts.

Kā izvēlēties glabātuvi, neieÅ”aujot sev kājā

Vide

Un, protams, svarÄ«gs jautājums ir, kādā vidē Ŕī uzglabāŔanas sistēma darbosies.

  • Kā ar baroÅ”anu/dzesÄ“Å”anu?
  • Kāds savienojums
  • Kur tas tiks uzstādÄ«ts?
  • utt.

Bieži vien Ŕie jautājumi tiek uztverti kā paŔsaprotami un īpaŔi neapdomāti, taču dažreiz tie ir tie, kas var visu pagriezt otrādi.

Ka

Pārdevējs

No Å”odienas (2019. gada vidus) Krievijas krātuves tirgu var iedalÄ«t 5 kategorijās:

  1. Augstākā nodaļa ir labi izveidoti uzņēmumi ar plaÅ”u disku plauktu klāstu no vienkārŔākajiem lÄ«dz augstākās klases (HPE, DellEMC, Hitachi, NetApp, IBM / Lenovo)
  2. Otrā divÄ«zija ā€“ uzņēmumi ar ierobežotu lÄ«niju, niÅ”as spēlētāji, nopietni SDS pārdevēji vai jaunpienācēji (Fujitsu, Datacore, Infinidat, Huawei, Pure u.c.)
  3. TreŔā divÄ«zija - niÅ”as risinājumi zemākajā lÄ«menÄ«, lēti SDS, uzlaboti produkti, kuru pamatā ir ceph un citi atvērti projekti (Infortrend, Starwind utt.)
  4. SOHO segments - mazas un Ä«paÅ”i mazas uzglabāŔanas sistēmas mājas/maza biroja lÄ«menÄ« (Synology, QNAP u.c.)
  5. Importa aizvietotas uzglabāŔanas sistēmas - tas ietver gan pirmās nodaļas aparatÅ«ru ar pārmarķētām etiÄ·etēm, gan retus otrās pārstāvjus (RAIDIX, otro mēs viņiem iedosim iepriekÅ”), bet galvenokārt Ŕī ir treŔā nodaļa (Aerodisk, Baum, Depo utt.)

SadalÄ«jums ir diezgan patvaļīgs, un tas nebÅ«t nenozÄ«mē, ka treÅ”ais jeb SOHO segments ir slikts un to nevar izmantot. Konkrētos projektos ar skaidri definētu datu kopu un slodzes profilu tie var darboties ļoti labi, cenas/kvalitātes attiecÄ«bas ziņā krietni pārspējot pirmo divÄ«ziju. Ir svarÄ«gi vispirms izlemt par saviem mērÄ·iem, izaugsmes perspektÄ«vām un nepiecieÅ”amo funkcionalitāti ā€“ un tad Synology jums uzticÄ«gi kalpos, un jÅ«su mati kļūs mÄ«ksti un zÄ«daini.

Viens no svarÄ«giem faktoriem, izvēloties pārdevēju, ir paÅ”reizējā vide. Cik daudz uzglabāŔanas sistēmu jums jau ir un ar kādām uzglabāŔanas sistēmām var strādāt jÅ«su inženieri. Vai jums ir nepiecieÅ”ams cits pārdevējs, cits kontaktpunkts, vai pakāpeniski migrēsit visu slodzi no pārdevēja A uz piegādātāju B?

Nevajadzētu radÄ«t vienÄ«bas, kas pārsniedz nepiecieÅ”amo.

iSCSI/FC/Fails

Inženieru vidÅ« nav vienprātÄ«bas jautājumā par piekļuves protokoliem, un debates vairāk atgādina teoloÄ£iskas diskusijas, nevis inženierzinātnes. Bet kopumā var atzÄ«mēt Ŕādus punktus:

FCoE vairāk miris nekā dzīvs.

FC pret iSCSI. Viena no galvenajām FC priekÅ”rocÄ«bām 2019. gadā salÄ«dzinājumā ar IP krātuvi, kas ir datu piekļuves rÅ«pnÄ«ca, tiek kompensēta ar Ä«paÅ”u IP tÄ«klu. FC nav globālu priekÅ”rocÄ«bu salÄ«dzinājumā ar IP tÄ«kliem, un IP var izmantot, lai izveidotu jebkura slodzes lÄ«meņa uzglabāŔanas sistēmas, lÄ«dz pat smagām DBVS sistēmām lielas bankas pamata banku sistēmai. No otras puses, FC nāve tiek pravietota jau vairākus gadus, taču kaut kas to visu laiku kavē. Å odien, piemēram, daži krātuves tirgus dalÄ«bnieki aktÄ«vi izstrādā NVMEoF standartu. Vai viņŔ dalÄ«sies ar FCoE likteni - laiks rādÄ«s.

Piekļuve failam tas arī nav nekas necienīgs. NFS/CIFS labi darbojas produktivitātes vidēs, un, ja tas ir pareizi izstrādāts, tam nav vairāk sūdzību kā bloku protokoliem.

Hibrīds / viss zibspuldzes masīvs

Klasiskās uzglabāŔanas sistēmas ir divu veidu:

  1. AFA (All Flash Array) - sistēmas, kas optimizētas SSD lietoÅ”anai.
  2. HibrÄ«ds ā€“ ļauj izmantot gan HDD, gan SSD vai to kombināciju.

To galvenā atŔķirÄ«ba ir atbalstÄ«tās uzglabāŔanas efektivitātes tehnoloÄ£ijas un maksimālais veiktspējas lÄ«menis (augsts IOPS un zems latentums). Abas sistēmas (lielākajā daļā to modeļu, neskaitot zemās klases segmentu) var darboties gan kā bloku, gan failu ierÄ«ces. AtbalstÄ«tā funkcionalitāte ir atkarÄ«ga no sistēmas lÄ«meņa, un jaunākiem modeļiem tā visbiežāk tiek samazināta lÄ«dz minimālajam lÄ«menim. Tam ir vērts pievērst uzmanÄ«bu, pētot konkrēta modeļa Ä«paŔības, nevis tikai visas lÄ«nijas iespējas kopumā. Tāpat, protams, no sistēmas lÄ«meņa ir atkarÄ«gi arÄ« tā tehniskie parametri, piemēram, procesors, atmiņas apjoms, keÅ”atmiņa, portu skaits un veidi utt. No pārvaldÄ«bas viedokļa AFA atŔķiras no hibrÄ«dajām (disku) sistēmām tikai ar SSD diskdziņu mehānismu ievieÅ”anu, un pat ja jÅ«s izmantojat SSD hibrÄ«dsistēmā, tas nebÅ«t nenozÄ«mē, ka jÅ«s varēsit lai sasniegtu veiktspējas lÄ«meni AFA sistēmas lÄ«menÄ«. Turklāt vairumā gadÄ«jumu hibrÄ«dsistēmās ir atspējoti iekļauti efektÄ«vi uzglabāŔanas mehānismi, un to iekļauÅ”ana noved pie veiktspējas zuduma.

ÄŖpaÅ”as uzglabāŔanas sistēmas

Papildus vispārējas nozÄ«mes uzglabāŔanas sistēmām, kas galvenokārt vērstas uz operatÄ«vo datu apstrādi, ir arÄ« Ä«paÅ”as uzglabāŔanas sistēmas ar galvenajiem principiem, kas bÅ«tiski atŔķiras no parastajiem (zems latentums, augsts IOPS):

PlaÅ”saziņas lÄ«dzekļi.

Å Ä«s sistēmas ir paredzētas lielu multivides failu glabāŔanai un apstrādei. Resp. aizkave kļūst praktiski nesvarÄ«ga, un priekÅ”plānā izvirzās iespēja nosÅ«tÄ«t un saņemt datus plaŔā joslā daudzās paralēlās plÅ«smās.

Krātuves sistēmu dublÄ“Å”ana dublÄ“Å”anai.

Tā kā rezerves kopijas izceļas ar lÄ«dzÄ«bu viena otrai, kas normālos apstākļos ir reti sastopama (vidējā rezerves kopija atŔķiras no vakardienas kopijas par 1-2%), Ŕī sistēmu klase ārkārtÄ«gi efektÄ«vi iepako tajās ierakstÄ«tos datus diezgan mazā fizisko datu nesēju skaits. Piemēram, dažos gadÄ«jumos datu saspieÅ”anas pakāpe var sasniegt 200 pret 1.

Objektu uzglabāŔanas sistēmas.

Å Ä«m uzglabāŔanas sistēmām nav parasto bloka piekļuves apjomu un failu koplietoÅ”anas, un galvenokārt tās atgādina milzÄ«gu datu bāzi. Piekļuvi Ŕādā sistēmā saglabātam objektam nodroÅ”ina unikāls identifikators vai metadati (piemēram, visi JPEG formāta objekti ar izveides datumu no XX-XX-XXXX lÄ«dz YY-YY-YYYY).

Atbilstības sistēma.

MÅ«sdienās Krievijā tie nav tik izplatÄ«ti, taču ir vērts pieminēt. Šādu uzglabāŔanas sistēmu mērÄ·is ir garantēta datu glabāŔana, lai tā atbilstu droŔības politikām vai normatÄ«vajām prasÄ«bām. Dažās sistēmās (piemēram, EMC Centera) ir ieviesta funkcija, kas aizliedz datu dzÄ“Å”anu ā€“ tiklÄ«dz tiek pagriezta atslēga un sistēma pāriet Å”ajā režīmā, ne administrators, ne kāds cits nevar fiziski izdzēst jau ierakstÄ«tos datus.

Patentētas tehnoloģijas

Flash keÅ”atmiņa

Flash Cache ir parasts nosaukums visām patentētajām tehnoloÄ£ijām, kas paredzētas zibatmiņas izmantoÅ”anai kā otrā lÄ«meņa keÅ”atmiņa. Izmantojot zibatmiņu, uzglabāŔanas sistēma parasti tiek aprēķināta tā, lai nodroÅ”inātu vienmērÄ«gu slodzi no magnētiskajiem diskiem, savukārt maksimumu apkalpo keÅ”atmiņa.

Å ajā gadÄ«jumā ir jāsaprot slodzes profils un piekļuves lokalizācijas pakāpe uzglabāŔanas apjomu blokiem. Flash keÅ”atmiņa ir tehnoloÄ£ija darba slodzēm ar ļoti lokalizētiem vaicājumiem, un tā praktiski nav piemērojama vienmērÄ«gi ielādētiem sējumiem (piemēram, analÄ«tikas sistēmām).

TirgÅ« ir pieejamas divas zibatmiņas keÅ”atmiņas ievieÅ”anas:

  • Tikai lasÄ«t. Å ajā gadÄ«jumā keÅ”atmiņā tiek saglabāti tikai nolasÄ«tie dati, un rakstÄ«Å”ana notiek tieÅ”i uz diskiem. Daži ražotāji, piemēram, NetApp, uzskata, ka rakstÄ«Å”ana viņu uzglabāŔanas sistēmās jau ir optimāla, un keÅ”atmiņa nepalÄ«dzēs.
  • LasÄ«t rakstÄ«t. Ne tikai lasÄ«Å”ana, bet arÄ« rakstÄ«Å”ana tiek saglabāta keÅ”atmiņā, kas ļauj buferizēt straumi un samazināt RAID soda ietekmi, kā rezultātā palielināt kopējo veiktspēju uzglabāŔanas sistēmām ar mazāk optimālu rakstÄ«Å”anas mehānismu.

LÄ«meņoÅ”ana

DaudzlÄ«meņu krātuve (nogurdinoÅ”a) ir tehnoloÄ£ija dažādu veiktspējas lÄ«meņu, piemēram, SSD un HDD, apvienoÅ”anai vienā disku pÅ«lā. Izteiktu datu bloku piekļuves nevienmērÄ«guma gadÄ«jumā sistēma spēs automātiski lÄ«dzsvarot datu blokus, pārceļot noslogotos uz augstas veiktspējas lÄ«meni, bet aukstos, gluži pretēji, uz lēnāku.

Zemākās un vidējās klases hibrÄ«dsistēmas izmanto daudzlÄ«meņu krātuvi ar datu pārvietoÅ”anu starp lÄ«meņiem pēc grafika. Tajā paŔā laikā daudzlÄ«meņu atmiņas bloka izmērs labākajiem modeļiem ir 256 MB. Å Ä«s funkcijas neļauj mums uzskatÄ«t, ka daudzpakāpju uzglabāŔanas tehnoloÄ£ija ir tehnoloÄ£ija produktivitātes palielināŔanai, kā daudzi cilvēki kļūdaini uzskata. DaudzlÄ«meņu uzglabāŔana zemās un vidējās klases sistēmās ir tehnoloÄ£ija uzglabāŔanas izmaksu optimizÄ“Å”anai sistēmām ar izteiktu slodzes nevienmērÄ«bu.

momentuzņēmums

NeatkarÄ«gi no tā, cik daudz mēs runājam par uzglabāŔanas sistēmu uzticamÄ«bu, ir daudz iespēju zaudēt datus, kas nav atkarÄ«gi no aparatÅ«ras problēmām. Tas var bÅ«t vÄ«rusi, hakeri vai jebkāda cita nejauÅ”a datu dzÄ“Å”ana/bojāŔana. Å Ä« iemesla dēļ ražoÅ”anas datu dublÄ“Å”ana ir inženiera darba neatņemama sastāvdaļa.

Momentuzņēmums ir apjoma momentuzņēmums noteiktā laika posmā. Strādājot ar lielāko daļu sistēmu, piemēram, virtualizāciju, datu bāzēm utt. mums jāuzņem tāds momentuzņēmums, no kura kopēsim datus uz rezerves kopiju, kamēr mÅ«su IS varēs droÅ”i turpināt darbu ar Å”o sējumu. Bet ir vērts atcerēties, ka ne visi momentuzņēmumi ir vienlÄ«dz noderÄ«gi. Dažādiem pārdevējiem ir atŔķirÄ«gas pieejas momentuzņēmumu izveidei, kas saistÄ«ti ar to arhitektÅ«ru.

Govs (kopÄ“Å”ana uz rakstÄ«Å”anas). Mēģinot uzrakstÄ«t datu bloku, tā sākotnējais saturs tiek kopēts uz Ä«paÅ”u apgabalu, pēc kura rakstÄ«Å”ana notiek kā parasti. Tas novērÅ” datu bojājumus momentuzņēmumā. Protams, visas Ŕīs ā€œparazÄ«tiskāsā€ datu manipulācijas rada papildu slodzi krātuves sistēmai, un Ŕī iemesla dēļ piegādātāji ar lÄ«dzÄ«gām implementācijām neiesaka izmantot vairāk nekā duci momentuzņēmumu un neizmantot tos ļoti noslogotos sējumos.

Rinda (novirzÄ«Å”ana rakstÄ«Å”anas laikā). Å ajā gadÄ«jumā sākotnējais apjoms dabiski sasalst, un, mēģinot rakstÄ«t datu bloku, uzglabāŔanas sistēma ieraksta datus Ä«paŔā apgabalā brÄ«vā vietā, mainot Ŕī bloka atraÅ”anās vietu metadatu tabulā. Tas ļauj samazināt pārrakstÄ«Å”anas darbÄ«bu skaitu, kas galu galā novērÅ” veiktspējas samazināŔanos un noņem ierobežojumus momentuzņēmumiem un to skaitam.

Momentuzņēmumi ir arī divu veidu saistībā ar lietojumprogrammām:

Pielietojuma konsekvence. Momentuzņēmuma izveides brÄ«dÄ« uzglabāŔanas sistēma izvelk aÄ£entu patērētāja operētājsistēmā, kas piespiedu kārtā izskalo diska keÅ”atmiņas no atmiņas uz disku un piespiež lietojumprogrammu to darÄ«t. Å ajā gadÄ«jumā, atjaunojot no momentuzņēmuma, dati bÅ«s konsekventi.

Konsekventa avārija. Å ajā gadÄ«jumā nekas tāds nenotiek, un momentuzņēmums tiek izveidots tāds, kāds tas ir. AtkopÅ”anas gadÄ«jumā no Ŕāda momentuzņēmuma attēls ir identisks tam, kas notiktu, ja strāvas padeve pēkŔņi tiktu izslēgta un ir iespējams zināms datu zudums, kas iestrēgst keÅ”atmiņā un nekad nesasniedz disku. Šādus momentuzņēmumus ir vieglāk ieviest un tie neizraisa lietojumprogrammu veiktspējas pasliktināŔanos, taču tie ir mazāk uzticami.

Kāpēc uzglabāŔanas sistēmās ir nepiecieÅ”ami momentuzņēmumi?

  • DublÄ“Å”ana bez aÄ£entiem tieÅ”i no uzglabāŔanas sistēmas
  • Izveidojiet testa vides, pamatojoties uz reāliem datiem
  • Failu glabāŔanas sistēmu gadÄ«jumā to var izmantot, lai izveidotu VDI vidi, hipervizora vietā izmantojot krātuves sistēmas momentuzņēmumus.
  • NodroÅ”iniet zemus RPO, izveidojot ieplānotus momentuzņēmumus ar frekvenci, kas ir ievērojami augstāka nekā rezerves kopÄ“Å”anas biežums

KlonēŔana

Apjoma klonÄ“Å”ana - darbojas pēc lÄ«dzÄ«ga principa kā momentuzņēmumi, taču tiek izmantots ne tikai datu lasÄ«Å”anai, bet arÄ« pilnÄ«gai darbÄ«bai ar tiem. Mēs varam iegÅ«t precÄ«zu sava sējuma kopiju ar visiem datiem, neveidojot fizisku kopiju, kas ietaupÄ«s vietu. Parasti apjoma klonÄ“Å”ana tiek izmantota programmā Test&Dev vai arÄ« tad, ja vēlaties pārbaudÄ«t dažu IS atjauninājumu funkcionalitāti. KlonÄ“Å”ana ļaus to izdarÄ«t pēc iespējas ātrāk un ekonomiski diska resursu ziņā, jo Tiks rakstÄ«ti tikai mainÄ«tie datu bloki.

Replikācija / žurnālu rakstīŔana

Replikācija ir mehānisms datu kopiju izveidei citā fiziskajā uzglabāŔanas sistēmā. Parasti katram pārdevējam ir patentēta tehnoloÄ£ija, kas darbojas tikai savā lÄ«nijā. Taču ir arÄ« treÅ”o puÅ”u risinājumi, tostarp tādi, kas darbojas hipervizora lÄ«menÄ«, piemēram, VMware vSphere Replication.

Patentēto tehnoloÄ£iju funkcionalitāte un lietoÅ”anas vienkārŔība parasti ir daudz pārāka par universālajām, taču tās izrādās nepiemērotas, ja, piemēram, ir nepiecieÅ”ams izgatavot NetApp kopiju uz HP MSA.

Replikācija ir sadalīta divos apakŔtipos:

Sinhrons. Sinhronās replikācijas gadÄ«jumā rakstÄ«Å”anas darbÄ«ba tiek nekavējoties nosÅ«tÄ«ta uz otro krātuves sistēmu, un izpilde netiek apstiprināta, kamēr attālā krātuves sistēma neapstiprina. Sakarā ar to piekļuves aizkave palielinās, bet mums ir precÄ«za datu spoguļkopija. Tie. RPO = 0 galvenās uzglabāŔanas sistēmas zuduma gadÄ«jumā.

asinhrons. RakstÄ«Å”anas darbÄ«bas tiek izpildÄ«tas tikai galvenajā krātuves sistēmā un tiek apstiprinātas nekavējoties, vienlaikus uzkrājot buferi pakeÅ”u pārsÅ«tÄ«Å”anai uz attālās krātuves sistēmu. Å is replikācijas veids attiecas uz mazāk vērtÄ«giem datiem vai kanāliem ar mazu joslas platumu vai lielu latentumu (parasti attālumiem, kas pārsniedz 100 km). AttiecÄ«gi RPO = pakeÅ”u sÅ«tÄ«Å”anas frekvence.

Bieži vien kopā ar replikāciju pastāv mehānisms mežizstrāde diska operācijas. Å ajā gadÄ«jumā mežizstrādei tiek atvēlēta speciāla zona un tiek glabātas noteikta dziļuma darbÄ«bas laikā vai ierobežotas ar baļķa tilpumu. Dažām patentētām tehnoloÄ£ijām, piemēram, EMC RecoverPoint, ir integrācija ar sistēmas programmatÅ«ru, kas ļauj saistÄ«t noteiktas grāmatzÄ«mes ar noteiktu žurnāla ierakstu. Pateicoties tam, ir iespējams atvilkt sējuma stāvokli (vai izveidot klonu) ne tikai uz 23. aprÄ«li, 11 stundām 59 sekundēm 13 milisekundēm, bet uz brÄ«di pirms ā€œDROP ALL TABLES; APŅEMTIES.ā€

Metro klasteris

Metro klasteris ir tehnoloÄ£ija, kas ļauj izveidot divvirzienu sinhronu replikāciju starp divām uzglabāŔanas sistēmām tā, lai no ārpuses Å”is pāris izskatās kā viena uzglabāŔanas sistēma. To izmanto, lai izveidotu kopas ar Ä£eogrāfiski atdalÄ«tām atzariem metro attālumos (mazāk par 100 km).

Pamatojoties uz izmantoÅ”anas piemēru virtualizācijas vidē, metroklasteris ļauj izveidot datu krātuvi ar virtuālajām maŔīnām, kas ir pieejama ierakstÄ«Å”anai no diviem datu centriem vienlaikus. Å ajā gadÄ«jumā hipervizora lÄ«menÄ« tiek izveidots klasteris, kas sastāv no saimniekiem dažādos fiziskos datu centros, kas savienoti ar Å”o datu krātuvi. Kas ļauj veikt Ŕādas darbÄ«bas:

  • PilnÄ«ga atkopÅ”anas procesa automatizācija pēc viena datu centra nāves. Bez papildu lÄ«dzekļiem visas virtuālās maŔīnas, kas darbojas miruÅ”ajā datu centrā, tiks automātiski restartētas atlikuÅ”ajā. RTO = augstas pieejamÄ«bas klastera taimauts (15 sekundes VMware) + laiks operētājsistēmas ielādei un pakalpojumu palaiÅ”anai.
  • IzvairÄ«Å”anās no katastrofām jeb, krieviski, izvairÄ«Å”anās no katastrofām. Ja datu centrā 1 ir plānoti elektroapgādes darbi, tad mums ir iespēja visu svarÄ«go slodzi migrēt uz 2. datu centru bez apstājas iepriekÅ”, pirms darbu sākÅ”anas.

Virtualizācija

Krātuves virtualizācija tehniski ir sējumu izmantoÅ”ana no citas krātuves sistēmas kā diski. Krātuves virtualizētājs var vienkārÅ”i pārsÅ«tÄ«t kāda cita sējumu patērētājam kā savu, vienlaikus atspoguļojot to citā krātuves sistēmā vai pat izveidot RAID no ārējiem sējumiem.
Klasiskie pārstāvji krātuves virtualizācijas klasē ir EMC VPLEX un IBM SVC. Un, protams, uzglabāŔanas sistēmas ar virtualizācijas funkcionalitāti - NetApp, Hitachi, IBM / Lenovo Storwize.

Kāpēc tas varētu būt vajadzīgs?

  • Redundance uzglabāŔanas sistēmas lÄ«menÄ«. Starp sējumiem tiek izveidots spogulis, un viena puse var bÅ«t uz HP 3Par, bet otra - uz NetApp. Un virtualizētājs ir no EMC.
  • Pārvietojiet datus ar minimālu dÄ«kstāves laiku starp dažādu ražotāju uzglabāŔanas sistēmām. Pieņemsim, ka dati ir jāmigrē no vecā 3Par, kas tiks norakstÄ«ts, uz jauno Dell. Å ajā gadÄ«jumā patērētāji tiek atvienoti no 3Par, apjomi tiek nodoti zem VPLEX un tiek atkārtoti uzrādÄ«ti patērētājiem. Tā kā skaļumā nekas nav mainÄ«jies, darbs turpinās. Skaļuma atspoguļoÅ”anas process uz jauno Dell sākas fonā, un pēc pabeigÅ”anas spogulis tiek sabojāts un 3Par tiek atspējots.
  • Metroklasteru organizÄ“Å”ana.

SaspieŔana/dedublikācija

SaspieÅ”ana un dublÄ“Å”anās ir tehnoloÄ£ijas, kas ļauj ietaupÄ«t vietu diskā jÅ«su uzglabāŔanas sistēmā. Uzreiz ir vērts pieminēt, ka principā ne visi dati tiek saspiesti un/vai dedublēti, savukārt daži datu veidi tiek saspiesti un dedublēti labāk, un daži - otrādi.

Ir divi saspieŔanas un dublēŔanas veidi:

Rindā ā€” datu bloku saspieÅ”ana un dublÄ“Å”anās notiek pirms Å”o datu ierakstÄ«Å”anas diskā. Tādējādi sistēma tikai aprēķina bloka hash un salÄ«dzina to tabulā ar esoÅ”ajiem. Pirmkārt, tas ir ātrāk nekā tikai ierakstÄ«Å”ana diskā, un, otrkārt, mēs netērējam papildu vietu diskā.

amats - ja Ŕīs darbÄ«bas tiek veiktas ar jau ierakstÄ«tiem datiem, kas atrodas diskos. AttiecÄ«gi dati vispirms tiek ierakstÄ«ti diskā, un tikai pēc tam tiek aprēķināts hash un dzēsti nevajadzÄ«gie bloki un atbrÄ«voti diska resursi.

Ir vērts teikt, ka lielākā daļa pārdevēju izmanto abus veidus, kas ļauj optimizēt Å”os procesus un tādējādi palielināt to efektivitāti. Lielākajai daļai krātuves pārdevēju ir utilÄ«tas, kas ļauj analizēt datu kopas. Å Ä«s utilÄ«tas darbojas saskaņā ar to paÅ”u loÄ£iku, kas tiek ieviesta uzglabāŔanas sistēmā, tāpēc paredzamais efektivitātes lÄ«menis bÅ«s tāds pats. Tāpat ņemiet vērā, ka daudziem pārdevējiem ir veiktspējas garantijas programmas, kas sola vismaz tikpat labu veiktspēju noteiktiem (vai visiem) datu veidiem. Un nevajadzētu atstāt novārtā Å”o programmu, jo, aprēķinot sistēmu saviem uzdevumiem, ņemot vērā konkrētas sistēmas efektivitātes koeficientu, jÅ«s varat ietaupÄ«t apjomu. Ir arÄ« vērts padomāt, ka Ŕīs programmas ir paredzētas AFA sistēmām, taču, pateicoties mazāka apjoma SSD iegādei nekā HDD klasiskajās sistēmās, tas samazinās to izmaksas un, ja ne vienādas ar diska sistēmas izmaksām, tad nokļūt diezgan tuvu tam.

Modelis

Un Å”eit mēs nonākam pie pareizā jautājuma.

"Viņi man piedāvā divas krātuves iespējas ā€” ABC SuperStorage S600 un XYZ HyperOcean 666v4, ko jÅ«s ieteiktu?"

PārvērÅ”as par ā€œÅ eit viņi man piedāvā divas uzglabāŔanas iespējas - ABC SuperStorage S600 un XYZ HyperOcean 666v4, ko jÅ«s ieteiktu?

MērÄ·a slodze ir jauktas VMware virtuālās maŔīnas ar ražoÅ”anas/testÄ“Å”anas/izstrādes cilpām. PārbaudÄ«jums = produktÄ«vs. 150 TB katrs ar maksimālo veiktspēju 80 000 IOPS 8 kb bloks 50% brÄ«vpiekļuves 80/20 lasÄ«Å”anas-rakstÄ«Å”anas. 300 TB izstrādei, pietiek ar 50 000 IOPS, 80 nejauÅ”i, 80 rakstÄ«t.

Produktivitāte, domājams, metroklasterā RPO = 15 minūtes RTO = 1 stunda, izstrāde asinhronā replikācijā RPO = 3 stundas, tests vienā vietā.

BÅ«s 50TB DBVS, reÄ£istrÄ“Å”ana viņiem bÅ«tu jauki.

Mums visur ir Dell serveri, vecās Hitachi uzglabāŔanas sistēmas, tās knapi tiek galā, plānojam palielināt slodzi par 50% apjoma un veiktspējas ziņā.ā€

Kā saka, pareizi formulēts jautājums satur 80% atbildes.

papildu informācija

Kas pēc autoru domām būtu jāizlasa papildus

grāmatas

  • Olifers un Olifers ā€œDatortÄ«kliā€. Grāmata palÄ«dzēs sistematizēt un, iespējams, labāk izprast, kā darbojas datu pārraides vide IP/Ethernet uzglabāŔanas sistēmām
  • "EMC informācijas glabāŔana un pārvaldÄ«ba." Lieliska grāmata par uzglabāŔanas sistēmu pamatiem, kāpēc, kā un kāpēc.

Forumi un tērzÄ“Å”ana

Vispārēji ieteikumi

Cenas

Tagad par cenām - kopumā, ja ir cenas uzglabāŔanas sistēmām, tās parasti ir List cenas, no kurām katrs klients saņem individuālu atlaidi. Atlaides lielums sastāv no liela skaita parametru, tāpēc vienkārÅ”i nav iespējams paredzēt, kādu gala cenu saņems jÅ«su uzņēmums, nejautājot izplatÄ«tājam. Bet tajā paŔā laikā parastajos datoru veikalos pēdējā laikā ir sākuÅ”i parādÄ«ties zemās klases modeļi, piemēram, piemēram nix.ru vai xcom-shop.ru. Å eit JÅ«s varat uzreiz iegādāties interesējoÅ”o sistēmu par fiksētu cenu, kā jebkuru datora komponentu.

Bet es gribētu uzreiz atzÄ«mēt, ka tieÅ”s salÄ«dzinājums ar TB/$ nav pareizs. Ja pieiet no Ŕāda viedokļa, tad lētākais risinājums bÅ«s vienkārÅ”s JBOD + serveris, kas nenodroÅ”inās ne elastÄ«bu, ne uzticamÄ«bu, ko nodroÅ”ina pilnvērtÄ«ga, divu kontrolieru uzglabāŔanas sistēma. Tas nebÅ«t nenozÄ«mē, ka JBOD ir pretÄ«gs un ŔķebinoÅ”s netÄ«rs triks, jums vienkārÅ”i atkal ļoti skaidri jāsaprot, kā un kādiem nolÅ«kiem jÅ«s izmantosit Å”o risinājumu. Bieži var dzirdēt, ka JBOD nav ko lauzt, ir tikai viena aizmugures plakne. Tomēr arÄ« aizmugurējās plaknes dažreiz neizdodas. Viss agri vai vēlu saplÄ«st.

Kopā

Ir jāsalīdzina sistēmas savā starpā ne tikai pēc cenas vai ne tikai pēc veiktspējas, bet visu rādītāju kopuma.

Pērciet HDD tikai tad, ja esat pārliecināts, ka jums ir nepiecieÅ”ams HDD. Mazām slodzēm un nesaspiežamiem datu tipiem, pretējā gadÄ«jumā, ir vērts pievērsties SSD krātuves efektivitātes garantijas programmām, kuras tagad ir lielākajai daļai pārdevēju (un tās patieŔām darbojas pat Krievijā), taču viss ir atkarÄ«gs no lietojumprogrammām un datiem, kas tiks atrasti. Å”ajā uzglabāŔanas sistēmā.

Nevajag lēti. Dažreiz tie slēpj daudz nepatÄ«kamu mirkļu, no kuriem vienu Jevgeņijs Elizarovs aprakstÄ«jis savos rakstos par Infortrend. Un ka galu galā Å”is lētums var atspēlēties pret jums. Neaizmirstiet - "skopais maksā divreiz."

Avots: www.habr.com

Pievieno komentāru