Datu zentro birtualizatuaren diseinua

Datu zentro birtualizatuaren diseinua

Sarrera

Erabiltzailearen ikuspuntutik informazio sistema bat ondo definituta dago GOST RV 51987-n - "sistema automatizatu bat, eta horren emaitza irteerako informazioa aurkeztea da gero erabiltzeko". Barne egitura kontuan hartzen badugu, funtsean, edozein IS kodean inplementatutako interkonektatutako algoritmoen sistema bat da. Turing-Church tesiaren zentzu zabalean, algoritmo batek (edo IS) sarrerako datu multzo bat irteerako datu multzo batean bihurtzen du.
Esan liteke sarrerako datuen eraldaketa informazio-sistema baten existentziaren esanahia dela. Horren arabera, IS eta IS konplexu osoaren balioa sarrerako eta irteerako datuen balioaren bidez zehazten da.
Hori kontuan hartuta, diseinua hasi eta datuetan oinarrituta egon behar da, arkitektura eta metodoak datuen egitura eta esangurara egokituz.

Biltegiratutako datuak
Diseinua prestatzeko funtsezko etapa bat prozesatzeko eta biltegiratzeko aurreikusitako datu-multzo guztien ezaugarriak lortzea da. Ezaugarri horien artean daude:
- Datuen bolumena;
— Datuen bizi-zikloari buruzko informazioa (datu berrien hazkundea, iraupena, zaharkitutako datuen tratamendua);
— Datuen sailkapena ikuspuntutik konpainiaren negozio nagusian (konfidentzialtasunaren, osotasunaren, erabilgarritasunaren hirukotea) eragina finantza-adierazleekin batera (adibidez, azken orduko datu-galeren kostua);
— Datuen tratamenduaren geografia (prozesatzeko sistemen kokapen fisikoa);
— Datu-klase bakoitzeko arau-eskakizunak (adibidez, Federal Law-152, PCI DSS).

Informazio Sistemak

Datuak biltegiratu ez ezik, informazio sistemek prozesatzen (eraldatu) ere egiten dituzte. Datuen ezaugarriak lortu ondoren hurrengo urratsa informazio sistemen inbentariorik osatuena da, haien arkitektura-ezaugarriak, elkarrekiko mendekotasunak eta azpiegitura-eskakizunak unitate konbentzionaletan lau baliabide motatarako:
— Prozesadorearen konputazio-potentzia;
— RAM kopurua;
— Datuak biltegiratzeko sistemaren bolumenaren eta errendimenduaren baldintzak;
— Datuak transmititzeko sarearen baldintzak (kanpoko kanalak, IS osagaien arteko kanalak).
Kasu honetan, zerbitzu/mikrozerbitzu bakoitzeko eskakizunak egon behar dira ISren zati gisa.
Bereizita, kontuan izan behar da, diseinu zuzena izateko, ISk enpresaren negozio nagusian duen eraginari buruzko datuak eskuragarri egotea derrigorrezkoa dela IS geldialdiaren kostuaren (orduko errubloak) moduan.

Mehatxu eredua

Datuak/zerbitzuak babesteko aurreikusitako mehatxuen eredu formal bat egon behar da. Gainera, mehatxu ereduak konfidentzialtasunaren alderdiak ez ezik, osotasuna eta erabilgarritasuna ere barne hartzen ditu. Horiek. Adibidez:
— Zerbitzari fisikoaren porrota;
— Rack-eko goiko etengailuaren hutsegitea;
— Datu-zentroen arteko komunikazio-kanal optikoaren etena;
— Biltegiratze sistema operatibo osoaren porrota.
Zenbait kasutan, mehatxu-ereduak azpiegitura-osagaietarako ez ezik, informazio-sistema espezifikoetarako edo haien osagaietarako ere idazten dira, adibidez, datu-egituraren suntsipen logikoa duen DBMS hutsegite bat.
Deskribatu gabeko mehatxu baten aurka babesteko proiektuaren erabaki guztiak ez dira beharrezkoak.

Arau-eskakizunak

Tratatzen ari diren datuak erregulatzaileek ezarritako arau berezien menpe badaude, datu multzoei eta prozesatzeko/biltegiratzeko arauei buruzko informazioa behar da.

RPO/RTO helburuak

Edozein babes mota diseinatzeak datu-galera adierazleak eta xede-zerbitzua berreskuratzeko denbora eskatzen du deskribatutako mehatxu bakoitzeko.
Egokiena, RPOk eta RTOk datu-galeren eta geldialdi-denboraren kostuak izan beharko lituzkete denbora-unitate bakoitzeko.

Datu zentro birtualizatuaren diseinua

Baliabide multzoetan banatzea

Hasierako sarrerako informazio guztia bildu ondoren, lehen urratsa datu-multzoak eta IP-a multzoetan multzokatzea da, mehatxu-ereduetan eta arauzko eskakizunetan oinarrituta. Hainbat igerilekuen zatiketa mota zehazten da - programatikoki sistemaren software mailan edo fisikoki.
Adibideak:
— Datu pertsonalak prozesatzeko zirkuitua fisikoki guztiz bereizita dago beste sistemetatik;
— Babeskopiak biltegiratze sistema bereizi batean gordetzen dira.

Kasu honetan, igerilekuak guztiz independenteak izan daitezke, adibidez, bi baliabide informatiko multzo definitzen dira (prozesadorearen potentzia + RAM), datu biltegiratze multzo bakarra eta datu-transmisiorako baliabide multzo bakarra erabiltzen dutenak.

Prozesatzeko ahalmena

Datu zentro birtualizatuaren diseinua

Laburpena, datu-zentro birtualizatu baten prozesatzeko potentzia-eskakizunak prozesadore birtualen (vCPU) eta prozesadore fisikoetan (pCPU) kontsolidazio-ratioaren arabera neurtzen dira. Kasu zehatz honetan, 1 pCPU = 1 prozesadore fisiko nukleoa (Hyper-Threading izan ezik). vCPU kopurua definitutako baliabide multzo guztietan batzen da (horietako bakoitzak bere finkapen-faktorea izan dezake).
Kargatutako sistemen sendotze-koefizientea enpirikoki lortzen da, dauden azpiegituretan oinarrituta, edo instalazio pilotu eta karga-probaren bidez. Deskargatutako sistemetarako, "praktika onena" erabiltzen da. Zehazki, VMware-k batez besteko ratioa 8:1 aipatzen du.

Memoria operatiboa

RAM eskakizun osoa batuketa sinple baten bidez lortzen da. Ez da gomendagarria RAM gehiegizko harpidetza erabiltzea.

Biltegiratzeko baliabideak

Biltegiratze-baldintzak igerileku guztiak edukieraren eta errendimenduaren arabera batuz besterik gabe lortzen dira.
Errendimendu-eskakizunak IOPS-tan adierazten dira, batez besteko irakurketa/idazketa erlazioarekin eta, behar izanez gero, gehienezko erantzun-latentzia batekin.
Zerbitzuaren kalitatea (QoS) eskakizunak igerileku edo sistema zehatzetarako bereizita zehaztu behar dira.

Datu-sareko baliabideak

Datu-sarearen eskakizunak banda zabalera multzo guztiak batuz besterik gabe lortzen dira.
Igerileku edo sistema zehatzetarako Zerbitzuaren Kalitate (QoS) eta latentzia (RTT) eskakizunak bereizita zehaztu behar dira.
Datu-sareko baliabideen eskakizunen barruan, sareko trafikoa isolatzeko eta/edo enkriptatzeko baldintzak eta hobetsitako mekanismoak (802.1q, IPSec, etab.) ere adierazten dira.

Arkitektura aukeraketa

Gida honek ez ditu x86 arkitektura eta %100 zerbitzariaren birtualizazioa ez diren aukerak hartzen. Hori dela eta, informatika-azpisistemaren arkitektura aukeratzea zerbitzariaren birtualizazio plataforma, zerbitzariaren forma-faktorea eta zerbitzariaren konfigurazio-eskakizun orokorrak aukeratzeari dagokio.

Aukera gakoa ikuspegi klasikoa erabiltzearen ziurtasuna da, datuak prozesatzeko, gordetzeko eta igortzeko funtzioak edo konbergenteak bereizten dituena.

arkitektura klasikoa Datuak gordetzeko eta transmititzeko kanpoko azpisistema adimentsuak erabiltzea dakar, zerbitzariek prozesatzeko potentzia eta RAM baliabide fisiko komunean soilik laguntzen duten bitartean. Muturreko kasuetan, zerbitzariak guztiz anonimoak bihurtzen dira, ez bakarrik beren diskoak, baizik eta sistemaren identifikatzailerik ere ez. Kasu honetan, sistema eragilea edo hipervisorea integratutako flash euskarritik edo kanpoko datuak biltegiratzeko sistema batetik kargatzen da (Sanetik abiarazi).
Arkitektura klasikoaren esparruan, pala eta bastidoreen arteko aukeraketa printzipio hauetan oinarritzen da batez ere:
— Errentagarria (batez beste, rack-muntatutako zerbitzariak merkeagoak dira);
— Dentsitate konputazionala (paletan handiagoa);
— Energia-kontsumoa eta beroa xahutzea (palek unitateko unitate espezifiko handiagoa dute);
— Eskalagarritasuna eta kontrolagarritasuna (palek, oro har, esfortzu txikiagoa eskatzen dute instalazio handietarako);
- Hedapen-txartelak erabiltzea (aukera oso mugatua paletarako).
Arkitektura konbergentea (izenez ere ezaguna hiperkonbergetuak) datuak prozesatzeko eta biltegiratzeko funtzioak uztartzea dakar, eta horrek zerbitzari lokaleko diskoak erabiltzea dakar eta, ondorioz, blade forma-faktore klasikoa alde batera uztea dakar. Sistema konbergenteetarako, rack zerbitzariak edo cluster sistemak erabiltzen dira, hainbat blade zerbitzari eta disko lokalak kasu bakar batean konbinatuz.

CPU/Memoria

Konfigurazioa behar bezala kalkulatzeko, ingurunearen edo kluster independente bakoitzaren karga mota ulertu behar duzu.
CPU lotua – Prozesadorearen potentziaren errendimenduan mugatutako ingurunea. RAM gehitzeak ez du ezer aldatuko errendimenduari dagokionez (zerbitzari bakoitzeko VM kopurua).
Memoria lotua – RAMek mugatutako ingurunea. Zerbitzarian RAM gehiago zerbitzarian VM gehiago exekutatzeko aukera ematen du.
GB / MHz (GB / pCPU) - karga jakin honek RAMaren eta prozesadorearen potentziaren batez besteko kontsumoaren proportzioa. Errendimendu jakin baterako behar den memoria-kopurua kalkulatzeko erabil daiteke eta alderantziz.

Zerbitzariaren konfigurazioaren kalkulua

Datu zentro birtualizatuaren diseinua

Lehenik eta behin, karga mota guztiak zehaztu behar dituzu eta konputazio-talde desberdinak multzo ezberdinetan konbinatu edo banatzea erabaki behar duzu.
Ondoren, definitutako kluster bakoitzeko, GB / MHz erlazioa aldez aurretik ezagutzen den karga batean zehazten da. Karga aldez aurretik ezagutzen ez bada, baina prozesadorearen potentziaren erabilera maila gutxi gorabehera ulertzen bada, vCPU:pCPU ratio estandarrak erabil ditzakezu igerilekuen eskakizunak fisiko bihurtzeko.

Kluster bakoitzeko, zatitu vCPU multzoen eskakizunen batura koefizientearekin:
vCPUsum / vCPU:pCPU = pCPUsum - beharrezko unitate fisikoen kopurua. nukleoak
pCPUsum / 1.25 = pCPUht - Hyper-Threading-erako egokitutako nukleoen kopurua
Demagun beharrezkoa dela 190 nukleo / 3.5 TB RAM dituen cluster bat kalkulatzea. Aldi berean, prozesadorearen potentziaren % 50eko eta RAMaren % 75eko karga bat onartzen dugu.

pCPU
190
CPU erabilgarria
50%

memoria
3500
Mem erabilgarritasuna
75%

Socket
Core
Srv/CPU
Srv Mem
Srv/Mem

2
6
25,3
128
36,5

2
8
19,0
192
24,3

2
10
15,2
256
18,2

2
14
10,9
384
12,2

2
18
8,4
512
9,1

Kasu honetan, beti erabiltzen dugu hurbilen dagoen osoko gorako biribilketa (=ROUNDUP(A1;0)).
Taulan agerikoa da zerbitzariaren hainbat konfigurazio orekatuta daudela helburu-adierazleetarako:
— 26 zerbitzari 2*6c / 192 GB
— 19 zerbitzari 2*10c / 256 GB
— 10 zerbitzari 2*18c / 512 GB

Ondoren, konfigurazio horien aukeraketa faktore gehigarrietan oinarrituta egin behar da, hala nola pakete termikoa eta erabilgarri dagoen hozte, dagoeneko erabilitako zerbitzariak edo kostua.

Zerbitzariaren konfigurazioa aukeratzeko ezaugarriak

VM zabalak. VM zabalak ostatzea beharrezkoa bada (NUMA nodo 1 edo gehiagorekin alderatuta), gomendagarria da, ahal bada, VM horiek NUMA nodoaren barruan geratzea ahalbidetzen duen konfigurazio bat duen zerbitzari bat hautatzea. VM zabalen kopuru handiarekin, kluster baliabideen zatiketa arriskua dago, eta kasu honetan, VM zabalak ahalik eta trinkoen jartzea ahalbidetzen duten zerbitzariak hautatzen dira.

Huts bakarreko domeinuaren tamaina.

Zerbitzariaren tamaina aukeratzea hutsegite bakarraren domeinua minimizatzeko printzipioan ere oinarritzen da. Esate baterako, aukeratzerakoan:
— 3 x 4*10c / 512 GB
— 6 x 2*10c / 256 GB
Beste gauza guztiak berdinak izanik, bigarren aukera aukeratu behar duzu, zerbitzari batek huts egiten duenean (edo mantentzen ari direnean), ez baita kluster baliabideen % 33 galtzen, % 17 baizik. Modu berean, istripuak eragindako VM eta IS kopurua erdira murrizten da.

Biltegiratze-sistema klasikoen kalkulua errendimenduan oinarrituta

Datu zentro birtualizatuaren diseinua

Biltegiratze sistema klasikoak kasurik txarrena erabiliz kalkulatzen dira beti, cache operatiboaren eragina eta eragiketen optimizazioa alde batera utzita.
Oinarrizko errendimendu-adierazle gisa, errendimendu mekanikoa diskotik hartzen dugu (IOPSdisk):
– 7.2k – 75 IOPS
– 10k – 125 IOPS
– 15k – 175 IOPS

Ondoren, disko-multzoko disko kopurua honako formula hau erabiliz kalkulatzen da: = TotalIOPS * ( RW + (1 –RW) * RAIDPen) / IOPSdisk. Non:
- Guztira IOPS - Disko multzoko IOPS-n behar den errendimendu osoa
- RW – irakurketa-eragiketen ehunekoa
- RAID boligrafoa – RAID zigorra hautatutako RAID mailarako

Irakurri gehiago Gailuko RAID eta RAID zigorrari buruz hemen - Biltegiratze-errendimendua. Lehen zatia. и Biltegiratze-errendimendua. Bigarren zatia. и Biltegiratze-errendimendua. Hirugarren zatia

Sortutako disko-kopuruaren arabera, biltegiratze-ahalmen-baldintzak betetzen dituzten aukera posibleak kalkulatzen dira, maila anitzeko biltegiratze-aukerak barne.
SSD biltegiratze geruza gisa erabiltzen duten sistemen kalkulua bereizita hartzen da.
Flash Cache-rekin kalkulatzeko sistemen ezaugarriak

Flash Cachea – Flash memoria bigarren mailako cache gisa erabiltzeko jabedun teknologia guztien izen arrunta. Flash cachea erabiltzean, biltegiratze-sistema disko magnetikoetatik karga egonkorra eskaintzeko kalkulatzen da normalean, eta gailurra cacheak zerbitzatzen duen bitartean.
Kasu honetan, beharrezkoa da karga-profila eta biltegiratze-bolumen blokeetarako sarbidearen lokalizazio-maila ulertzea. Flash cachea oso lokalizatutako kontsultak dituzten lan-kargarentzako teknologia da, eta ia ez da aplikatzen uniformeki kargatutako bolumenetarako (analitika-sistemetarako, esaterako).

Gama baxuko/erdiko sistema hibridoen kalkulua

Klase baxuko eta ertaineko sistema hibridoek maila anitzeko biltegiratzea erabiltzen dute, datuak mailaz ordutegi batean mugitzen direlarik. Aldi berean, eredu onenentzako maila anitzeko biltegiratze blokearen tamaina 256 MB da. Ezaugarri hauek ez digute uzten mailakako biltegiratze teknologia produktibitatea areagotzeko teknologiatzat har, jende askok oker uste baitu. Maila anitzeko biltegiratzea klase baxuko eta ertaineko sistemetan biltegiratze-kostuak optimizatzeko teknologia da karga-desberdintasun nabarmena duten sistemetan.

Mailakako biltegiratzeko, goiko mailaren errendimendua kalkulatzen da lehenik, eta beheko biltegiratze mailak falta den biltegiratze ahalmenari soilik laguntzen diola jotzen da. Maila anitzeko sistema hibrido baterako, derrigorrezkoa da maila anitzeko igerilekurako flash cache teknologia erabiltzea, beheko mailatik bat-batean berotutako datuen errendimenduaren murrizketa konpentsatzeko.

Disko multzo mailakatu batean SSD bat erabiltzea

Datu zentro birtualizatuaren diseinua

SSDak maila anitzeko disko multzo batean erabiltzeak aldaketak ditu, fabrikatzaile jakin batek flash cache algoritmoen ezarpen zehatzaren arabera.
SSD maila duen disko-talde baterako biltegiratze-politikaren praktika orokorra SSD da lehenik.
Irakurtzeko soilik Flash Cachea. Irakurtzeko soilik flash cache baterako, SSD-ko biltegiratze-geruzak idazketen lokalizazio esanguratsuarekin dator, cachea edozein dela ere.
Irakurri/idatzi Flash Cachea. Flash cachearen kasuan, idazteko cache-tamaina cache-tamaina maximoan ezartzen da lehenik eta SSD biltegiratze-maila bakarrik agertzen da cache-tamaina lokalizatutako lan-karga osoari zerbitzua emateko nahikoa ez denean.
SSD eta cachearen errendimenduaren kalkuluak fabrikatzailearen gomendioetan oinarrituta egiten dira aldi bakoitzean, baina beti kasu txarrenerako.

Iturria: www.habr.com

Gehitu iruzkin berria