Virtualizēts datu centra dizains

Virtualizēts datu centra dizains

Ievads

Informācijas sistēma no lietotāja viedokļa ir labi definēta GOST RV 51987 - "automatizēta sistēma, kuras rezultāts ir izejas informācijas uzrādÄ«Å”ana turpmākai lietoÅ”anai". Ja ņemam vērā iekŔējo struktÅ«ru, tad pēc bÅ«tÄ«bas jebkura IS ir kodā realizēta savstarpēji saistÄ«tu algoritmu sistēma. PlaŔā TjÅ«ringa-Church tēzes izpratnē algoritms (vai IS) pārveido ievaddatu kopu izvaddatu kopā.
Varētu pat teikt, ka ievaddatu transformācija ir informācijas sistēmas pastāvÄ“Å”anas jēga. AttiecÄ«gi IS un visa IS kompleksa vērtÄ«ba tiek noteikta caur ievades un izvades datu vērtÄ«bu.
Pamatojoties uz to, projektÄ“Å”anai ir jāsākas un jābÅ«t balstÄ«tai uz datiem, pielāgojot arhitektÅ«ru un metodes datu struktÅ«rai un nozÄ«mei.

Saglabātie dati
Galvenais sagatavoÅ”anās posms projektÄ“Å”anai ir visu apstrādei un uzglabāŔanai plānoto datu kopu raksturlielumu iegÅ«Å”ana. Å Ä«s Ä«paŔības ietver:
- Datu apjoms;
ā€” Informācija par datu dzÄ«ves ciklu (jaunu datu pieaugums, dzÄ«ves ilgums, novecojuÅ”o datu apstrāde);
ā€” Datu klasifikācija no viedokļa ietekme uz uzņēmuma pamatdarbÄ«bu (konfidencialitātes, integritātes, pieejamÄ«bas triāde) kopā ar finanÅ”u rādÄ«tājiem (piemēram, datu zuduma izmaksas pēdējā stundā);
ā€” datu apstrādes Ä£eogrāfija (apstrādes sistēmu fiziskā atraÅ”anās vieta);
ā€” NormatÄ«vās prasÄ«bas katrai datu klasei (piemēram, Federālais likums-152, PCI DSS).

Informācijas sistēmas

Datus ne tikai uzglabā, bet arÄ« apstrādā (pārveido) informācijas sistēmas. Nākamais solis pēc datu raksturlielumu iegÅ«Å”anas ir vispilnÄ«gākā informācijas sistēmu, to arhitektÅ«ras Ä«patnÄ«bu, savstarpējo atkarÄ«bu un infrastruktÅ«ras prasÄ«bu uzskaite parastajās vienÄ«bās četru veidu resursiem:
ā€” procesora skaitļoÅ”anas jauda;
- RAM apjoms;
ā€” PrasÄ«bas datu uzglabāŔanas sistēmas apjomam un veiktspējai;
ā€” PrasÄ«bas datu pārraides tÄ«klam (ārējie kanāli, kanāli starp IS sastāvdaļām).
Šajā gadījumā ir jābūt prasībām katram pakalpojumam/mikropakalpojumam kā daļai no IS.
AtseviŔķi jāatzÄ«mē, ka pareizai projektÄ“Å”anai ir obligāta datu pieejamÄ«ba par IS ietekmi uz uzņēmuma pamatdarbÄ«bu IS dÄ«kstāves izmaksu veidā (rubļi stundā).

Draudi modelis

Jābūt formālam draudu modelim, no kura plānots aizsargāt datus/pakalpojumus. Turklāt draudu modelis ietver ne tikai konfidencialitātes aspektus, bet arī integritāti un pieejamību. Tie. Piemēram:
ā€” fiziskā servera kļūme;
ā€” augŔējā plaukta slēdža kļūme;
ā€” optiskā sakaru kanāla traucējumi starp datu centriem;
ā€” visas operatÄ«vās uzglabāŔanas sistēmas atteice.
Dažos gadÄ«jumos draudu modeļi tiek rakstÄ«ti ne tikai infrastruktÅ«ras komponentiem, bet arÄ« konkrētām informācijas sistēmām vai to komponentiem, piemēram, DBVS kļūme ar datu struktÅ«ras loÄ£isku iznÄ«cināŔanu.
Visi projekta ietvaros pieņemtie lēmumi, lai aizsargātu pret neaprakstītiem draudiem, ir lieki.

Normatīvās prasības

Ja uz apstrādājamajiem datiem attiecas īpaŔi regulatoru noteikti noteikumi, ir nepiecieŔama informācija par datu kopām un apstrādes/glabāŔanas noteikumiem.

RPO/RTO mērķi

Lai izstrādātu jebkāda veida aizsardzÄ«bu, katram no aprakstÄ«tajiem draudiem ir nepiecieÅ”ami mērÄ·a datu zuduma indikatori un mērÄ·a pakalpojuma atkopÅ”anas laiks.
Ideālā gadījumā RPO un RTO vajadzētu būt saistītām izmaksām par datu zudumu un dīkstāvi laika vienībā.

Virtualizēts datu centra dizains

Sadalījums resursu baseinos

Pēc visas sākotnējās ievades informācijas apkopoÅ”anas pirmais solis ir datu kopu un IP grupÄ“Å”ana pÅ«los, pamatojoties uz draudu modeļiem un normatÄ«vajām prasÄ«bām. Tiek noteikts dažādu pÅ«lu sadalÄ«Å”anas veids - programmatiski sistēmas programmatÅ«ras lÄ«menÄ« vai fiziski.
Piemēri:
ā€” personas datu apstrādes shēma ir pilnÄ«bā fiziski atdalÄ«ta no citām sistēmām;
ā€” Dublējumkopijas tiek glabātas atseviŔķā uzglabāŔanas sistēmā.

Å ajā gadÄ«jumā pÅ«li var bÅ«t nepilnÄ«gi neatkarÄ«gi, piemēram, tiek definēti divi skaitļoÅ”anas resursu pÅ«li (procesora jauda + operatÄ«vā atmiņa), kas izmanto vienu datu krātuves kopu un vienu datu pārraides resursu kopu.

Apstrādes jauda

Virtualizēts datu centra dizains

Respektīvi, virtualizētā datu centra apstrādes jaudas prasības tiek mērītas, ņemot vērā virtuālo procesoru (vCPU) skaitu un to konsolidācijas koeficientu fiziskajos procesoros (pCPU). Šajā konkrētajā gadījumā 1 pCPU = 1 fiziskais procesora kodols (izņemot Hyper-Threading). VCPU skaits tiek summēts visos noteiktajos resursu baseinos (katram no tiem var būt savs konsolidācijas koeficients).
Noslogotu sistēmu konsolidācijas koeficients tiek iegÅ«ts empÄ«riski, pamatojoties uz esoÅ”o infrastruktÅ«ru, vai ar izmēģinājuma instalāciju un slodzes testÄ“Å”anu. Nenolādētām sistēmām tiek izmantota ā€œlabākā prakseā€. Konkrēti, VMware norāda vidējo attiecÄ«bu kā 8:1.

Operatīvā atmiņa

Kopējo RAM pieprasÄ«jumu iegÅ«st, vienkārÅ”i summējot. Nav ieteicams izmantot RAM pārmērÄ«gu abonÄ“Å”anu.

Krātuves resursi

UzglabāŔanas prasÄ«bas tiek iegÅ«tas, vienkārÅ”i summējot visus baseinus pēc ietilpÄ«bas un veiktspējas.
Veiktspējas prasÄ«bas ir izteiktas IOPS kombinācijā ar vidējo lasÄ«Å”anas/rakstÄ«Å”anas attiecÄ«bu un, ja nepiecieÅ”ams, maksimālo atbildes latentumu.
Pakalpojuma kvalitātes (QoS) prasÄ«bas konkrētiem pÅ«liem vai sistēmām ir jānorāda atseviŔķi.

Datu tīkla resursi

Datu tÄ«kla prasÄ«bas tiek iegÅ«tas, vienkārÅ”i summējot visas joslas platuma kopas.
Pakalpojuma kvalitātes (QoS) un latentuma (RTT) prasÄ«bas konkrētiem pÅ«liem vai sistēmām ir jānorāda atseviŔķi.
Kā daļa no prasÄ«bām datu tÄ«kla resursiem ir norādÄ«tas arÄ« prasÄ«bas tÄ«kla trafika izolācijai un/vai Å”ifrÄ“Å”anai un vēlamie mehānismi (802.1q, IPSec u.c.).

Arhitektūras izvēle

Å ajā rokasgrāmatā nav apskatÄ«ta neviena cita izvēle, izņemot x86 arhitektÅ«ru un 100% servera virtualizāciju. Tāpēc skaitļoÅ”anas apakÅ”sistēmas arhitektÅ«ras izvēle ir atkarÄ«ga no servera virtualizācijas platformas, servera formas faktora un vispārējām servera konfigurācijas prasÄ«bām.

Galvenais izvēles punkts ir pārliecÄ«ba par klasiskās pieejas izmantoÅ”anu ar datu apstrādes, uzglabāŔanas un pārsÅ«tÄ«Å”anas funkciju nodalÄ«Å”anu vai konverÄ£entu.

klasiskā arhitektÅ«ra ietver inteliÄ£entu ārējo apakÅ”sistēmu izmantoÅ”anu datu glabāŔanai un pārsÅ«tÄ«Å”anai, savukārt serveri kopējā fizisko resursu baseinā nodroÅ”ina tikai apstrādes jaudu un RAM. Ārkārtējos gadÄ«jumos serveri kļūst pilnÄ«gi anonÄ«mi, tiem ir ne tikai savi diski, bet pat nav sistēmas identifikatora. Å ajā gadÄ«jumā OS vai hipervizors tiek ielādēts no iebÅ«vēta zibatmiņas datu nesēja vai no ārējās datu glabāŔanas sistēmas (sāknÄ“Å”ana no SAN).
Klasiskās arhitektÅ«ras ietvaros izvēle starp asmeņiem un statÄ«viem galvenokārt tiek veikta, pamatojoties uz Ŕādiem principiem:
ā€” rentabli (vidēji stacionārie serveri ir lētāki);
ā€” skaitļoÅ”anas blÄ«vums (lielāks asmeņiem);
ā€” EnerÄ£ijas patēriņŔ un siltuma izkliede (asmeņiem ir lielāka Ä«patnējā vienÄ«ba uz vienÄ«bu);
ā€” mērogojamÄ«ba un vadāmÄ«ba (lielām instalācijām parasti ir nepiecieÅ”ams mazāk pūļu);
- PaplaÅ”ināŔanas karÅ”u izmantoÅ”ana (ļoti ierobežota izvēle asmeņiem).
KonverÄ£enta arhitektÅ«ra (zināms arÄ« kā hiperkonverģēts) ietver datu apstrādes un uzglabāŔanas funkciju apvienoÅ”anu, kā rezultātā tiek izmantoti lokālie servera diski un lÄ«dz ar to tiek atmests klasiskais asmens formas faktors. Konverģētām sistēmām tiek izmantoti statÄ«va serveri vai klasteru sistēmas, kas vienā gadÄ«jumā apvieno vairākus asmens serverus un lokālos diskus.

CPU/atmiņa

Lai pareizi aprēķinātu konfigurāciju, jums ir jāsaprot vides vai katras neatkarīgās kopas slodzes veids.
CPU saistÄ«ts ā€“ vide, kuru veiktspēju ierobežo procesora jauda. RAM pievienoÅ”ana neko nemainÄ«s veiktspējas ziņā (VM skaits uz serveri).
Atmiņa ir saistÄ«ta ā€“ vide, ko ierobežo RAM. Vairāk RAM serverÄ« ļauj darbināt vairāk virtuālo maŔīnu serverÄ«.
GB / MHz (GB / pCPU) - vidējā RAM patēriņa un procesora jaudas attiecÄ«ba ar Å”o konkrēto slodzi. Var izmantot, lai aprēķinātu nepiecieÅ”amo atmiņas apjomu noteiktai veiktspējai un otrādi.

Servera konfigurācijas aprēķins

Virtualizēts datu centra dizains

Pirmkārt, jums ir jānosaka visi slodzes veidi un jāizlemj par dažādu skaitļoŔanas kopu apvienoŔanu vai sadalīŔanu dažādās kopās.
Pēc tam katram no definētajiem klasteriem nosaka GB / MHz attiecÄ«bu ar iepriekÅ” zināmu slodzi. Ja slodze nav zināma iepriekÅ”, bet ir aptuvenas izpratnes par procesora jaudas izmantoÅ”anas lÄ«meni, varat izmantot standarta vCPU:pCPU attiecÄ«bas, lai pÅ«la prasÄ«bas pārvērstu fiziskās.

Katram klasterim sadaliet vCPU pūla prasību summu ar koeficientu:
vCPUsum / vCPU:pCPU = pCPUsum ā€“ nepiecieÅ”amais fizisko vienÄ«bu skaits. serdeņi
pCPUsum / 1.25 = pCPUht ā€” Hyper-Threading pielāgotais kodolu skaits
Pieņemsim, ka ir jāaprēķina klasteris ar 190 kodoliem / 3.5 TB RAM. Tajā paŔā laikā mēs pieņemam mērÄ·a slodzi 50% procesora jaudas un 75% RAM.

pCPU
190
CPU util
50%

Mem
3500
Mem lietderība
75%

Ligzda
Kodols
Srv/CPU
Srv Mem
Srv/Mem

2
6
25,3
128
36,5

2
8
19,0
192
24,3

2
10
15,2
256
18,2

2
14
10,9
384
12,2

2
18
8,4
512
9,1

Å ajā gadÄ«jumā mēs vienmēr izmantojam noapaļoÅ”anu uz augÅ”u lÄ«dz tuvākajam veselam skaitlim (=ROUNDUP(A1;0)).
No tabulas kļūst skaidrs, ka mērķa indikatoriem ir līdzsvarotas vairākas servera konfigurācijas:
ā€” 26 serveri 2*6c / 192 GB
ā€” 19 serveri 2*10c / 256 GB
ā€” 10 serveri 2*18c / 512 GB

Pēc tam Å”o konfigurāciju izvēle jāveic, pamatojoties uz papildu faktoriem, piemēram, termisko paketi un pieejamo dzesÄ“Å”anu, jau izmantotajiem serveriem vai izmaksām.

Servera konfigurācijas izvēles iespējas

PlaÅ”as virtuālās maŔīnas. Ja nepiecieÅ”ams mitināt plaÅ”as virtuālās maŔīnas (salÄ«dzināmas ar 1 NUMA mezglu vai vairāk), ir ieteicams, ja iespējams, izvēlēties serveri ar konfigurāciju, kas ļauj Ŕādām virtuālajām maŔīnām palikt NUMA mezglā. Ja ir liels skaits plaÅ”u virtuālo maŔīnu, pastāv klasteru resursu sadrumstalotÄ«bas risks, un Å”ajā gadÄ«jumā tiek atlasÄ«ti serveri, kas ļauj pēc iespējas blÄ«vāk izvietot plaÅ”as VM.

Vienas kļūmes domēna lielums.

Servera lieluma izvēle balstās arÄ« uz vienas atteices domēna minimizÄ“Å”anas principu. Piemēram, izvēloties vienu no:
ā€” 3 x 4*10c / 512 GB
ā€” 6 x 2*10c / 256 GB
Ja visas pārējās lietas ir vienādas, jāizvēlas otrais variants, jo vienam serverim atteicoties (vai tiekot uzturēts), tiek zaudēti nevis 33% klastera resursu, bet gan 17%. Tādā paŔā veidā negadÄ«juma skarto VM un IS skaits tiek samazināts uz pusi.

Klasisko uzglabāŔanas sistēmu aprēķins, pamatojoties uz veiktspēju

Virtualizēts datu centra dizains

Klasiskās uzglabāŔanas sistēmas vienmēr tiek aprēķinātas, izmantojot sliktāko scenāriju, izslēdzot darbÄ«bas keÅ”atmiņas ietekmi un darbÄ«bu optimizāciju.
Kā pamata veiktspējas rādītājus mēs ņemam mehānisko veiktspēju no diska (IOPSdisk):
ā€“ 7.2k ā€“ 75 IOPS
ā€“ 10k ā€“ 125 IOPS
ā€“ 15k ā€“ 175 IOPS

Pēc tam disku skaits diskā tiek aprēķināts, izmantojot Ŕādu formulu: = TotalIOPS * ( RW + (1 ā€“ RW) * RAIDPen) / IOPS disks. Kur:
Sākot no TotalIOPS ā€“ kopējā nepiecieÅ”amā veiktspēja IOPS no diska pÅ«la
Sākot no RW ā€“ nolasÄ«Å”anas operāciju procentuālā daļa
Sākot no RAID pildspalva ā€“ RAID sods par izvēlēto RAID lÄ«meni

Lasiet vairāk par ierÄ«ces RAID un RAID sodu Å”eit - UzglabāŔanas veiktspēja. Pirmā daļa. Šø UzglabāŔanas veiktspēja. Otrā daļa. Šø UzglabāŔanas veiktspēja. TreŔā daļa

Pamatojoties uz iegÅ«to disku skaitu, tiek aprēķinātas iespējamās opcijas, kas atbilst uzglabāŔanas ietilpÄ«bas prasÄ«bām, tostarp opcijas ar daudzlÄ«meņu krātuvi.
Sistēmu aprēķins, kas izmanto SSD kā uzglabāŔanas slāni, tiek apskatÄ«ts atseviŔķi.
Aprēķinu sistēmu iespējas ar Flash keÅ”atmiņu

Flash keÅ”atmiņa ā€“ parasts nosaukums visām patentētajām tehnoloÄ£ijām, kas paredzētas zibatmiņas izmantoÅ”anai kā otrā lÄ«meņa keÅ”atmiņa. Izmantojot zibatmiņu, uzglabāŔanas sistēma parasti tiek aprēķināta tā, lai nodroÅ”inātu vienmērÄ«gu slodzi no magnētiskajiem diskiem, savukārt maksimumu apkalpo keÅ”atmiņa.
Å ajā gadÄ«jumā ir jāsaprot slodzes profils un piekļuves lokalizācijas pakāpe uzglabāŔanas apjomu blokiem. Flash keÅ”atmiņa ir tehnoloÄ£ija darba slodzēm ar ļoti lokalizētiem vaicājumiem, un tā praktiski nav piemērojama vienmērÄ«gi ielādētiem sējumiem (piemēram, analÄ«tikas sistēmām).

Zemākās/vidējās klases hibrīdu sistēmu aprēķins

Zemākās un vidējās klases hibrÄ«dsistēmas izmanto daudzlÄ«meņu krātuvi ar datu pārvietoÅ”anu starp lÄ«meņiem pēc grafika. Tajā paŔā laikā daudzlÄ«meņu atmiņas bloka izmērs labākajiem modeļiem ir 256 MB. Å Ä«s funkcijas neļauj mums uzskatÄ«t, ka daudzpakāpju uzglabāŔanas tehnoloÄ£ija ir tehnoloÄ£ija produktivitātes palielināŔanai, kā daudzi cilvēki kļūdaini uzskata. DaudzlÄ«meņu uzglabāŔana zemās un vidējās klases sistēmās ir tehnoloÄ£ija uzglabāŔanas izmaksu optimizÄ“Å”anai sistēmām ar izteiktu slodzes nevienmērÄ«bu.

Daudzpakāpju uzglabāŔanai vispirms tiek aprēķināta augstākā lÄ«meņa veiktspēja, savukārt tiek uzskatÄ«ts, ka apakŔējā krātuves lÄ«menis tikai veicina trÅ«kstoÅ”o krātuves ietilpÄ«bu. HibrÄ«dai vairāku lÄ«meņu sistēmai ir obligāti jāizmanto zibatmiņas keÅ”atmiņas tehnoloÄ£ija vairāku lÄ«meņu pÅ«lam, lai kompensētu veiktspējas samazināŔanos pēkŔņi uzkarsētiem datiem no zemākā lÄ«meņa.

SSD izmantoŔana daudzpakāpju disku baseinā

Virtualizēts datu centra dizains

SSD izmantoÅ”anai daudzlÄ«meņu disku pÅ«lā ir dažādas variācijas atkarÄ«bā no konkrētā ražotāja zibatmiņas keÅ”atmiņas algoritmu ievieÅ”anas.
Vispārējā uzglabāŔanas politikas prakse diska pÅ«lam ar SSD lÄ«meni vispirms ir SSD.
Tikai lasāma Flash keÅ”atmiņa. Tikai lasāmai zibatmiņai SSD atmiņas slānis ir nodroÅ”ināts ar ievērojamu rakstÄ«Å”anas lokalizāciju neatkarÄ«gi no keÅ”atmiņas.
LasÄ«t/rakstÄ«t Flash keÅ”atmiņu. Flash keÅ”atmiņas gadÄ«jumā rakstÄ«Å”anas keÅ”atmiņas lielums vispirms tiek iestatÄ«ts uz maksimālo keÅ”atmiņas lielumu, un SSD krātuves lÄ«menis parādās tikai tad, ja keÅ”atmiņas lielums nav pietiekams, lai apkalpotu visu lokalizēto darba slodzi.
SSD un keÅ”atmiņas veiktspējas aprēķini tiek veikti katru reizi, pamatojoties uz ražotāja ieteikumiem, bet vienmēr sliktākajā gadÄ«jumā.

Avots: www.habr.com

Pievieno komentāru