Dizajn virtuelizovanog data centra

Dizajn virtuelizovanog data centra

Uvod

Informacijski sistem s korisničke tačke gledišta dobro je definiran u GOST RV 51987 - „automatski sistem čiji je rezultat prezentacija izlaznih informacija za naknadnu upotrebu.“ Ako uzmemo u obzir unutrašnju strukturu, onda je u suštini svaki IS sistem međusobno povezanih algoritama implementiranih u kodu. U širem smislu Turing-Church teze, algoritam (ili IS) transformiše skup ulaznih podataka u skup izlaznih podataka.
Moglo bi se čak reći da je transformacija ulaznih podataka smisao postojanja informacionog sistema. Shodno tome, vrijednost IS-a i cjelokupnog IS kompleksa se utvrđuje kroz vrijednost ulaznih i izlaznih podataka.
Na osnovu toga, dizajn mora započeti i biti vođen podacima, prilagođavajući arhitekturu i metode strukturi i značaju podataka.

Pohranjeni podaci
Ključna faza u pripremi za projektovanje je dobijanje karakteristika svih skupova podataka planiranih za obradu i skladištenje. Ove karakteristike uključuju:
- Obim podataka;
— Informacije o životnom ciklusu podataka (rast novih podataka, životni vijek, obrada zastarjelih podataka);
— Klasifikacija podataka sa stanovišta uticaj na osnovnu delatnost kompanije (trijada poverljivosti, integriteta, dostupnosti) zajedno sa finansijskim pokazateljima (na primer, trošak gubitka podataka u poslednjem satu);
— Geografija obrade podataka (fizička lokacija sistema za obradu);
— Regulatorni zahtjevi za svaku klasu podataka (na primjer, Federalni zakon-152, PCI DSS).

Informacioni sistemi

Podaci se ne samo pohranjuju, već i obrađuju (transformišu) informacionim sistemima. Sledeći korak nakon dobijanja karakteristika podataka je najpotpuniji inventar informacionih sistema, njihovih arhitektonskih karakteristika, međuzavisnosti i infrastrukturnih zahteva u konvencionalnim jedinicama za četiri vrste resursa:
— Računarska snaga procesora;
— Količina RAM-a;
— Zahtjevi za volumen i performanse sistema za skladištenje podataka;
— Zahtjevi za mrežu za prijenos podataka (spoljni kanali, kanali između IS komponenti).
U ovom slučaju, moraju postojati zahtjevi za svaku uslugu/mikrouslugu kao dio IS-a.
Odvojeno, potrebno je napomenuti da je za ispravno projektovanje obavezna dostupnost podataka o uticaju IS-a na osnovnu delatnost kompanije u vidu troškova zastoja IS-a (rubalji po satu).

Model pretnje

Mora postojati formalni model prijetnji od kojih se planira zaštititi podaci/usluge. Štaviše, model prijetnje uključuje ne samo aspekte povjerljivosti, već i integritet i dostupnost. One. Na primjer:
— Kvar fizičkog servera;
— Kvar prekidača na vrhu;
— Poremećaj optičkog komunikacionog kanala između centara podataka;
— Kvar cjelokupnog operativnog sistema skladištenja.
U nekim slučajevima, modeli prijetnji se pišu ne samo za infrastrukturne komponente, već i za specifične informacione sisteme ili njihove komponente, kao što je kvar DBMS-a sa logičkim uništenjem strukture podataka.
Sve odluke u okviru projekta za zaštitu od neopisane prijetnje su nepotrebne.

Regulatorni zahtjevi

Ako podaci koji se obrađuju podliježu posebnim pravilima koje su uspostavili regulatori, potrebne su informacije o skupovima podataka i pravilima obrade/čuvanja.

RPO/RTO ciljevi

Dizajniranje bilo koje vrste zaštite zahtijeva postojanje ciljnih indikatora gubitka podataka i ciljanog vremena oporavka usluge za svaku od opisanih prijetnji.
U idealnom slučaju, RPO i RTO bi trebali imati povezane troškove gubitka podataka i zastoja po jedinici vremena.

Dizajn virtuelizovanog data centra

Podjela na skupove resursa

Nakon prikupljanja svih početnih ulaznih informacija, prvi korak je grupisanje skupova podataka i IP-a u skupove na osnovu modela prijetnji i regulatornih zahtjeva. Određuje se vrsta podjele različitih pulova - programski na nivou sistemskog softvera ili fizički.
primjeri:
— Krug koji obrađuje lične podatke potpuno je fizički odvojen od drugih sistema;
— Sigurnosne kopije se pohranjuju na zasebnom sistemu za pohranu.

U ovom slučaju, spremišta mogu biti nepotpuno neovisna, na primjer, definirana su dva skupa računarskih resursa (snaga procesora + RAM), koji koriste jedno spremište podataka i jedno spremište resursa za prijenos podataka.

Procesna snaga

Dizajn virtuelizovanog data centra

Sažetak, zahtjevi za procesorskom snagom virtueliziranog centra podataka mjere se u smislu broja virtuelnih procesora (vCPU) i njihovog omjera konsolidacije na fizičkim procesorima (pCPU). U ovom konkretnom slučaju, 1 pCPU = 1 fizičko jezgro procesora (isključujući Hyper-Threading). Broj vCPU-ova se zbraja u svim definiranim skupovima resursa (od kojih svaki može imati svoj vlastiti faktor konsolidacije).
Koeficijent konsolidacije za opterećene sisteme dobija se empirijski, na osnovu postojeće infrastrukture, ili kroz pilot instalaciju i testiranje opterećenja. Za neopterećene sisteme koristi se “najbolja praksa”. Konkretno, VMware navodi da je prosječan omjer 8:1.

Operativna memorija

Ukupni zahtjevi RAM-a dobijaju se jednostavnim zbrajanjem. Ne preporučuje se korištenje prekomjerne pretplate RAM-a.

Resursi za skladištenje

Zahtjevi za skladištenje dobivaju se jednostavnim zbrajanjem svih skupova po kapacitetu i performansama.
Zahtjevi za performanse izraženi su u IOPS u kombinaciji s prosječnim omjerom čitanja/pisanja i, ako je potrebno, maksimalnom latencijom odgovora.
Zahtjevi za kvalitetu usluge (QoS) za specifična spremišta ili sisteme moraju biti specificirani zasebno.

Resursi mreže podataka

Zahtjevi za podatkovnu mrežu dobivaju se jednostavnim zbrajanjem svih skupova propusnog opsega.
Zahtjevi za kvalitetu usluge (QoS) i kašnjenje (RTT) za specifična spremišta ili sisteme trebaju biti specificirani odvojeno.
Kao dio zahtjeva za mrežne resurse podataka, također su naznačeni zahtjevi za izolaciju i/ili enkripciju mrežnog prometa i preferirani mehanizmi (802.1q, IPSec, itd.).

Odabir arhitekture

Ovaj vodič ne pokriva druge izbore osim x86 arhitekture i 100% virtuelizacije servera. Stoga se izbor arhitekture računarskog podsistema svodi na izbor platforme za virtuelizaciju servera, faktora forme servera i opštih zahteva konfiguracije servera.

Ključna točka izbora je sigurnost korištenja klasičnog pristupa sa odvajanjem funkcija obrade, pohranjivanja i prijenosa podataka ili konvergentnog.

klasična arhitektura uključuje upotrebu inteligentnih eksternih podsistema za skladištenje i prenos podataka, dok serveri doprinose samo procesorskoj snazi ​​i RAM-u zajedničkom skupu fizičkih resursa. U ekstremnim slučajevima, serveri postaju potpuno anonimni, nemaju samo svoje diskove, već čak nemaju ni sistemski identifikator. U ovom slučaju, OS ili hipervizor se učitavaju sa ugrađenog flash medija ili sa eksternog sistema za skladištenje podataka (pokretanje sa SAN-a).
U okviru klasične arhitekture, izbor između lopatica i regala vrši se prvenstveno na osnovu sljedećih principa:
— Isplativ (u prosjeku su serveri za postavljanje u stalak jeftiniji);
— Računska gustina (veća za lopatice);
— Potrošnja energije i rasipanje topline (lopatice imaju veću specifičnu jedinicu po jedinici);
— Skalabilnost i upravljivost (lopatice općenito zahtijevaju manje napora za velike instalacije);
- Upotreba kartica za proširenje (veoma ograničen izbor za blade).
Konvergentna arhitektura (takođe poznat kao hiperkonvergiran) uključuje kombinovanje funkcija obrade i skladištenja podataka, što dovodi do upotrebe lokalnih serverskih diskova i, kao posledica, napuštanja klasičnog blade form faktora. Za konvergentne sisteme koriste se ili rack serveri ili klaster sistemi, koji kombinuju nekoliko blejd servera i lokalnih diskova u jednom kućištu.

CPU/Memorija

Da biste ispravno izračunali konfiguraciju, morate razumjeti vrstu opterećenja za okruženje ili svaki od nezavisnih klastera.
CPU vezan – okruženje ograničeno u performansama snagom procesora. Dodavanje RAM-a neće promijeniti ništa u smislu performansi (broj VM-ova po serveru).
Vezano za pamćenje – okruženje ograničeno RAM-om. Više RAM-a na serveru omogućava vam da pokrenete više VM-ova na serveru.
GB / MHz (GB / pCPU) – prosječan omjer potrošnje RAM-a i snage procesora za ovo određeno opterećenje. Može se koristiti za izračunavanje potrebne količine memorije za date performanse i obrnuto.

Proračun konfiguracije servera

Dizajn virtuelizovanog data centra

Prvo, morate odrediti sve vrste opterećenja i odlučiti o kombiniranju ili podjeli različitih računalnih skupova u različite klastere.
Zatim, za svaki od definiranih klastera, omjer GB/MHz se određuje pri unaprijed poznatom opterećenju. Ako opterećenje nije poznato unaprijed, ali postoji grubo razumijevanje nivoa iskorištenosti snage procesora, možete koristiti standardne omjere vCPU:pCPU za pretvaranje zahtjeva skupa u fizičke.

Za svaki klaster, podijelite zbir zahtjeva vCPU spremišta sa koeficijentom:
vCPUsum / vCPU:pCPU = pCPUsum – potreban broj fizičkih jedinica. jezgra
pCPUsum / 1.25 = pCPUht – broj jezgara prilagođen za Hyper-Threading
Pretpostavimo da je potrebno izračunati klaster sa 190 jezgri / 3.5 TB RAM-a. Istovremeno, prihvatamo ciljno opterećenje od 50% snage procesora i 75% RAM-a.

pCPU
190
CPU util
50%

memorija
3500
Mem utility
75%

Utičnica
jezgro
Srv/CPU
Srv Mem
Srv/Mem

2
6
25,3
128
36,5

2
8
19,0
192
24,3

2
10
15,2
256
18,2

2
14
10,9
384
12,2

2
18
8,4
512
9,1

U ovom slučaju uvijek koristimo zaokruživanje na najbliži cijeli broj (=ROUNDUP(A1;0)).
Iz tabele postaje očigledno da je nekoliko konfiguracija servera uravnoteženo za ciljne indikatore:
— 26 servera 2*6c / 192 GB
— 19 servera 2*10c / 256 GB
— 10 servera 2*18c / 512 GB

Izbor ovih konfiguracija se tada mora izvršiti na osnovu dodatnih faktora, kao što su termalni paket i dostupno hlađenje, serveri koji su već korišćeni ili cena.

Karakteristike odabira konfiguracije servera

Široke VM. Ako je potrebno ugostiti široke VM-ove (uporedivo sa 1 NUMA čvorom ili više), preporučuje se, ako je moguće, da odaberete server sa konfiguracijom koja dozvoljava takvim VM-ovima da ostanu unutar NUMA čvora. Kod velikog broja širokih VM-ova postoji opasnost od fragmentacije resursa klastera i u ovom slučaju se biraju serveri koji omogućavaju što gušće postavljanje širokih VM-ova.

Veličina domene jednog kvara.

Izbor veličine servera se takođe zasniva na principu minimiziranja domena pojedinačnog kvara. Na primjer, kada birate između:
— 3 x 4*10c / 512 GB
— 6 x 2*10c / 256 GB
Uz sve ostale stvari jednake, morate odabrati drugu opciju, jer kada jedan server pokvari (ili se održava), ne gubi se 33% resursa klastera, već 17%. Na isti način, broj VM-ova i IS-ova pogođenih nesrećom je prepolovljen.

Proračun klasičnih sistema skladištenja na osnovu performansi

Dizajn virtuelizovanog data centra

Klasični sistemi skladištenja se uvek izračunavaju korišćenjem najgoreg scenarija, isključujući uticaj operativne keš memorije i optimizaciju operacija.
Kao osnovne indikatore performansi uzimamo mehaničke performanse sa diska (IOPSdisk):
– 7.2 k – 75 IOPS
– 10 k – 125 IOPS
– 15 k – 175 IOPS

Zatim se broj diskova u spremištu diskova izračunava pomoću sljedeće formule: = TotalIOPS * (RW + (1 –RW) * RAIDPen) / IOPSdisk. gdje:
- TotalIOPS – ukupne potrebne performanse u IOPS iz spremišta diskova
- RW – procenat operacija čitanja
- RAID olovka – RAID kazna za odabrani RAID nivo

Pročitajte više o RAID-u uređaja i RAID kazni ovdje - Performanse skladištenja. Prvi dio. и Performanse skladištenja. Drugi dio. и Performanse skladištenja. Treći dio

Na osnovu rezultirajućeg broja diskova, izračunavaju se moguće opcije koje zadovoljavaju zahtjeve za kapacitetom pohrane, uključujući opcije s pohranom na više nivoa.
Proračun sistema koji koriste SSD kao sloj za skladištenje se razmatra odvojeno.
Karakteristike računskih sistema sa Flash Cache-om

flash-cache – zajednički naziv za sve vlasničke tehnologije za korištenje fleš memorije kao keš memorije drugog nivoa. Kada se koristi fleš keš, sistem za skladištenje se obično izračunava da obezbedi stabilno opterećenje sa magnetnih diskova, dok vrhunac opslužuje keš memorija.
U ovom slučaju, potrebno je razumjeti profil opterećenja i stupanj lokalizacije pristupa blokovima volumena pohrane. Flash cache je tehnologija za radna opterećenja s visoko lokaliziranim upitima i praktično je neprimjenjiva za ravnomjerno učitane volumene (kao što su za analitičke sisteme).

Proračun hibridnih sistema niske i srednje klase

Hibridni sistemi niže i srednje klase koriste skladištenje na više nivoa sa podacima koji se kreću između nivoa po rasporedu. Istovremeno, veličina bloka za skladištenje na više nivoa za najbolje modele je 256 MB. Ove karakteristike nam ne dopuštaju da tehnologiju za pohranu na više nivoa smatramo tehnologijom za povećanje produktivnosti, kao što mnogi ljudi pogrešno vjeruju. Skladištenje na više nivoa u sistemima niske i srednje klase je tehnologija za optimizaciju troškova skladištenja za sisteme sa izraženom neujednačenošću opterećenja.

Za višeslojnu pohranu, performanse najvišeg sloja se prvo izračunavaju, dok se smatra da donji nivo skladišta doprinosi samo nedostajućem kapacitetu skladištenja. Za hibridni višeslojni sistem, obavezno je koristiti tehnologiju flash keš memorije za višeslojni skup kako bi se nadoknadilo smanjenje performansi za naglo zagrijane podatke sa nižeg nivoa.

Korištenje SSD-a u višeslojnom skupu diskova

Dizajn virtuelizovanog data centra

Upotreba SSD-a u višerazinskom skupu diskova ima varijacije, ovisno o specifičnoj implementaciji algoritama flash keš memorije od strane određenog proizvođača.
Opća praksa politike skladištenja za spremište diskova sa SSD nivoom je prvo SSD.
Flash Cache samo za čitanje. Za flash keš memoriju samo za čitanje, sloj za pohranu na SSD-u dolazi sa značajnom lokalizacijom upisivanja, bez obzira na keš memoriju.
Read/Write Flash Cache. U slučaju flash keš memorije, veličina predmemorije za upisivanje se prvo postavlja na maksimalnu veličinu keša, a nivo SSD memorije se pojavljuje samo kada je veličina keša nedovoljna za opsluživanje cjelokupnog lokaliziranog radnog opterećenja.
Proračuni performansi SSD-a i keš memorije se rade svaki put na osnovu preporuka proizvođača, ali uvijek za najgori scenario.

izvor: www.habr.com

Dodajte komentar