Виртуалды деректер орталығының дизайны

Виртуалды деректер орталығының дизайны

Кіріспе

Пайдаланушы көзқарасы бойынша ақпараттық жүйе ГОСТ RV 51987-де жақсы анықталған - «нәтижесі кейін пайдалану үшін шығыс ақпаратты ұсыну болып табылатын автоматтандырылған жүйе». Егер ішкі құрылымды қарастыратын болсақ, онда мәні бойынша кез келген АЖ кодта жүзеге асырылатын өзара байланысты алгоритмдер жүйесі болып табылады. Тьюринг-Шіркеу тезисінің кең мағынасында алгоритм (немесе АЖ) кіріс деректер жинағын шығыс деректер жинағына түрлендіреді.
Тіпті кіріс деректерін түрлендіру ақпараттық жүйенің болуының мәні деп айтуға болады. Сәйкесінше, АЖ және бүкіл АЖ кешенінің мәні кіріс және шығыс деректердің мәні арқылы анықталады.
Осыған сүйене отырып, дизайн басталуы және деректерге негізделген болуы керек, архитектура мен әдістерді деректердің құрылымы мен маңыздылығына сәйкестендіреді.

Сақталған деректер
Жобалауға дайындықтың негізгі кезеңі өңдеуге және сақтауға жоспарланған барлық деректер жиынының сипаттамаларын алу болып табылады. Бұл сипаттамаларға мыналар жатады:
- Деректер көлемі;
— Мәліметтердің өмірлік циклі туралы ақпарат (жаңа деректердің өсуі, қызмет ету мерзімі, ескірген деректерді өңдеу);
— Мәліметтерді көзқарас тұрғысынан жіктеу қаржылық көрсеткіштермен бірге компанияның негізгі қызметіне әсері (құпиялылық, тұтастық, қолжетімділік триадасы) (мысалы, соңғы сағаттағы деректердің жоғалу құны);
— Мәліметтерді өңдеу географиясы (өңдеу жүйелерінің физикалық орналасуы);
— Әрбір деректер класына арналған нормативтік талаптар (мысалы, Федералдық заң-152, PCI DSS).

Ақпараттық жүйелер

Мәліметтер тек сақталып қана қоймайды, сонымен қатар ақпараттық жүйелер арқылы өңделеді (трансформацияланады). Деректер сипаттамаларын алғаннан кейінгі келесі қадам ақпараттық жүйелерді, олардың архитектуралық ерекшеліктерін, өзара тәуелділіктерін және ресурстардың төрт түрі үшін шартты блоктардағы инфрақұрылым талаптарын барынша толық түгендеу болып табылады:
— Процессордың есептеу қуаты;
- ЖЖҚ көлемі;
— Мәліметтерді сақтау жүйесінің көлемі мен өнімділігіне қойылатын талаптар;
— Мәліметтерді беру желісіне қойылатын талаптар (сыртқы арналар, АЖ құрамдастары арасындағы арналар).
Бұл жағдайда АЖ бөлігі ретінде әрбір қызметке/микросервиске талаптар болуы керек.
Сонымен қатар, дұрыс жобалау үшін АЖ тоқтап қалу құны (сағатына рубль) түріндегі АЖ-ның компанияның негізгі қызметіне әсері туралы деректердің болуы міндетті екенін атап өткен жөн.

Қауіп үлгісі

Деректерді/қызметтерді қорғау жоспарланған қауіптердің ресми моделі болуы керек. Сонымен қатар, қауіп моделі құпиялылық аспектілерін ғана емес, сонымен бірге тұтастық пен қолжетімділікті қамтиды. Анау. Мысалы:
— Физикалық сервердің істен шығуы;
— Сөренің үстіңгі қосқышының істен шығуы;
— Мәліметтер орталықтары арасындағы оптикалық байланыс арнасының бұзылуы;
— Бүкіл операциялық сақтау жүйесінің істен шығуы.
Кейбір жағдайларда қауіп үлгілері тек инфрақұрылымдық құрамдастарға ғана емес, сонымен қатар нақты ақпараттық жүйелерге немесе деректер құрылымының логикалық бұзылуымен ДҚБЖ қатесі сияқты олардың құрамдас бөліктеріне де жазылады.
Сипатталған қауіптен қорғау үшін жобаның барлық шешімдері қажет емес.

Нормативтік талаптар

Егер өңделетін деректер реттеушілер белгілеген арнайы ережелерге бағынатын болса, деректер жиыны және өңдеу/сақтау ережелері туралы ақпарат қажет.

RPO/RTO мақсаттары

Қорғаудың кез келген түрін жобалау үшін сипатталған қауіптердің әрқайсысы үшін мақсатты деректер жоғалту көрсеткіштері мен мақсатты қызметті қалпына келтіру уақыты болуы қажет.
Ең дұрысы, RPO және RTO уақыт бірлігі үшін деректердің жоғалуы мен тоқтап қалудың байланысты шығындары болуы керек.

Виртуалды деректер орталығының дизайны

Ресурстар пулдарына бөлу

Барлық бастапқы кіріс ақпаратын жинағаннан кейін, бірінші қадам қауіп үлгілері мен реттеу талаптары негізінде деректер жиынын және IP-ді пулдарға топтау болып табылады. Әртүрлі пулдардың бөліну түрі - жүйелік бағдарламалық жасақтама деңгейінде немесе физикалық түрде анықталады.
мысалдар:
— Жеке деректерді өңдеу схемасы басқа жүйелерден толығымен физикалық түрде бөлінген;
— Сақтық көшірмелер бөлек сақтау жүйесінде сақталады.

Бұл жағдайда пулдар толық емес тәуелсіз болуы мүмкін, мысалы, есептеу ресурстарының екі пулы анықталған (процессордың қуаты + ЖЖҚ), олар бір деректерді сақтау пулын және деректерді берудің бірыңғай ресурстық пулын пайдаланады.

Өңдеу қуаты

Виртуалды деректер орталығының дизайны

Аннотация, виртуалдандырылған деректер орталығының өңдеу қуатына қойылатын талаптар виртуалды процессорлар (vCPU) саны және олардың физикалық процессорлардағы (pCPU) біріктіру коэффициенті бойынша өлшенеді. Бұл нақты жағдайда 1 pCPU = 1 физикалық процессор өзегі (Hyper-Threading қоспағанда). vCPU саны барлық анықталған ресурс пулдары бойынша жинақталады (олардың әрқайсысында өзінің біріктіру коэффициенті болуы мүмкін).
Жүктелген жүйелер үшін шоғырландыру коэффициенті бар инфрақұрылымға негізделген эмпирикалық жолмен немесе пилоттық орнату және жүктеме сынағы арқылы алынады. Жүктелмеген жүйелер үшін «үздік тәжірибе» қолданылады. Атап айтқанда, VMware орташа қатынасты 8:1 деп атайды.

Жедел жад

ЖЖҚ-ға жалпы қажеттілік қарапайым жинақтау арқылы алынады. ЖЖҚ артық жазылуын пайдалану ұсынылмайды.

Сақтау ресурстары

Сақтау талаптары сыйымдылығы мен өнімділігі бойынша барлық пулдарды жай ғана жинақтау арқылы алынады.
Өнімділік талаптары орташа оқу/жазу қатынасымен және қажет болған жағдайда жауаптың максималды кешігуімен біріктірілген IOPS-те көрсетіледі.
Арнайы пулдарға немесе жүйелерге арналған қызмет көрсету сапасы (QoS) талаптары бөлек көрсетілуі керек.

Деректер желісінің ресурстары

Деректер желісіне қойылатын талаптар барлық өткізу қабілеттілігі пулдарын жай ғана жинақтау арқылы алынады.
Арнайы пулдар немесе жүйелер үшін қызмет көрсету сапасы (QoS) және кідіріс (RTT) талаптары бөлек көрсетілуі керек.
Деректер желісі ресурстарына қойылатын талаптардың бөлігі ретінде желілік трафикті оқшаулауға және/немесе шифрлауға және қолайлы механизмдерге (802.1q, IPSec және т.б.) қойылатын талаптар да көрсетілген.

Архитектура таңдау

Бұл нұсқаулық x86 архитектурасы мен 100% серверді виртуалдандырудан басқа таңдауды талқыламайды. Сондықтан есептеуіш ішкі жүйенің архитектурасын таңдау серверді виртуалдандыру платформасын, сервер пішін факторын және сервер конфигурациясының жалпы талаптарын таңдауға байланысты.

Таңдаудың негізгі нүктесі - деректерді өңдеу, сақтау және беру функцияларын немесе конвергентті бөлумен классикалық тәсілді қолданудың сенімділігі.

классикалық сәулет деректерді сақтау және беру үшін интеллектуалды сыртқы ішкі жүйелерді пайдалануды қамтиды, ал серверлер физикалық ресурстардың ортақ пулына тек өңдеу қуаты мен жедел жадты қосады. Төтенше жағдайларда серверлер толығымен анонимді болады, тек өздерінің дискілері ғана емес, тіпті жүйе идентификаторы да жоқ. Бұл жағдайда операциялық жүйе немесе гипервизор кіріктірілген флэш-таушыдан немесе сыртқы деректерді сақтау жүйесінен жүктеледі (SAN жүйесінен жүктеледі).
Классикалық архитектура аясында пышақтар мен тіректер арасындағы таңдау, ең алдымен, келесі принциптерге негізделген:
— үнемді (орта есеппен тірекке орнатылатын серверлер арзанырақ);
— Есептеу тығыздығы (пышақтар үшін жоғары);
— Энергияны тұтыну және жылуды бөлу (пышақтар бірлігіне жоғары меншікті бірлікке ие);
— Масштабтау және басқару мүмкіндігі (пышақтар әдетте үлкен қондырғылар үшін аз күш жұмсайды);
- Кеңейту карталарын пайдалану (пышақтар үшін өте шектеулі таңдау).
Конвергентті архитектура (сонымен бірге гиперконвергациялық) деректерді өңдеу және сақтау функцияларын біріктіруді қамтиды, бұл жергілікті серверлік дискілерді пайдалануға және соның салдары ретінде классикалық пішін факторынан бас тартуға әкеледі. Конвергентті жүйелер үшін бір жағдайда бірнеше blade серверлері мен жергілікті дискілерді біріктіретін тірек серверлері немесе кластерлік жүйелер пайдаланылады.

Орталық процессор/жад

Конфигурацияны дұрыс есептеу үшін қоршаған ортаға немесе тәуелсіз кластерлердің әрқайсысына арналған жүктеме түрін түсіну керек.
CPU байланысты – процессор қуатымен өнімділігі шектелген орта. ЖЖҚ қосу өнімділік тұрғысынан ештеңені өзгертпейді (бір серверге VM саны).
Жадқа байланысты – жедел жадпен шектелген орта. Сервердегі көбірек ЖЖҚ серверде көбірек виртуалды құрылғыларды іске қосуға мүмкіндік береді.
ГБ / МГц (ГБ / pCPU) – осы нақты жүктеме бойынша жедел жады мен процессор қуатын тұтынудың орташа қатынасы. Берілген өнімділік үшін жадтың қажетті көлемін есептеу үшін пайдалануға болады және керісінше.

Сервер конфигурациясын есептеу

Виртуалды деректер орталығының дизайны

Біріншіден, сіз жүктеменің барлық түрлерін анықтап, әртүрлі есептеу пулдарын әртүрлі кластерлерге біріктіру немесе бөлу туралы шешім қабылдауыңыз керек.
Әрі қарай, анықталған кластерлердің әрқайсысы үшін ГБ/МГц арақатынасы алдын ала белгілі жүктемеде анықталады. Жүктеме алдын ала белгісіз болса, бірақ процессор қуатын пайдалану деңгейі туралы шамамен түсінік болса, пул талаптарын физикалық талаптарға түрлендіру үшін стандартты vCPU:pCPU қатынасын пайдалануға болады.

Әрбір кластер үшін vCPU пул талаптарының қосындысын коэффициентке бөліңіз:
vCPUsum / vCPU:pCPU = pCPUsum – физикалық бірліктердің қажетті саны. өзектер
pCPUsum / 1.25 = pCPUht – Hyper-Threading үшін реттелетін ядролар саны
190 ядросы / 3.5 ТБ жедел жады бар кластерді есептеу қажет деп есептейік. Бұл ретте біз процессор қуатының 50% және жедел жадтың 75% мақсатты жүктемені қабылдаймыз.

pCPU
190
CPU утилитасы
50%

Мем
3500
Mem утилитасы
75%

Сокет
өзек
Srv/CPU
Srv Mem
Srv/Mem

2
6
25,3
128
36,5

2
8
19,0
192
24,3

2
10
15,2
256
18,2

2
14
10,9
384
12,2

2
18
8,4
512
9,1

Бұл жағдайда біз әрқашан ең жақын бүтін санға дейін дөңгелектеуді қолданамыз (=ROUNDUP(A1;0)).
Кестеден бірнеше сервер конфигурациялары мақсатты индикаторлар үшін теңестірілгені анық болады:
— 26 сервер 2*6c / 192 ГБ
— 19 сервер 2*10c / 256 ГБ
— 10 сервер 2*18c / 512 ГБ

Содан кейін бұл конфигурацияларды таңдау термиялық пакет және қолжетімді салқындату, бұрыннан пайдаланылған серверлер немесе құны сияқты қосымша факторларға негізделуі керек.

Сервер конфигурациясын таңдау мүмкіндіктері

Кең виртуалды машиналар. Кең виртуалды виртуалды құрылғыларды орналастыру қажет болса (1 NUMA түйінімен немесе одан да көп салыстырылады), мүмкіндігінше мұндай VM-лердің NUMA түйінінде қалуына мүмкіндік беретін конфигурациясы бар серверді таңдау ұсынылады. Кең VM-лердің үлкен санымен кластерлік ресурстардың фрагментациялану қаупі бар және бұл жағдайда кең VM-ді мүмкіндігінше тығыз орналастыруға мүмкіндік беретін серверлер таңдалады.

Бір қателік домен өлшемі.

Сервер өлшемін таңдау да бір сәтсіздік доменін азайту принципіне негізделген. Мысалы, біреуін таңдағанда:
— 3 x 4*10c / 512 ГБ
— 6 x 2*10c / 256 ГБ
Барлық қалған нәрселер тең болса, сіз екінші опцияны таңдауыңыз керек, өйткені бір сервер істен шыққанда (немесе қызмет көрсетіліп жатқанда) кластер ресурстарының 33% емес, 17% жоғалады. Дәл осылай апаттан зардап шеккен VM және АЖ саны екі есе азаяды.

Классикалық сақтау жүйелерін өнімділікке негізделген есептеу

Виртуалды деректер орталығының дизайны

Классикалық сақтау жүйелері әрқашан операциялық кэштің әсерін және операцияларды оңтайландыруды қоспағанда, ең нашар сценарий арқылы есептеледі.
Негізгі өнімділік көрсеткіштері ретінде біз дискіден (IOPSdisk) механикалық өнімділікті аламыз:
– 7.2к – 75 IOPS
– 10к – 125 IOPS
– 15к – 175 IOPS

Содан кейін диск пулындағы дискілердің саны келесі формула арқылы есептеледі: = TotalIOPS * ( RW + (1 –RW) * RAIDPen) / IOPSdisk. Қайда:
- Барлығы IOPS – диск пулындағы IOPS ішіндегі жалпы талап етілетін өнімділік
- RW – оқу операцияларының пайызы
- RAID қаламы – Таңдалған RAID деңгейі үшін RAID айыппұлы

Device RAID және RAID Penalty туралы толығырақ мына жерден оқыңыз - Сақтау өнімділігі. Бірінші бөлім. и Сақтау өнімділігі. Екінші бөлім. и Сақтау өнімділігі. Үшінші бөлім

Алынған дискілердің саны негізінде сақтау сыйымдылығы талаптарына сәйкес келетін ықтимал опциялар, соның ішінде көп деңгейлі жады бар опциялар есептеледі.
Сақтау қабаты ретінде SSD пайдаланатын жүйелерді есептеу бөлек қарастырылады.
Flash кэшпен есептеу жүйелерінің мүмкіндіктері

Flash кэш – флэш-жадты екінші деңгейлі кэш ретінде пайдалануға арналған барлық меншікті технологиялардың жалпы атауы. Флэш кэшті пайдаланған кезде сақтау жүйесі әдетте магниттік дискілерден тұрақты жүктемені қамтамасыз ету үшін есептелінеді, ал шыңға кэш қызмет етеді.
Бұл жағдайда жүктеме профилін және сақтау көлемінің блоктарына қол жеткізуді оқшаулау дәрежесін түсіну қажет. Flash кэш - жоғары локализацияланған сұраулары бар жұмыс жүктемелеріне арналған технология және біркелкі жүктелген көлемдер үшін (мысалы, аналитикалық жүйелер үшін) іс жүзінде қолданылмайды.

Төменгі/орта диапазондағы гибридті жүйелерді есептеу

Төменгі және орта таптардың гибридті жүйелері кесте бойынша деңгейлер арасында қозғалатын деректермен көп деңгейлі сақтауды пайдаланады. Бұл ретте ең жақсы үлгілер үшін көп деңгейлі сақтау блогының көлемі 256 МБ құрайды. Бұл мүмкіндіктер деңгейлі сақтау технологиясын өнімділікті арттыру технологиясы ретінде қарастыруға мүмкіндік бермейді, өйткені көптеген адамдар қателеседі. Төмен және орта класты жүйелердегі көп деңгейлі сақтау - бұл жүктеменің біркелкі еместігі белгілі жүйелер үшін сақтау шығындарын оңтайландыру технологиясы.

Деңгейлі сақтау үшін ең алдымен жоғарғы деңгейдің өнімділігі есептеледі, ал сақтаудың төменгі деңгейі тек жетіспейтін сақтау сыйымдылығына ықпал етеді деп саналады. Гибридті көп деңгейлі жүйе үшін төменгі деңгейден кенет қыздырылған деректер үшін өнімділіктің төмендеуін өтеу үшін көп деңгейлі пулға арналған флэш кэш технологиясын пайдалану міндетті болып табылады.

Деңгейлі диск пулында SSD пайдалану

Виртуалды деректер орталығының дизайны

Көп деңгейлі диск пулында SSD дискілерін пайдалану белгілі бір өндірушінің флэш кэш алгоритмдерін нақты іске асыруына байланысты өзгереді.
SSD деңгейі бар дискі пулына арналған сақтау саясатының жалпы тәжірибесі алдымен SSD болып табылады.
Тек оқуға арналған Flash кэш. Тек оқуға арналған флэш кэш үшін SSD жадындағы сақтау қабаты кэшке қарамастан жазуларды айтарлықтай локализациялаумен бірге келеді.
Flash кэшін оқу/жазу. Флэш кэш жағдайында жазу кэшінің өлшемі алдымен ең үлкен кэш өлшеміне орнатылады және SSD сақтау деңгейі кэш өлшемі бүкіл локализацияланған жұмыс жүктемесіне қызмет көрсету үшін жеткіліксіз болған кезде ғана пайда болады.
SSD және кэш өнімділігін есептеулер әр уақытта өндірушінің ұсыныстары негізінде жасалады, бірақ әрқашан ең нашар сценарий үшін.

Ақпарат көзі: www.habr.com

пікір қалдыру