Дизајн виртуелизованог дата центра

Дизајн виртуелизованог дата центра

Увод

Информациони систем са тачке гледишта корисника добро је дефинисан у ГОСТ РВ 51987 - „аутоматски систем, чији је резултат представљање излазних информација за накнадну употребу. Ако узмемо у обзир унутрашњу структуру, онда је у суштини сваки ИС систем међусобно повезаних алгоритама имплементираних у коду. У ширем смислу Туринг-Черчеве тезе, алгоритам (или ИС) трансформише скуп улазних података у скуп излазних података.
Могло би се чак рећи да је трансформација улазних података смисао постојања информационог система. Сходно томе, вредност ИС и целокупног ИС комплекса се утврђује кроз вредност улазних и излазних података.
Имајући ово на уму, дизајн мора започети и бити вођен подацима, прилагођавајући архитектуру и методе структури и значају података.

Сачувани подаци
Кључна фаза у припреми за пројектовање је добијање карактеристика свих скупова података планираних за обраду и складиштење. Ове карактеристике укључују:
- Обим података;
— Информације о животном циклусу података (раст нових података, животни век, обрада застарелих података);
— Класификација података са становишта утицај на основну делатност компаније (тријада поверљивост, интегритет, доступност) заједно са финансијским показатељима (на пример, цена губитка података у последњем сату);
— Географија обраде података (физичка локација система за обраду);
— Регулаторни захтеви за сваку класу података (на пример, Савезни закон-152, ПЦИ ДСС).

Информациони системи

Подаци се не само чувају, већ и обрађују (трансформишу) информациони системи. Следећи корак након добијања карактеристика података је најпотпунији инвентар информационих система, њихових архитектонских карактеристика, међузависности и инфраструктурних захтева у конвенционалним јединицама за четири врсте ресурса:
— Рачунарска снага процесора;
— Количина РАМ-а;
— Захтеви за обим и перформансе система за складиштење података;
— Захтеви за мрежу за пренос података (спољни канали, канали између ИС компоненти).
У овом случају, морају постојати захтеви за сваку услугу/микроуслугу као део ИС-а.
Одвојено, потребно је напоменути да је за правилно пројектовање обавезна доступност података о утицају ИС-а на основну делатност компаније у виду трошкова застоја ИС-а (рубаљи по сату).

Модел претње

Мора постојати формални модел претњи од којих се планира заштитити подаци/услуге. Штавише, модел претње укључује не само аспекте поверљивости, већ и интегритет и доступност. Оне. На пример:
— Квар физичког сервера;
— Квар прекидача на врху;
— Поремећај оптичког комуникационог канала између центара података;
— Отказивање целог оперативног система складиштења.
У неким случајевима, модели претњи се пишу не само за инфраструктурне компоненте, већ и за специфичне информационе системе или њихове компоненте, као што је квар ДБМС-а са логичким уништењем структуре података.
Све одлуке у оквиру пројекта за заштиту од неописане претње су непотребне.

Регулаторни захтеви

Ако подаци који се обрађују подлежу посебним правилима које су установили регулатори, потребне су информације о скуповима података и правилима обраде/чувања.

РПО/РТО циљеви

Дизајнирање било које врсте заштите захтева поседовање циљних индикатора губитка података и циљног времена опоравка услуге за сваку од описаних претњи.
У идеалном случају, РПО и РТО би требало да имају повезане трошкове губитка података и застоја по јединици времена.

Дизајн виртуелизованог дата центра

Подела на фондове ресурса

Након прикупљања свих почетних улазних информација, први корак је груписање скупова података и ИП-а у групе на основу модела претњи и регулаторних захтева. Одређује се тип поделе различитих пулова – програмски на нивоу системског софтвера или физички.
Примери:
— Коло које обрађује личне податке је потпуно физички одвојено од других система;
— Резервне копије се чувају на посебном систему за складиштење.

У овом случају, скупови могу бити непотпуно независни, на пример, дефинисана су два скупа рачунарских ресурса (снага процесора + РАМ), који користе један базен за складиштење података и један базен ресурса за пренос података.

Процесна снага

Дизајн виртуелизованог дата центра

Сажетак, захтеви за процесорском снагом виртуелизованог центра података мере се у смислу броја виртуелних процесора (вЦПУ) и њиховог односа консолидације на физичким процесорима (пЦПУ). У овом конкретном случају, 1 пЦПУ = 1 физичко језгро процесора (искључујући Хипер-Тхреадинг). Број вЦПУ-ова се сумира у свим дефинисаним скуповима ресурса (од којих сваки може имати свој фактор консолидације).
Коефицијент консолидације за оптерећене системе добија се емпиријски, на основу постојеће инфраструктуре, или кроз пилот инсталацију и тестирање оптерећења. За неоптерећене системе користи се „најбоља пракса“. Конкретно, ВМваре наводи да је просечан однос 8:1.

Оперативна меморија

Укупни захтеви за РАМ се добијају једноставним сумирањем. Не препоручује се коришћење прекомерне претплате на РАМ.

Ресурси за складиштење

Захтеви за складиштење се добијају једноставним сабирањем свих скупова по капацитету и перформансама.
Захтеви за перформансе су изражени у ИОПС у комбинацији са просечним односом читања/писања и, ако је потребно, максималном латенцијом одговора.
Захтеви за квалитет услуге (КоС) за специфичне групе или системе морају бити специфицирани посебно.

Ресурси мреже података

Захтеви за мрежу података добијају се једноставним сабирањем свих скупова пропусног опсега.
Захтеви за квалитет услуге (КоС) и кашњење (РТТ) за специфичне групе или системе треба да буду специфицирани одвојено.
Као део захтева за мрежне ресурсе података, такође су назначени захтеви за изоловање и/или шифровање мрежног саобраћаја и преферирани механизми (802.1к, ИПСец, итд.).

Избор архитектуре

Овај водич не говори о другом избору осим к86 архитектури и 100% виртуелизацији сервера. Стога се избор архитектуре рачунарског подсистема своди на избор платформе за виртуелизацију сервера, фактора форме сервера и општих захтева за конфигурацијом сервера.

Кључна тачка избора је извесност коришћења класичног приступа са одвајањем функција обраде, складиштења и преноса података или конвергентног.

класична архитектура укључује употребу интелигентних екстерних подсистема за складиштење и пренос података, док сервери доприносе само процесорској снази и РАМ-у заједничком скупу физичких ресурса. У екстремним случајевима, сервери постају потпуно анонимни, имају не само сопствене дискове, већ чак ни системски идентификатор. У овом случају, ОС или хипервизор се учитавају са уграђеног флеш медија или са спољног система за складиштење података (покретање са САН-а).
У оквиру класичне архитектуре, избор између лопатица и регала врши се првенствено на основу следећих принципа:
— Исплатив (у просеку, сервери за монтирање у сталак су јефтинији);
— Рачунска густина (већа за лопатице);
— Потрошња енергије и расипање топлоте (лопатице имају већу специфичну јединицу по јединици);
— Скалабилност и управљивост (лопатице генерално захтевају мање напора за велике инсталације);
- Коришћење картица за проширење (веома ограничен избор за блејдове).
Конвергентна архитектура (такође познат као хиперконвергентан) подразумева комбиновање функција обраде и складиштења података, што доводи до употребе локалних серверских дискова и, као последица, напуштања класичног блејд форм фактора. За конвергентне системе, користе се или рацк сервери или кластер системи, који комбинују неколико блејд сервера и локалних дискова у једном кућишту.

ЦПУ/Меморија

Да бисте правилно израчунали конфигурацију, морате разумети врсту оптерећења за окружење или сваки од независних кластера.
ЦПУ боунд – окружење ограничено у перформансама снагом процесора. Додавање РАМ-а неће променити ништа у погледу перформанси (број ВМ-а по серверу).
Везано за памћење – окружење ограничено РАМ-ом. Више РАМ-а на серверу омогућава вам да покренете више ВМ-ова на серверу.
ГБ / МХз (ГБ / пЦПУ) – просечан однос потрошње РАМ-а и снаге процесора према овом конкретном оптерећењу. Може се користити за израчунавање потребне количине меморије за дате перформансе и обрнуто.

Прорачун конфигурације сервера

Дизајн виртуелизованог дата центра

Прво, морате да одредите све врсте оптерећења и одлучите да комбинујете или поделите различите рачунарске групе у различите кластере.
Затим, за сваки од дефинисаних кластера, однос ГБ/МХз се одређује при унапред познатом оптерећењу. Ако оптерећење није познато унапред, али постоји грубо разумевање нивоа искоришћења снаге процесора, можете користити стандардне односе вЦПУ:пЦПУ да бисте конвертовали захтеве скупа у физичке.

За сваки кластер, поделите збир захтева вЦПУ скупа са коефицијентом:
вЦПУсум / вЦПУ:пЦПУ = пЦПУсум – потребан број физичких јединица. језгра
пЦПУсум / 1.25 = пЦПУхт – број језгара прилагођен за Хипер-Тхреадинг
Претпоставимо да је потребно израчунати кластер са 190 језгара / 3.5 ТБ РАМ-а. Истовремено, прихватамо циљно оптерећење од 50% снаге процесора и 75% РАМ-а.

пЦПУ
190
ЦПУ утил
100%

Мем
3500
Мем утилити
100%

Утичница
Језгро
Срв/ЦПУ
Срв Мем
Срв/Мем

2
6
25,3
128
36,5

2
8
19,0
192
24,3

2
10
15,2
256
18,2

2
14
10,9
384
12,2

2
18
8,4
512
9,1

У овом случају увек користимо заокруживање на најближи цео број (=РОУНДУП(А1;0)).
Из табеле постаје очигледно да је неколико конфигурација сервера уравнотежено за циљне индикаторе:
— 26 сервера 2*6ц / 192 ГБ
— 19 сервера 2*10ц / 256 ГБ
— 10 сервера 2*18ц / 512 ГБ

Избор ових конфигурација се онда мора извршити на основу додатних фактора, као што су термални пакет и расположиво хлађење, сервери који се већ користе или цена.

Карактеристике избора конфигурације сервера

Широке ВМ. Ако је потребно да хостујете широке ВМ (упоредиво са 1 НУМА чвором или више), препоручује се, ако је могуће, да изаберете сервер са конфигурацијом која дозвољава таквим ВМ-овима да остану унутар НУМА чвора. Код великог броја широких ВМ-ова постоји опасност од фрагментације ресурса кластера и у овом случају се бирају сервери који омогућавају што гушће постављање широких ВМ-а.

Величина једног домена грешке.

Избор величине сервера се такође заснива на принципу минимизирања појединачног домена грешке. На пример, када бирате између:
— 3 к 4*10ц / 512 ГБ
— 6 к 2*10ц / 256 ГБ
Под свим осталим једнаким условима, морате изабрати другу опцију, јер када један сервер поквари (или се одржава), не губи се 33% ресурса кластера, већ 17%. На исти начин, број ВМ и ИС погођених несрећом је преполовљен.

Прорачун класичних система складиштења на основу перформанси

Дизајн виртуелизованог дата центра

Класични системи складиштења се увек израчунавају коришћењем најгорег сценарија, искључујући утицај оперативног кеша и оптимизацију операција.
Као основне индикаторе перформанси узимамо механичке перформансе са диска (ИОПСдиск):
– 7.2 к – 75 ИОПС
– 10 к – 125 ИОПС
– 15 к – 175 ИОПС

Затим се број дискова у групи дискова израчунава помоћу следеће формуле: = ТоталИОПС * (РВ + (1 –РВ) * РАИДПен) / ИОПСдиск. Где:
- ТоталИОПС – укупне потребне перформансе у ИОПС из скупа дискова
- RW – проценат операција читања
- РАИДпен – РАИД казна за изабрани ниво РАИД-а

Прочитајте више о РАИД-у уређаја и РАИД казни овде - Перформансе складиштења. Први део. и Перформансе складиштења. Други део. и Перформансе складиштења. Трећи део

На основу добијеног броја дискова израчунавају се могуће опције које испуњавају захтеве за капацитетом складиштења, укључујући опције са складиштењем на више нивоа.
Прорачун система који користе ССД као слој за складиштење се разматра одвојено.
Карактеристике рачунских система са Фласх Цацхе-ом

Фласх Цацхе – заједнички назив за све власничке технологије за коришћење флеш меморије као кеш меморије другог нивоа. Када се користи флеш кеш, систем за складиштење се обично израчунава да обезбеди стабилно оптерећење са магнетних дискова, док врхунац опслужује кеш.
У овом случају, потребно је разумети профил оптерећења и степен локализације приступа блоковима запремине складишта. Фласх кеш је технологија за радна оптерећења са високо локализованим упитима и практично је неприменљива за равномерно учитане волумене (као што су системи за анализу).

Прорачун хибридних система ниске и средње класе

Хибридни системи ниже и средње класе користе складиштење на више нивоа са подацима који се крећу између нивоа по распореду. Истовремено, величина блока за складиштење на више нивоа за најбоље моделе је 256 МБ. Ове карактеристике нам не дозвољавају да сматрамо вишеслојну технологију складиштења технологијом за повећање продуктивности, као што многи људи погрешно верују. Складиштење на више нивоа у системима ниске и средње класе је технологија за оптимизацију трошкова складиштења за системе са израженом неуједначеношћу оптерећења.

За вишеслојно складиштење, перформансе највишег нивоа се прво израчунавају, док се сматра да доњи ниво складиштења доприноси само недостајућем капацитету складиштења. За хибридни вишеслојни систем, обавезна је употреба технологије флеш кеш меморије за вишеслојни скуп како би се надокнадило смањење перформанси за нагло загрејане податке са нижег нивоа.

Коришћење ССД-а у вишеслојном скупу дискова

Дизајн виртуелизованог дата центра

Употреба ССД-а у вишеслојном скупу дискова има варијације, у зависности од специфичне имплементације алгоритама флеш кеш меморије од стране датог произвођача.
Општа пракса политике складиштења за дисковни скуп са ССД нивоом је прво ССД.
Фласх Цацхе само за читање. За флеш кеш само за читање, слој за складиштење на ССД-у долази са значајном локализацијом уписивања, без обзира на кеш.
Реад/Врите Фласх Цацхе. У случају флеш кеша, величина кеш меморије за писање се прво поставља на максималну величину кеш меморије, а ниво ССД меморије се појављује само када је величина кеша недовољна за опслуживање целог локализованог радног оптерећења.
Прорачуни перформанси ССД-а и кеш меморије се врше сваки пут на основу препорука произвођача, али увек за најгори сценарио.

Извор: ввв.хабр.цом

Додај коментар