Виртуалдык маалымат борборунун дизайны

Виртуалдык маалымат борборунун дизайны

тааныштыруу

Колдонуучунун көз карашы боюнча маалымат системасы ГОСТ RV 51987де жакшы аныкталган - "автоматташтырылган система, анын натыйжасы кийин пайдалануу үчүн чыгуучу маалыматты көрсөтүү болуп саналат." Эгерде ички түзүмүн карай турган болсок, анда ар кандай ИС түпкүлүгүндө коддо ишке ашырылган өз ара байланышкан алгоритмдердин системасы болуп саналат. Тьюринг-Черч тезисинин кеңири маанисинде алгоритм (же ИС) киргизилген маалыматтардын жыйындысын чыгуучу маалыматтардын жыйындысына айлантат.
Киргизилген маалыматтарды трансформациялоо маалыматтык системанын бар экендигинин мааниси деп да айтууга болот. Ушуга ылайык, ИСтин жана бүткүл ИС комплексинин мааниси кириш жана чыгаруу маалыматтарынын мааниси аркылуу аныкталат.
Мунун негизинде дизайн башталышы жана берилиштерге негизделиши керек, архитектураны жана методдорду маалыматтардын структурасына жана маанисине ылайыкташтыруу керек.

Сакталган маалыматтар
Долбоорлоого даярдануунун негизги этабы болуп иштеп чыгуу жана сактоо үчүн пландаштырылган бардык маалымат топтомдорунун мүнөздөмөлөрүн алуу саналат. Бул мүнөздөмөлөргө төмөнкүлөр кирет:
- маалыматтардын көлөмү;
— Маалыматтын жашоо цикли жөнүндө маалымат (жаңы маалыматтардын өсүшү, иштөө мөөнөтү, эскирген маалыматтарды иштетүү);
— спецификациялар менен маалыматтарды классификациялоо каржылык көрсөткүчтөр менен бирге компаниянын негизги бизнесине таасири (купуялуулук, бүтүндүк, жеткиликтүүлүк триадасы) (мисалы, акыркы сааттагы маалыматтарды жоготуу баасы);
— Маалыматтарды иштетүү географиясы (иштетүү системаларынын физикалык жайгашуусу);
— Ар бир маалымат классы үчүн ченемдик талаптар (мисалы, Федералдык Мыйзам-152, PCI DSS).

Маалымат системалары

Маалыматтар бир гана сакталбастан, маалыматтык системалар тарабынан иштетилет (трансформацияланат). Маалыматтык мүнөздөмөлөрдү алгандан кийинки кадам маалыматтык системалардын, алардын архитектуралык өзгөчөлүктөрүнүн, өз ара көз карандылыктарынын жана инфраструктуралык талаптардын эң толук инвентаризациясы болуп саналат, ресурстардын төрт түрү үчүн шарттуу бирдиктерде:
— Процессордун эсептөө күчү;
- RAM көлөмү;
— Маалыматтарды сактоо системасынын көлөмүнө жана иштөөсүнө талаптар;
— Маалыматтарды берүү тармагына талаптар (тышкы каналдар, ИС компоненттеринин ортосундагы каналдар).
Мында ИСтин бир бөлүгү катары ар бир кызматка/микросервиске талаптар болушу керек.
Өзүнчө белгилеп кетүүчү нерсе, туура долбоорлоо үчүн ИСтин компаниянын негизги бизнесине тийгизген таасири жөнүндө маалыматтардын IS токтоп калуу наркы (саатына рубль) түрүндө болушу милдеттүү.

Коркунуч модели

Маалыматтарды/кызматтарды коргоо пландаштырылган коркунучтардын расмий модели болушу керек. Мындан тышкары, коркунуч модели купуялуулуктун аспектилерин гана эмес, бүтүндүктү жана жеткиликтүүлүктү да камтыйт. Ошол. Мисалы:
— Физикалык сервердин иштебей калышы;
— Стеллаждын үстүнкү өчүргүчүнүн бузулушу;
— Маалымат борборлорунун ортосундагы оптикалык байланыш каналынын үзгүлтүккө учурашы;
— Бүткүл оперативдүү сактоо тутумунун бузулушу.
Кээ бир учурларда, коркунуч моделдери инфраструктуранын компоненттери үчүн гана эмес, ошондой эле белгилүү бир маалымат тутумдары же алардын компоненттери үчүн да жазылат, мисалы, маалымат структурасынын логикалык бузулушу менен СББнын бузулушу.
Белгисиз коркунучтан коргоо үчүн долбоордун ичиндеги бардык чечимдердин кереги жок.

Ченемдик талаптар

Эгерде иштетилип жаткан маалыматтар жөнгө салуучу органдар тарабынан белгиленген атайын эрежелерге баш ийсе, маалымат топтомдору жана иштетүү/сактоо эрежелери жөнүндө маалымат талап кылынат.

RPO/RTO максаттары

Коргоонун ар кандай түрүн иштеп чыгуу үчүн ар бир сүрөттөлгөн коркунуч үчүн максаттуу маалыматтарды жоготуу индикаторлору жана кызматты калыбына келтирүү үчүн максаттуу убакыт керек.
Идеалында, RPO жана RTO маалымат жоготууга жана убакыт бирдигине токтоп калууга байланыштуу чыгымдарга ээ болушу керек.

Виртуалдык маалымат борборунун дизайны

Ресурстук бассейндерге бөлүү

Бардык баштапкы киргизүү маалыматын чогулткандан кийин, биринчи кадам коркунуч моделдеринин жана ченемдик талаптардын негизинде маалымат топтомдорун жана IPди топтоо болуп саналат. Ар кандай бассейндердин бөлүнүү түрү аныкталат - программалык түрдө системанын программалык деңгээлинде же физикалык жактан.
мисалдар:
— Жеке маалыматтарды иштеп чыгуу схемасы башка системалардан физикалык жактан толугу менен бөлүнгөн;
— Камдык көчүрмөлөр өзүнчө сактоо тутумунда сакталат.

Бул учурда, бассейндер толук эмес көз карандысыз болушу мүмкүн, мисалы, эсептөө ресурстарынын эки бассейни аныкталат (процессордун кубаттуулугу + RAM), алар бирдиктүү маалыматты сактоо пулун жана бирдиктүү маалымат берүү ресурстук пулун колдонушат.

Кайра иштетүү күчү

Виртуалдык маалымат борборунун дизайны

Аннотация, виртуалдаштырылган маалымат борборунун иштетүү кубаттуулугуна талаптар виртуалдык процессорлордун (vCPU) саны жана алардын физикалык процессорлордо (pCPU) консолидация катышы менен өлчөнөт. Бул өзгөчө учурда, 1 pCPU = 1 физикалык процессор өзөгү (Hyper-Threading кошпогондо). vCPU саны бардык аныкталган ресурс пулдары боюнча (алардын ар бири өзүнүн консолидация факторуна ээ болушу мүмкүн) жалпыланган.
Жүктөлгөн системалар үчүн консолидация коэффициенти эмпирикалык түрдө, болгон инфраструктуранын негизинде же пилоттук орнотуу жана жүктөмдү сыноо аркылуу алынат. Жүктөлбөгөн системалар үчүн "мыкты тажрыйба" колдонулат. Тактап айтканда, VMware орточо катышты 8:1 деп атайт.

мүмкүндүк алуу түйүнү

Жалпы RAM талабы жөнөкөй суммалоо жолу менен алынат. RAM ашыкча жазылууну колдонуу сунушталбайт.

Сактоо ресурстары

Сактоо талаптары жөн гана бардык бассейндерди сыйымдуулугу жана өндүрүмдүүлүгү боюнча жалпылоо аркылуу алынат.
Аткаруу талаптары орточо окуу/жазуу катышы жана зарыл болсо, жооптун максималдуу кечигүү мөөнөтү менен айкалышкан IOPS менен көрсөтүлөт.
Конкреттүү бассейндерге же системаларга Тейлөө сапаты (QoS) талаптары өзүнчө көрсөтүлүшү керек.

Маалымат тармагы ресурстары

Маалымат тармагынын талаптары жөн гана бардык өткөрүү жөндөмдүүлүгү көлмөлөрүн кошуу менен алынат.
Кызматтын сапаты (QoS) жана белгилүү бир бассейндер же системалар үчүн күтүү (RTT) талаптары өзүнчө көрсөтүлүшү керек.
Маалымат тармагынын ресурстарына талаптардын бир бөлүгү катары тармактык трафикти обочолонтуу жана/же шифрлөө талаптары жана артыкчылыктуу механизмдер (802.1q, IPSec ж.б.) да көрсөтүлгөн.

Архитектура тандоо

Бул колдонмо x86 архитектурасынан жана 100% серверди виртуалдаштыруудан башка тандоону талкуулабайт. Демек, эсептөөчү подсистеманын архитектурасын тандоо серверди виртуалдаштыруу платформасын, сервер форма факторун жана сервер конфигурациясынын жалпы талаптарын тандоого туура келет.

Тандоонун негизги пункту - бул маалыматтарды иштеп чыгуу, сактоо жана берүү функцияларын же конвергентти бөлүү менен классикалык ыкманы колдонуунун ишенимдүүлүгү.

классикалык архитектура маалыматтарды сактоо жана берүү үчүн интеллектуалдык тышкы подсистемаларды колдонууну камтыйт, ал эми серверлер физикалык ресурстардын жалпы бассейнине иштетүүчү кубаттуулукту жана оперативдүү эстутумду гана кошот. Экстремалдуу учурларда серверлер толугу менен анонимдүү болуп калышат, алар өздөрүнүн дисктерине гана ээ эмес, ал тургай система идентификаторуна да ээ эмес. Бул учурда, ОС же гипервизор орнотулган флэш медиадан же тышкы маалыматтарды сактоо тутумунан (САНдан жүктөө) жүктөлөт.
Классикалык архитектуранын алкагында, бычактарды жана стеллаждарды тандоо, биринчи кезекте, төмөнкү принциптердин негизинде жүргүзүлөт:
— Эффективдүү (орточо эсеп менен стойкага орнотулган серверлер арзаныраак);
— Эсептөө тыгыздыгы (пычактар ​​үчүн жогору);
— Энергияны керектөө жана жылуулукту бөлүштүрүү (блоктар бирдигине көбүрөөк өзгөчө бирдикке ээ);
— Масштабдуулугу жана башкарылуучулугу (плачтар көбүнчө чоң орнотуулар үчүн аз күч-аракетти талап кылат);
- Кеңейтүү карталарын колдонуу (блада үчүн өтө чектелген тандоо).
Конвергенттүү архитектура (ошондой эле белгилүү гиперконвергацияланган) маалыматтарды иштетүү жана сактоо функцияларын бириктирүүнү камтыйт, бул локалдык сервердик дисктерди колдонууга жана натыйжада классикалык blade форма факторунан баш тартууга алып келет. Конвергенттик системалар үчүн же рейк серверлери же кластердик системалар колдонулат, алар бир учурда бир нече лейд серверлерин жана локалдык дисктерди бириктирет.

CPU/ эс тутум

Туура конфигурацияны эсептөө үчүн, сиз айлана-чөйрөгө же көз карандысыз кластерлердин ар бири үчүн жүктүн түрүн түшүнүү керек.
CPU байланган – процессордун күчү менен иштөөсү чектелген чөйрө. RAM кошуу өндүрүмдүүлүк жагынан эч нерсени өзгөртпөйт (бир серверге VM саны).
Эстутум байланган – RAM менен чектелген чөйрө. Сервердеги көбүрөөк RAM сизге серверде көбүрөөк VMлерди иштетүүгө мүмкүндүк берет.
ГБ / МГц (ГБ / pCPU) – бул конкреттүү жүктөм боюнча RAM жана процессордун кубаттуулугун керектөөнүн орточо катышы. Берилген аткаруу үчүн эстутумдун керектүү көлөмүн эсептөө үчүн колдонулушу мүмкүн жана тескерисинче.

Сервердин конфигурациясын эсептөө

Виртуалдык маалымат борборунун дизайны

Биринчиден, сиз жүктүн бардык түрлөрүн аныктап, ар кандай эсептөө бассейндерин ар кандай кластерлерге бириктирүү же бөлүү жөнүндө чечим кабыл алышыңыз керек.
Андан кийин, аныкталган кластерлердин ар бири үчүн ГБ/МГц катышы алдын ала белгилүү болгон жүктө аныкталат. Эгерде жүктөө алдын ала белгисиз болсо, бирок процессордун кубаттуулугун пайдалануу деңгээли тууралуу болжолдуу түшүнүк бар болсо, бассейн талаптарын физикалык талаптарга айландыруу үчүн стандарттуу vCPU:pCPU катыштарын колдонсоңуз болот.

Ар бир кластер үчүн vCPU пул талаптарынын суммасын коэффициентке бөлүңүз:
vCPUsum / vCPU: pCPU = pCPUsum – физикалык бирдиктердин талап кылынган саны. өзөктөр
pCPUsum / 1.25 = pCPUht – Hyper-Threading үчүн туураланган өзөктөрдүн саны
190 өзөгү / 3.5 ТБ оперативдүү эс тутуму бар кластерди эсептөө керек деп ойлойлу. Ошол эле учурда биз процессордун кубаттуулугунун 50% жана оперативдүү эстин 75% максаттуу жүктү кабыл алабыз.

pCPU
190
CPU утилитасы
50%

Мем
3500
Mem утилитасы
75%

чанак
негизги
Srv/CPU
Srv Mem
Srv/Mem

2
6
25,3
128
36,5

2
8
19,0
192
24,3

2
10
15,2
256
18,2

2
14
10,9
384
12,2

2
18
8,4
512
9,1

Бул учурда биз ар дайым эң жакын бүтүн санга чейин тегеректөө ыкмасын колдонобуз (=ROUNDUP(A1;0)).
Таблицадан көрүнүп тургандай, бир нече сервер конфигурациялары максаттуу индикаторлор үчүн тең салмактуу:
— 26 сервер 2*6c / 192 ГБ
— 19 сервер 2*10c / 256 ГБ
— 10 сервер 2*18c / 512 ГБ

Андан кийин бул конфигурацияларды тандоо кошумча факторлордун негизинде жасалышы керек, мисалы, термикалык пакет жана жеткиликтүү муздатуу, буга чейин колдонулган серверлер же баалар.

Сервер конфигурациясын тандоонун өзгөчөлүктөрү

Кеңири VMлер. Кеңири VMлерди (1 NUMA түйүнү менен салыштырууга болот же андан көп) жайгаштыруу зарыл болсо, мүмкүн болсо, мындай VM'лердин NUMA түйүнүн ичинде калышына мүмкүндүк берген конфигурацияга ээ серверди тандоо сунушталат. Кеңири VMлердин көп саны менен кластердик ресурстардын фрагменттелүү коркунучу бар жана бул учурда кең VMлерди мүмкүн болушунча жыш жайгаштырууга мүмкүндүк берген серверлер тандалат.

Жалгыз ката доменинин өлчөмү.

Сервердин өлчөмүн тандоо да бир ката доменин минималдаштыруу принцибине негизделген. Мисалы, тандоодо:
— 3 x 4*10c / 512 ГБ
— 6 x 2*10c / 256 ГБ
Калган нерселердин баары бирдей болгондо, сиз экинчи вариантты тандашыңыз керек, анткени бир сервер иштебей калганда (же тейлөөдө), кластердик ресурстардын 33% эмес, 17% жоголот. Ушундай эле жол менен авариядан жабыркаган VM жана ИСтин саны эки эсеге кыскарат.

аткаруунун негизинде классикалык сактоо системаларын эсептөө

Виртуалдык маалымат борборунун дизайны

Классикалык сактоо системалары оперативдүү кэштин таасирин жана операцияларды оптималдаштырууну эске албаганда, ар дайым эң начар сценарийди колдонуу менен эсептелет.
Негизги өндүрүмдүүлүк көрсөткүчтөрү катары, биз дисктен (IOPSdisk) механикалык көрсөткүчтөрдү алабыз:
– 7.2к – 75 IOPS
– 10к – 125 IOPS
– 15к – 175 IOPS

Андан кийин, диск бассейниндеги дисктердин саны төмөнкү формула менен эсептелет: = TotalIOPS * ( RW + (1 –RW) * RAIDPen) / IOPSdisk. Кайда:
- TotalIOPS – диск бассейнинен IOPS боюнча жалпы талап кылынган аткаруу
- RW – окуу операцияларынын пайызы
- RAID калеми – Тандалган RAID деңгээли үчүн RAID жазасы

Бул жерден Device RAID жана RAID Penalty жөнүндө көбүрөөк оку - Сактоо көрсөткүчү. Биринчи бөлүк. и Сактоо көрсөткүчү. Экинчи бөлүм. и Сактоо көрсөткүчү. Үчүнчү бөлүк

Алынган дисктердин санынын негизинде сактоо сыйымдуулугунун талаптарына жооп берген мүмкүн болгон варианттар, анын ичинде көп деңгээлдүү сактагычы бар варианттар эсептелет.
сактоо катмары катары SSD колдонгон системаларды эсептөө өзүнчө каралат.
Flash кэш менен эсептөө системаларынын өзгөчөлүктөрү

Flash кэш – экинчи деңгээлдеги кэш катары флэш эстутумду колдонуунун бардык менчик технологияларынын жалпы аталышы. Флэш кэшти колдонууда сактоо системасы, адатта, магниттик дисктерден туруктуу жүктү камсыз кылуу үчүн эсептелинет, ал эми чокусу кэш тарабынан тейленет.
Бул учурда, жүктүн профилин жана сактоо көлөмүнүн блокторуна жетүү локализациясынын даражасын түшүнүү зарыл. Flash кэш жогорку локализацияланган суроо-талаптары бар жумуш жүктөмдөрү үчүн технология жана бир калыпта жүктөлгөн томдор үчүн (мисалы, аналитикалык системалар үчүн) иш жүзүндө колдонулбайт.

Төмөнкү/орто диапазондогу гибриддик системаларды эсептөө

Төмөнкү жана орто класстардын гибриддик тутумдары график боюнча деңгээлдердин ортосунда кыймылдаган маалыматтар менен көп деңгээлдүү сактоону колдонушат. Ошол эле учурда, мыкты моделдер үчүн көп баскычтуу сактоо блогунун көлөмү 256 МБ. Бул өзгөчөлүктөр көп адамдар жаңылыш ойлогондой, баскычтуу сактоо технологиясын өндүрүмдүүлүктү жогорулатуу технологиясы катары кароого мүмкүндүк бербейт. Төмөн жана орто класстагы системаларда көп деңгээлдүү сактоо - бул жүктүн бирдей эместиги бар системалар үчүн сактоо чыгымдарын оптималдаштыруу технологиясы.

Деңгээлдүү сактоо үчүн эң биринчи жогорку деңгээлдеги көрсөткүчтөр эсептелет, ал эми сактоонун төмөнкү деңгээли жетишпеген сактоо сыйымдуулугуна гана салым кошот деп эсептелет. Гибриддик көп деңгээлдүү система үчүн, төмөнкү деңгээлден күтүлбөгөн жерден жылыган маалыматтар үчүн өндүрүмдүүлүктүн төмөндөшүнүн ордун толтуруу үчүн көп баскычтуу бассейн үчүн флеш кэш технологиясын колдонуу милдеттүү.

Деңгээлдүү диск бассейнинде SSDди колдонуу

Виртуалдык маалымат борборунун дизайны

Көп деңгээлдүү диск бассейнинде SSD дисктерин колдонуу, берилген өндүрүүчү тарабынан флеш кэш алгоритмдерин конкреттүү ишке ашыруусуна жараша вариацияларга ээ.
SSD деңгээли бар диск бассейни үчүн сактоо саясатынын жалпы практикасы биринчи SSD болуп саналат.
Окуу үчүн гана Flash кэш. Окуу үчүн гана флеш кэш үчүн, SSDдеги сактоо катмары кэшке карабастан жазуулардын олуттуу локализациясы менен келет.
Flash кэшти окуу/жазуу. Флэш кэш учурда, жазуу кэшинин өлчөмү адегенде максималдуу кэш өлчөмүнө коюлат, ал эми SSD сактагыч деңгээли кэштин көлөмү бүт локализацияланган жумуш жүгүн тейлөө үчүн жетишсиз болгондо гана пайда болот.
SSD жана кэштин өндүрүмдүүлүгүн эсептөөлөр ар бир жолу өндүрүүчүнүн сунуштарынын негизинде жүргүзүлөт, бирок ар дайым эң начар сценарий үчүн.

Source: www.habr.com

Комментарий кошуу