Hleðslujöfnun í Openstack (2. hluti)

В síðasta greinin við ræddum tilraunir okkar til að nota Watcher og lögðum fram prófunarskýrslu. Við gerum reglulega slíkar prófanir fyrir jafnvægi og aðrar mikilvægar aðgerðir stórfyrirtækis eða rekstrarskýja.

Hið flókna vandamál sem verið er að leysa gæti þurft nokkrar greinar til að lýsa verkefninu okkar. Í dag erum við að birta aðra greinina í röðinni, tileinkað jafnvægi á sýndarvélum í skýinu.

Einhver hugtök

VmWare fyrirtækið kynnti DRS (Distributed Resource Scheduler) tólið til að jafna álagið á sýndarvæðingarumhverfið sem þau þróuðu og buðu upp á.

Samkvæmt searchvmware.techtarget.com/definition/VMware-DRS
„VMware DRS (Distributed Resource Scheduler) er tól sem jafnar tölvuálag við tiltæk auðlindir í sýndarumhverfi. Tækið er hluti af sýndarvæðingarsvítu sem kallast VMware Infrastructure.

Með VMware DRS skilgreina notendur reglur um að dreifa efnislegum auðlindum á milli sýndarvéla (VM). Hægt er að stilla tólið fyrir handvirka eða sjálfvirka stjórn. Auðvelt er að bæta við, fjarlægja eða endurskipuleggja VMware tilföng. Ef þess er óskað er hægt að einangra auðlindahópa á milli mismunandi rekstrareininga. Ef vinnuálagið á einni eða fleiri sýndarvélum breytist verulega, endurdreifir VMware DRS sýndarvélunum yfir líkamlega netþjóna. Ef heildarvinnuálagið minnkar, gætu sumir líkamlegir netþjónar verið teknir tímabundið án nettengingar og vinnuálagið sameinað."

Hvers vegna þarf jafnvægi?


Að okkar mati er DRS skýjaeiginleiki sem þarf að hafa, þó það þýði ekki að DRS verði að nota alltaf og alls staðar. Það fer eftir tilgangi og þörfum skýsins, það geta verið mismunandi kröfur um DRS og jafnvægisaðferðir. Það geta komið upp aðstæður þar sem jafnvægi er alls ekki þörf. Eða jafnvel skaðlegt.

Til að skilja betur hvar og fyrir hvaða viðskiptavini DRS er þörf, skulum við íhuga markmið þeirra og markmið. Skýjum má skipta í opinbert og einkarekið. Hér er aðalmunurinn á þessum skýjum og markmiðum viðskiptavina.

Einkaský / Stórir fyrirtækjaviðskiptavinir
Opinber ský / Meðalstór og lítil fyrirtæki, fólk

Meginviðmið og markmið rekstraraðila
Að veita áreiðanlega þjónustu eða vöru
Að draga úr kostnaði við þjónustu í baráttunni á samkeppnismarkaði

Þjónustukröfur
Áreiðanleiki á öllum stigum og í öllum kerfisþáttum

Ábyrgð á afköstum

Forgangsraðaðu sýndarvélum í nokkra flokka 

Upplýsinga- og líkamlegt gagnaöryggi

SLA og XNUMX/XNUMX stuðningur
Hámarks vellíðan við að fá þjónustuna

Tiltölulega einföld þjónusta

Ábyrgð á gögnunum er hjá viðskiptavininum

Engin forgangsröðun VM krafist

Upplýsingaöryggi á stigi staðlaðrar þjónustu, ábyrgð á viðskiptavini

Það geta verið gallar

Engin SLA, gæði ekki tryggð

Stuðningur með tölvupósti

Afritun er ekki nauðsynleg

Eiginleikar viðskiptavinar
Mjög fjölbreytt úrval af forritum.

Eldri umsóknir í arf í fyrirtækinu.

Flókin sérsniðin arkitektúr fyrir hvern viðskiptavin.

Reglur um skyldleika.

Hugbúnaðurinn virkar án þess að stoppa í 7x24 ham. 

Verkfæri til öryggisafritunar á flugi.

Fyrirsjáanlegt hringlaga álag viðskiptavina.
Dæmigert forrit - netjafnvægi, Apache, WEB, VPN, SQL

Umsóknin gæti stöðvast um stund

Leyfir handahófskennda dreifingu VM í skýinu

Viðskiptavinur öryggisafrit

Fyrirsjáanlegt tölfræðilegt meðaltal álags með miklum fjölda viðskiptavina.

Afleiðingar fyrir arkitektúr
Jarðþyrping

Miðstýrð eða dreifð geymsla

Frátekin IBS
Staðbundin gagnageymsla á tölvuhnútum

Jafnvægismarkmið
Jöfn álagsdreifing

Hámarksviðbrögð við umsókn 

Lágmarks seinkun fyrir jafnvægi

Jafnvægi aðeins þegar brýna nauðsyn ber til

Að koma með einhvern búnað til fyrirbyggjandi viðhalds
Lækka þjónustukostnað og rekstrarkostnað 

Slökkt á sumum tilföngum ef álag er lítið

Að spara orku

Að draga úr starfsmannakostnaði

Við drögum eftirfarandi ályktanir fyrir okkur sjálf:

Fyrir einkaskýveitt stórum fyrirtækjaviðskiptavinum er hægt að nota DRS með eftirfarandi takmörkunum:

  • upplýsingaöryggi og að teknu tilliti til skyldleikareglna við jafnvægi;
  • tiltækt nægilegt fjármagn í varasjóði ef slys ber að höndum;
  • sýndarvélagögn eru staðsett á miðlægu eða dreifðu geymslukerfi;
  • tímaaðskilnaður stjórnunar-, öryggisafritunar- og jöfnunarferla;
  • jafnvægi aðeins innan samansafns gestgjafa viðskiptavina;
  • jafnvægi aðeins þegar það er mikið ójafnvægi, áhrifaríkustu og öruggustu VM flutningarnir (eftir allt, flutningur getur mistekist);
  • jafnvægi tiltölulega „hljóðlátra“ sýndarvéla (flutningur „hávaðasamra“ sýndarvéla getur tekið mjög langan tíma);
  • jafnvægi að teknu tilliti til „kostnaðar“ - álag á geymslukerfi og netkerfi (með sérsniðnum arkitektúr fyrir stóra viðskiptavini);
  • jafnvægi að teknu tilliti til einstakra hegðunareiginleika hvers VM;
  • Jafnvægi fer helst fram á óvinnutíma (nætur, helgar, frí).

Fyrir almenningsskýveita litlum viðskiptavinum þjónustu, DRS er hægt að nota mun oftar, með háþróaðri getu:

  • skortur á upplýsingaöryggistakmörkunum og skyldleikareglum;
  • jafnvægi innan skýsins;
  • jafnvægi á hverjum hæfilegum tíma;
  • jafnvægi á hvaða VM sem er;
  • jafnvægi „hávær“ sýndarvélar (til að trufla ekki aðra);
  • sýndarvélagögn eru oft staðsett á staðbundnum diskum;
  • að teknu tilliti til meðalafkasta geymslukerfa og netkerfa (skýjaarkitektúrinn er sameinaður);
  • jafnvægi samkvæmt almennum reglum og fyrirliggjandi tölfræði um hegðun gagnavera.

Flækjustig vandans

Erfiðleikar við jafnvægi er að DRS verður að vinna með fjölda óvissuþátta:

  • hegðun notenda hvers upplýsingakerfa viðskiptavina;
  • reiknirit fyrir rekstur upplýsingakerfaþjóna;
  • hegðun DBMS netþjóna;
  • álag á tölvuauðlindir, geymslukerfi, netkerfi;
  • samskipti netþjóna sín á milli í baráttunni um skýjaauðlindir.

Álag á fjölda sýndarforritaþjóna og gagnagrunna á skýjaauðlindir á sér stað með tímanum, afleiðingarnar geta gert vart við sig og skarast hver aðra með ófyrirsjáanlegum áhrifum yfir ófyrirsjáanlegan tíma. Jafnvel til að stjórna tiltölulega einföldum ferlum (til dæmis til að stjórna vél, vatnshitakerfi heima), þurfa sjálfvirk stjórnkerfi að nota flókið hlutfalls-heildar-aðgreining reiknirit með endurgjöf.

Hleðslujöfnun í Openstack (2. hluti)

Verkefni okkar er mörgum stærðargráðum flóknara og hætt er við að kerfið nái ekki að jafna álagi við sett gildi á hæfilegum tíma, jafnvel þótt engin utanaðkomandi áhrif komi frá notendum.

Hleðslujöfnun í Openstack (2. hluti)

Saga þróunar okkar

Til að leysa þetta vandamál ákváðum við að byrja ekki frá grunni, heldur byggja á fyrirliggjandi reynslu og hófum samskipti við sérfræðinga með reynslu á þessu sviði. Sem betur fer fór skilningur okkar á vandamálinu algjörlega saman.

Stig 1

Við notuðum kerfi sem byggt var á tauganettækni og reyndum að hagræða auðlindum okkar út frá því.

Áhuginn á þessu stigi var að prófa nýja tækni og mikilvægi hennar var að beita óstöðluðum aðferðum til að leysa vandamál þar sem staðlaðar nálganir voru nánast tæmandi, að öðru óbreyttu.

Við settum kerfið í gang og við byrjuðum virkilega á jafnvægi. Umfang skýsins okkar leyfði okkur ekki að fá þær bjartsýnu niðurstöður sem hönnuðirnir sögðu, en það var ljóst að jafnvægið virkaði.

Á sama tíma höfðum við töluvert alvarlegar takmarkanir:

  • Til að þjálfa taugakerfi þurfa sýndarvélar að keyra án teljandi breytinga í margar vikur eða mánuði.
  • Reikniritið er hannað til hagræðingar byggt á greiningu á fyrri „sögulegum“ gögnum.
  • Þjálfun taugakerfis krefst nokkuð mikið magn af gögnum og tölvuauðlindum.
  • Hagræðingu og jafnvægi er hægt að gera tiltölulega sjaldan - einu sinni á nokkurra klukkustunda fresti, sem er greinilega ekki nóg.

Stig 2

Þar sem við vorum ekki sátt við stöðu mála ákváðum við að breyta kerfinu og til að gera þetta, svaraðu aðalspurning - fyrir hvern erum við að búa það til?

Fyrst - fyrir viðskiptavini. Þetta þýðir að við þurfum kerfi sem virkar hratt, með þeim fyrirtækjahömlum sem aðeins einfalda framkvæmdina.

Önnur spurning - hvað meinarðu með orðinu "strax"? Í kjölfar stuttrar umræðu ákváðum við að við gætum byrjað með viðbragðstíma upp á 5–10 mínútur, þannig að skammtímabylgjur myndu ekki koma kerfinu í ómun.

Þriðja spurning – hvaða stærð af jafnvægisfjölda netþjóna á að velja?
Þetta mál leystist af sjálfu sér. Venjulega gera viðskiptavinir ekki samsöfnun netþjóna mjög stór og það er í samræmi við ráðleggingar greinarinnar um að takmarka samsöfnun við 30-40 netþjóna.

Að auki, með því að skipta upp netþjónahópnum, einföldum við verkefni jafnvægisreikniritsins.

Fjórða spurning – hversu heppilegt er tauganet fyrir okkur með sínu langa námsferli og sjaldgæfu jafnvægi? Við ákváðum að hætta við það í þágu einfaldari rekstraralgríms til að fá niðurstöður á nokkrum sekúndum.

Hleðslujöfnun í Openstack (2. hluti)

Hægt er að finna lýsingu á kerfi sem notar slík reiknirit og ókosti þess hér

Við innleiddum og settum þetta kerfi í notkun og fengum uppörvandi niðurstöður - nú greinir það reglulega skýjaálagið og gerir ráðleggingar um að færa sýndarvélar, sem eru að mestu leyti réttar. Jafnvel núna er ljóst að við getum náð 10-15% losun auðlinda fyrir nýjar sýndarvélar á sama tíma og við getum bætt gæði vinnu þeirra sem fyrir eru.

Hleðslujöfnun í Openstack (2. hluti)

Þegar ójafnvægi í vinnsluminni eða örgjörva greinist gefur kerfið út skipanir til Tionix tímaáætlunarbúnaðarins um að framkvæma lifandi flutning á nauðsynlegum sýndarvélum. Eins og sést á vöktunarkerfinu flutti sýndarvélin sig frá einum (efri) til annars (neðri) hýsil og losaði um minni á efri hýsilnum (auðkenndur í gulum hringjum), í sömu röð og tók það á þann neðri (auðkenndur með hvítu hringi).

Nú erum við að reyna að meta skilvirkni núverandi reiknirit með nákvæmari hætti og erum að reyna að finna hugsanlegar villur í því.

Stig 3

Svo virðist sem maður geti róað sig yfir þessu, beðið eftir sannaðan árangur og lokað umræðuefninu.
En okkur er ýtt til að framkvæma nýjan áfanga með eftirfarandi augljósu hagræðingartækifærum

  1. Tölfræði, td. hér и hér sýnir að tveggja og fjögurra örgjörva kerfi eru verulega lægri í afköstum en eins örgjörva kerfi. Þetta þýðir að allir notendur fá umtalsvert minna framleiðsla frá örgjörva, vinnsluminni, SSD, staðarneti, FC keypt í fjölgjörvakerfum samanborið við einn örgjörva.
  2. Tilfangaáætlunarmennirnir sjálfir geta haft alvarlegar villur, hér er ein af greinunum um þetta efni.
  3. Tækni sem Intel og AMD bjóða upp á til að fylgjast með vinnsluminni og skyndiminni gerir það mögulegt að rannsaka hegðun sýndarvéla og koma þeim fyrir á þann hátt að „hávær“ nágrannar trufli ekki „hljóðlátar“ sýndarvélar.
  4. Stækkun færibreytna (net, geymslukerfi, forgang sýndarvélarinnar, kostnaður við flutning, tilbúinn til flutnings).

Alls

Niðurstaða vinnu okkar við að bæta jafnvægisreiknirit var sú skýra niðurstaða að með nútíma reikniritum er hægt að ná umtalsverðri hagræðingu á gagnaverum (25-30%) og um leið bæta gæði þjónustu við viðskiptavini.

Reiknirit sem byggir á tauganetum er vissulega áhugaverð lausn, en sem þarfnast frekari þróunar og vegna takmarkana sem fyrir eru hentar það ekki til að leysa vandamál af þessu tagi á rúmmáli sem er dæmigert fyrir einkaský. Á sama tíma sýndi reikniritið góðan árangur í opinberum skýjum af verulegri stærð.

Við munum segja þér meira um getu örgjörva, tímasetningar og jafnvægis á háu stigi í eftirfarandi greinum.

Heimild: www.habr.com

Bæta við athugasemd