Vipimo vipya vya uhifadhi wa kitu

Vipimo vipya vya uhifadhi wa kituNgome ya Kuruka na Nele-Diel

Amri ya uhifadhi wa kitu cha S3 Hifadhi ya Wingu ya Mail.ru ilitafsiri makala kuhusu vigezo gani ni muhimu wakati wa kuchagua hifadhi ya kitu. Ifuatayo ni maandishi kutoka kwa mtazamo wa mwandishi.

Linapokuja suala la kuhifadhi vitu, kwa kawaida watu hufikiria jambo moja tu: bei kwa kila TB/GB. Bila shaka, kipimo hiki ni muhimu, lakini hufanya mbinu kuwa ya upande mmoja na kusawazisha uhifadhi wa kitu na zana ya kuhifadhi kumbukumbu. Zaidi ya hayo, mbinu hii inapunguza umuhimu wa uhifadhi wa kitu kwa rafu ya teknolojia ya biashara.

Wakati wa kuchagua uhifadhi wa kitu, unapaswa kuzingatia sifa tano:

  • utendaji;
  • scalability;
  • S3 sambamba;
  • majibu ya kushindwa;
  • uadilifu.

Sifa hizi tano ni vipimo vipya vya uhifadhi wa kitu, pamoja na gharama. Hebu tuwaangalie wote.

Uzalishaji

Maduka ya vitu vya jadi hayana utendaji. Watoa huduma mara kwa mara waliitoa dhabihu katika kutafuta bei ya chini. Walakini, na uhifadhi wa kisasa wa vitu ni tofauti.

Mifumo mbalimbali ya uhifadhi inakaribia au hata kuzidi kasi ya Hadoop. Mahitaji ya kisasa ya kasi ya kusoma na kuandika: kutoka 10 GB/s kwa anatoa ngumu, hadi 35 GB/s kwa NVMe. 

Upitishaji huu unatosha kwa Spark, Presto, Tensorflow, Teradata, Vertica, Splunk na mifumo mingine ya kisasa ya kompyuta katika rafu ya uchanganuzi. Ukweli kwamba hifadhidata za MPP zinasanidiwa kwa uhifadhi wa kitu unapendekeza kuwa inazidi kutumiwa kama hifadhi msingi.

Ikiwa mfumo wako wa hifadhi hautoi kasi unayohitaji, huwezi kutumia data na kutoa thamani kutoka kwake. Hata ukirudisha data kutoka kwa hifadhi ya kitu hadi kwenye muundo wa uchakataji wa kumbukumbu, bado utahitaji kipimo data ili kuhamisha data hadi na kutoka kwa kumbukumbu. Maduka ya vitu vya urithi hayana ya kutosha.

Hili ndilo jambo kuu: kipimo kipya cha utendakazi ni matokeo, si muda. Inahitajika kwa data kwa kiwango na ni kawaida katika miundombinu ya kisasa ya data.

Ingawa vigezo ni njia nzuri ya kubainisha utendakazi, haiwezi kupimwa kwa usahihi kabla ya kuendesha programu katika mazingira. Tu baada ya unaweza kusema ni wapi hasa kizuizi ni: katika programu, disks, mtandao au katika ngazi ya kompyuta.

Scalability

Scalability inarejelea idadi ya petabytes zinazotoshea katika nafasi moja ya majina. Kile ambacho wachuuzi wanadai ni scalability rahisi, wasichosema ni kwamba kadri wanavyoongezeka, mifumo mikubwa ya monolithic inakuwa dhaifu, ngumu, isiyo thabiti na ya gharama kubwa.

Kipimo kipya cha upanuzi ni idadi ya nafasi za majina au wateja unaoweza kuwahudumia. Kipimo kinachukuliwa moja kwa moja kutoka kwa viboreshaji, ambapo vizuizi vya ujenzi vya uhifadhi ni vidogo lakini vina ukubwa wa mabilioni ya vitengo. Kwa ujumla, hii ni kipimo cha wingu.

Wakati vizuizi vya ujenzi ni vidogo, ni rahisi kuboresha usalama, udhibiti wa ufikiaji, usimamizi wa sera, udhibiti wa mzunguko wa maisha na masasisho yasiyo ya usumbufu. Na hatimaye kuhakikisha tija. Ukubwa wa jengo la jengo ni kazi ya udhibiti wa eneo la kushindwa, ambayo ni jinsi mifumo yenye ustahimilivu inavyojengwa.

Upangaji mwingi una sifa nyingi. Ingawa mwelekeo unazungumza na jinsi mashirika hutoa ufikiaji wa data na programu, pia inarejelea programu zenyewe na mantiki ya kuzitenga kutoka kwa zingine.

Tabia za mbinu ya kisasa kwa wateja wengi:

  • Kwa muda mfupi, idadi ya wateja inaweza kukua kutoka mia kadhaa hadi milioni kadhaa.
  • Wateja wametengwa kabisa kutoka kwa kila mmoja. Hii inawaruhusu kuendesha matoleo tofauti ya programu sawa na kuhifadhi vitu vilivyo na usanidi tofauti, ruhusa, vipengele, viwango vya usalama na matengenezo. Hii ni muhimu wakati wa kuongeza seva mpya, masasisho na jiografia.
  • Hifadhi ni elastically scalable, rasilimali hutolewa kwa mahitaji.
  • Kila operesheni inadhibitiwa na API na inajiendesha bila uingiliaji wa kibinadamu.
  • Programu inaweza kupangishwa katika vyombo na kutumia mifumo ya kawaida ya uimbaji kama vile Kubernetes.

S3 inalingana

Amazon S3 API ndio kiwango halisi cha uhifadhi wa kitu. Kila muuzaji wa programu ya uhifadhi wa kitu anadai utangamano nayo. Utangamano na S3 ni wa binary: ama inatekelezwa kikamilifu au haijatekelezwa.

Katika mazoezi, kuna mamia au maelfu ya matukio makali ambapo kitu kitaenda vibaya wakati wa kutumia hifadhi ya kitu. Hasa kutoka kwa watoa huduma wa programu na huduma za wamiliki. Kesi zake kuu za utumiaji ni kumbukumbu moja kwa moja au chelezo, kwa hivyo kuna sababu chache za kupiga API, kesi za utumiaji ni sawa.

Programu huria ina faida kubwa. Inashughulikia hali nyingi zaidi, ikizingatiwa saizi na anuwai ya programu, mifumo ya uendeshaji, na usanifu wa maunzi.

Yote hii ni muhimu kwa watengenezaji wa programu, kwa hivyo inafaa kujaribu programu na watoa huduma wa uhifadhi. Chanzo huria hurahisisha mchakatoβ€”ni rahisi kuelewa ni jukwaa lipi linafaa kwa programu yako. Mtoa huduma anaweza kutumika kama sehemu moja ya kuingia kwenye hifadhi, kumaanisha kuwa itakidhi mahitaji yako. 

Chanzo huria kinamaanisha: programu hazifungamani na muuzaji na ziko wazi zaidi. Hii inahakikisha maisha marefu ya maombi.

Na vidokezo vichache zaidi kuhusu chanzo wazi na S3. 

Ikiwa unatumia programu kubwa ya data, S3 SELECT huboresha utendaji na ufanisi kwa mpangilio wa ukubwa. Inafanya hivyo kwa kutumia SQL kupata tu vitu unavyohitaji kutoka kwa uhifadhi.

Jambo kuu ni msaada kwa arifa za ndoo. Arifa za ndoo huwezesha kompyuta isiyo na seva, sehemu muhimu ya usanifu wowote wa huduma ndogo ambayo hutolewa kama huduma. Ikizingatiwa kuwa uhifadhi wa kitu ni uhifadhi wa wingu, uwezo huu unakuwa muhimu wakati uhifadhi wa kitu unatumiwa na programu zinazotegemea wingu.

Hatimaye, utekelezaji wa S3 lazima usaidie API za usimbaji fiche za upande wa seva ya Amazon S3: SSE-C, SSE-S3, SSE-KMS. Hata bora zaidi, S3 inasaidia ulinzi wa tamper ambao ni salama kweli. 

Majibu ya kushindwa

Kipimo ambacho pengine mara nyingi hupuuzwa ni jinsi mfumo unavyoshughulikia kushindwa. Kushindwa hutokea kwa sababu mbalimbali, na uhifadhi wa kitu lazima ushughulikie zote.

Kwa mfano, kuna hatua moja ya kushindwa, metric ya hii ni sifuri.

Kwa bahati mbaya, mifumo mingi ya kuhifadhi vitu hutumia nodi maalum ambazo lazima ziwezeshwe ili nguzo ifanye kazi vizuri. Hizi ni pamoja na nodi za majina au seva za metadata - hii inaleta nukta moja ya kutofaulu.

Hata pale ambapo kuna pointi nyingi za kushindwa, uwezo wa kuhimili kushindwa kwa janga ni muhimu. Disks kushindwa, seva kushindwa. Jambo kuu ni kuunda programu iliyoundwa kushughulikia kutofaulu kama hali ya kawaida. Ikiwa diski au node inashindwa, programu hiyo itaendelea kufanya kazi bila mabadiliko.

Ulinzi uliojengewa ndani dhidi ya ufutaji wa data na uharibifu wa data huhakikisha kwamba unaweza kupoteza diski au nodi nyingi kadri unavyokuwa na vizuizi vya usawaβ€”kawaida nusu ya diski. Hapo ndipo programu haitaweza kurejesha data.

Kushindwa hujaribiwa mara chache chini ya mzigo, lakini upimaji kama huo unahitajika. Kuiga kushindwa kwa mzigo kutaonyesha jumla ya gharama zilizotumika baada ya kushindwa.

Uthabiti

Alama ya uthabiti ya 100% pia inaitwa uthabiti mkali. Uthabiti ni sehemu muhimu ya mfumo wowote wa kuhifadhi, lakini uthabiti thabiti ni nadra. Kwa mfano, Amazon S3 ListObject haiendani kabisa, ni thabiti tu mwishoni.

Nini maana ya uthabiti mkali? Kwa shughuli zote zinazofuata operesheni ya PUT iliyothibitishwa, yafuatayo lazima yatokee:

  • Thamani iliyosasishwa inaonekana wakati wa kusoma kutoka kwa nodi yoyote.
  • Sasisho linalindwa dhidi ya kutofaulu kwa nodi.

Hii ina maana kwamba ikiwa unavuta kuziba katikati ya kurekodi, hakuna kitu kitakachopotea. Mfumo haurudishi data iliyoharibika au iliyopitwa na wakati. Huu ni upau wa juu ambao ni muhimu katika hali nyingi, kutoka kwa programu za malipo hadi nakala rudufu na urejeshaji.

Hitimisho

Hivi ni vipimo vipya vya uhifadhi wa vitu vinavyoakisi mifumo ya utumiaji katika mashirika ya leo, ambapo utendaji, uthabiti, ukubwa, vikoa vyenye hitilafu na uoanifu wa S3 ndio vizuizi vya programu za wingu na uchanganuzi mkubwa wa data. Ninapendekeza kutumia orodha hii pamoja na bei wakati wa kujenga hifadhi za kisasa za data. 

Kuhusu uhifadhi wa kitu cha Mail.ru Cloud Solutions: Usanifu wa S3. Miaka 3 ya mageuzi ya Hifadhi ya Wingu ya Mail.ru.

Nini kingine cha kusoma:

  1. Mfano wa programu inayoendeshwa na tukio kulingana na viboreshaji vya wavuti katika hifadhi ya kitu cha S3 Mail.ru Cloud Solutions.
  2. Zaidi ya Ceph: Hifadhi ya kuzuia wingu ya MCS 
  3. Kufanya kazi na Mail.ru Cloud Solutions S3 kuhifadhi kitu kama mfumo wa faili.
  4. Kituo chetu cha Telegraph kilicho na habari kuhusu masasisho ya hifadhi ya S3 na bidhaa zingine

Chanzo: mapenzi.com

Kuongeza maoni