Uudet objektin tallennustiedot

Uudet objektin tallennustiedotNele-Dielin lentävä linnoitus

S3 objektin tallennuskomento Mail.ru pilvitallennus käänsi artikkelin siitä, mitkä kriteerit ovat tärkeitä objektivaraston valinnassa. Seuraava on teksti kirjoittajan näkökulmasta.

Kun kyse on esineen tallennustilasta, ihmiset ajattelevat yleensä vain yhtä asiaa: hinta per TB/GB. Tietenkin tämä mittari on tärkeä, mutta se tekee lähestymistavasta yksipuoliseksi ja rinnastaa objektien tallennuksen arkiston tallennustyökaluun. Lisäksi tämä lähestymistapa vähentää objektin tallennuksen merkitystä yrityksen teknologiapinolle.

Kun valitset esineen varastointia, sinun tulee kiinnittää huomiota viiteen ominaisuuteen:

  • suorituskyky;
  • skaalautuvuus;
  • S3-yhteensopiva;
  • vastaus epäonnistumisiin;
  • eheys.

Nämä viisi ominaisuutta ovat uusia mittareita objektien varastoinnissa kustannusten ohella. Katsotaanpa niitä kaikkia.

Suorituskyky

Perinteisistä esinekaupoista puuttuu suorituskyky. Palveluntarjoajat uhrasivat sitä jatkuvasti alhaisten hintojen vuoksi. Nykyaikaisen esinevaraston kanssa asiat ovat kuitenkin toisin.

Erilaiset tallennusjärjestelmät lähestyvät tai jopa ylittävät Hadoopin nopeuden. Nykyaikaiset vaatimukset luku- ja kirjoitusnopeuksille: 10 Gt/s kiintolevyille, 35 Gt/s NVMe:lle. 

Tämä läpimenokyky riittää Sparkille, Prestolle, Tensorflowlle, Teradatalle, Verticalle, Splunkille ja muille nykyaikaisille analytiikkapinon laskentakehyksille. Se tosiasia, että MPP-tietokantoja konfiguroidaan objektien tallennusta varten, viittaa siihen, että sitä käytetään yhä enemmän ensisijaisena tallennusvälineenä.

Jos tallennusjärjestelmäsi ei tarjoa tarvitsemaasi nopeutta, et voi käyttää tietoja ja poimia niistä arvoa. Vaikka noutaisit tietoja objektivarastosta muistissa olevaan käsittelyrakenteeseen, tarvitset silti kaistanleveyttä tietojen siirtämiseen muistiin ja muistista. Vanhoissa esinekaupoissa sitä ei ole tarpeeksi.

Tämä on keskeinen kohta: uusi suorituskykymittari on suorituskyky, ei latenssi. Sitä tarvitaan mittakaavassa olevaan dataan ja se on normi nykyaikaisessa tietoinfrastruktuurissa.

Vaikka vertailuarvot ovat hyvä tapa määrittää suorituskykyä, sitä ei voida mitata tarkasti ennen sovelluksen suorittamista ympäristössä. Vasta sen jälkeen voit sanoa, missä pullonkaula tarkalleen on: ohjelmistossa, levyissä, verkossa vai laskentatasolla.

Skaalautuvuus

Skaalautuvuus viittaa yhteen nimiavaruuteen mahtuvien petatavujen määrään. Toimittajat väittävät olevan helppo skaalautuvuus, mutta he eivät väitä, että massiivisista monoliittisista järjestelmistä tulee skaalautuessaan hauraita, monimutkaisia, epävakaita ja kalliita.

Uusi skaalautuvuuden mittari on palveltavien nimitilojen tai asiakkaiden määrä. Mittari on otettu suoraan hyperskaalaajista, joissa varastointielementit ovat pieniä, mutta skaalautuvat miljardeihin yksiköihin. Yleensä tämä on pilvimittari.

Kun rakennuspalikat ovat pieniä, ne on helpompi optimoida turvallisuutta, kulunvalvontaa, käytäntöjen hallintaa, elinkaarihallintaa ja häiritsemättömiä päivityksiä varten. Ja viime kädessä varmistaa tuottavuus. Rakennuspalikan koko on funktio vika-alueen hallittavuudesta, mikä tarkoittaa, kuinka erittäin joustavia järjestelmiä rakennetaan.

Monivuokrasopimuksella on monia ominaisuuksia. Vaikka ulottuvuus puhuu siitä, kuinka organisaatiot tarjoavat pääsyn tietoihin ja sovelluksiin, se viittaa myös itse sovelluksiin ja logiikkaan niiden eristämisessä toisistaan.

Nykyaikaisen lähestymistavan moniasiakkaaseen ominaisuudet:

  • Lyhyessä ajassa asiakasmäärä voi kasvaa useista sadasta useisiin miljooniin.
  • Asiakkaat ovat täysin eristettyjä toisistaan. Tämän ansiosta he voivat käyttää eri versioita samasta ohjelmistosta ja tallentaa objekteja eri kokoonpanoilla, käyttöoikeuksilla, ominaisuuksilla, suojaus- ja ylläpitotasoilla. Tämä on tarpeen skaalattaessa uusia palvelimia, päivityksiä ja maantieteellisiä alueita.
  • Varasto on joustavasti skaalautuva, resursseja tarjotaan tarpeen mukaan.
  • Jokaista toimintoa ohjaa API, ja se on automatisoitu ilman ihmisen puuttumista.
  • Ohjelmisto voidaan isännöidä konteissa ja käyttää tavallisia orkestrointijärjestelmiä, kuten Kubernetes.

S3 yhteensopiva

Amazon S3 API on de facto standardi objektien tallentamiseen. Jokainen objektitallennusohjelmiston toimittaja väittää olevansa yhteensopiva sen kanssa. Yhteensopivuus S3:n kanssa on binääristä: joko se on täysin toteutettu tai ei.

Käytännössä on satoja tai tuhansia reunaskenaarioita, joissa jokin menee pieleen objektitallennusta käytettäessä. Erityisesti ohjelmistojen ja palvelujen tarjoajilta. Sen pääasialliset käyttötapaukset ovat suora arkistointi tai varmuuskopiointi, joten on vähän syitä kutsua API, käyttötapaukset ovat homogeenisia.

Avoimen lähdekoodin ohjelmistoilla on merkittäviä etuja. Se kattaa useimmat reunaskenaariot, kun otetaan huomioon sovellusten, käyttöjärjestelmien ja laitteistoarkkitehtuurien koko ja valikoima.

Kaikki tämä on tärkeää sovellusten kehittäjille, joten sovellusta kannattaa testata tallennuspalveluntarjoajien kanssa. Avoin lähdekoodi helpottaa prosessia – on helpompi ymmärtää, mikä alusta sopii sovelluksellesi. Palveluntarjoajaa voidaan käyttää yhtenä pisteenä varastoon, mikä tarkoittaa, että se vastaa tarpeisiisi. 

Avoin lähdekoodi tarkoittaa: sovelluksia ei ole sidottu toimittajaan ja ne ovat läpinäkyvämpiä. Tämä takaa pitkän käyttöiän.

Ja vielä muutama huomautus avoimesta lähdekoodista ja S3:sta. 

Jos käytät big data -sovellusta, S3 SELECT parantaa suorituskykyä ja tehokkuutta suuruusluokkaa. Se tekee tämän käyttämällä SQL:ää hakemaan vain tarvitsemasi objektit tallennustilasta.

Keskeinen asia on tukiryhmä-ilmoitusten tuki. Säilön ilmoitukset helpottavat palvelimetonta tietojenkäsittelyä, joka on tärkeä osa minkä tahansa palveluna toimitettavan mikropalveluarkkitehtuurin. Koska objektin tallennus on käytännössä pilvitallennusta, tästä ominaisuudesta tulee kriittinen, kun pilvipohjaiset sovellukset käyttävät objektien tallennustilaa.

Lopuksi S3-toteutuksen on tuettava Amazon S3 -palvelinpuolen salaussovellusliittymiä: SSE-C, SSE-S3, SSE-KMS. Vielä parempi, S3 tukee peukalointisuojaa, joka on todella turvallinen. 

Vastaus epäonnistumiseen

Mittari, joka todennäköisesti jää usein huomiotta, on se, kuinka järjestelmä käsittelee vikoja. Vikoja tapahtuu useista syistä, ja objektin tallennuksen on käsiteltävä ne kaikki.

Esimerkiksi epäonnistumispiste on yksi, jonka mittari on nolla.

Valitettavasti monet objektin tallennusjärjestelmät käyttävät erityisiä solmuja, jotka on otettava käyttöön, jotta klusteri toimisi kunnolla. Näitä ovat nimisolmut tai metatietopalvelimet – tämä luo yhden virhepisteen.

Vaikka epäonnistumispisteitä olisi useita, kyky kestää katastrofaaliset epäonnistumiset on ensiarvoisen tärkeää. Levyt epäonnistuvat, palvelimet epäonnistuvat. Tärkeintä on luoda ohjelmisto, joka on suunniteltu käsittelemään vika normaalitilanteena. Jos levy tai solmu epäonnistuu, tällainen ohjelmisto jatkaa toimintaansa ilman muutoksia.

Sisäänrakennettu suojaus tietojen poistamista ja heikkenemistä vastaan ​​varmistaa, että voit menettää niin monta levyä tai solmua kuin sinulla on pariteettilohkoja – yleensä puolet levyistä. Vain silloin ohjelmisto ei voi palauttaa tietoja.

Vika testataan harvoin kuormituksella, mutta tällainen testaus on pakollinen. Kuormahäiriön simulointi näyttää vian jälkeen aiheutuneet kokonaiskustannukset.

Johdonmukaisuus

100 %:n johdonmukaisuusarvoa kutsutaan myös tiukaksi johdonmukaisuudeksi. Johdonmukaisuus on minkä tahansa tallennusjärjestelmän avaintekijä, mutta vahva yhtenäisyys on harvinaista. Esimerkiksi Amazon S3 ListObject ei ole tiukasti johdonmukainen, se on johdonmukainen vain lopussa.

Mitä tiukka johdonmukaisuus tarkoittaa? Kaikissa vahvistetun PUT-toiminnon jälkeisissä toimissa on tapahduttava seuraava:

  • Päivitetty arvo näkyy luettaessa mistä tahansa solmusta.
  • Päivitys on suojattu solmuvirheiden redundanssilta.

Tämä tarkoittaa, että jos vedät pistokkeen kesken tallennuksen, mitään ei menetä. Järjestelmä ei koskaan palauta vioittuneita tai vanhentuneita tietoja. Tämä on korkea rima, jolla on merkitystä monissa skenaarioissa, tapahtumasovelluksista varmuuskopiointiin ja palautukseen.

Johtopäätös

Nämä ovat uusia objektitallennusmittareita, jotka heijastelevat nykypäivän organisaatioiden käyttötapoja, joissa suorituskyky, johdonmukaisuus, skaalautuvuus, vikaalueet ja S3-yhteensopivuus ovat pilvisovellusten ja big data -analytiikan rakennuspalikoita. Suosittelen käyttämään tätä listaa hinnan lisäksi kun rakennat nykyaikaisia ​​tietopinoja. 

Tietoja Mail.ru Cloud Solutions -objektien tallennustilasta: S3 arkkitehtuuri. 3 vuotta Mail.ru Cloud Storagen kehitystä.

Mitä muuta luettavaa:

  1. Esimerkki tapahtumapohjaisesta sovelluksesta, joka perustuu webhookeihin S3-objektitallennustilassa Mail.ru Cloud Solutions.
  2. Enemmän kuin Ceph: MCS-pilvilohkotallennus 
  3. Työskentely Mail.ru Cloud Solutions S3 -objektien tallennuksen kanssa tiedostojärjestelmänä.
  4. Telegram-kanavamme, joka sisältää uutisia S3-tallennustilapäivityksistä ja muista tuotteista

Lähde: will.com

Lisää kommentti