Gefa út TileDB 2.0 geymsluvél

Опубликовано geymsla TileDB 2.0, fínstillt til að geyma fjölvíddar fylki og gögn sem notuð eru í vísindalegum útreikningum. Ýmis kerfi til að vinna úr erfðaupplýsingum, landupplýsingum og fjárhagslegum gögnum eru nefnd sem notkunarsvið TileDB, þ.e. stýrikerfi dreifður eða stöðugt fylltar fjölvíddar fylki. TileDB býður upp á C++ bókasafn til að draga úr aðgangi að gögnum og lýsigögnum á gagnsæjan hátt í forritum, og sjá um alla vinnu á lágu stigi fyrir skilvirka geymslu. Verkefnakóði er skrifaður í C++ og dreift af undir MIT leyfi. Styður vinnu á Linux, macOS og Windows.

Helstu eiginleikar TileDB:

  • Skilvirkar aðferðir til að geyma dreifðar fylki þar sem gögnin eru ekki samfelld; fylkið er fyllt með brotum og flestir þættirnir eru tómir eða hafa sama gildi.
  • Geta til að fá aðgang að gögnum á lykilgildasniði eða dálkasettum (DataFrame);

    Gefa út TileDB 2.0 geymsluvél

  • Styður samþættingu við skýgeymslu AWS S3, Google Cloud Storage og Azure Blob Storage;
  • Stuðningur við flísalögð (blokk) fylki;
  • Geta til að nota mismunandi gagnaþjöppun og dulkóðunaralgrím;
  • Stuðningur við heiðarleikaathugun með því að nota eftirlitstölur;
  • Vinna í fjölþráðum ham með samhliða inntak/úttak;
  • Stuðningur við útgáfu geymdra gagna, þar á meðal til að sækja ástand á ákveðnum tímapunkti í fortíðinni eða frumeindauppfærslur á heilum stórum settum.
  • Geta til að tengja lýsigögn;
  • Stuðningur við flokkun gagna;
  • Samþættingareiningar til notkunar sem geymsluvél á lágu stigi í Spark, Dask, MariaDB, GDAL, PDAL, Rasterio, gVCF og PrestoDB;
  • Bindandi bókasöfn fyrir C++ API fyrir Python, R, Java og Go.

Útgáfa 2.0 er áberandi fyrir stuðning sinn við „DataFrame“ hugtakið, sem gerir kleift að geyma gögn í formi dálka með gildum af handahófskenndri lengd, bundin við ákveðna eiginleika. Geymslan er einnig fínstillt til að vinna úr dreifðum fylkjum af ólíkum stærðum (frumur geta geymt gögn af mismunandi gerðum og geta framkvæmt samrunaaðgerðir á dálkum af mismunandi gerðum, til dæmis þá sem geyma nafn, tíma og verð). Bætt við stuðningi við dálka með strengjagögnum. Bætt við einingum fyrir samþættingu við Google Cloud Storage og Azure Blob Storage. API fyrir R tungumálið hefur verið endurhannað.

Heimild: opennet.ru

Bæta við athugasemd