„TileDB 2.0“ saugojimo variklio išleidimas

Опубликовано saugykla TileDB 2.0, optimizuotas saugoti daugiamates matricas ir duomenis, naudojamus moksliniuose skaičiavimuose. Kaip TileDB taikymo sritys minimos įvairios genetinės informacijos, erdvinių ir finansinių duomenų apdorojimo sistemos, t.y. Operacinės sistemos retas arba nuolat pildomos daugiamatės matricos. „TileDB“ siūlo C++ biblioteką, leidžiančią skaidriai abstrahuoti prieigą prie duomenų ir metaduomenų programose, pasirūpinant visu žemo lygio darbu, kad būtų galima efektyviai saugoti. Projekto kodas parašytas C++ ir išplatino pagal MIT licenciją. Palaiko darbą „Linux“, „MacOS“ ir „Windows“.

Pagrindinės „TileDB“ savybės:

  • Veiksmingi retųjų masyvų saugojimo metodai, kurių duomenys nėra ištisiniai; masyvas užpildytas fragmentais ir dauguma elementų lieka tušti arba įgauna tą pačią reikšmę.
  • Galimybė pasiekti duomenis rakto vertės formatu arba stulpelių rinkiniais (DataFrame);

    „TileDB 2.0“ saugojimo variklio išleidimas

  • Palaiko integraciją su debesies saugykla AWS S3, Google Cloud Storage ir Azure Blob Storage;
  • Plytelių (blokų) masyvų palaikymas;
  • Gebėjimas naudoti skirtingus duomenų glaudinimo ir šifravimo algoritmus;
  • Palaikymas vientisumo tikrinimui naudojant kontrolines sumas;
  • Darbas kelių sriegių režimu su lygiagrečiu įėjimu/išėjimu;
  • Saugomų duomenų versijų kūrimo palaikymas, įskaitant būsenos gavimą tam tikru praeities tašku arba visų didelių rinkinių atnaujinimus.
  • Galimybė susieti metaduomenis;
  • Duomenų grupavimo palaikymas;
  • Integravimo moduliai, skirti naudoti kaip žemo lygio saugojimo variklis Spark, Dask, MariaDB, GDAL, PDAL, Rasterio, gVCF ir PrestoDB;
  • Įrišamos bibliotekos, skirtos C++ API, skirtos Python, R, Java ir Go.

2.0 leidimas išsiskiria tuo, kad palaiko „DataFrame“ koncepciją, leidžiančią saugoti duomenis savavališko ilgio verčių stulpelių pavidalu, susietų su tam tikrais atributais. Saugykla taip pat optimizuota retiems, nevienalyčių dydžių masyvams apdoroti (ląstelėse galima saugoti įvairių tipų duomenis ir atlikti sujungimo operacijas su skirtingų tipų stulpeliais, pvz., saugojančiais pavadinimą, laiką ir kainą). Pridėtas stulpelių su eilutės duomenimis palaikymas. Pridėta modulių, skirtų integracijai su „Google Cloud Storage“ ir „Azure Blob Storage“. R kalbos API buvo perkurta.

Šaltinis: opennet.ru

Добавить комментарий