Kutolewa kwa injini ya uhifadhi ya TileDB 2.0

ΠžΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½ΠΎ hifadhi TileDB 2.0, iliyoboreshwa kwa ajili ya kuhifadhi safu nyingi na data inayotumika katika hesabu za kisayansi. Mifumo mbalimbali ya kuchakata taarifa za kijenetiki, data ya anga na fedha imetajwa kuwa maeneo ya utumaji maombi ya TileDB, i.e. mifumo ya uendeshaji wachache au mfululizo wa kujazwa kwa multidimensional. TileDB inatoa maktaba ya C++ kwa kutoa ufikiaji wa data na metadata kwa uwazi katika programu, kutunza kazi zote za kiwango cha chini kwa uhifadhi bora. Nambari ya mradi imeandikwa katika C++ na kusambazwa na chini ya leseni ya MIT. Inasaidia kazi kwenye Linux, macOS na Windows.

Sifa kuu za TileDB:

  • Mbinu bora za kuhifadhi safu chache, data ambayo haiendelei; safu imejaa vipande na vipengele vingi husalia tupu au kuchukua thamani sawa.
  • Uwezo wa kufikia data katika umbizo la thamani-msingi au seti za safu wima (DataFrame);

    Kutolewa kwa injini ya uhifadhi ya TileDB 2.0

  • Inasaidia kuunganishwa na hifadhi ya wingu AWS S3, Hifadhi ya Wingu la Google na Hifadhi ya Azure Blob;
  • Msaada kwa safu za tiled (block);
  • Uwezo wa kutumia ukandamizaji tofauti wa data na algorithms ya usimbuaji;
  • Usaidizi wa kuangalia uadilifu kwa kutumia cheki;
  • Fanya kazi katika hali ya nyuzi nyingi na pembejeo / pato sambamba;
  • Usaidizi wa matoleo ya data iliyohifadhiwa, ikiwa ni pamoja na kurejesha hali katika hatua fulani huko nyuma au masasisho ya atomiki ya seti nzima kubwa.
  • Uwezo wa kuunganisha metadata;
  • Usaidizi wa kupanga data;
  • Module za ujumuishaji za kutumika kama injini ya uhifadhi ya kiwango cha chini katika Spark, Dask, MariaDB, GDAL, PDAL, Rasterio, gVCF na PrestoDB;
  • Kufunga maktaba kwa API ya C++ ya Python, R, Java na Go.

Toleo la 2.0 linajulikana kwa msaada wake kwa dhana ya "DataFrame", ambayo inaruhusu data kuhifadhiwa katika mfumo wa safu wima za urefu wa kiholela, zimefungwa kwa sifa fulani. Hifadhi pia imeboreshwa kwa ajili ya kuchakata safu chache za ukubwa tofauti (seli zinaweza kuhifadhi data za aina tofauti na zinaweza kufanya shughuli za kuunganisha kwenye safu wima za aina tofauti, kwa mfano, zile zinazohifadhi jina, wakati na bei). Usaidizi ulioongezwa kwa safu wima zilizo na data ya mfuatano. Moduli zilizoongezwa za kuunganishwa na Hifadhi ya Wingu la Google na Hifadhi ya Azure Blob. API ya lugha ya R imeundwa upya.

Chanzo: opennet.ru

Kuongeza maoni