Liberazione di u mutore di almacenamiento TileDB 2.0

Publicatu nantu repositoriu TileDB 2.0, ottimizzatu per almacenà arrays multidimensionali è dati utilizati in calculi scientifichi. Diversi sistemi per u processu di l'infurmazione genetica, dati spaziali è finanziarii sò citati cum'è spazii di applicazione per TileDB, i.e. sistemi operativi sparse o matrici multidimensionali continuamente riempite. TileDB offre una libreria C ++ per l'astrazione trasparente di l'accessu à i dati è i metadati in l'applicazioni, cura di tuttu u travagliu di livellu bassu per un almacenamentu efficiente. U codice di u prugettu hè scrittu in C++ è distribuitu da sottu licenza MIT. Supporta u travagliu in Linux, macOS è Windows.

Caratteristiche principali di TileDB:

  • Metudi efficaci per almacenà array sparse, i dati in quale ùn hè micca cuntinuu; u array hè pienu di frammenti è a maiò parte di l'elementi restanu viotu o piglianu u listessu valore.
  • Capacità di accede à e dati in formatu chjave-valore o setti di colonne (DataFrame);

    Liberazione di u mutore di almacenamiento TileDB 2.0

  • Supporta l'integrazione cù u cloud storage AWS S3, Google Cloud Storage è Azure Blob Storage;
  • Supportu per arrays tiled (bloccu);
  • Capacità di utilizà diversi algoritmi di compressione di dati è criptografia;
  • Supportu per a verificazione di l'integrità usendu checksums;
  • U travagliu in modu multi-threaded cù input / output paralleli;
  • Supportu per a versione di dati almacenati, cumpresu per ricuperà u statu in un certu puntu in u passatu o l'aghjurnamenti atomichi di setti interi grandi.
  • Capacità di ligà metadata;
  • Supportu per a raggruppamentu di dati;
  • Moduli d'integrazione per l'utilizazione cum'è un mutore di almacenamentu di bassu livellu in Spark, Dask, MariaDB, GDAL, PDAL, Rasterio, gVCF è PrestoDB;
  • Biblioteche di associazione per l'API C++ per Python, R, Java è Go.

A versione 2.0 hè notevule per u so supportu per u cuncettu "DataFrame", chì permette a dati per esse guardatu in forma di colonne di valori di lunghezza arbitraria, ligati à certi attributi. L'almacenamiento hè ancu ottimizatu per processà arrays sparse di dimensioni eterogenee (i celluli ponu almacenà dati di diversi tipi è ponu fà operazioni di fusione nantu à colonne di diversi tipi, per esempiu, quelli chì almacenanu u nome, u tempu è u prezzu). Aghjunghje supportu per e colonne cù dati di stringa. Aggiunti moduli per l'integrazione cù Google Cloud Storage è Azure Blob Storage. L'API per a lingua R hè stata riprogettata.

Source: opennet.ru

Add a comment