TileDB 2.0 сактоо кыймылдаткычынын чыгарылышы

Жарыяланган жай TileDB 2.0, көп өлчөмдүү массивдерди жана илимий эсептөөлөрдө колдонулган маалыматтарды сактоо үчүн оптималдаштырылган. TileDB үчүн колдонуу чөйрөлөрү катары генетикалык маалыматты, мейкиндик жана финансылык маалыматтарды иштетүү үчүн ар кандай системалар айтылган, б.а. операциялык системалар сейрек же тынымсыз толтурулган көп өлчөмдүү массивдер. TileDB колдонмолордогу маалыматтарга жана метаберилиштерге ачык-айкын мүмкүндүк алуу үчүн C++ китепканасын сунуштайт, эффективдүү сактоо үчүн бардык төмөнкү деңгээлдеги жумуштарды аткарат. Долбоордун коду C++ тилинде жазылган жана жайылуу MIT лицензиясы боюнча. Linux, macOS жана Windows менен иштөөнү колдойт.

TileDB негизги өзгөчөлүктөрү:

  • Берилиштер үзгүлтүксүз болгон сейрек массивдерди сактоонун эффективдүү ыкмалары; массив фрагменттерге толгон жана элементтердин көбү бош бойдон кала берет же бирдей мааниге ээ.
  • Ачкыч-маани форматындагы же мамычалар топтомундагы маалыматтарга кирүү мүмкүнчүлүгү (DataFrame);

    TileDB 2.0 сактоо кыймылдаткычынын чыгарылышы

  • Булут сактагычы AWS S3, Google Cloud Storage жана Azure Blob Storage менен интеграцияны колдойт;
  • плиткалуу (блок) массивдерди колдоо;
  • ар кандай маалыматтарды кысуу жана шифрлөө алгоритмдерин колдонуу мүмкүнчүлүгү;
  • текшерүү суммасын колдонуу менен бүтүндүгүн текшерүү үчүн колдоо;
  • Параллель киргизүү/чыгаруу менен көп жиптүү режимде иштөө;
  • Сакталган маалыматтардын версиясын колдоо, анын ичинде мурунку белгилүү бир учурда абалды алуу же бүтүндөй чоң топтомдордун атомдук жаңыртуулары.
  • Метадайындарды байланыштыруу мүмкүнчүлүгү;
  • Маалыматтарды топтоого колдоо көрсөтүү;
  • Spark, Dask, MariaDB, GDAL, PDAL, Rasterio, gVCF жана PrestoDBде төмөнкү деңгээлдеги сактоо кыймылдаткычы катары колдонуу үчүн интеграциялык модулдар;
  • Python, R, Java жана Go үчүн C++ API үчүн милдеттүү китепканалар.

Release 2.0 "DataFrame" концепциясын колдоосу менен айырмаланат, ал маалыматтарды белгилүү бир атрибуттарга байланган ыктыярдуу узундуктагы маанилердин мамычалары түрүндө сактоого мүмкүндүк берет. Сактоо ошондой эле гетерогендүү өлчөмдөгү сейрек массивдерди иштетүү үчүн оптималдаштырылган (уячалар ар кандай типтеги маалыматтарды сактай алат жана ар кандай типтеги мамычаларда бириктирүү операцияларын аткара алат, мисалы, аталышы, убактысы жана баасы сакталган). Сап маалыматтары бар мамычаларды колдоо кошулду. Google Cloud Storage жана Azure Blob Storage менен интеграциялоо үчүн модулдар кошулду. R тили үчүн API кайра иштелип чыккан.

Source: opennet.ru

Комментарий кошуу