TileDB 2.0 saqlash dvigatelining chiqarilishi

Nashr etildi tonoz TileDB 2.0, ko'p o'lchovli massivlarni va ilmiy hisob-kitoblarda ishlatiladigan ma'lumotlarni saqlash uchun optimallashtirilgan. TileDB uchun qo'llash sohalari sifatida genetik ma'lumotlarni, fazoviy va moliyaviy ma'lumotlarni qayta ishlash uchun turli xil tizimlar qayd etilgan, ya'ni. operatsion tizimlar siyrak yoki doimiy ravishda to'ldirilgan ko'p o'lchovli massivlar. TileDB ilovalardagi ma'lumotlar va metama'lumotlarga kirishni shaffof mavhumlash uchun C++ kutubxonasini taklif qiladi, samarali saqlash uchun barcha past darajadagi ishlarni bajaradi. Loyiha kodi C++ tilida yozilgan va tarqaladi MIT litsenziyasi ostida. Linux, macOS va Windows-da ishlashni qo'llab-quvvatlaydi.

TileDB ning asosiy xususiyatlari:

  • Ma'lumotlar uzluksiz bo'lmagan siyrak massivlarni saqlashning samarali usullari; massiv parchalar bilan to'ldirilgan va elementlarning aksariyati bo'sh qoladi yoki bir xil qiymatni oladi.
  • Kalit-qiymat formatidagi yoki ustunlar to'plamidagi ma'lumotlarga kirish imkoniyati (DataFrame);

    TileDB 2.0 saqlash dvigatelining chiqarilishi

  • AWS S3 bulutli saqlash, Google Cloud Storage va Azure Blob Storage bilan integratsiyani qo'llab-quvvatlaydi;
  • Plitkali (blok) massivlarni qo'llab-quvvatlash;
  • Turli xil ma'lumotlarni siqish va shifrlash algoritmlaridan foydalanish qobiliyati;
  • Tekshirish summalari yordamida yaxlitlikni tekshirishni qo'llab-quvvatlash;
  • Parallel kiritish/chiqarish bilan ko'p tarmoqli rejimda ishlash;
  • Saqlangan ma'lumotlarning versiyalarini qo'llab-quvvatlash, shu jumladan o'tmishdagi ma'lum bir nuqtadagi holatni olish yoki butun katta to'plamlarning atomik yangilanishlari.
  • Meta-ma'lumotlarni bog'lash qobiliyati;
  • Ma'lumotlarni guruhlashni qo'llab-quvvatlash;
  • Spark, Dask, MariaDB, GDAL, PDAL, Rasterio, gVCF va PrestoDB da past darajadagi saqlash mexanizmi sifatida foydalanish uchun integratsiya modullari;
  • Python, R, Java va Go uchun C++ API uchun majburiy kutubxonalar.

Release 2.0 "DataFrame" kontseptsiyasini qo'llab-quvvatlashi bilan ajralib turadi, bu ma'lumotlarni ma'lum atributlarga bog'langan ixtiyoriy uzunlikdagi qiymatlar ustunlari shaklida saqlashga imkon beradi. Saqlash, shuningdek, heterojen o'lchamdagi siyrak massivlarni qayta ishlash uchun optimallashtirilgan (hujayralar har xil turdagi ma'lumotlarni saqlashi mumkin va har xil turdagi ustunlarda birlashtirish operatsiyalarini bajarishi mumkin, masalan, nom, vaqt va narxni saqlaydiganlar). Satr ma'lumotlari bo'lgan ustunlar uchun qo'shimcha yordam. Google Cloud Storage va Azure Blob Storage bilan integratsiya uchun modullar qoβ€˜shildi. R tili uchun API qayta ishlab chiqilgan.

Manba: opennet.ru

a Izoh qo'shish