TileDB 2.0 хадгалах хөдөлгүүрийг гаргасан

Нийтлэгдсэн репозитор TileDB 2.0, шинжлэх ухааны тооцоололд ашигласан олон хэмжээст массив болон өгөгдлийг хадгалахад оновчтой болгосон. Удамшлын мэдээлэл, орон зайн болон санхүүгийн өгөгдлийг боловсруулах янз бүрийн системийг TileDB-ийн хэрэглээний талбар болгон дурдсан байдаг. үйлдлийн системүүд сийрэг эсвэл тасралтгүй дүүргэсэн олон хэмжээст массивууд. TileDB нь программ дахь өгөгдөл болон мета өгөгдөлд хандах хандалтыг ил тод байдлаар хийсвэрлэх, үр ашигтай хадгалах зорилгоор доод түвшний бүх ажлыг хариуцах C++ номын санг санал болгодог. Төслийн код нь C++ хэл дээр бичигдсэн ба тараасан MIT лицензийн дагуу. Линукс, macOS болон Windows дээр ажиллахыг дэмждэг.

TileDB-ийн гол онцлогууд:

  • Мэдээлэл нь тасралтгүй биш, сийрэг массивуудыг хадгалах үр дүнтэй аргууд; массив нь фрагментуудаар дүүрсэн бөгөөд ихэнх элементүүд хоосон хэвээр эсвэл ижил утгыг авдаг.
  • Түлхүүр утгын формат эсвэл баганын багц дахь өгөгдөлд хандах чадвар (DataFrame);

    TileDB 2.0 хадгалах хөдөлгүүрийг гаргасан

  • AWS S3 үүл хадгалах сан, Google Cloud Storage болон Azure Blob Storage-тэй нэгтгэхийг дэмждэг;
  • Хавтанцар (блок) массивыг дэмжих;
  • Өөр өөр өгөгдөл шахах, шифрлэх алгоритмуудыг ашиглах чадвар;
  • Шалгалтын дүнг ашиглан бүрэн бүтэн байдлыг шалгахад дэмжлэг үзүүлэх;
  • Зэрэгцээ оролт/гаралттай олон урсгалтай горимд ажиллах;
  • Хадгалсан өгөгдлийн хувилбарыг гаргах, тэр дундаа өнгөрсөн үеийн тодорхой цэгийн төлөвийг сэргээх эсвэл бүхэл бүтэн том багцын атомын шинэчлэлтийг дэмжих.
  • Мета өгөгдлийг холбох чадвар;
  • Мэдээллийг бүлэглэх дэмжлэг;
  • Spark, Dask, MariaDB, GDAL, PDAL, Rasterio, gVCF болон PrestoDB-д бага түвшний хадгалах хөдөлгүүр болгон ашиглах нэгдсэн модулиуд;
  • Python, R, Java болон Go-д зориулсан C++ API-д зориулсан холбох сангууд.

Release 2.0 нь өгөгдлийг тодорхой шинж чанаруудтай холбосон дурын урттай утгын багана хэлбэрээр хадгалах боломжийг олгодог "DataFrame" үзэл баримтлалыг дэмждэгээрээ алдартай. Хадгалалт нь мөн адил бус хэмжээтэй сийрэг массивуудыг боловсруулахад оновчтой болсон (нүдүүд нь янз бүрийн төрлийн өгөгдлийг хадгалах боломжтой бөгөөд өөр өөр төрлийн багана дээр нэгтгэх үйлдлүүдийг хийх боломжтой, жишээлбэл, нэр, цаг, үнийг хадгалах). Мөр өгөгдөл бүхий баганын дэмжлэгийг нэмсэн. Google Cloud Storage болон Azure Blob Storage-тэй нэгтгэх модулиудыг нэмсэн. R хэлний API-г дахин зохион бүтээсэн.

Эх сурвалж: opennet.ru

сэтгэгдэл нэмэх