TileDB 2.0 ಶೇಖರಣಾ ಎಂಜಿನ್‌ನ ಬಿಡುಗಡೆ

ಪ್ರಕಟಿಸಲಾಗಿದೆ ಭಂಡಾರ TileDB 2.0, ಬಹುಆಯಾಮದ ಅರೇಗಳು ಮತ್ತು ವೈಜ್ಞಾನಿಕ ಲೆಕ್ಕಾಚಾರಗಳಲ್ಲಿ ಬಳಸಲಾದ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಲು ಹೊಂದುವಂತೆ ಮಾಡಲಾಗಿದೆ. ಆನುವಂಶಿಕ ಮಾಹಿತಿ, ಪ್ರಾದೇಶಿಕ ಮತ್ತು ಹಣಕಾಸಿನ ಡೇಟಾವನ್ನು ಪ್ರಕ್ರಿಯೆಗೊಳಿಸಲು ವಿವಿಧ ವ್ಯವಸ್ಥೆಗಳನ್ನು TileDB ಗಾಗಿ ಅಪ್ಲಿಕೇಶನ್‌ನ ಕ್ಷೇತ್ರಗಳಾಗಿ ಉಲ್ಲೇಖಿಸಲಾಗಿದೆ, ಅಂದರೆ. ಆಪರೇಟಿಂಗ್ ಸಿಸ್ಟಂಗಳು ವಿರಳ ಅಥವಾ ನಿರಂತರವಾಗಿ ತುಂಬಿದ ಬಹುಆಯಾಮದ ಅರೇಗಳು. TileDB ಅಪ್ಲಿಕೇಶನ್‌ಗಳಲ್ಲಿ ಡೇಟಾ ಮತ್ತು ಮೆಟಾಡೇಟಾಗೆ ಪ್ರವೇಶವನ್ನು ಪಾರದರ್ಶಕವಾಗಿ ಅಮೂರ್ತಗೊಳಿಸಲು C++ ಲೈಬ್ರರಿಯನ್ನು ನೀಡುತ್ತದೆ, ಸಮರ್ಥ ಸಂಗ್ರಹಣೆಗಾಗಿ ಎಲ್ಲಾ ಕಡಿಮೆ-ಮಟ್ಟದ ಕೆಲಸವನ್ನು ನೋಡಿಕೊಳ್ಳುತ್ತದೆ. ಯೋಜನೆಯ ಕೋಡ್ ಅನ್ನು C ++ ನಲ್ಲಿ ಬರೆಯಲಾಗಿದೆ ಮತ್ತು ವಿತರಿಸುವವರು MIT ಪರವಾನಗಿ ಅಡಿಯಲ್ಲಿ. Linux, macOS ಮತ್ತು Windows ನಲ್ಲಿ ಕೆಲಸವನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ.

TileDB ಯ ಮುಖ್ಯ ಲಕ್ಷಣಗಳು:

  • ವಿರಳವಾದ ಸರಣಿಗಳನ್ನು ಸಂಗ್ರಹಿಸಲು ಸಮರ್ಥ ವಿಧಾನಗಳು, ಡೇಟಾವು ನಿರಂತರವಾಗಿಲ್ಲ; ರಚನೆಯು ತುಣುಕುಗಳಿಂದ ತುಂಬಿರುತ್ತದೆ ಮತ್ತು ಹೆಚ್ಚಿನ ಅಂಶಗಳು ಖಾಲಿಯಾಗಿ ಉಳಿಯುತ್ತವೆ ಅಥವಾ ಅದೇ ಮೌಲ್ಯವನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತವೆ.
  • ಕೀ-ಮೌಲ್ಯದ ಸ್ವರೂಪ ಅಥವಾ ಕಾಲಮ್ ಸೆಟ್‌ಗಳಲ್ಲಿ ಡೇಟಾವನ್ನು ಪ್ರವೇಶಿಸುವ ಸಾಮರ್ಥ್ಯ (ಡೇಟಾ ಫ್ರೇಮ್);

    TileDB 2.0 ಶೇಖರಣಾ ಎಂಜಿನ್‌ನ ಬಿಡುಗಡೆ

  • ಕ್ಲೌಡ್ ಸ್ಟೋರೇಜ್ AWS S3, Google Cloud Storage ಮತ್ತು Azure Blob Storage ಜೊತೆಗೆ ಏಕೀಕರಣವನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ;
  • ಟೈಲ್ಡ್ (ಬ್ಲಾಕ್) ಅರೇಗಳಿಗೆ ಬೆಂಬಲ;
  • ವಿಭಿನ್ನ ಡೇಟಾ ಕಂಪ್ರೆಷನ್ ಮತ್ತು ಎನ್‌ಕ್ರಿಪ್ಶನ್ ಅಲ್ಗಾರಿದಮ್‌ಗಳನ್ನು ಬಳಸುವ ಸಾಮರ್ಥ್ಯ;
  • ಚೆಕ್ಸಮ್ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಸಮಗ್ರತೆಯ ಪರಿಶೀಲನೆಗೆ ಬೆಂಬಲ;
  • ಸಮಾನಾಂತರ ಇನ್ಪುಟ್ / ಔಟ್ಪುಟ್ನೊಂದಿಗೆ ಬಹು-ಥ್ರೆಡ್ ಮೋಡ್ನಲ್ಲಿ ಕೆಲಸ ಮಾಡಿ;
  • ಹಿಂದಿನ ನಿರ್ದಿಷ್ಟ ಹಂತದಲ್ಲಿ ಸ್ಥಿತಿಯನ್ನು ಮರುಪಡೆಯಲು ಅಥವಾ ಸಂಪೂರ್ಣ ದೊಡ್ಡ ಸೆಟ್‌ಗಳ ಪರಮಾಣು ನವೀಕರಣಗಳನ್ನು ಒಳಗೊಂಡಂತೆ ಸಂಗ್ರಹಿಸಲಾದ ಡೇಟಾವನ್ನು ಆವೃತ್ತಿ ಮಾಡಲು ಬೆಂಬಲ.
  • ಮೆಟಾಡೇಟಾವನ್ನು ಲಿಂಕ್ ಮಾಡುವ ಸಾಮರ್ಥ್ಯ;
  • ಡೇಟಾ ಗುಂಪಿಗೆ ಬೆಂಬಲ;
  • Spark, Dask, MariaDB, GDAL, PDAL, Rasterio, gVCF ಮತ್ತು PrestoDB ಯಲ್ಲಿ ಕಡಿಮೆ-ಮಟ್ಟದ ಶೇಖರಣಾ ಎಂಜಿನ್ ಆಗಿ ಬಳಸಲು ಏಕೀಕರಣ ಮಾಡ್ಯೂಲ್‌ಗಳು;
  • Python, R, Java ಮತ್ತು Go ಗಾಗಿ C++ API ಗಾಗಿ ಬೈಂಡಿಂಗ್ ಲೈಬ್ರರಿಗಳು.

ಬಿಡುಗಡೆ 2.0 "ಡೇಟಾಫ್ರೇಮ್" ಪರಿಕಲ್ಪನೆಗೆ ಅದರ ಬೆಂಬಲಕ್ಕಾಗಿ ಗಮನಾರ್ಹವಾಗಿದೆ, ಇದು ಕೆಲವು ಗುಣಲಕ್ಷಣಗಳೊಂದಿಗೆ ಅನಿಯಂತ್ರಿತ ಉದ್ದದ ಮೌಲ್ಯಗಳ ಕಾಲಮ್ಗಳ ರೂಪದಲ್ಲಿ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಲು ಅನುಮತಿಸುತ್ತದೆ. ಭಿನ್ನಜಾತಿಯ ಗಾತ್ರಗಳ ವಿರಳ ಸರಣಿಗಳನ್ನು ಪ್ರಕ್ರಿಯೆಗೊಳಿಸಲು ಸಂಗ್ರಹಣೆಯನ್ನು ಹೊಂದುವಂತೆ ಮಾಡಲಾಗಿದೆ (ಕೋಶಗಳು ವಿವಿಧ ಪ್ರಕಾರಗಳ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಬಹುದು ಮತ್ತು ವಿವಿಧ ಪ್ರಕಾರಗಳ ಕಾಲಮ್‌ಗಳಲ್ಲಿ ವಿಲೀನ ಕಾರ್ಯಾಚರಣೆಗಳನ್ನು ಮಾಡಬಹುದು, ಉದಾಹರಣೆಗೆ, ಹೆಸರು, ಸಮಯ ಮತ್ತು ಬೆಲೆಯನ್ನು ಸಂಗ್ರಹಿಸುವುದು). ಸ್ಟ್ರಿಂಗ್ ಡೇಟಾದೊಂದಿಗೆ ಕಾಲಮ್‌ಗಳಿಗೆ ಬೆಂಬಲವನ್ನು ಸೇರಿಸಲಾಗಿದೆ. Google ಮೇಘ ಸಂಗ್ರಹಣೆ ಮತ್ತು ಅಜೂರ್ ಬ್ಲಾಬ್ ಸಂಗ್ರಹಣೆಯೊಂದಿಗೆ ಏಕೀಕರಣಕ್ಕಾಗಿ ಮಾಡ್ಯೂಲ್‌ಗಳನ್ನು ಸೇರಿಸಲಾಗಿದೆ. R ಭಾಷೆಗಾಗಿ API ಅನ್ನು ಮರುವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ.

ಮೂಲ: opennet.ru

ಕಾಮೆಂಟ್ ಅನ್ನು ಸೇರಿಸಿ