TileDB 2.0 சேமிப்பு இயந்திரத்தின் வெளியீடு

வெளியிடப்பட்டது களஞ்சியம் TileDB 2.0, அறிவியல் கணக்கீடுகளில் பயன்படுத்தப்படும் பல பரிமாண வரிசைகள் மற்றும் தரவுகளை சேமிப்பதற்காக உகந்ததாக உள்ளது. மரபணுத் தகவல், இடஞ்சார்ந்த மற்றும் நிதித் தரவுகளைச் செயலாக்குவதற்கான பல்வேறு அமைப்புகள் TileDBக்கான பயன்பாட்டுப் பகுதிகளாகக் குறிப்பிடப்படுகின்றன, அதாவது. இயக்க முறைமைகள் அரிதான அல்லது தொடர்ச்சியாக நிரப்பப்பட்ட பல பரிமாண அணிவரிசைகள். TileDB ஆனது C++ லைப்ரரியை வழங்குகிறது, பயன்பாடுகளில் தரவு மற்றும் மெட்டாடேட்டாவிற்கான அணுகலை வெளிப்படையாக சுருக்கவும், திறமையான சேமிப்பிற்காக அனைத்து குறைந்த-நிலை வேலைகளையும் கவனித்துக்கொள்கிறது. திட்டக் குறியீடு C++ இல் எழுதப்பட்டுள்ளது வழங்கியது MIT உரிமத்தின் கீழ். லினக்ஸ், மேகோஸ் மற்றும் விண்டோஸில் வேலை செய்வதை ஆதரிக்கிறது.

TileDB இன் முக்கிய அம்சங்கள்:

  • ஸ்பேஸ் வரிசைகளை சேமிப்பதற்கான திறமையான முறைகள், தரவு தொடர்ச்சியாக இல்லை; வரிசை துண்டுகளால் நிரப்பப்பட்டுள்ளது மற்றும் பெரும்பாலான உறுப்புகள் காலியாக இருக்கும் அல்லது அதே மதிப்பை எடுக்கும்.
  • முக்கிய மதிப்பு வடிவம் அல்லது நெடுவரிசை தொகுப்புகளில் தரவை அணுகும் திறன் (டேட்டாஃப்ரேம்);

    TileDB 2.0 சேமிப்பு இயந்திரத்தின் வெளியீடு

  • கிளவுட் ஸ்டோரேஜ் AWS S3, Google Cloud Storage மற்றும் Azure Blob Storage உடன் ஒருங்கிணைப்பை ஆதரிக்கிறது;
  • டைல்டு (தொகுதி) வரிசைகளுக்கான ஆதரவு;
  • வெவ்வேறு தரவு சுருக்க மற்றும் குறியாக்க வழிமுறைகளைப் பயன்படுத்தும் திறன்;
  • செக்சம்களைப் பயன்படுத்தி ஒருமைப்பாடு சரிபார்ப்புக்கான ஆதரவு;
  • இணை உள்ளீடு/வெளியீட்டுடன் பல-திரிக்கப்பட்ட முறையில் வேலை செய்யுங்கள்;
  • கடந்த காலத்தில் ஒரு குறிப்பிட்ட புள்ளியில் நிலையை மீட்டெடுப்பது அல்லது முழு பெரிய தொகுப்புகளின் அணு புதுப்பிப்புகள் உட்பட, சேமிக்கப்பட்ட தரவைப் பதிப்பதற்கான ஆதரவு.
  • மெட்டாடேட்டாவை இணைக்கும் திறன்;
  • தரவு குழுவிற்கான ஆதரவு;
  • Spark, Dask, MariaDB, GDAL, PDAL, Rasterio, gVCF மற்றும் PrestoDB ஆகியவற்றில் குறைந்த-நிலை சேமிப்பக இயந்திரமாகப் பயன்படுத்துவதற்கான ஒருங்கிணைப்பு தொகுதிகள்;
  • Python, R, Java மற்றும் Go க்கான C++ APIக்கான பைண்டிங் லைப்ரரிகள்.

வெளியீடு 2.0 ஆனது “டேட்டாஃப்ரேம்” கருத்தாக்கத்திற்கான ஆதரவிற்காக குறிப்பிடத்தக்கது, இது தரவுகளை தன்னிச்சையான நீளத்தின் மதிப்புகளின் நெடுவரிசைகளின் வடிவத்தில் சேமிக்க அனுமதிக்கிறது, சில பண்புகளுடன் பிணைக்கப்பட்டுள்ளது. பன்முகத்தன்மை கொண்ட அளவுகளின் அரிதான வரிசைகளைச் செயலாக்குவதற்கும் சேமிப்பகம் உகந்ததாக உள்ளது (கலங்கள் வெவ்வேறு வகைகளின் தரவைச் சேமிக்கலாம் மற்றும் வெவ்வேறு வகையான நெடுவரிசைகளில் ஒன்றிணைக்கும் செயல்பாடுகளைச் செய்யலாம், எடுத்துக்காட்டாக, பெயர், நேரம் மற்றும் விலை ஆகியவற்றைச் சேமிக்கும்). சரம் தரவு கொண்ட நெடுவரிசைகளுக்கான ஆதரவு சேர்க்கப்பட்டது. கூகுள் கிளவுட் ஸ்டோரேஜ் மற்றும் அஸூர் ப்ளாப் ஸ்டோரேஜ் ஆகியவற்றுடன் ஒருங்கிணைப்பதற்கான தொகுதிகள் சேர்க்கப்பட்டன. R மொழிக்கான API மறுவடிவமைப்பு செய்யப்பட்டுள்ளது.

ஆதாரம்: opennet.ru

கருத்தைச் சேர்