TileDB 2.0 స్టోరేజ్ ఇంజిన్ విడుదల

ప్రచురించబడింది రిపోజిటరీ TileDB 2.0, శాస్త్రీయ గణనలలో ఉపయోగించే బహుళ డైమెన్షనల్ శ్రేణులు మరియు డేటాను నిల్వ చేయడానికి ఆప్టిమైజ్ చేయబడింది. జన్యు సమాచారం, ప్రాదేశిక మరియు ఆర్థిక డేటాను ప్రాసెస్ చేయడానికి వివిధ వ్యవస్థలు TileDB కోసం అప్లికేషన్ యొక్క ప్రాంతాలుగా పేర్కొనబడ్డాయి, అనగా. ఆపరేటింగ్ సిస్టమ్స్ అరుదైన లేదా నిరంతరంగా పూరించిన బహుమితీయ శ్రేణులు. టైల్‌డిబి అప్లికేషన్‌లలో డేటా మరియు మెటాడేటాకు యాక్సెస్‌ను పారదర్శకంగా సంగ్రహించడం కోసం C++ లైబ్రరీని అందిస్తుంది, సమర్థవంతమైన నిల్వ కోసం అన్ని తక్కువ-స్థాయి పనిని చూసుకుంటుంది. ప్రాజెక్ట్ కోడ్ C++లో వ్రాయబడింది మరియు ద్వారా పంపిణీ చేయబడింది MIT లైసెన్స్ కింద. Linux, macOS మరియు Windowsలో పని చేయడానికి మద్దతు ఇస్తుంది.

TileDB యొక్క ప్రధాన లక్షణాలు:

  • అరుదైన శ్రేణులను నిల్వ చేయడానికి సమర్థవంతమైన పద్ధతులు, డేటా నిరంతరంగా ఉండదు; శ్రేణి శకలాలు నిండి ఉంటుంది మరియు చాలా మూలకాలు ఖాళీగా ఉంటాయి లేదా అదే విలువను తీసుకుంటాయి.
  • కీ-విలువ ఫార్మాట్ లేదా కాలమ్ సెట్‌లలో డేటాను యాక్సెస్ చేయగల సామర్థ్యం (డేటా ఫ్రేమ్);

    TileDB 2.0 స్టోరేజ్ ఇంజిన్ విడుదల

  • క్లౌడ్ స్టోరేజ్ AWS S3, Google క్లౌడ్ స్టోరేజ్ మరియు అజూర్ బ్లాబ్ స్టోరేజ్‌తో ఏకీకరణకు మద్దతు ఇస్తుంది;
  • టైల్డ్ (బ్లాక్) శ్రేణులకు మద్దతు;
  • విభిన్న డేటా కంప్రెషన్ మరియు ఎన్‌క్రిప్షన్ అల్గారిథమ్‌లను ఉపయోగించగల సామర్థ్యం;
  • చెక్‌సమ్‌లను ఉపయోగించి సమగ్రతను తనిఖీ చేయడానికి మద్దతు;
  • సమాంతర ఇన్‌పుట్/అవుట్‌పుట్‌తో బహుళ-థ్రెడ్ మోడ్‌లో పని చేయండి;
  • గతంలోని నిర్దిష్ట సమయంలో స్థితిని తిరిగి పొందడం లేదా మొత్తం పెద్ద సెట్‌ల అటామిక్ అప్‌డేట్‌లతో సహా నిల్వ చేసిన డేటా సంస్కరణకు మద్దతు.
  • మెటాడేటాను లింక్ చేయగల సామర్థ్యం;
  • డేటా సమూహానికి మద్దతు;
  • Spark, Dask, MariaDB, GDAL, PDAL, Rasterio, gVCF మరియు PrestoDBలలో తక్కువ-స్థాయి నిల్వ ఇంజిన్‌గా ఉపయోగించడానికి ఇంటిగ్రేషన్ మాడ్యూల్స్;
  • Python, R, Java మరియు Go కోసం C++ API కోసం బైండింగ్ లైబ్రరీలు.

విడుదల 2.0 "డేటాఫ్రేమ్" కాన్సెప్ట్‌కు దాని మద్దతు కోసం గుర్తించదగినది, ఇది నిర్దిష్ట లక్షణాలతో ముడిపడి ఉన్న ఏకపక్ష పొడవు విలువల నిలువు వరుసల రూపంలో డేటాను నిల్వ చేయడానికి అనుమతిస్తుంది. వైవిధ్య పరిమాణాల యొక్క చిన్న శ్రేణులను ప్రాసెస్ చేయడానికి నిల్వ కూడా ఆప్టిమైజ్ చేయబడింది (కణాలు వివిధ రకాల డేటాను నిల్వ చేయగలవు మరియు వివిధ రకాల నిలువు వరుసలపై విలీన కార్యకలాపాలను చేయగలవు, ఉదాహరణకు, పేరు, సమయం మరియు ధరను నిల్వ చేసేవి). స్ట్రింగ్ డేటాతో నిలువు వరుసలకు మద్దతు జోడించబడింది. Google Cloud Storage మరియు Azure Blob Storageతో ఏకీకరణ కోసం మాడ్యూల్స్ జోడించబడ్డాయి. R భాష కోసం API పునఃరూపకల్పన చేయబడింది.

మూలం: opennet.ru

ఒక వ్యాఖ్యను జోడించండి