RDF சேமிப்பகத்தில் இப்போது என்ன நடக்கிறது?

சொற்பொருள் வலை மற்றும் இணைக்கப்பட்ட தரவு ஆகியவை விண்வெளியைப் போன்றது: அங்கு வாழ்க்கை இல்லை. இன்னும் கொஞ்ச நேரம் அங்கே போக... “நான் விண்வெளி வீரன் ஆக வேண்டும்” என்று சிறுவயதில் உங்களிடம் என்ன சொன்னார்கள் என்று தெரியவில்லை. ஆனால் பூமியில் என்ன நடக்கிறது என்பதை நீங்கள் கவனிக்கலாம்; ஒரு அமெச்சூர் வானியலாளர் அல்லது ஒரு தொழில்முறை கூட ஆக மிகவும் எளிதானது.

கட்டுரை RDF சேமிப்பகத்தின் உலகின் சமீபத்திய போக்குகளில் கவனம் செலுத்தும், பல மாதங்களுக்கு மேல் இல்லை. முதல் பத்தியில் உள்ள உருவகம் வெட்டப்பட்ட காவிய அளவிலான விளம்பரப் படத்தால் ஈர்க்கப்பட்டுள்ளது.


காவியப் படம்

RDF சேமிப்பகத்தில் இப்போது என்ன நடக்கிறது?

I. RDF அணுகலுக்கான GraphQL

அவர்கள் சொல்கிறார்கள்GraphQL ஆனது உலகளாவிய தரவுத்தள அணுகல் மொழியாக மாறுவதை நோக்கமாகக் கொண்டுள்ளது. GraphQL ஐப் பயன்படுத்தி RDF ஐ அணுகும் திறன் பற்றி என்ன?

பெட்டிக்கு வெளியே இந்த வாய்ப்பை வழங்கியவர்:

களஞ்சியம் அத்தகைய வாய்ப்பை வழங்கவில்லை என்றால், பொருத்தமான "தீர்வை" எழுதுவதன் மூலம் அதை சுயாதீனமாக செயல்படுத்த முடியும். எடுத்துக்காட்டாக, பிரெஞ்சு திட்டத்தில் இதைத்தான் செய்தார்கள் டேட்டா டூரிசம். அல்லது நீங்கள் இனி எதையும் எழுத முடியாது, ஆனால் எடுத்துக் கொள்ளுங்கள் HyperGraphQL.

செமாண்டிக் வெப் மற்றும் லிங்க்ட் டேட்டாவைக் கடைப்பிடிப்பவரின் பார்வையில், இவை அனைத்தும் சோகமானது, ஏனெனில் இது அடுத்த தரவு சிலோவைச் சுற்றி கட்டமைக்கப்பட்ட ஒருங்கிணைப்புகளுக்காக வடிவமைக்கப்பட்டுள்ளது மற்றும் பொருத்தமான தளங்கள் அல்ல (ஆர்டிஎஃப் கடைகள், நிச்சயமாக) .

GraphQL ஐ SPARQL உடன் ஒப்பிடுவதிலிருந்து வரும் பதிவுகள் இரண்டு மடங்கு.

  • ஒருபுறம், GraphQL ஆனது SPARQL இன் தொலைதூர உறவினராகத் தெரிகிறது: இது REST க்கு பொதுவான வினவல்களின் மறு மாதிரி மற்றும் பெருக்கத்தின் சிக்கல்களைத் தீர்க்கிறது - இது இல்லாமல், அநேகமாக, அதைக் கருத்தில் கொள்ள முடியாது. கேள்வி மொழி, குறைந்தபட்சம் வலைக்கு;
  • மறுபுறம், GraphQL இன் கடினமான திட்டம் ஏமாற்றமளிக்கிறது. அதன்படி, RDF இன் முழு பிரதிபலிப்புடன் ஒப்பிடும்போது அதன் "உள்நோக்கு" மிகவும் குறைவாகவே தெரிகிறது. சொத்து பாதைகளின் அனலாக் எதுவும் இல்லை, எனவே அது ஏன் “வரைபடம்-” என்பது கூட தெளிவாகத் தெரியவில்லை.

II. மோங்கோடிபிக்கான அடாப்டர்கள்

முந்தைய போக்கை நிரப்பும் போக்கு.

  • இப்போது Stardog இல் சாத்தியமான - குறிப்பாக, அனைத்தும் ஒரே GraphQL இல் - மோங்கோடிபி தரவின் மேப்பிங்கை மெய்நிகர் RDF வரைபடங்களாக உள்ளமைக்கவும்;
  • Ontotext GraphDB சமீபத்தில் உள்ளது அது அனுமதிக்கிறது MongoDB வினவலில் SPARQL இல் துண்டுகளைச் செருகவும்.

JSON ஆதாரங்களுக்கான அடாப்டர்களைப் பற்றி நாம் விரிவாகப் பேசினால், இந்த ஆதாரங்களில் சேமிக்கப்பட்டுள்ள JSON ஐ RDF ஆகக் குறிப்பிடுவதற்கு அதிகமாகவோ அல்லது குறைவாகவோ "பறக்க" அனுமதிக்கும், நீண்ட காலத்தை நாம் நினைவுபடுத்தலாம் SPARQL உருவாக்கு, சரிசெய்யக்கூடியது, உதாரணமாக, அப்பாச்சி ஜெனாவுக்கு.

முதல் இரண்டு போக்குகளை சுருக்கமாக, RDF சேமிப்பகங்கள் "பாலிகிளாட் நிலைத்தன்மை" நிலைமைகளில் ஒருங்கிணைப்பு மற்றும் செயல்பாட்டிற்கான முழு தயார்நிலையை நிரூபிக்கின்றன என்று கூறலாம். எவ்வாறாயினும், இந்த பிந்தையது நீண்ட காலமாக நாகரீகமாக இல்லை, மேலும் மாற்றப்படுகிறது வருகிறது பல மாதிரி. RDF சேமிப்பக உலகில் பல மாடலிங் பற்றி என்ன?

சுருக்கமாக, வழி இல்லை. மல்டி-மாடல் டிபிஎம்எஸ்கள் என்ற தலைப்பில் ஒரு தனி கட்டுரையை நான் அர்ப்பணிக்க விரும்புகிறேன், ஆனால் தற்போது வரைபட மாதிரியின் அடிப்படையில் பல மாதிரி டிபிஎம்எஸ்கள் இல்லை என்பதைக் கவனத்தில் கொள்ளலாம் (ஆர்.டி.எஃப் அதன் வகையாகக் கருதப்படலாம்) . சில சிறிய மல்டி-மாடலிங் - மாற்று LPG வரைபட மாதிரிக்கான RDF சேமிப்பக ஆதரவு - இதில் விவாதிக்கப்படும் பிரிவு V.

III. OLTP vs. OLAP

இருப்பினும், அதே கார்ட்னர் அவர் எழுதுகிறார்மல்டிமாடல் என்பது முதன்மையாக ஒரு நிபந்தனை அல்ல அறுவை சிகிச்சை அறைகள் டிபிஎம்எஸ். இது புரிந்துகொள்ளத்தக்கது: "பன்முக சேமிப்பு" சூழ்நிலையில், பரிவர்த்தனையுடன் முக்கிய சிக்கல்கள் எழுகின்றன.

ஆனால் OLTP-OLAP அளவில் RDF சேமிப்பகங்கள் எங்கே உள்ளன? நான் இந்த வழியில் பதிலளிப்பேன்: அங்கேயும் இல்லை இங்கேயும் இல்லை. அவை எதை நோக்கமாகக் கொண்டுள்ளன என்பதைக் குறிக்க, சில மூன்றாவது சுருக்கம் தேவை. ஒரு விருப்பமாக நான் பரிந்துரைக்கிறேன் OLIP - ஆன்லைன் அறிவுசார் செயலாக்கம்.

இருப்பினும், இன்னும்:

  • கிராஃப்டிபியில் செயல்படுத்தப்பட்ட மோங்கோடிபி உடனான ஒருங்கிணைப்பு வழிமுறைகள் குறைவாக இல்லை நோக்கம் செயல்திறன் சிக்கல்களை எழுதுவதற்கு வேலை செய்ய;
  • ஸ்டார்டாக் இன்னும் அதிகமாகவும் முழுமையாகவும் செல்கிறது மீண்டும் எழுதுகிறார் இயந்திரம், மீண்டும் பதிவு செயல்திறனை மேம்படுத்தும் குறிக்கோளுடன்.

இப்போது ஒரு புதிய வீரரை சந்தைக்கு அறிமுகப்படுத்துகிறேன். IBM Netezza மற்றும் Amazon Redshift ஆகியவற்றின் படைப்பாளர்களிடமிருந்து - அன்சோகிராஃப்™. அதன் அடிப்படையில் ஒரு தயாரிப்புக்கான விளம்பரத்தின் படம் கட்டுரையின் தொடக்கத்தில் வெளியிடப்பட்டது. AnzoGraph தன்னை ஒரு GOLAP தீர்வாக நிலைநிறுத்துகிறது. சாளர செயல்பாடுகளுடன் கூடிய SPARQL ஐ நீங்கள் எப்படி விரும்புகிறீர்கள்? —

SELECT ?month (COUNT(?event) OVER (PARTITION BY ?month) AS ?events) WHERE {  …  }

IV. ராக்ஸ்டிபி

ஏற்கனவே அதிகமாக உள்ளது ஒரு இணைப்பு இருந்தது Stardog 7 Beta இன் அறிவிப்புக்கு, Stardog RocksDB ஐ அடிப்படை சேமிப்பக அமைப்பாகப் பயன்படுத்தப் போகிறது - ஒரு முக்கிய மதிப்பு ஸ்டோர், Google இன் LevelDB இன் ஃபேஸ்புக் ஃபோர்க். ஒரு குறிப்பிட்ட போக்கைப் பற்றி பேசுவது ஏன் மதிப்பு?

முதலில், தீர்மானித்தல் விக்கிபீடியா கட்டுரை, RDF சேமிப்பகங்கள் மட்டுமல்ல RocksDB க்கு "இடமாற்றம்" செய்யப்பட்டுள்ளது. ArangoDB, MongoDB, MySQL மற்றும் MariaDB, Cassandra ஆகியவற்றில் RocksDB ஐ சேமிப்பக இயந்திரமாகப் பயன்படுத்துவதற்கான திட்டங்கள் உள்ளன.

இரண்டாவதாக, தொடர்புடைய தலைப்புகளில் திட்டங்கள் (அதாவது தயாரிப்புகள் அல்ல) RocksDB இல் உருவாக்கப்படுகின்றன.

எடுத்துக்காட்டாக, eBay RocksDB ஐப் பயன்படுத்துகிறது ஒரு தளம் உங்கள் "அறிவு வரைபடத்திற்கு". சொல்லப்போனால், படிக்க வேடிக்கையாக இருக்கிறது: வினவல் மொழி வீட்டில் வளர்க்கப்பட்ட வடிவமாகத் தொடங்கியது, ஆனால் சமீபகாலமாக அது SPARQL ஐப் போலவே மாறுகிறது.. நகைச்சுவையைப் போல: நாம் எவ்வளவு அறிவு வரைபடத்தை உருவாக்கினாலும், நாம் இன்னும் RDF உடன் முடிவடைகிறோம்.

மற்றொரு உதாரணம் - சில மாதங்களுக்கு முன்பு தோன்றியது விக்கிடேட்டா வரலாறு வினவல் சேவை. அறிமுகம் செய்யப்படுவதற்கு முன், விக்கிடேட்டாவின் வரலாற்றுத் தகவல்களை அணுக வேண்டியிருந்தது MWAPI நிலையான மீடியாவிக்கி API க்கு. இப்போது தூய SPARQL மூலம் நிறைய சாத்தியம். "ஹூட்டின் கீழ்" ராக்ஸ்டிபியும் உள்ளது. மூலம், WDHQS ஆனது, Google அறிவு வரைபடத்தில் Freebase ஐ இறக்குமதி செய்த நபரால் உருவாக்கப்பட்டது.

V. LPG ஆதரவு

LPG வரைபடங்களுக்கும் RDF வரைபடங்களுக்கும் உள்ள முக்கிய வேறுபாட்டை உங்களுக்கு நினைவூட்டுகிறேன்.

LPG இல், அளவுகோல் பண்புகளை விளிம்பு நிகழ்வுகளுக்கு ஒதுக்கலாம், RDF இல் அவை விளிம்பு "வகைகளுக்கு" மட்டுமே ஒதுக்கப்படும் (ஆனால் அளவிடும் பண்புகள் மட்டுமல்ல, சாதாரண இணைப்புகளும்). LPG உடன் ஒப்பிடும்போது RDF இன் இந்த வரம்பு கடந்து வா ஒன்று அல்லது மற்றொரு மாடலிங் நுட்பம். RDF உடன் ஒப்பிடும்போது LPGயின் வரம்புகளை சமாளிப்பது மிகவும் கடினம், ஆனால் LPG வரைபடங்கள் RDF வரைபடங்களை விட ஹராரி பாடப்புத்தகத்தின் படங்களைப் போலவே இருக்கின்றன, அதனால்தான் மக்கள் அவற்றை விரும்புகிறார்கள்.

வெளிப்படையாக, "எல்பிஜி ஆதரவு" பணி இரண்டு பகுதிகளாக விழுகிறது:

  1. RDF மாதிரியில் மாற்றங்களைச் செய்தல், அது LPG கட்டமைப்புகளை உருவகப்படுத்துவதை சாத்தியமாக்குகிறது;
  2. இந்த மாற்றியமைக்கப்பட்ட மாதிரியில் தரவை அணுகுவதை சாத்தியமாக்கும் RDF வினவல் மொழியில் மாற்றங்களைச் செய்தல் அல்லது பிரபலமான எல்பிஜி வினவல் மொழிகளில் இந்த மாதிரியை வினவல் செய்யும் திறனை செயல்படுத்துதல்.

வி.1. தரவு மாதிரி

இங்கே பல சாத்தியமான அணுகுமுறைகள் உள்ளன.

வி.1.1. சிங்கிள்டன் சொத்து

RDF மற்றும் LPG ஆகியவற்றை ஒத்திசைப்பதற்கான மிகச் சிறந்த அணுகுமுறை அநேகமாக இருக்கலாம் சிங்கிள்டன் சொத்து:

  • எடுத்துக்காட்டாக, முன்னறிவிப்புக்கு பதிலாக :isMarriedTo முன்னறிவிப்புகள் பயன்படுத்தப்படுகின்றன :isMarriedTo1, :isMarriedTo2 மற்றும் பல.
  • இந்த முன்னறிவிப்புகள் புதிய மும்மடங்குகளின் பாடங்களாக மாறும்: :isMarriedTo1 :since "2013-09-13"^^xsd:date மற்றும் மற்றவர்கள்.
  • முன்னறிவிப்புகளின் இந்த நிகழ்வுகளின் இணைப்பு ஒரு பொதுவான முன்கணிப்புடன் படிவத்தின் மும்மடங்குகளால் நிறுவப்பட்டது :isMarriedTo1 rdf:singletonPropertyOf :isMarriedTo.
  • அது என்று தெளிவாக இருக்கிறது rdf:singletonPropertyOf rdfs:subPropertyOf rdf:type, ஆனால் நீங்கள் ஏன் எழுதக்கூடாது என்று சிந்தியுங்கள் :isMarriedTo1 rdf:type :isMarriedTo.

"எல்பிஜி ஆதரவு" பிரச்சனை RDFS அளவில் இங்கே தீர்க்கப்படுகிறது. அத்தகைய முடிவு பொருத்தமானதாக சேர்க்கப்பட வேண்டும் நிலையான. RDF ஸ்டோர்களில் சில மாற்றங்கள் தேவைப்படலாம், அவை விளைவுகளை இணைக்கின்றன, ஆனால் இப்போதைக்கு, Singleton Property என்பது மற்றொரு மாடலிங் நுட்பமாகக் கருதப்படலாம்.

வி.1.2. மறுசீரமைப்பு சரியாக முடிந்தது

குறைவான அப்பாவியான அணுகுமுறைகள், சொத்து நிகழ்வுகள் மும்மடங்குகளால் முழுமையாக நிலைநிறுத்தப்படக்கூடியவை என்பதை உணர்ந்ததில் இருந்து உருவாகின்றன. மும்மூர்த்திகளைப் பற்றி ஏதாவது சொல்ல முடிந்தால், சொத்து நிகழ்வுகளைப் பற்றி பேச முடியும்.

இந்த அணுகுமுறைகளில் மிகவும் வலுவானது RDF*ஆர்.டி.ஆர். பிறந்தார் பிளேஸ்கிராப்பின் ஆழத்தில். இது ஆரம்பத்திலிருந்தே தேர்ந்தெடுக்கப்பட்டார் உங்களுக்கும் AnzoGraph க்கும். அணுகுமுறையின் திடத்தன்மை அதன் கட்டமைப்பிற்குள் இருக்கும் உண்மையால் தீர்மானிக்கப்படுகிறது வழங்கப்படுகின்றன தொடர்புடைய மாற்றங்கள் RDF சொற்பொருள். இருப்பினும், புள்ளி மிகவும் எளிமையானது. RDF இன் ஆமை வரிசையாக்கத்தில் நீங்கள் இப்போது இப்படி எழுதலாம்:

<<:bob :isMarriedTo :alice>> :since "2013-09-13"^^xsd:date .

வி.1.3. மற்ற அணுகுமுறைகள்

முறையான சொற்பொருளில் நீங்கள் கவலைப்பட முடியாது, ஆனால் மும்மடங்குகளுக்கு சில அடையாளங்காட்டிகள் உள்ளன, அவை நிச்சயமாக URIகள் மற்றும் இந்த URI களைக் கொண்டு புதிய மும்மடங்குகளை உருவாக்குகின்றன. SPARQL இல் இந்த URIகளுக்கான அணுகலை வழங்குவது மட்டுமே எஞ்சியுள்ளது. அதனால் வருகிறது நட்சத்திர நாய்.

அலெக்ரோகிராஃபில் சென்றார் ஒரு இடைநிலை வழியில். அலெக்ரோகிராஃபில் மும்மடங்கு அடையாளங்காட்டிகள் என்று அறியப்படுகிறது இருக்கிறது, ஆனால் மூன்று பண்புகளை செயல்படுத்தும் போது அவை வெளியே ஒட்டாது. இருப்பினும், இது இன்னும் முறையான சொற்பொருளிலிருந்து வெகு தொலைவில் உள்ளது. மும்மடங்கு பண்புக்கூறுகள் URI கள் அல்ல என்பது குறிப்பிடத்தக்கது, மேலும் இந்த பண்புக்கூறுகளின் மதிப்புகள் எழுத்துப்பூர்வமாக மட்டுமே இருக்க முடியும். எல்பிஜி பின்பற்றுபவர்கள் அவர்கள் விரும்பியதைப் பெறுகிறார்கள். சிறப்பாகக் கண்டுபிடிக்கப்பட்ட NQX வடிவமைப்பில், RDF*க்கு மேலே உள்ளதைப் போன்ற ஒரு உதாரணம் இதுபோல் தெரிகிறது:

:bob :marriedTo :alice {"since" : "2013-09-13"}

V.2. வினவல் மொழிகள்

மாதிரி மட்டத்தில் எல்பிஜியை ஒரு வழியில் அல்லது வேறு வழியில் ஆதரிப்பதால், அத்தகைய மாதிரியில் தரவைப் பற்றிய வினவல்களை நீங்கள் சாத்தியமாக்க வேண்டும்.

 SELECT * { <<:bob :isMarriedTo ?wife>> :since ?since }

  • அன்சோகிராஃப் கூட ஆதரிக்கிறது பிரகாசம்* மற்றும் ஆதரிக்கப் போகிறது சைபர், Neo4j இல் ஒரு வினவல் மொழி.
  • ஸ்டார்டாக் அதன் சொந்தத்தை ஆதரிக்கிறது расширение SPARQL மற்றும் மீண்டும் கிரெம்லின். இது போன்ற ஒன்றைப் பயன்படுத்தி SPARQL இல் மும்மடங்கு URI மற்றும் "மெட்டா-தகவல்" ஆகியவற்றைப் பெறலாம்:

SELECT * {
    BIND (stardog:identifier(:bob, :isMarriedTo, ?wife) AS ?id)
    ?id :since ?since
}

  • அலெக்ரோகிராஃப் அதன் சொந்தத்தை ஆதரிக்கிறது расширение பிரகாசம்:

 SELECT * { ("since" ?since)  franz:attributesNameValue  ( :bob :marriedTo ?wife ) }

மூலம், GraphDB ஒரு காலத்தில் LPG ஐ ஆதரிக்காமல் Tinkerpop/Gremlin ஐ ஆதரித்தது, ஆனால் இது பதிப்பு 8.0 அல்லது 8.1 இல் நிறுத்தப்பட்டது.

VI. உரிமங்களை இறுக்குவது

"தேர்வுக்கான டிரிபிள்ஸ்டோர்" மற்றும் "ஓப்பன் சோர்ஸ் டிரிபிள்ஸ்டோர்" தொகுப்புகளின் குறுக்குவெட்டில் சமீபத்திய சேர்த்தல்கள் எதுவும் இல்லை. புதிய ஓப்பன் சோர்ஸ் ஆர்டிஎஃப் ஸ்டோர்கள் அன்றாட பயன்பாட்டிற்கான சிறந்த தேர்வாக இருந்து வெகு தொலைவில் உள்ளன, மேலும் நான் பயன்படுத்த விரும்பும் புதிய டிரிபிள் ஸ்டோர்கள் (அன்ஸோகிராஃப் போன்றவை) மூடப்பட்ட மூலமாகும். மாறாக, குறைவதைப் பற்றி பேசலாம்.

நிச்சயமாக, திறந்த மூலமானது கடந்த காலத்தில் மூடப்படவில்லை, ஆனால் சில ஓப்பன் சோர்ஸ் களஞ்சியங்கள் படிப்படியாக தேர்ந்தெடுக்கப்பட வேண்டியவையாக கருதப்படுவதில்லை. ஓப்பன்சோர்ஸ் பதிப்பைக் கொண்ட விர்டுவோசோ, பிழைகளில் மூழ்கிக்கொண்டிருக்கிறது என்பது என் கருத்து. பிளேஸ்கிராஃப் AWS ஆல் வாங்கப்பட்டது மற்றும் அமேசான் நெப்டியூனின் அடிப்படையை உருவாக்கியது; குறைந்தபட்சம் இன்னும் ஒரு வெளியீடு இருக்குமா என்பது இப்போது தெளிவாகத் தெரியவில்லை. எஞ்சியிருப்பது ஜெனா மட்டுமே...

ஓப்பன் சோர்ஸ் மிகவும் முக்கியமல்ல, ஆனால் நீங்கள் அதை முயற்சி செய்ய விரும்பினால், எல்லாமே முன்பை விட குறைவாகவே இருக்கும். உதாரணத்திற்கு:

  • நட்சத்திர நாய் நிறுத்துகிறது இலவச பதிப்பை விநியோகிக்கவும் (இருப்பினும், வழக்கமான பதிப்பின் சோதனை காலம் இரட்டிப்பாகியுள்ளது);
  • в GraphDB கிளவுட், முன்பு நீங்கள் இலவச அடிப்படைத் திட்டத்தைத் தேர்வுசெய்தால், புதிய பயனர் பதிவுகள் இடைநிறுத்தப்பட்டுள்ளன.

பொதுவாக, சராசரி ஐடி நபருக்கு, இடம் மேலும் மேலும் அணுக முடியாததாகி வருகிறது; அதன் வளர்ச்சி பெருநிறுவனங்களாக மாறி வருகிறது.

ஆதாரம்: www.habr.com

கருத்தைச் சேர்