சொற்பொருள் வலை மற்றும் இணைக்கப்பட்ட தரவு ஆகியவை விண்வெளி போன்றது: அங்கு உயிர் இல்லை. இன்னும் கொஞ்ச நேரம் அங்கே போக... சரி, “நான் விண்வெளி வீராங்கனையாக ஆக வேண்டும்” என்று சிறுவயதில் உங்களிடம் என்ன சொன்னார்கள் என்று தெரியவில்லை. ஆனால் பூமியில் என்ன நடக்கிறது என்பதை நீங்கள் கவனிக்கலாம்; ஒரு அமெச்சூர் வானியலாளர் அல்லது ஒரு தொழில்முறை கூட ஆக மிகவும் எளிதானது.
கட்டுரை RDF சேமிப்பக உலகின் சமீபத்திய, பல மாதங்களுக்கு மேல் இல்லாத போக்குகளில் கவனம் செலுத்தும். முதல் பத்தியில் உள்ள உருவகம் வெட்டப்பட்ட காவிய அளவிலான விளம்பரப் படத்தால் ஈர்க்கப்பட்டது.
காவியப் படம்

I. RDF அணுகலுக்கான GraphQL
GraphQL ஆனது உலகளாவிய தரவுத்தள அணுகல் மொழியாக மாறுவதை நோக்கமாகக் கொண்டுள்ளது. GraphQL ஐப் பயன்படுத்தி RDF ஐ அணுகும் திறன் பற்றி என்ன?
பெட்டிக்கு வெளியே இந்த வாய்ப்பை வழங்கியவர்:
- ஸ்டார்டாக் (, );
- TopQuadrant தயாரிப்புகள் (, ).
களஞ்சியம் அத்தகைய வாய்ப்பை வழங்கவில்லை என்றால், பொருத்தமான "தீர்வை" எழுதுவதன் மூலம் அதை சுயாதீனமாக செயல்படுத்த முடியும். எடுத்துக்காட்டாக, பிரெஞ்சு திட்டத்தில் இதைத்தான் செய்தார்கள் . அல்லது நீங்கள் இனி எதையும் எழுத முடியாது, ஆனால் எடுத்துக் கொள்ளுங்கள் .
செமாண்டிக் வெப் மற்றும் லிங்க்ட் டேட்டாவைக் கடைப்பிடிப்பவரின் பார்வையில், இவை அனைத்தும் சோகமானது, ஏனெனில் இது அடுத்த தரவு சிலோவைச் சுற்றி கட்டமைக்கப்பட்ட ஒருங்கிணைப்புகளுக்காக வடிவமைக்கப்பட்டுள்ளது மற்றும் பொருத்தமான தளங்கள் அல்ல (ஆர்டிஎஃப் கடைகள், நிச்சயமாக) .
GraphQL ஐ SPARQL உடன் ஒப்பிடுவதிலிருந்து வரும் பதிவுகள் இரண்டு மடங்கு.
- ஒருபுறம், GraphQL ஆனது SPARQL இன் தொலைதூர உறவினராகத் தெரிகிறது: இது REST க்கு பொதுவான வினவல்களின் மறு மாதிரி மற்றும் பெருக்கத்தின் சிக்கல்களைத் தீர்க்கிறது - இது இல்லாமல், அநேகமாக, அதைக் கருத்தில் கொள்ள முடியாது. கேள்வி மொழி, குறைந்தபட்சம் வலைக்கு;
- மறுபுறம், GraphQL இன் கடினமான திட்டம் ஏமாற்றமளிக்கிறது. அதன்படி, RDF இன் முழு பிரதிபலிப்புடன் ஒப்பிடும்போது அதன் "உள்நோக்கு" மிகவும் குறைவாகவே தெரிகிறது. சொத்து பாதைகளின் அனலாக் எதுவும் இல்லை, எனவே அது ஏன் “வரைபடம்-” என்பது கூட தெளிவாகத் தெரியவில்லை.
II. மோங்கோடிபிக்கான அடாப்டர்கள்
முந்தைய போக்கை நிரப்பும் போக்கு.
- இப்போது Stardog இல் - குறிப்பாக, அனைத்தும் ஒரே GraphQL இல் - மோங்கோடிபி தரவின் மேப்பிங்கை மெய்நிகர் RDF வரைபடங்களாக உள்ளமைக்கவும்;
- GraphDB சமீபத்தில் உள்ளது MongoDB வினவலில் SPARQL இல் துண்டுகளைச் செருகவும்.
JSON ஆதாரங்களுக்கான அடாப்டர்களைப் பற்றி நாம் விரிவாகப் பேசினால், இந்த ஆதாரங்களில் சேமிக்கப்பட்டுள்ள JSON ஐ RDF ஆகக் குறிப்பிடுவதற்கு அதிகமாகவோ அல்லது குறைவாகவோ "பறக்க" அனுமதிக்கும், நீண்ட காலத்தை நாம் நினைவுபடுத்தலாம் , சரிசெய்யக்கூடியது, , அப்பாச்சி ஜெனாவுக்கு.
முதல் இரண்டு போக்குகளை சுருக்கமாக, RDF சேமிப்பகங்கள் "பாலிகிளாட் நிலைத்தன்மை" நிலைமைகளில் ஒருங்கிணைப்பு மற்றும் செயல்பாட்டிற்கான முழு தயார்நிலையை நிரூபிக்கின்றன என்று கூறலாம். எவ்வாறாயினும், இந்த பிந்தையது நீண்ட காலமாக நாகரீகமாக இல்லை, மேலும் மாற்றப்படுகிறது பல மாதிரி. RDF சேமிப்பக உலகில் பல மாடலிங் பற்றி என்ன?
சுருக்கமாக, வழி இல்லை. மல்டி-மாடல் டிபிஎம்எஸ்கள் என்ற தலைப்பில் ஒரு தனி கட்டுரையை நான் அர்ப்பணிக்க விரும்புகிறேன், ஆனால் தற்போது வரைபட மாதிரியின் அடிப்படையில் பல மாதிரி டிபிஎம்எஸ்கள் இல்லை என்பதைக் கவனத்தில் கொள்ளலாம் (ஆர்.டி.எஃப் அதன் வகையாகக் கருதப்படலாம்) . சில சிறிய மல்டி-மாடலிங் - மாற்று LPG வரைபட மாதிரிக்கான RDF சேமிப்பக ஆதரவு - இதில் விவாதிக்கப்படும் .
III. OLTP vs. OLAP
இருப்பினும், அதே கார்ட்னர் மல்டிமாடல் என்பது முதன்மையாக ஒரு நிபந்தனை அல்ல அறுவை சிகிச்சை அறைகள் டிபிஎம்எஸ். இது புரிந்துகொள்ளத்தக்கது: "பன்முக சேமிப்பு" சூழ்நிலையில், பரிவர்த்தனையுடன் முக்கிய சிக்கல்கள் எழுகின்றன.
ஆனால் OLTP-OLAP அளவில் RDF சேமிப்பகங்கள் எங்கே உள்ளன? நான் இந்த வழியில் பதிலளிப்பேன்: அங்கேயும் இல்லை இங்கேயும் இல்லை. அவை எதை நோக்கமாகக் கொண்டுள்ளன என்பதைக் குறிக்க, சில மூன்றாவது சுருக்கம் தேவை. ஒரு விருப்பமாக நான் பரிந்துரைக்கிறேன் OLIP - ஆன்லைன் அறிவுசார் செயலாக்கம்.
இருப்பினும், இன்னும்:
- கிராஃப்டிபியில் செயல்படுத்தப்பட்ட மோங்கோடிபி உடனான ஒருங்கிணைப்பு வழிமுறைகள் குறைவாக இல்லை செயல்திறன் சிக்கல்களை எழுதுவதற்கு வேலை செய்ய;
- ஸ்டார்டாக் இன்னும் அதிகமாகவும் முழுமையாகவும் செல்கிறது இயந்திரம், மீண்டும் பதிவு செயல்திறனை மேம்படுத்தும் குறிக்கோளுடன்.
இப்போது ஒரு புதிய வீரரை சந்தைக்கு அறிமுகப்படுத்துகிறேன். IBM Netezza மற்றும் Amazon Redshift ஆகியவற்றின் படைப்பாளர்களிடமிருந்து - . அதன் அடிப்படையில் ஒரு தயாரிப்புக்கான விளம்பரத்தின் படம் கட்டுரையின் தொடக்கத்தில் வெளியிடப்பட்டது. AnzoGraph தன்னை ஒரு GOLAP தீர்வாக நிலைநிறுத்துகிறது. சாளர செயல்பாடுகளுடன் கூடிய SPARQL ஐ நீங்கள் எப்படி விரும்புகிறீர்கள்? —
SELECT ?month (COUNT(?event) OVER (PARTITION BY ?month) AS ?events) WHERE { … }IV. ராக்ஸ்டிபி
ஏற்கனவே அதிகமாக உள்ளது Stardog 7 Beta இன் அறிவிப்புக்கு, Stardog RocksDB ஐ அடிப்படை சேமிப்பக அமைப்பாகப் பயன்படுத்தப் போகிறது - ஒரு முக்கிய மதிப்பு ஸ்டோர், Google இன் LevelDB இன் ஃபேஸ்புக் ஃபோர்க். ஒரு குறிப்பிட்ட போக்கைப் பற்றி பேசுவது ஏன் மதிப்பு?
முதலில், தீர்மானித்தல் , RDF சேமிப்பகங்கள் மட்டுமல்ல RocksDB க்கு "இடமாற்றம்" செய்யப்பட்டுள்ளது. ArangoDB, MongoDB, MySQL மற்றும் MariaDB, Cassandra ஆகியவற்றில் RocksDB ஐ சேமிப்பக இயந்திரமாகப் பயன்படுத்துவதற்கான திட்டங்கள் உள்ளன.
இரண்டாவதாக, தொடர்புடைய தலைப்புகளில் திட்டங்கள் (அதாவது தயாரிப்புகள் அல்ல) RocksDB இல் உருவாக்கப்படுகின்றன.
எடுத்துக்காட்டாக, eBay RocksDB ஐப் பயன்படுத்துகிறது உங்கள் "அறிவு வரைபடத்திற்கு". சொல்லப்போனால், படிக்க வேடிக்கையாக இருக்கிறது: வினவல் மொழி வீட்டில் வளர்க்கப்பட்ட வடிவமாகத் தொடங்கியது, ஆனால் சமீபகாலமாக அது SPARQL ஐப் போலவே மாறுகிறது.. நகைச்சுவையைப் போல: நாம் எவ்வளவு அறிவு வரைபடத்தை உருவாக்கினாலும், நாம் இன்னும் RDF உடன் முடிவடைகிறோம்.
மற்றொரு உதாரணம் - சில மாதங்களுக்கு முன்பு தோன்றியது . அறிமுகம் செய்யப்படுவதற்கு முன், விக்கிடேட்டாவின் வரலாற்றுத் தகவல்களை அணுக வேண்டியிருந்தது நிலையான மீடியாவிக்கி API க்கு. இப்போது தூய SPARQL மூலம் நிறைய சாத்தியம். "ஹூட்டின் கீழ்" ராக்ஸ்டிபியும் உள்ளது. மூலம், WDHQS ஆனது, Google அறிவு வரைபடத்தில் Freebase ஐ இறக்குமதி செய்த நபரால் உருவாக்கப்பட்டது.
V. LPG ஆதரவு
LPG வரைபடங்களுக்கும் RDF வரைபடங்களுக்கும் உள்ள முக்கிய வேறுபாட்டை உங்களுக்கு நினைவூட்டுகிறேன்.
LPG இல், அளவுகோல் பண்புகளை விளிம்பு நிகழ்வுகளுக்கு ஒதுக்கலாம், RDF இல் அவை விளிம்பு "வகைகளுக்கு" மட்டுமே ஒதுக்கப்படும் (ஆனால் அளவிடும் பண்புகள் மட்டுமல்ல, சாதாரண இணைப்புகளும்). LPG உடன் ஒப்பிடும்போது RDF இன் இந்த வரம்பு ஒன்று அல்லது மற்றொரு மாடலிங் நுட்பம். RDF உடன் ஒப்பிடும்போது LPGயின் வரம்புகளை சமாளிப்பது மிகவும் கடினம், ஆனால் LPG வரைபடங்கள் RDF வரைபடங்களை விட ஹராரி பாடப்புத்தகத்தின் படங்களைப் போலவே இருக்கின்றன, அதனால்தான் மக்கள் அவற்றை விரும்புகிறார்கள்.
வெளிப்படையாக, "எல்பிஜி ஆதரவு" பணி இரண்டு பகுதிகளாக விழுகிறது:
- RDF மாதிரியில் மாற்றங்களைச் செய்தல், அது LPG கட்டமைப்புகளை உருவகப்படுத்துவதை சாத்தியமாக்குகிறது;
- இந்த மாற்றியமைக்கப்பட்ட மாதிரியில் தரவை அணுகுவதை சாத்தியமாக்கும் RDF வினவல் மொழியில் மாற்றங்களைச் செய்தல் அல்லது பிரபலமான எல்பிஜி வினவல் மொழிகளில் இந்த மாதிரியை வினவல் செய்யும் திறனை செயல்படுத்துதல்.
வி.1. தரவு மாதிரி
இங்கே பல சாத்தியமான அணுகுமுறைகள் உள்ளன.
வி.1.1. சிங்கிள்டன் சொத்து
RDF மற்றும் LPG ஆகியவற்றை ஒத்திசைப்பதற்கான மிகச் சிறந்த அணுகுமுறை அநேகமாக இருக்கலாம் :
- எடுத்துக்காட்டாக, முன்னறிவிப்புக்கு பதிலாக
:isMarriedToமுன்னறிவிப்புகள் பயன்படுத்தப்படுகின்றன:isMarriedTo1,:isMarriedTo2மற்றும் பல. - இந்த முன்னறிவிப்புகள் புதிய மும்மடங்குகளின் பாடங்களாக மாறும்:
:isMarriedTo1 :since "2013-09-13"^^xsd:dateமற்றும் மற்றவர்கள். - முன்னறிவிப்புகளின் இந்த நிகழ்வுகளின் இணைப்பு ஒரு பொதுவான முன்கணிப்புடன் படிவத்தின் மும்மடங்குகளால் நிறுவப்பட்டது
:isMarriedTo1 rdf:singletonPropertyOf :isMarriedTo. - அது என்று தெளிவாக இருக்கிறது
rdf:singletonPropertyOf rdfs:subPropertyOf rdf:type, ஆனால் நீங்கள் ஏன் எழுதக்கூடாது என்று சிந்தியுங்கள்:isMarriedTo1 rdf:type :isMarriedTo.
"எல்பிஜி ஆதரவு" பிரச்சனை RDFS அளவில் இங்கே தீர்க்கப்படுகிறது. அத்தகைய முடிவு பொருத்தமானதாக சேர்க்கப்பட வேண்டும் . RDF ஸ்டோர்களில் சில மாற்றங்கள் தேவைப்படலாம், அவை விளைவுகளை இணைக்கின்றன, ஆனால் இப்போதைக்கு, Singleton Property என்பது மற்றொரு மாடலிங் நுட்பமாகக் கருதப்படலாம்.
வி.1.2. மறுசீரமைப்பு சரியாக முடிந்தது
குறைவான அப்பாவியான அணுகுமுறைகள், சொத்து நிகழ்வுகள் மும்மடங்குகளால் முழுமையாக நிலைநிறுத்தப்படக்கூடியவை என்பதை உணர்ந்ததில் இருந்து உருவாகின்றன. மும்மூர்த்திகளைப் பற்றி ஏதாவது சொல்ல முடிந்தால், சொத்து நிகழ்வுகளைப் பற்றி பேச முடியும்.
இந்த அணுகுமுறைகளில் மிகவும் வலுவானது ஆர்.டி.ஆர். பிளேஸ்கிராப்பின் ஆழத்தில். இது ஆரம்பத்திலிருந்தே உங்களுக்கும் AnzoGraph க்கும். அணுகுமுறையின் திடத்தன்மை அதன் கட்டமைப்பிற்குள் இருக்கும் உண்மையால் தீர்மானிக்கப்படுகிறது தொடர்புடைய மாற்றங்கள் . இருப்பினும், புள்ளி மிகவும் எளிமையானது. RDF இன் ஆமை வரிசையாக்கத்தில் நீங்கள் இப்போது இப்படி எழுதலாம்:
<<:bob :isMarriedTo :alice>> :since "2013-09-13"^^xsd:date .வி.1.3. மற்ற அணுகுமுறைகள்
முறையான சொற்பொருளில் நீங்கள் கவலைப்பட முடியாது, ஆனால் மும்மடங்குகளுக்கு சில அடையாளங்காட்டிகள் உள்ளன, அவை நிச்சயமாக URIகள் மற்றும் இந்த URI களைக் கொண்டு புதிய மும்மடங்குகளை உருவாக்குகின்றன. SPARQL இல் இந்த URIகளுக்கான அணுகலை வழங்குவது மட்டுமே எஞ்சியுள்ளது. அதனால் நட்சத்திர நாய்.
அலெக்ரோகிராஃபில் ஒரு இடைநிலை வழியில். அலெக்ரோகிராஃபில் மும்மடங்கு அடையாளங்காட்டிகள் என்று அறியப்படுகிறது , ஆனால் மூன்று பண்புகளை செயல்படுத்தும் போது அவை வெளியே ஒட்டாது. இருப்பினும், இது இன்னும் முறையான சொற்பொருளிலிருந்து வெகு தொலைவில் உள்ளது. மும்மடங்கு பண்புக்கூறுகள் URI கள் அல்ல என்பது குறிப்பிடத்தக்கது, மேலும் இந்த பண்புக்கூறுகளின் மதிப்புகள் எழுத்துப்பூர்வமாக மட்டுமே இருக்க முடியும். எல்பிஜி பின்பற்றுபவர்கள் அவர்கள் விரும்பியதைப் பெறுகிறார்கள். சிறப்பாகக் கண்டுபிடிக்கப்பட்ட NQX வடிவமைப்பில், RDF*க்கு மேலே உள்ளதைப் போன்ற ஒரு உதாரணம் இதுபோல் தெரிகிறது:
:bob :marriedTo :alice {"since" : "2013-09-13"}V.2. வினவல் மொழிகள்
மாதிரி மட்டத்தில் எல்பிஜியை ஒரு வழியில் அல்லது வேறு வழியில் ஆதரிப்பதால், அத்தகைய மாதிரியில் தரவைப் பற்றிய வினவல்களை நீங்கள் சாத்தியமாக்க வேண்டும்.
- RDF* வினவல்களை ஆதரிக்கும் Blazegraph и . ஒரு SPARQL* வினவல் இப்படி இருக்கும்:
SELECT * { <<:bob :isMarriedTo ?wife>> :since ?since }- அன்சோகிராஃப் கூட ஆதரிக்கிறது மற்றும் ஆதரிக்கப் போகிறது , Neo4j இல் ஒரு வினவல் மொழி.
- ஸ்டார்டாக் அதன் சொந்தத்தை ஆதரிக்கிறது SPARQL மற்றும் கிரெம்லின். இது போன்ற ஒன்றைப் பயன்படுத்தி SPARQL இல் மும்மடங்கு URI மற்றும் "மெட்டா-தகவல்" ஆகியவற்றைப் பெறலாம்:
SELECT * {
BIND (stardog:identifier(:bob, :isMarriedTo, ?wife) AS ?id)
?id :since ?since
}- அலெக்ரோகிராஃப் அதன் சொந்தத்தை ஆதரிக்கிறது பிரகாசம்:
SELECT * { ("since" ?since) franz:attributesNameValue ( :bob :marriedTo ?wife ) }மூலம், GraphDB ஒரு காலத்தில் LPG ஐ ஆதரிக்காமல் Tinkerpop/Gremlin ஐ ஆதரித்தது, ஆனால் இது பதிப்பு 8.0 அல்லது 8.1 இல் நிறுத்தப்பட்டது.
VI. உரிமங்களை இறுக்குவது
"தேர்வுக்கான டிரிபிள்ஸ்டோர்" மற்றும் "ஓப்பன் சோர்ஸ் ட்ரிப்பிள்ஸ்டோர்" தொகுப்புகளின் குறுக்குவெட்டில் சமீபத்திய சேர்த்தல்கள் எதுவும் இல்லை. புதிய ஓப்பன் சோர்ஸ் ஆர்டிஎஃப் ஸ்டோர்கள் அன்றாடப் பயன்பாட்டிற்கான சிறந்த தேர்வாக இருந்து வெகு தொலைவில் உள்ளன, மேலும் நான் பயன்படுத்த விரும்பும் புதிய ஆர்டிஎஃப் ஸ்டோர்கள் (அன்சோகிராஃப் போன்றவை) மூடிய மூலமாகும். மாறாக, குறைப்பு பற்றி கூட பேசலாம்.
நிச்சயமாக, திறந்த மூலமானது கடந்த காலத்தில் மூடப்படவில்லை, ஆனால் சில ஓப்பன் சோர்ஸ் களஞ்சியங்கள் படிப்படியாக தேர்ந்தெடுக்கப்பட வேண்டியவையாக கருதப்படுவதில்லை. ஓப்பன்சோர்ஸ் பதிப்பைக் கொண்ட விர்டுவோசோ, பிழைகளில் மூழ்கிக்கொண்டிருக்கிறது என்பது என் கருத்து. பிளேஸ்கிராஃப் AWS ஆல் வாங்கப்பட்டது மற்றும் அமேசான் நெப்டியூனின் அடிப்படையை உருவாக்கியது; குறைந்தபட்சம் இன்னும் ஒரு வெளியீடு இருக்குமா என்பது இப்போது தெளிவாகத் தெரியவில்லை. எஞ்சியிருப்பது ஜெனா மட்டுமே...
ஓப்பன் சோர்ஸ் மிகவும் முக்கியமல்ல, ஆனால் நீங்கள் அதை முயற்சி செய்ய விரும்பினால், எல்லாமே முன்பை விட குறைவாகவே இருக்கும். உதாரணத்திற்கு:
- நட்சத்திர நாய் இலவச பதிப்பை விநியோகிக்கவும் (இருப்பினும், வழக்கமான பதிப்பின் சோதனை காலம் இரட்டிப்பாகியுள்ளது);
- в , முன்பு நீங்கள் ஒரு இலவச அடிப்படைத் திட்டத்தைத் தேர்வுசெய்யலாம், புதிய பயனர் பதிவுகளை இடைநிறுத்தியுள்ளது.
பொதுவாக, சராசரி ஐடி நபருக்கு, இடம் மேலும் மேலும் அணுக முடியாததாகி வருகிறது; அதன் வளர்ச்சி பெருநிறுவனங்களாக மாறி வருகிறது.
ஆதாரம்: www.habr.com
