RDF சேமிப்பகத்தில் இப்போது என்ன நடக்கிறது?

Semantic Web и Linked Data подобны ближнему космосу: жизни там нет. Чтобы отправиться туда на более-менее длительный срок… ну, не знаю, что говорили вам в детстве в ответ на «хочу стать космонавтом». Но понаблюдать за происходящим можно и находясь на Земле; стать астрономом-любителем или даже профессионалом гораздо проще.

В статье речь пойдет о свежих, не старее нескольких месяцев, трендах из мира RDF-хранилищ. Метафора в первом абзаце была навеяна эпических размеров рекламной картинкой под катом.


காவியப் படம்

RDF சேமிப்பகத்தில் இப்போது என்ன நடக்கிறது?

I. RDF அணுகலுக்கான GraphQL

அவர்கள் சொல்கிறார்கள்GraphQL ஆனது உலகளாவிய தரவுத்தள அணுகல் மொழியாக மாறுவதை நோக்கமாகக் கொண்டுள்ளது. GraphQL ஐப் பயன்படுத்தி RDF ஐ அணுகும் திறன் பற்றி என்ன?

பெட்டிக்கு வெளியே இந்த வாய்ப்பை வழங்கியவர்:

களஞ்சியம் அத்தகைய வாய்ப்பை வழங்கவில்லை என்றால், பொருத்தமான "தீர்வை" எழுதுவதன் மூலம் அதை சுயாதீனமாக செயல்படுத்த முடியும். எடுத்துக்காட்டாக, பிரெஞ்சு திட்டத்தில் இதைத்தான் செய்தார்கள் டேட்டா டூரிசம். அல்லது நீங்கள் இனி எதையும் எழுத முடியாது, ஆனால் எடுத்துக் கொள்ளுங்கள் HyperGraphQL.

செமாண்டிக் வெப் மற்றும் லிங்க்ட் டேட்டாவைக் கடைப்பிடிப்பவரின் பார்வையில், இவை அனைத்தும் சோகமானது, ஏனெனில் இது அடுத்த தரவு சிலோவைச் சுற்றி கட்டமைக்கப்பட்ட ஒருங்கிணைப்புகளுக்காக வடிவமைக்கப்பட்டுள்ளது மற்றும் பொருத்தமான தளங்கள் அல்ல (ஆர்டிஎஃப் கடைகள், நிச்சயமாக) .

GraphQL ஐ SPARQL உடன் ஒப்பிடுவதிலிருந்து வரும் பதிவுகள் இரண்டு மடங்கு.

  • ஒருபுறம், GraphQL ஆனது SPARQL இன் தொலைதூர உறவினராகத் தெரிகிறது: இது REST க்கு பொதுவான வினவல்களின் மறு மாதிரி மற்றும் பெருக்கத்தின் சிக்கல்களைத் தீர்க்கிறது - இது இல்லாமல், அநேகமாக, அதைக் கருத்தில் கொள்ள முடியாது. கேள்வி மொழி, குறைந்தபட்சம் வலைக்கு;
  • மறுபுறம், GraphQL இன் கடினமான திட்டம் ஏமாற்றமளிக்கிறது. அதன்படி, RDF இன் முழு பிரதிபலிப்புடன் ஒப்பிடும்போது அதன் "உள்நோக்கு" மிகவும் குறைவாகவே தெரிகிறது. சொத்து பாதைகளின் அனலாக் எதுவும் இல்லை, எனவே அது ஏன் “வரைபடம்-” என்பது கூட தெளிவாகத் தெரியவில்லை.

II. மோங்கோடிபிக்கான அடாப்டர்கள்

முந்தைய போக்கை நிரப்பும் போக்கு.

  • в Stardog теперь சாத்தியமான - குறிப்பாக, அனைத்தும் ஒரே GraphQL இல் - மோங்கோடிபி தரவின் மேப்பிங்கை மெய்நிகர் RDF வரைபடங்களாக உள்ளமைக்கவும்;
  • GraphDB с недавних пор அது அனுமதிக்கிறது MongoDB வினவலில் SPARQL இல் துண்டுகளைச் செருகவும்.

JSON ஆதாரங்களுக்கான அடாப்டர்களைப் பற்றி நாம் விரிவாகப் பேசினால், இந்த ஆதாரங்களில் சேமிக்கப்பட்டுள்ள JSON ஐ RDF ஆகக் குறிப்பிடுவதற்கு அதிகமாகவோ அல்லது குறைவாகவோ "பறக்க" அனுமதிக்கும், நீண்ட காலத்தை நாம் நினைவுபடுத்தலாம் SPARQL உருவாக்கு, சரிசெய்யக்கூடியது, உதாரணமாக, அப்பாச்சி ஜெனாவுக்கு.

முதல் இரண்டு போக்குகளை சுருக்கமாக, RDF சேமிப்பகங்கள் "பாலிகிளாட் நிலைத்தன்மை" நிலைமைகளில் ஒருங்கிணைப்பு மற்றும் செயல்பாட்டிற்கான முழு தயார்நிலையை நிரூபிக்கின்றன என்று கூறலாம். எவ்வாறாயினும், இந்த பிந்தையது நீண்ட காலமாக நாகரீகமாக இல்லை, மேலும் மாற்றப்படுகிறது வருகிறது பல மாதிரி. RDF சேமிப்பக உலகில் பல மாடலிங் பற்றி என்ன?

சுருக்கமாக, வழி இல்லை. மல்டி-மாடல் டிபிஎம்எஸ்கள் என்ற தலைப்பில் ஒரு தனி கட்டுரையை நான் அர்ப்பணிக்க விரும்புகிறேன், ஆனால் தற்போது வரைபட மாதிரியின் அடிப்படையில் பல மாதிரி டிபிஎம்எஸ்கள் இல்லை என்பதைக் கவனத்தில் கொள்ளலாம் (ஆர்.டி.எஃப் அதன் வகையாகக் கருதப்படலாம்) . சில சிறிய மல்டி-மாடலிங் - மாற்று LPG வரைபட மாதிரிக்கான RDF சேமிப்பக ஆதரவு - இதில் விவாதிக்கப்படும் பிரிவு V.

III. OLTP vs. OLAP

இருப்பினும், அதே கார்ட்னர் அவர் எழுதுகிறார்மல்டிமாடல் என்பது முதன்மையாக ஒரு நிபந்தனை அல்ல அறுவை சிகிச்சை அறைகள் டிபிஎம்எஸ். இது புரிந்துகொள்ளத்தக்கது: "பன்முக சேமிப்பு" சூழ்நிலையில், பரிவர்த்தனையுடன் முக்கிய சிக்கல்கள் எழுகின்றன.

ஆனால் OLTP-OLAP அளவில் RDF சேமிப்பகங்கள் எங்கே உள்ளன? நான் இந்த வழியில் பதிலளிப்பேன்: அங்கேயும் இல்லை இங்கேயும் இல்லை. அவை எதை நோக்கமாகக் கொண்டுள்ளன என்பதைக் குறிக்க, சில மூன்றாவது சுருக்கம் தேவை. ஒரு விருப்பமாக நான் பரிந்துரைக்கிறேன் OLIP - ஆன்லைன் அறிவுசார் செயலாக்கம்.

இருப்பினும், இன்னும்:

  • கிராஃப்டிபியில் செயல்படுத்தப்பட்ட மோங்கோடிபி உடனான ஒருங்கிணைப்பு வழிமுறைகள் குறைவாக இல்லை நோக்கம் செயல்திறன் சிக்கல்களை எழுதுவதற்கு வேலை செய்ய;
  • ஸ்டார்டாக் இன்னும் அதிகமாகவும் முழுமையாகவும் செல்கிறது மீண்டும் எழுதுகிறார் இயந்திரம், மீண்டும் பதிவு செயல்திறனை மேம்படுத்தும் குறிக்கோளுடன்.

А теперь разрешите представить нового игрока на рынке. от создателей IBM Netezza и Amazon Redshift — AnzoGraph. அதன் அடிப்படையில் ஒரு தயாரிப்புக்கான விளம்பரத்தின் படம் கட்டுரையின் தொடக்கத்தில் வெளியிடப்பட்டது. AnzoGraph தன்னை ஒரு GOLAP தீர்வாக நிலைநிறுத்துகிறது. சாளர செயல்பாடுகளுடன் கூடிய SPARQL ஐ நீங்கள் எப்படி விரும்புகிறீர்கள்? —

SELECT ?month (COUNT(?event) OVER (PARTITION BY ?month) AS ?events) WHERE {  …  }

IV. ராக்ஸ்டிபி

ஏற்கனவே அதிகமாக உள்ளது ஒரு இணைப்பு இருந்தது Stardog 7 Beta இன் அறிவிப்புக்கு, Stardog RocksDB ஐ அடிப்படை சேமிப்பக அமைப்பாகப் பயன்படுத்தப் போகிறது - ஒரு முக்கிய மதிப்பு ஸ்டோர், Google இன் LevelDB இன் ஃபேஸ்புக் ஃபோர்க். ஒரு குறிப்பிட்ட போக்கைப் பற்றி பேசுவது ஏன் மதிப்பு?

முதலில், தீர்மானித்தல் விக்கிபீடியா கட்டுரை, RDF சேமிப்பகங்கள் மட்டுமல்ல RocksDB க்கு "இடமாற்றம்" செய்யப்பட்டுள்ளது. ArangoDB, MongoDB, MySQL மற்றும் MariaDB, Cassandra ஆகியவற்றில் RocksDB ஐ சேமிப்பக இயந்திரமாகப் பயன்படுத்துவதற்கான திட்டங்கள் உள்ளன.

இரண்டாவதாக, தொடர்புடைய தலைப்புகளில் திட்டங்கள் (அதாவது தயாரிப்புகள் அல்ல) RocksDB இல் உருவாக்கப்படுகின்றன.

எடுத்துக்காட்டாக, eBay RocksDB ஐப் பயன்படுத்துகிறது ஒரு தளம் உங்கள் "அறிவு வரைபடத்திற்கு". சொல்லப்போனால், படிக்க வேடிக்கையாக இருக்கிறது: வினவல் மொழி வீட்டில் வளர்க்கப்பட்ட வடிவமாகத் தொடங்கியது, ஆனால் சமீபகாலமாக அது SPARQL ஐப் போலவே மாறுகிறது.. நகைச்சுவையைப் போல: நாம் எவ்வளவு அறிவு வரைபடத்தை உருவாக்கினாலும், நாம் இன்னும் RDF உடன் முடிவடைகிறோம்.

மற்றொரு உதாரணம் - சில மாதங்களுக்கு முன்பு தோன்றியது விக்கிடேட்டா வரலாறு வினவல் சேவை. அறிமுகம் செய்யப்படுவதற்கு முன், விக்கிடேட்டாவின் வரலாற்றுத் தகவல்களை அணுக வேண்டியிருந்தது MWAPI நிலையான மீடியாவிக்கி API க்கு. இப்போது தூய SPARQL மூலம் நிறைய சாத்தியம். "ஹூட்டின் கீழ்" ராக்ஸ்டிபியும் உள்ளது. மூலம், WDHQS ஆனது, Google அறிவு வரைபடத்தில் Freebase ஐ இறக்குமதி செய்த நபரால் உருவாக்கப்பட்டது.

V. LPG ஆதரவு

LPG வரைபடங்களுக்கும் RDF வரைபடங்களுக்கும் உள்ள முக்கிய வேறுபாட்டை உங்களுக்கு நினைவூட்டுகிறேன்.

LPG இல், அளவுகோல் பண்புகளை விளிம்பு நிகழ்வுகளுக்கு ஒதுக்கலாம், RDF இல் அவை விளிம்பு "வகைகளுக்கு" மட்டுமே ஒதுக்கப்படும் (ஆனால் அளவிடும் பண்புகள் மட்டுமல்ல, சாதாரண இணைப்புகளும்). LPG உடன் ஒப்பிடும்போது RDF இன் இந்த வரம்பு கடந்து வா ஒன்று அல்லது மற்றொரு மாடலிங் நுட்பம். RDF உடன் ஒப்பிடும்போது LPGயின் வரம்புகளை சமாளிப்பது மிகவும் கடினம், ஆனால் LPG வரைபடங்கள் RDF வரைபடங்களை விட ஹராரி பாடப்புத்தகத்தின் படங்களைப் போலவே இருக்கின்றன, அதனால்தான் மக்கள் அவற்றை விரும்புகிறார்கள்.

வெளிப்படையாக, "எல்பிஜி ஆதரவு" பணி இரண்டு பகுதிகளாக விழுகிறது:

  1. RDF மாதிரியில் மாற்றங்களைச் செய்தல், அது LPG கட்டமைப்புகளை உருவகப்படுத்துவதை சாத்தியமாக்குகிறது;
  2. இந்த மாற்றியமைக்கப்பட்ட மாதிரியில் தரவை அணுகுவதை சாத்தியமாக்கும் RDF வினவல் மொழியில் மாற்றங்களைச் செய்தல் அல்லது பிரபலமான எல்பிஜி வினவல் மொழிகளில் இந்த மாதிரியை வினவல் செய்யும் திறனை செயல்படுத்துதல்.

வி.1. தரவு மாதிரி

இங்கே பல சாத்தியமான அணுகுமுறைகள் உள்ளன.

வி.1.1. சிங்கிள்டன் சொத்து

RDF மற்றும் LPG ஆகியவற்றை ஒத்திசைப்பதற்கான மிகச் சிறந்த அணுகுமுறை அநேகமாக இருக்கலாம் சிங்கிள்டன் சொத்து:

  • எடுத்துக்காட்டாக, முன்னறிவிப்புக்கு பதிலாக :isMarriedTo முன்னறிவிப்புகள் பயன்படுத்தப்படுகின்றன :isMarriedTo1, :isMarriedTo2 மற்றும் பல.
  • இந்த முன்னறிவிப்புகள் புதிய மும்மடங்குகளின் பாடங்களாக மாறும்: :isMarriedTo1 :since "2013-09-13"^^xsd:date மற்றும் மற்றவர்கள்.
  • முன்னறிவிப்புகளின் இந்த நிகழ்வுகளின் இணைப்பு ஒரு பொதுவான முன்கணிப்புடன் படிவத்தின் மும்மடங்குகளால் நிறுவப்பட்டது :isMarriedTo1 rdf:singletonPropertyOf :isMarriedTo.
  • அது என்று தெளிவாக இருக்கிறது rdf:singletonPropertyOf rdfs:subPropertyOf rdf:type, ஆனால் நீங்கள் ஏன் எழுதக்கூடாது என்று சிந்தியுங்கள் :isMarriedTo1 rdf:type :isMarriedTo.

"எல்பிஜி ஆதரவு" பிரச்சனை RDFS அளவில் இங்கே தீர்க்கப்படுகிறது. அத்தகைய முடிவு பொருத்தமானதாக சேர்க்கப்பட வேண்டும் நிலையான. RDF ஸ்டோர்களில் சில மாற்றங்கள் தேவைப்படலாம், அவை விளைவுகளை இணைக்கின்றன, ஆனால் இப்போதைக்கு, Singleton Property என்பது மற்றொரு மாடலிங் நுட்பமாகக் கருதப்படலாம்.

வி.1.2. மறுசீரமைப்பு சரியாக முடிந்தது

குறைவான அப்பாவியான அணுகுமுறைகள், சொத்து நிகழ்வுகள் மும்மடங்குகளால் முழுமையாக நிலைநிறுத்தப்படக்கூடியவை என்பதை உணர்ந்ததில் இருந்து உருவாகின்றன. மும்மூர்த்திகளைப் பற்றி ஏதாவது சொல்ல முடிந்தால், சொத்து நிகழ்வுகளைப் பற்றி பேச முடியும்.

இந்த அணுகுமுறைகளில் மிகவும் வலுவானது RDF*ஆர்.டி.ஆர். பிறந்தார் பிளேஸ்கிராப்பின் ஆழத்தில். இது ஆரம்பத்திலிருந்தே தேர்ந்தெடுக்கப்பட்டார் உங்களுக்கும் AnzoGraph க்கும். அணுகுமுறையின் திடத்தன்மை அதன் கட்டமைப்பிற்குள் இருக்கும் உண்மையால் தீர்மானிக்கப்படுகிறது வழங்கப்படுகின்றன தொடர்புடைய மாற்றங்கள் RDF சொற்பொருள். இருப்பினும், புள்ளி மிகவும் எளிமையானது. RDF இன் ஆமை வரிசையாக்கத்தில் நீங்கள் இப்போது இப்படி எழுதலாம்:

<<:bob :isMarriedTo :alice>> :since "2013-09-13"^^xsd:date .

வி.1.3. மற்ற அணுகுமுறைகள்

முறையான சொற்பொருளில் நீங்கள் கவலைப்பட முடியாது, ஆனால் மும்மடங்குகளுக்கு சில அடையாளங்காட்டிகள் உள்ளன, அவை நிச்சயமாக URIகள் மற்றும் இந்த URI களைக் கொண்டு புதிய மும்மடங்குகளை உருவாக்குகின்றன. SPARQL இல் இந்த URIகளுக்கான அணுகலை வழங்குவது மட்டுமே எஞ்சியுள்ளது. அதனால் வருகிறது நட்சத்திர நாய்.

அலெக்ரோகிராஃபில் சென்றார் ஒரு இடைநிலை வழியில். அலெக்ரோகிராஃபில் மும்மடங்கு அடையாளங்காட்டிகள் என்று அறியப்படுகிறது இருக்கிறது, ஆனால் மூன்று பண்புகளை செயல்படுத்தும் போது அவை வெளியே ஒட்டாது. இருப்பினும், இது இன்னும் முறையான சொற்பொருளிலிருந்து வெகு தொலைவில் உள்ளது. மும்மடங்கு பண்புக்கூறுகள் URI கள் அல்ல என்பது குறிப்பிடத்தக்கது, மேலும் இந்த பண்புக்கூறுகளின் மதிப்புகள் எழுத்துப்பூர்வமாக மட்டுமே இருக்க முடியும். எல்பிஜி பின்பற்றுபவர்கள் அவர்கள் விரும்பியதைப் பெறுகிறார்கள். சிறப்பாகக் கண்டுபிடிக்கப்பட்ட NQX வடிவமைப்பில், RDF*க்கு மேலே உள்ளதைப் போன்ற ஒரு உதாரணம் இதுபோல் தெரிகிறது:

:bob :marriedTo :alice {"since" : "2013-09-13"}

V.2. வினவல் மொழிகள்

மாதிரி மட்டத்தில் எல்பிஜியை ஒரு வழியில் அல்லது வேறு வழியில் ஆதரிப்பதால், அத்தகைய மாதிரியில் தரவைப் பற்றிய வினவல்களை நீங்கள் சாத்தியமாக்க வேண்டும்.

 SELECT * { <<:bob :isMarriedTo ?wife>> :since ?since }

  • அன்சோகிராஃப் கூட ஆதரிக்கிறது பிரகாசம்* மற்றும் ஆதரிக்கப் போகிறது சைபர், Neo4j இல் ஒரு வினவல் மொழி.
  • ஸ்டார்டாக் அதன் சொந்தத்தை ஆதரிக்கிறது расширение SPARQL மற்றும் மீண்டும் கிரெம்லின். இது போன்ற ஒன்றைப் பயன்படுத்தி SPARQL இல் மும்மடங்கு URI மற்றும் "மெட்டா-தகவல்" ஆகியவற்றைப் பெறலாம்:

SELECT * {
    BIND (stardog:identifier(:bob, :isMarriedTo, ?wife) AS ?id)
    ?id :since ?since
}

  • அலெக்ரோகிராஃப் அதன் சொந்தத்தை ஆதரிக்கிறது расширение பிரகாசம்:

 SELECT * { ("since" ?since)  franz:attributesNameValue  ( :bob :marriedTo ?wife ) }

மூலம், GraphDB ஒரு காலத்தில் LPG ஐ ஆதரிக்காமல் Tinkerpop/Gremlin ஐ ஆதரித்தது, ஆனால் இது பதிப்பு 8.0 அல்லது 8.1 இல் நிறுத்தப்பட்டது.

VI. உரிமங்களை இறுக்குவது

Никаких прибавлений в пересечении множеств «triplestore of choice» и «open source triplestore» в последнее время не случалось. Новым RDF-хранилищам с открытым исходным кодом далеко до того, чтобы стать хорошим выбором для повседневного использования, а исходный код новых RDF-хранилищ, которые хотелось бы поиспользовать (того же AnzoGraph), закрыт. Скорее можно говорить даже об убавлениях…

நிச்சயமாக, திறந்த மூலமானது கடந்த காலத்தில் மூடப்படவில்லை, ஆனால் சில ஓப்பன் சோர்ஸ் களஞ்சியங்கள் படிப்படியாக தேர்ந்தெடுக்கப்பட வேண்டியவையாக கருதப்படுவதில்லை. ஓப்பன்சோர்ஸ் பதிப்பைக் கொண்ட விர்டுவோசோ, பிழைகளில் மூழ்கிக்கொண்டிருக்கிறது என்பது என் கருத்து. பிளேஸ்கிராஃப் AWS ஆல் வாங்கப்பட்டது மற்றும் அமேசான் நெப்டியூனின் அடிப்படையை உருவாக்கியது; குறைந்தபட்சம் இன்னும் ஒரு வெளியீடு இருக்குமா என்பது இப்போது தெளிவாகத் தெரியவில்லை. எஞ்சியிருப்பது ஜெனா மட்டுமே...

ஓப்பன் சோர்ஸ் மிகவும் முக்கியமல்ல, ஆனால் நீங்கள் அதை முயற்சி செய்ய விரும்பினால், எல்லாமே முன்பை விட குறைவாகவே இருக்கும். உதாரணத்திற்கு:

  • நட்சத்திர நாய் நிறுத்துகிறது இலவச பதிப்பை விநியோகிக்கவும் (இருப்பினும், வழக்கமான பதிப்பின் சோதனை காலம் இரட்டிப்பாகியுள்ளது);
  • в GraphDB கிளவுட், где раньше можно было выбрать бесплатный базовый план, приостановлена регистрация новых пользователей .

பொதுவாக, சராசரி ஐடி நபருக்கு, இடம் மேலும் மேலும் அணுக முடியாததாகி வருகிறது; அதன் வளர்ச்சி பெருநிறுவனங்களாக மாறி வருகிறது.

ஆதாரம்: www.habr.com

கருத்தைச் சேர்