අර්ථකථන වෙබ් සහ සබැඳි දත්ත. නිවැරදි කිරීම් සහ එකතු කිරීම්

මෑතකදී ප්‍රකාශයට පත් කරන ලද මෙම පොතේ කොටසක් මහජනතාවට ඉදිරිපත් කිරීමට මම කැමැත්තෙමි:

ව්‍යවසායක ඔන්ටොලොජිකල් ආකෘති නිර්මාණය: ක්‍රම සහ තාක්ෂණය [පෙළ]: මොනොග්‍රැෆ් / [එස්. V. Gorshkov, S. S. Kralin, O. I. Mushtak සහ වෙනත් අය; විධායක සංස්කාරක S.V. Gorshkov]. - Ekaterinburg: Ural University Publishing House, 2019. - 234 p.: ill., table; 20 සෙ.මී.. - කර්තෘ. පිටුපස ටයිට් මත දක්වා ඇත. සමග. - ග්‍රන්ථ නාමාවලිය ch අවසානයේ. — ISBN 978-5-7996-2580-1: පිටපත් 200ක්.

මෙම ඛණ්ඩනය Habré හි පළ කිරීමේ අරමුණ හතර ගුණයකි:

  • ඔහු ගෞරවනීය සේවාදායකයෙකු නොවන්නේ නම් කිසිවෙකුට මෙම පොත අතේ තබා ගැනීමට හැකි වනු ඇතැයි සිතිය නොහැක SergeIndex; එය අනිවාර්යයෙන්ම විකිණීමට නැත.
  • පෙළට නිවැරදි කිරීම් සිදු කර ඇත (ඒවා පහතින් උද්දීපනය කර නැත) සහ මුද්‍රිත මොනොග්‍රැෆ් ආකෘතියට ඉතා නොගැලපෙන එකතු කිරීම් සිදු කර ඇත: මාතෘකා සටහන් (ස්පොයිලර් යටතේ) සහ අධි සබැඳි.
  • මට උවමනයි ප්රශ්න සහ අදහස් එකතු කරන්න, වෙනත් ඕනෑම ප්‍රකාශනයක සංශෝධිත පෝරමයක මෙම පාඨය ඇතුළත් කිරීමේදී ඒවා සැලකිල්ලට ගැනීම සඳහා.
  • බොහෝ Semantic Web සහ Linked Data අනුගාමිකයින් තවමත් විශ්වාස කරන්නේ ඔවුන්ගේ කවය ඉතා පටු බව, ප්‍රධාන වශයෙන් සාමාන්‍ය ජනතාවට තවමත් Semantic Web සහ Linked Data අනුගාමිකයෙකු වීම කෙතරම් ශ්‍රේෂ්ඨද යන්න පැහැදිලි කර නොමැති බැවිනි. ඛණ්ඩනයේ කතුවරයා, ඔහු මෙම කවයට අයත් වුවද, මෙම මතය දරන්නේ නැත, කෙසේ වෙතත්, තවත් උත්සාහයක් ගැනීමට තමා බැඳී සිටින බව සලකයි.

එසේ නම්,

සෙමැන්ටික වෙබ්

අන්තර්ජාලයේ පරිණාමය පහත පරිදි නිරූපණය කළ හැකිය (හෝ පහත දැක්වෙන අනුපිළිවෙලෙහි පිහිටුවා ඇති එහි කොටස් ගැන කතා කරන්න):

  1. අන්තර්ජාලයේ ලේඛන. ප්රධාන තාක්ෂණයන් - Gopher, FTP, ආදිය.
    අන්තර්ජාලය යනු දේශීය සම්පත් හුවමාරු කර ගැනීමේ ගෝලීය ජාලයකි.
  2. අන්තර්ජාල ලේඛන. ප්රධාන තාක්ෂණයන් වන්නේ HTML සහ HTTP ය.
    නිරාවරණය වන සම්පත් වල ස්වභාවය ඔවුන්ගේ සම්ප්රේෂණ මාධ්යයේ ලක්ෂණ සැලකිල්ලට ගනී.
  3. අන්තර්ජාල දත්ත. ප්රධාන තාක්ෂණයන් - REST සහ SOAP API, XHR, ආදිය.
    අන්තර්ජාල යෙදුම් යුගය, මිනිසුන් පමණක් නොව සම්පත් පාරිභෝගිකයන් බවට පත් වේ.
  4. අන්තර්ජාල දත්ත. ප්‍රධාන තාක්ෂණයන් වන්නේ සම්බන්ධිත දත්ත තාක්ෂණයයි.
    මෙම සිව්වන අදියර, දෙවන හා W3C හි අධ්‍යක්ෂ ප්‍රධාන තාක්ෂණයේ නිර්මාතෘ වන බර්නර්ස්-ලී විසින් පුරෝකථනය කරන ලද අතර, එය Semantic Web ලෙස හැඳින්වේ; සබැඳි දත්ත තාක්‍ෂණ සැලසුම් කර ඇත්තේ වෙබයේ දත්ත යන්ත්‍රයෙන් කියවිය හැකි පමණක් නොව, “යන්ත්‍රයෙන් තේරුම් ගත හැකි” බවට පත් කිරීමට ය.

පහත දැක්වෙන දේවලින්, දෙවන සහ සිව්වන අදියරවල ප්රධාන සංකල්ප අතර ලිපි හුවමාරුව පාඨකයාට වැටහෙනු ඇත:

  • URLs URI වලට සමානයි,
  • HTML හි ප්‍රතිසමය RDF වේ,
  • HTML අධි සබැඳි RDF ලේඛනවල URI සිදුවීම් වලට සමාන වේ.

Semantic Web යනු නිශ්චිත ස්වයංසිද්ධ හෝ ලොබි ප්‍රවණතාවයකට වඩා අන්තර්ජාලයේ අනාගතය පිළිබඳ පද්ධතිමය දැක්මකි, නමුත් එයට මේවා සැලකිල්ලට ගත හැකිය. උදාහරණයක් ලෙස, Web 2.0 ලෙස හැඳින්වෙන වැදගත් ලක්ෂණයක් "පරිශීලක-උත්පාදිත අන්තර්ගතය" ලෙස සැලකේ. විශේෂයෙන්ම, W3C නිර්දේශය සැලකිල්ලට ගැනීම සඳහා කැඳවනු ලැබේ "වෙබ් විවරණ ඔන්ටොලොජි"සහ එවැනි වගකීමක් ඝණ.

Semantic Web එක මිය ගිහින්ද?

ඔබ ප්රතික්ෂේප කරන්නේ නම් යථාර්ථවාදී නොවන අපේක්ෂාවන්, සංවර්ධිත සමාජවාදයේ කාලවලදී කොමියුනිස්ට්වාදයට සමාන අර්ථකථන වෙබ් සමඟ තත්වය ආසන්න වශයෙන් සමාන වේ (සහ ඉලිච්ගේ කොන්දේසි සහිත ඉල්ලීම් වලට පක්ෂපාතීත්වය නිරීක්ෂණය කරන්නේද, සෑම කෙනෙකුටම තමන් විසින්ම තීරණය කිරීමට ඉඩ දෙන්න). සෙවුම් යන්ත්ර තරමක් සාර්ථකයි RDFa සහ JSON-LD භාවිතා කිරීමට වෙබ් අඩවි බල කරන අතර පහත විස්තර කර ඇති ඒවාට අදාළ තාක්ෂණයන් භාවිතා කරයි (Google දැනුම ප්‍රස්තාරය, Bing දැනුම ප්‍රස්තාරය).

පොදුවේ ගත් කල, කතුවරයාට විශාල පැතිරීම වළක්වන්නේ කුමක් දැයි පැවසිය නොහැක, නමුත් ඔහුට පුද්ගලික අත්දැකීම් මත කතා කළ හැකිය. එස්ඩබ්ලිව් ප්‍රහාරයේ තත්වයන් තුළ "පෙට්ටියෙන් පිටත" විසඳිය හැකි ගැටළු තිබේ, ඒවා එතරම් පුළුල් නොවූවත්. එහි ප්‍රතිඵලයක් වශයෙන්, මෙම කර්තව්‍යයන්ට මුහුණ දෙන අයට විසඳුමක් ලබා දිය හැකි අයට එරෙහිව බලකිරීමේ ක්‍රමයක් නොමැති අතර, දෙවැන්නාගේ ස්වාධීන විසඳුමක් ලබා දීම ඔවුන්ගේ ව්‍යාපාරික ආකෘතීන්ට පටහැනි වේ. එබැවින් අපි HTML විග්‍රහ කිරීම සහ විවිධ API එකට ඇලවීම දිගටම කරගෙන යමු.

කෙසේ වෙතත්, සබැඳි දත්ත තාක්ෂණයන් ප්‍රධාන ධාරාවෙන් ඔබ්බට පැතිරී ඇත; පොත, ඇත්ත වශයෙන්ම, මෙම යෙදුම් සඳහා කැප කර ඇත. දැනට, සම්බන්ධිත දත්ත ප්‍රජාව මෙම තාක්‍ෂණයන් වඩාත් පුළුල් වනු ඇතැයි අපේක්ෂා කරන්නේ ගාට්නර්ගේ පටිගත කිරීම් (හෝ ඔබ කැමති පරිදි ප්‍රකාශ කිරීම) වැනි ප්‍රවණතාවලට ස්තුති වන්නට ය. දැනුම ප්‍රස්තාර и දත්ත රෙදි. පහත සාකච්ඡා කර ඇති W3C ප්‍රමිතීන්ට අදාළ ඒවා මිස මෙම සංකල්පවල “බයිසිකල්” ක්‍රියාත්මක කිරීම සාර්ථක නොවනු ඇතැයි මම විශ්වාස කිරීමට කැමැත්තෙමි.

සම්බන්ධිත දත්ත

බර්නර්ස්-ලී සම්බන්ධිත දත්ත අර්ථකථනය කළේ "නිවැරදිව කරන ලද" වෙබ් අඩවිය ලෙසයි: එහි අවසාන අරමුණු සාක්ෂාත් කර ගැනීමට ඉඩ සලසන ප්‍රවේශයන් සහ තාක්ෂණයන් සමූහයකි. සම්බන්ධිත දත්ත බර්නර්ස්-ලී හි මූලික මූලධර්ම ඉස්මතු කර ඇත පසුව එන.

මූලධර්මය 1. ආයතන නම් කිරීමට URI භාවිතා කිරීම.

URIs ප්‍රවේශයන් සඳහා වන දේශීය තන්තු හඳුනාගැනීම්වලට ප්‍රතිවිරුද්ධව ගෝලීය ආයතන හඳුනාගැනීම් වේ. පසුව, මෙම මූලධර්මය Google දැනුම ප්‍රස්තාර සටන් පාඨය තුළ වඩාත් හොඳින් ප්‍රකාශ විය.දේවල්, නූල් නොවේ".

මූලධර්මය 2. HTTP යෝජනා ක්‍රමය තුළ URI භාවිත කිරීම නිසා ඒවා ඉවත් කිරීමට හැකි වේ.

URI වෙත යොමු කිරීම මගින්, එම හැඟවුම්කාරකය පිටුපස ඇති සංඥාව ලබා ගැනීමට හැකි විය යුතුය (මෙහි ක්‍රියාකරුගේ නම සමඟ ඇති ප්‍රතිසමය පැහැදිලිය ").*"C හි); වඩාත් නිවැරදිව, HTTP ශීර්ෂයේ අගය මත පදනම්ව - මෙම සංඥාවේ යම් නියෝජනයක් ලබා ගැනීමට Accept:. සමහර විට, AR/VR යුගයේ පැමිණීමත් සමඟ, එය සම්පතම ලබා ගැනීමට හැකි වනු ඇත, නමුත් දැනට, බොහෝ විට, එය RDF ලේඛනයක් වනු ඇත, එය SPARQL විමසුමක් ක්රියාත්මක කිරීමේ ප්රතිඵලයකි. DESCRIBE.

මූලධර්මය 3. W3C ප්‍රමිතීන් භාවිතා කිරීම - මූලික වශයෙන් RDF(S) සහ SPARQL - විශේෂයෙන්ම URIs dereferencing විට.

සම්බන්ධිත දත්ත තාක්‍ෂණ තොගයේ මෙම තනි “ස්ථර” ලෙසද හැඳින්වේ Semantic Web Layer කේක්, පහත විස්තර කෙරේ.

මූලධර්මය 4. ආයතන විස්තර කිරීමේදී වෙනත් URI වෙත යොමු භාවිතය.

ස්වාභාවික භාෂාවෙන් සම්පතක් පිළිබඳ වාචික විස්තරයකට සීමා කිරීමට RDF ඔබට ඉඩ සලසයි, සහ සිව්වන මූලධර්මය මෙය නොකරන ලෙස ඉල්ලා සිටී. පළමු මූලධර්මය විශ්වීයව නිරීක්ෂණය කරන්නේ නම්, සම්පතක් විස්තර කිරීමේදී “විදේශීය” ඒවා ඇතුළුව වෙනත් අය වෙත යොමු කිරීමට හැකි වේ, එබැවින් දත්ත සම්බන්ධිත ලෙස හැඳින්වේ. ඇත්ත වශයෙන්ම, RDFS වචන මාලාවේ නම් කර ඇති URI භාවිතා කිරීම පාහේ නොවැළැක්විය හැකිය.

RDF

RDF (සම්පත් විස්තර රාමුව) යනු අන්තර් සම්බන්ධිත ආයතන විස්තර කිරීමේ විධිමත් භාවයකි.

ත්‍රිත්ව ලෙස හැඳින්වෙන “විෂය-පුරෝකථනය-වස්තු” ආකාරයේ ප්‍රකාශයන් ආයතන සහ ඒවායේ සම්බන්ධතා පිළිබඳව සිදු කෙරේ. සරලම අවස්ථාවෙහිදී, විෂය, පුරෝකථනය සහ වස්තුව යන සියල්ලම URI වේ. එකම URI විවිධ ත්‍රිත්වවල විවිධ ස්ථානවල තිබිය හැක: විෂයයක්, පුරෝකථනයක් සහ වස්තුවක් වන්න; මේ අනුව, ත්‍රිත්ව RDF ප්‍රස්ථාරයක් ලෙස හඳුන්වන ප්‍රස්ථාර වර්ගයක් සාදයි.

විෂයයන් සහ වස්තූන් URI පමණක් නොව, ඊනියා ද විය හැකිය හිස් නෝඩ්, සහ වස්තූන් ද විය හැක වචනාර්ථයෙන්. අක්ෂර යනු තන්තු නිරූපණයකින් සහ වර්ගය ඇඟවීමකින් සමන්විත ප්‍රාථමික වර්ගවල අවස්ථා වේ.

වචනාර්ථ ලිවීමේ උදාහරණ (කැස්බෑ වාක්‍ය ඛණ්ඩයේ, ඒ ගැන වැඩි විස්තර පහතින්): "5.0"^^xsd:float и "five"^^xsd:string. වර්ගය සහිත අක්ෂර rdf:langString භාෂා ටැගයකින් ද සමන්විත විය හැකිය; කැස්බෑවේ එය මෙසේ ලියා ඇත: "five"@en и "пять"@ru.

හිස් නෝඩ් යනු ගෝලීය හඳුනාගැනීම් නොමැති "නිර්නාමික" සම්පත් වන අතර, කෙසේ වෙතත්, ප්‍රකාශ කළ හැක; පැවැත්මේ විචල්‍ය වර්ගයකි.

ඉතින් (මෙය ඇත්ත වශයෙන්ම, RDF හි සමස්ත කරුණයි):

  • විෂය URI හෝ හිස් නෝඩයකි,
  • පුරෝකථනය URI වේ,
  • වස්තුව යනු URI, හිස් නෝඩයක් හෝ වචනාර්ථයකි.

පුරෝකථන හිස් නෝඩ් විය නොහැක්කේ ඇයි?

විය හැකි හේතුව වන්නේ අවිධිමත් ලෙස තේරුම් ගැනීමට සහ ත්‍රිත්ව පළමු පෙළ පුරෝකථන තර්කයේ භාෂාවට පරිවර්තනය කිරීමට ඇති ආශාවයි. s p o වගේ දෙයක් වගේ අර්ථකථන වෙබ් සහ සබැඳි දත්ත. නිවැරදි කිරීම් සහ එකතු කිරීම්කොහෙද අර්ථකථන වෙබ් සහ සබැඳි දත්ත. නිවැරදි කිරීම් සහ එකතු කිරීම් - පුරෝකථනය කරන්න, අර්ථකථන වෙබ් සහ සබැඳි දත්ත. නිවැරදි කිරීම් සහ එකතු කිරීම් и අර්ථකථන වෙබ් සහ සබැඳි දත්ත. නිවැරදි කිරීම් සහ එකතු කිරීම් - නියතයන්. මෙම අවබෝධයේ සලකුණු ලේඛනයේ ඇත "LBase: Semantic Web හි භාෂා සඳහා අර්ථ ශාස්ත්‍රය", W3C ක්‍රියාකාරී කණ්ඩායම් සටහනක තත්ත්වය ඇත. මේ අවබෝධයෙන් තෙරුවන් සරණයි s p []කොහෙද [] - හිස් නෝඩය, ලෙස පරිවර්තනය වනු ඇත අර්ථකථන වෙබ් සහ සබැඳි දත්ත. නිවැරදි කිරීම් සහ එකතු කිරීම්කොහෙද අර්ථකථන වෙබ් සහ සබැඳි දත්ත. නිවැරදි කිරීම් සහ එකතු කිරීම් - විචල්‍යය, නමුත් පරිවර්තනය කරන්නේ කෙසේද s [] o? W3C නිර්දේශ තත්ත්වය සහිත ලේඛනය "RDF 1.1 අර්ථ ශාස්ත්‍රය” වෙනත් පරිවර්තන ක්‍රමයක් ඉදිරිපත් කරයි, නමුත් පුරෝකථන හිස් නෝඩ් වීමේ හැකියාව තවමත් නොසලකයි.

කෙසේ වෙතත්, මනු ස්පෝර්නි අවසර.

RDF යනු වියුක්ත ආකෘතියකි. RDF විවිධ වාක්‍ය ඛණ්ඩ වලින් ලිවිය හැක (අනුක්‍රමික) RDF/XML, කැස්බෑවා (බොහෝ මිනිසුන් කියවිය හැකි), JSON-LD, HDT (ද්විමය).

එකම RDF විවිධ ආකාරවලින් RDF/XML වෙත අනුක්‍රමික කළ හැක, එබැවින්, උදාහරණයක් ලෙස, XSD භාවිතයෙන් ලැබෙන XML වලංගු කිරීම හෝ XPath භාවිතයෙන් දත්ත උකහා ගැනීමට උත්සාහ කිරීම තේරුමක් නැත. ඒ හා සමානව, JSON-LD විසින් සාමාන්‍ය ජාවාස්ක්‍රිප්ට් සංවර්ධකයාගේ සාමාන්‍ය ජාවාස්ක්‍රිප්ට් සංවර්ධකයාගේ ජාවාස්ක්‍රිප්ට් හි තිත සහ හතරැස් වරහන් අංකනය භාවිතයෙන් RDF සමඟ වැඩ කිරීමට ඇති ආශාව තෘප්තිමත් කිරීමට අපහසුය (JSON-LD යාන්ත්‍රණයක් ඉදිරිපත් කිරීමෙන් එම දිශාවට ගමන් කරයි. රාමු කිරීම).

බොහෝ සින්ටැක්ස් දිගු URI කෙටි කිරීමට ක්‍රම ඉදිරිපත් කරයි. උදාහරණයක් ලෙස, දැන්වීමක් @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> කැස්බෑවේ පසුව ඔබට ඒ වෙනුවට ලිවීමට ඉඩ දෙනු ඇත <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> සාධාරණයි rdf:type.

RDFS

RDFS (RDF යෝජනා ක්‍රමය) - මූලික ආකෘතිකරණ වචන මාලාවක්, දේපල සහ පන්තිය සහ ගුණාංග වැනි සංකල්ප හඳුන්වා දෙයි rdf:type, rdfs:subClassOf, rdfs:domain и rdfs:range. උදාහරණයක් ලෙස RDFS ශබ්දකෝෂය භාවිතයෙන් පහත වලංගු ප්‍රකාශන ලිවිය හැක:

rdf:type         rdf:type         rdf:Property .
rdf:Property     rdf:type         rdfs:Class .
rdfs:Class       rdfs:subClassOf  rdfs:Resource .
rdfs:subClassOf  rdfs:domain      rdfs:Class .
rdfs:domain      rdfs:domain      rdf:Property .
rdfs:domain      rdfs:range       rdfs:Class .
rdfs:label       rdfs:range       rdfs:Literal .

RDFS යනු විස්තර සහ ආකෘතිකරණ වචන මාලාවකි, නමුත් එය සීමා කිරීමේ භාෂාවක් නොවේ (නිල පිරිවිතර සහ කොළ එවැනි භාවිතයේ හැකියාව). "Schema" යන වචනය "XML Schema" යන ප්‍රකාශනයේ ඇති අර්ථයෙන්ම තේරුම් නොගත යුතුය. උදාහරණ වශයෙන්, :author rdfs:range foaf:Person ඒකේ තේරුම rdf:type සියලු දේපල වටිනාකම් :author - foaf:Person, නමුත් මෙය කල්තියා පැවසිය යුතු බව ඉන් අදහස් නොවේ.

SPARQL

SPARQL (SPARQL Protocol සහ RDF Query Language) - RDF දත්ත විමසීම සඳහා භාෂාවකි. සරල අවස්ථාවක, SPARQL විමසුමක් යනු විමසනු ලබන ප්‍රස්ථාරයේ ත්‍රිත්ව ගැළපෙන සාම්පල සමූහයකි. රටා වල විෂය, පුරෝකථනය සහ වස්තු පිහිටුම්වල විචල්‍ය අඩංගු විය හැක.

විමසුම මඟින් එවැනි විචල්‍ය අගයන් ලබා දෙන අතර එය සාම්පලවලට ආදේශ කළ විට විමසූ RDF ප්‍රස්ථාරයේ උප ප්‍රස්ථාරයක් (එහි ත්‍රිත්වවල උප කුලකයක්) ඇති කළ හැක. ත්‍රිත්ව විවිධ සාම්පලවල එකම නමේ විචල්‍යයන් එකම අගයන් තිබිය යුතුය.

උදාහරණයක් ලෙස, ඉහත RDFS axioms හතේ කට්ටලය ලබා දී ඇති විට, පහත විමසුම නැවත පැමිණෙනු ඇත rdfs:domain и rdfs:range අගයන් ලෙස ?s и ?p පිළිවෙලින්:

SELECT * WHERE {
 ?s ?p rdfs:Class .
 ?p ?p rdf:Property .
}

SPARQL ප්‍රකාශනාත්මක වන අතර එය ප්‍රස්තාර සංක්‍රමණය විස්තර කිරීමේ භාෂාවක් නොවන බව සඳහන් කිරීම වටී (කෙසේ වෙතත්, සමහර RDF ගබඩාවන් විමසුම් ක්‍රියාත්මක කිරීමේ සැලැස්ම සකස් කිරීමට ක්‍රම ඉදිරිපත් කරයි). එමනිසා, සමහර සම්මත ප්‍රස්ථාර ගැටළු, උදාහරණයක් ලෙස, කෙටිම මාර්ගය සොයා ගැනීම, SPARQL භාවිතා කිරීම ඇතුළුව, විසඳිය නොහැක. දේපල මාර්ග (නමුත්, නැවතත්, තනි RDF ගබඩාවන් මෙම ගැටළු විසඳීම සඳහා විශේෂ දිගු ඉදිරිපත් කරයි).

SPARQL ලෝකයේ විවෘතභාවය පිළිබඳ උපකල්පනය බෙදා නොගන්නා අතර "අසාර්ථක ලෙස නිෂේධනය" ප්‍රවේශය අනුගමනය කරයි. හැකි වැනි නිර්මාණ FILTER NOT EXISTS {…}. යාන්ත්රණය භාවිතයෙන් දත්ත බෙදා හැරීම සැලකිල්ලට ගනී ෆෙඩරල් විමසුම්.

SPARQL ප්‍රවේශ ලක්ෂ්‍යය - SPARQL විමසුම් සැකසීමේ හැකියාව ඇති RDF ගබඩාවකි - දෙවන අදියරේ සිට සෘජු ප්‍රතිසමයක් නොමැත (මෙම ඡේදයේ ආරම්භය බලන්න). එය HTML පිටු ජනනය කරන ලද, නමුත් පිටතින් ප්‍රවේශ විය හැකි අන්තර්ගතය මත පදනම්ව, දත්ත සමුදායකට සමාන කළ හැක. SPARQL ප්‍රවේශ ලක්ෂ්‍යය තුන්වන අදියරේ සිට API ප්‍රවේශ ලක්ෂ්‍යයට වඩා සමාන නමුත් ප්‍රධාන වෙනස්කම් දෙකක් ඇත. පළමුව, “පරමාණුක” විමසුම් කිහිපයක් එකකට ඒකාබද්ධ කළ හැකිය (එය GraphQL හි ප්‍රධාන ලක්ෂණයක් ලෙස සැලකේ), සහ දෙවනුව, එවැනි API සම්පූර්ණයෙන්ම ස්වයං ලේඛනගත වේ (එය HATEOAS සාක්ෂාත් කර ගැනීමට උත්සාහ කළ දෙයයි).

විවාදාත්මක ප්‍රකාශය

RDF යනු වෙබයේ දත්ත ප්‍රකාශ කිරීමේ ක්‍රමයකි, එබැවින් RDF ගබඩාව DBMS ලේඛනයක් ලෙස සැලකිය යුතුය. RDF යනු ප්‍රස්ථාරයක් මිස ගසක් නොවන බැවින් ඒවා ප්‍රස්ථාර මත පදනම් වූ ඒවා බව ඇත්තකි. එය කිසිසේත්ම සාර්ථක වීම පුදුම සහගතය. කවුද හිතුවේ හිස් නෝඩ් ක්‍රියාත්මක කරන බුද්ධිමත් අය ඇති කියලා. කෝඩ් මෙතන එය සාර්ථක වූයේ නැත.

RDF දත්ත වෙත ප්‍රවේශය සංවිධානය කිරීමට අඩු අංග සම්පූර්ණ ක්‍රම ද ඇත, උදාහරණයක් ලෙස, සම්බන්ධිත දත්ත කොටස් (LDF) සහ සම්බන්ධිත දත්ත වේදිකාව (LDP).

OWL

OWL (වෙබ් ඔන්ටොලොජි භාෂාව) - දැනුම නියෝජනය කිරීම සඳහා විධිමත් භාවයක්, විස්තර තර්කනයේ වාක්‍යමය අනුවාදයකි අර්ථකථන වෙබ් සහ සබැඳි දත්ත. නිවැරදි කිරීම් සහ එකතු කිරීම් (පහළ සෑම තැනකම OWL 2 කීම වඩාත් නිවැරදියි, OWL හි පළමු අනුවාදය පදනම් විය අර්ථකථන වෙබ් සහ සබැඳි දත්ත. නිවැරදි කිරීම් සහ එකතු කිරීම්).

OWL හි විස්තරාත්මක තර්ක පිළිබඳ සංකල්ප පන්තිවලට අනුරූප වේ, භූමිකාවන් ගුණාංගවලට අනුරූප වේ, පුද්ගලයන් ඔවුන්ගේ පෙර නම රඳවා ගනී. Axioms axioms ලෙසද හැඳින්වේ.

උදාහරණයක් ලෙස, ඊනියා දී මැන්චෙස්ටර් වාක්‍ය ඛණ්ඩය OWL අංකනය සඳහා අප දැනටමත් දන්නා ප්‍රත්‍යක්‍ෂයකි අර්ථකථන වෙබ් සහ සබැඳි දත්ත. නිවැරදි කිරීම් සහ එකතු කිරීම් මෙසේ ලියනු ඇත:

Class: Human
Class: Parent
   EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent

OWL ලිවීම සඳහා වෙනත් වාක්‍ය ඛණ්ඩ තිබේ ක්රියාකාරී සින්ටැක්ස්, නිල පිරිවිතර භාවිතා, සහ OWL/XML. මීට අමතරව, OWL අනුක්‍රමික කළ හැක RDF වාක්‍ය ඛණ්ඩය වියුක්ත කිරීමට සහ තවදුරටත් - ඕනෑම විශේෂිත වාක්‍ය ඛණ්ඩයක.

OWL RDF සමඟ ද්විත්ව සම්බන්ධතාවයක් ඇත. එක් අතකින්, එය RDFS දිගු කරන ශබ්දකෝෂයක් ලෙස සැලකිය හැකිය. අනෙක් අතට, එය RDF යනු අනුක්‍රමික ආකෘතියක් පමණක් වන වඩා බලවත් විධිමත්භාවයකි. සියලුම මූලික OWL ඉදිකිරීම් තනි RDF ත්‍රිත්වයක් භාවිතයෙන් ලිවිය නොහැක.

OWL ඉදිකිරීම් වල කුමන උප කුලකයක් භාවිතා කිරීමට අවසර තිබේද යන්න මත පදනම්ව, ඔවුන් ඊනියා ගැන කතා කරයි OWL පැතිකඩ. ප්‍රමිතිගත සහ වඩාත් ප්‍රසිද්ධ වන්නේ OWL EL, OWL RL සහ OWL QL ය. පැතිකඩ තේරීම සාමාන්‍ය ගැටළු වල ගණනය කිරීමේ සංකීර්ණතාවයට බලපායි. අනුරූපී OWL ඉදිකිරීම් සම්පූර්ණ කට්ටලයක් අර්ථකථන වෙබ් සහ සබැඳි දත්ත. නිවැරදි කිරීම් සහ එකතු කිරීම්, OWL DL ලෙස හැඳින්වේ. සමහර විට ඔවුන් OWL Full ගැන ද කතා කරයි, එහි දී OWL ඉදිකිරීම් RDF හි ආවේණික වූ පූර්ණ නිදහස සමඟ, අර්ථකථන සහ ගණනය කිරීමේ සීමාවන් නොමැතිව භාවිතා කිරීමට අවසර ඇත. අර්ථකථන වෙබ් සහ සබැඳි දත්ත. නිවැරදි කිරීම් සහ එකතු කිරීම්. උදාහරණයක් ලෙස, යමක් පන්තියක් සහ දේපලක් විය හැකිය. OWL Full යන්න තීරණය කළ නොහැක.

OWL හි ප්රතිවිපාක අනුයුක්ත කිරීම සඳහා ප්රධාන මූලධර්ම වන්නේ විවෘත ලෝක උපකල්පනය අනුගමනය කිරීමයි. ඕවා) සහ අද්විතීය නම් උපකල්පනය ප්‍රතික්ෂේප කිරීම (අද්විතීය නම් උපකල්පනය, යූඑන්ඒ) මෙම මූලධර්මවලට මඟ පෙන්විය හැක්කේ කොතැනටද යන්න සහ OWL නිර්මිතයන් කිහිපයක් හඳුන්වා දීමට අපි පහතින් බලමු.

ඔන්ටොලොජියෙහි පහත ඛණ්ඩනය අඩංගු වේ (මැන්චෙස්ටර් වාක්‍ය ඛණ්ඩයේ):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human
   Facts: hasChild Alice, hasChild Bob, hasChild Carol

ජෝන්ට බොහෝ දරුවන් සිටින බව පවසා ඇති දෙයින් එය අනුගමනය කරයිද? ඇලිස් සහ බොබ් එකම පුද්ගලයා විය හැකි බැවින් UNA ප්‍රතික්ෂේප කිරීම අනුමාන එන්ජිමට මෙම ප්‍රශ්නයට සෘණාත්මකව පිළිතුරු දීමට බල කරයි. පහත සඳහන් දේ සිදු වීමට නම්, පහත සඳහන් ප්‍රත්‍යය එකතු කිරීම අවශ්‍ය වේ:

DifferentIndividuals: Alice, Bob, Carol, John

දැන් ඔන්ටොලොජි ඛණ්ඩයට පහත ස්වරූපය තිබිය යුතුය (ජෝන්ට බොහෝ දරුවන් සිටින බව ප්‍රකාශ කර ඇත, නමුත් ඔහුට සිටින්නේ දරුවන් දෙදෙනෙකු පමණි):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human, manyChildren
   Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John

මෙම ඔන්ටොලොජි (අවලංගු දත්තවල සාක්ෂි ලෙස අර්ථ දැක්විය හැකි) නොගැලපේද? OWA පිළිගැනීමෙන් අනුමාන එන්ජිම සෘණාත්මකව ප්‍රතිචාර දැක්වීමට හේතු වනු ඇත: "කොතැනක හෝ" (වෙනත් ඔන්ටොලොජියක) කැරොල් ද ජෝන්ගේ දරුවා බව පැවසිය හැකිය.

මෙය සිදුවීමේ හැකියාව බැහැර කිරීම සඳහා, ජෝන් පිළිබඳ නව කරුණක් එකතු කරමු:

Individual: John
   Facts: hasChild Alice, hasChild Bob, not hasChild Carol

අනෙක් දරුවන්ගේ පෙනුම බැහැර කිරීම සඳහා, “දරුවෙකු සිටින” දේපලෙහි සියලුම වටිනාකම් මිනිසුන් යැයි කියමු, ඔවුන්ගෙන් අපට ඇත්තේ හතරක් පමණි:

ObjectProperty: hasChild
   Domain: Human
   Сharacteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }

දැන් ඔන්ටොලොජිය පරස්පර විරෝධී වනු ඇත, එය අනුමාන එන්ජිම වාර්තා කිරීමට අසමත් නොවනු ඇත. අපට ඇති අවසාන ප්‍රත්‍යක්ෂයන් සමඟ, එක් අර්ථයකින්, ලෝකය “වසා” ඇති අතර, ජෝන් ඔහුගේම දරුවෙකු වීමේ හැකියාව බැහැර කරන්නේ කෙසේදැයි දකිමු.

ව්යවසාය දත්ත සම්බන්ධ කිරීම

සබැඳි දත්ත කට්ටලය ප්‍රවේශයන් සහ තාක්ෂණයන් මුලින් අදහස් කළේ වෙබයේ දත්ත ප්‍රකාශනය සඳහා ය. අභ්යන්තර ආයතනික පරිසරයක ඔවුන්ගේ භාවිතය දුෂ්කරතා ගණනාවකට මුහුණ දෙයි.

උදාහරණයක් ලෙස, සංවෘත ආයතනික පරිසරයක් තුළ, OWA සම්මත කිරීම සහ UNA ප්‍රතික්ෂේප කිරීම මත පදනම් වූ OWL හි අඩු කිරීමේ බලය, වෙබයේ විවෘත සහ බෙදා හරින ලද ස්වභාවය නිසා ගන්නා තීරණ ඉතා දුර්වල ය. සහ මෙහි පහත විසඳුම් හැකි ය.

  • OWL ට අර්ථ ශාස්ත්‍රය ලබා දීම, OWA අත්හැරීම සහ UNA සම්මත කිරීම, අනුරූප නිමැවුම් එන්ජිම ක්‍රියාත්මක කිරීම ඇඟවුම් කරයි. - මේ මාර්ගය දිගේ යනවා Stardog RDF ගබඩාව.
  • රීති එන්ජින් සඳහා OWL හි අඩු කිරීමේ හැකියාවන් අත්හැරීම. - Stardog සහාය SWRL; Jena සහ GraphDB පිරිනැමීම තමන්ගේම භාෂා නීති
  • OWL හි අඩු කිරීමේ හැකියාවන් ප්‍රතික්ෂේප කිරීම, ආකෘති නිර්මාණය සඳහා RDFS ට ආසන්න එක් හෝ තවත් උප කුලකයක් භාවිතා කිරීම. - මේ ගැන වැඩි විස්තර පහතින් බලන්න.

තවත් ගැටළුවක් වන්නේ දත්ත ගුණාත්මක ගැටළු සහ සම්බන්ධිත දත්ත තොගයේ දත්ත වලංගු කිරීමේ මෙවලම් නොමැතිකම පිළිබඳව ආයතනික ලෝකයට ඇති වැඩි අවධානයයි. මෙහි නිමැවුම් පහත පරිදි වේ.

  • නැවතත්, සුදුසු අනුමාන එන්ජිමක් තිබේ නම්, සංවෘත ලෝක අර්ථ ශාස්ත්‍රය සහ අද්විතීය නම් සහිත OWL ඉදිකිරීම් වලංගු කිරීම සඳහා භාවිතා කරන්න.
  • භාවිතා කරන්න SHACL, Semantic Web Layer Cake ස්ථර ලැයිස්තුව ස්ථාවර කිරීමෙන් පසුව ප්‍රමිතිගත කර ඇත (කෙසේ වෙතත්, එය රීති එන්ජිමක් ලෙසද භාවිතා කළ හැක), හෝ ෂෙක්ස්.
  • සියල්ල අවසානයේ සිදු වන්නේ SPARQL විමසුම් වලින් බව වටහා ගැනීම, ඒවා භාවිතයෙන් ඔබේම සරල දත්ත වලංගු කිරීමේ යාන්ත්‍රණයක් නිර්මාණය කිරීම.

කෙසේ වෙතත්, අඩු කිරීමේ හැකියාවන් සහ වලංගු කිරීමේ මෙවලම් සම්පූර්ණයෙන් ප්‍රතික්ෂේප කිරීම පවා, සම්බන්ධිත දත්ත තොගය තරඟකාරීත්වයෙන් බැහැර කරයි, භූ දර්ශනයේ විවෘත සහ බෙදා හරින ලද වෙබ් - දත්ත ඒකාබද්ධ කිරීමේ කාර්යයන් සඳහා සමාන වේ.

සාමාන්‍ය ව්‍යවසාය තොරතුරු පද්ධතියක් ගැන කුමක් කිව හැකිද?

මෙය කළ හැකි නමුත්, ඇත්ත වශයෙන්ම, අදාළ තාක්ෂණයන් විසඳිය යුතු ගැටළු මොනවාදැයි ඔබ දැන සිටිය යුතුය. සාම්ප්‍රදායික තොරතුරු තාක්‍ෂණයේ දෘෂ්ටි කෝණයෙන් මෙම තාක්‍ෂණ තොගය පෙනෙන්නේ කෙසේද යන්න පෙන්වීමට සංවර්ධන සහභාගිවන්නන්ගේ සාමාන්‍ය ප්‍රතිචාරයක් මම මෙහි විස්තර කරමි. මට අලියාගේ උපමාව ටිකක් මතක් කරනවා.

  • ව්යාපාර විශ්ලේෂක: RDF යනු සෘජුවම ගබඩා කර ඇති තාර්කික ආකෘතියක් වැනි දෙයකි.
  • පද්ධති විශ්ලේෂක: RDF වගේ EAV, දර්ශක පොකුරක් සහ පහසු විමසුම් භාෂාවක් සමඟ පමණි.
  • සංවර්ධක: හොඳයි, මේ සියල්ල පොහොසත් ආකෘතිය සහ අඩු කේතය යන සංකල්පවල ආත්මය තුළ ය, කියවමින් සිටියේය මේ ගැන මෑතකදී.
  • ව්යාපෘති කළමනාකරු: ඔව් ඒකම තමයි තොගය කඩා වැටීම!

ප්‍රායෝගිකව පෙන්නුම් කරන්නේ දත්ත බෙදා හැරීම සහ විෂමජාතිය සම්බන්ධ කාර්යයන් සඳහා තොගය බොහෝ විට භාවිතා වන බවයි, උදාහරණයක් ලෙස, MDM (Master Data Management) හෝ DWH (Data Warehouse) පන්ති පද්ධති තැනීමේදී. එවැනි ගැටළු ඕනෑම කර්මාන්තයක පවතී.

කර්මාන්ත-විශේෂිත යෙදුම් අනුව, සම්බන්ධිත දත්ත තාක්ෂණයන් පහත සඳහන් කර්මාන්තවල දැනට වඩාත් ජනප්‍රිය වේ.

  • ජෛව වෛද්‍ය තාක්‍ෂණ (ඔවුන්ගේ ජනප්‍රියත්වය වසමෙහි සංකීර්ණත්වය හා සම්බන්ධ බව පෙනේ);

දැනට

“ජාතික වෛද්‍ය දැනුම පදනම” සංගමය විසින් සංවිධානය කරන ලද සම්මන්ත්‍රණයක් පසුගියදා “බෝයිලින් පොයින්ට්” හි පැවැත්විණි.ඔන්ටොලොජිස් ඒකාබද්ධ කිරීම. න්‍යායේ සිට ප්‍රායෝගික භාවිතය දක්වා".

  • සංකීර්ණ නිෂ්පාදන නිෂ්පාදනය සහ ක්‍රියාත්මක කිරීම (විශාල යාන්ත්‍රික ඉංජිනේරු විද්‍යාව, තෙල් සහ ගෑස් නිෂ්පාදනය; බොහෝ විට අපි කතා කරන්නේ සම්මතය ගැන ය ISO 15926);

දැනට

මෙන්න, ද, හේතුව විෂය ක්ෂේත්රයේ සංකීර්ණත්වය, විට, උදාහරණයක් ලෙස, ඉහළ අදියර, අපි තෙල් හා ගෑස් කර්මාන්තය ගැන කතා කරන්නේ නම්, සරල ගිණුම්කරණය සමහර CAD කාර්යයන් අවශ්ය වේ.

2008 දී, Chevron විසින් සංවිධානය කරන ලද නියෝජිත ස්ථාපන උත්සවයක් සිදු විය සමුළුව.

ISO 15926, අවසානයේදී, තෙල් හා ගෑස් කර්මාන්තයට තරමක් බර බවක් පෙනෙන්නට තිබුණි (සහ යාන්ත්‍රික ඉංජිනේරු විද්‍යාවේ සමහර විට විශාල යෙදුමක් සොයාගෙන ඇත). ස්ටාටොයිල් (Equinor) පමණක් එයට හොඳින් සම්බන්ධ විය; නෝර්වේහි, සමස්තයක් වශයෙන් පරිසර පද්ධතිය. තවත් සමහරු තමන්ගේම දෙයක් කිරීමට උත්සාහ කරති. නිදසුනක් වශයෙන්, කටකතා වලට අනුව, දේශීය බලශක්ති අමාත්‍යාංශය "ඉන්ධන හා බලශක්ති සංකීර්ණයේ සංකල්පීය ඔන්ටොලොජිකල් ආකෘතියක්" නිර්මාණය කිරීමට අදහස් කරයි, පෙනෙන විදිහට, විදුලි බල කර්මාන්තය සඳහා නිර්මාණය කර ඇත.

  • මූල්‍ය සංවිධාන (XBRL පවා SDMX සහ RDF Data Cube ontology හි දෙමුහුන් වර්ගයක් ලෙස සැලකිය හැක);

දැනට

වසර ආරම්භයේදී, LinkedIn විසින් “Force Majeure” රූපවාහිනී කතා මාලාවෙන් ඔහු දන්නා මූල්‍ය කර්මාන්තයේ සියලුම දැවැන්තයින්ගේ පුරප්පාඩු සමඟ කතුවරයාට සක්‍රියව ස්පෑම් කළේය: Goldman Sachs, JP Morgan Chase සහ/හෝ Morgan Stanley, Wells Fargo, SWIFT/Visa/Mastercard, Bank of America, Citigroup, Fed, Deutsche Bank... සමහරවිට හැමෝම හොයන්නේ තමන්ට එවන්න පුළුවන් කෙනෙක්ව වෙන්න ඇති. දැනුම ප්‍රස්තාර සමුළුව. කිහිප දෙනෙකු සොයා ගැනීමට සමත් විය: මූල්‍ය සංවිධාන සියල්ල ලබා ගත්තේය පළමු දිනයේ උදෑසන.

HeadHunter හි, Sberbank පමණක් රසවත් දෙයක් හමු විය; එය "RDF වැනි දත්ත ආකෘතියක් සහිත EAV ගබඩා කිරීම" ගැන ය.

බොහෝ විට, දේශීය හා බටහිර මූල්‍ය ආයතනවල අනුරූප තාක්‍ෂණයන් සඳහා ඇති ආදරයේ ප්‍රමාණයේ වෙනස, දෙවැන්නෙහි ක්‍රියාකාරකම්වල අන්තර් ජාතික ස්වභාවය නිසා විය හැකිය. පෙනෙන විදිහට, රාජ්ය දේශසීමා හරහා ඒකාබද්ධ කිරීම සඳහා ගුණාත්මකව වෙනස් ආයතනික සහ තාක්ෂණික විසඳුම් අවශ්ය වේ.

  • වාණිජ යෙදුම් සහිත ප්‍රශ්න-පිළිතුරු පද්ධති (IBM Watson, Apple Siri, Google Knowledge Graph);

දැනට

මාර්ගය වන විට, සිරියේ නිර්මාතෘ, තෝමස් ගෲබර්, ඔන්ටොලොජි (තොරතුරු තාක්ෂණ අර්ථයෙන්) "සංකල්පීය පිරිවිතරයක්" ලෙස අර්ථ දැක්වීමේ කතුවරයා වේ. මගේ මතය අනුව, මෙම නිර්වචනයේ ඇති වචන නැවත සකස් කිරීමෙන් එහි අර්ථය වෙනස් නොවේ, සමහර විට එය එහි නොමැති බව පෙන්නුම් කරයි.

  • ව්‍යුහගත දත්ත ප්‍රකාශනය (වැඩි සාධාරණීකරණයක් සහිතව මෙය සබැඳි විවෘත දත්ත වෙත ආරෝපණය කළ හැක).

දැනට

සම්බන්ධිත දත්තවල විශාල රසිකයින් වන්නේ ඊනියා GLAM: ගැලරි, පුස්තකාල, ලේඛනාගාර, සහ කෞතුකාගාර. කොන්ග්‍රස් පුස්තකාලය MARC21 සඳහා ආදේශකයක් ප්‍රවර්ධනය කරන බව පැවසීම ප්‍රමාණවත්ය BIBRAME, ඒ ග්‍රන්ථ නාමාවලියේ විස්තරයේ අනාගතය සඳහා පදනමක් සපයයි සහ, ඇත්ත වශයෙන්ම, RDF මත පදනම්ව.

සබැඳි විවෘත දත්ත ක්ෂේත්‍රයේ සාර්ථක ව්‍යාපෘතියක උදාහරණයක් ලෙස විකිදත්ත බොහෝ විට උපුටා දක්වයි - විකිපීඩියාවේ යන්ත්‍ර කියවිය හැකි අනුවාදයකි, එහි අන්තර්ගතය, DBPedia වලට ප්‍රතිවිරුද්ධව, ලිපි තොරතුරු කොටු වලින් ආයාත කිරීමෙන් ජනනය නොවේ, නමුත් අතින් අඩු වැඩි වශයෙන් නිර්මාණය කර ඇත (පසුව එම තොරතුරු පෙට්ටි සඳහා තොරතුරු මූලාශ්‍රයක් බවට පත් වේ).

ඔබ එය පරීක්ෂා කරන ලෙස ද අපි නිර්දේශ කරමු ලැයිස්තුව "පාරිභෝගිකයින්" කොටසේ Stardog වෙබ් අඩවියේ Stardog RDF ගබඩාව භාවිතා කරන්නන්.

එය එසේ වේවා, ගාට්නර්හි නැගී එන තාක්ෂණයන් සඳහා හයිප් සයිකල් 2016 "ව්‍යවසාය වර්ගීකරණය සහ ඔන්ටොලොජි කළමනාකරණය" වසර 10කට පෙර "ඵලදායිතා සානුව" කරා ළඟා වීමේ අපේක්ෂාව සමඟ කලකිරීමේ මිටියාවතට බැසීමක් මැද තබා ඇත.

ව්යවසාය දත්ත සම්බන්ධ කිරීම

අනාවැකි, අනාවැකි, අනාවැකි ...

ඓතිහාසික උනන්දුව නිසා, මම අපට උනන්දුවක් දක්වන තාක්ෂණයන් පිළිබඳ විවිධ වසර සඳහා ගාට්නර්ගේ අනාවැකි පහත වගුගත කර ඇත.

වසර තාක්ෂණය වාර්තාව පිහිටීම සානුවට අවුරුදු
2001 සෙමැන්ටික වෙබ් නැගී එන තාක්ෂණයන් නවෝත්පාදන ප්‍රේරකය 5-10
2006 ආයතනික අර්ථකථන වෙබ් නැගී එන තාක්ෂණයන් පුම්බන ලද අපේක්ෂාවන්හි උච්චතම අවස්ථාව 5-10
2012 සෙමැන්ටික වෙබ් විශාල දත්ත පුම්බන ලද අපේක්ෂාවන්හි උච්චතම අවස්ථාව > 10
2015 සම්බන්ධිත දත්ත උසස් විශ්ලේෂණ සහ දත්ත විද්‍යාව කලකිරීමේ අගල 5-10
2016 ව්යවසාය ඔන්ටොලොජි කළමනාකරණය නැගී එන තාක්ෂණයන් කලකිරීමේ අගල > 10
2018 දැනුම ප්‍රස්තාර නැගී එන තාක්ෂණයන් නවෝත්පාදන ප්‍රේරකය 5-10

කෙසේ වෙතත්, දැනටමත් ඇත "හයිප් සයිකල්..." 2018 තවත් ඉහළ ප්‍රවණතාවක් මතු වී ඇත - දැනුම ප්‍රස්ථාර. යම් පුනරුත්පත්තියක් සිදු විය: පරිශීලකයින්ගේ අවධානය සහ සංවර්ධකයින්ගේ උත්සාහය මාරු වූ ප්‍රස්ථාර DBMS, කලින් අයගේ ඉල්ලීම් සහ දෙවැන්නාගේ පුරුදු වල බලපෑම යටතේ, සමෝච්ඡයන් සහ ස්ථානගත කිරීම් ලබා ගැනීමට පටන් ගත්තේය. ඔවුන්ගේ පූර්වගාමී තරඟකරුවන්ගේ.

සෑම ප්‍රස්ථාරයක්ම පාහේ DBMS දැන් ආයතනික “දැනුම ප්‍රස්ථාරයක්” (“සම්බන්ධිත දත්ත” සමහර විට “සම්බන්ධිත දත්ත” මගින් ප්‍රතිස්ථාපනය වේ) ගොඩනැගීම සඳහා සුදුසු වේදිකාවක් ප්‍රකාශ කරයි, නමුත් එවැනි ප්‍රකාශයන් කෙතරම් සාධාරණද?

ප්‍රස්තාර දත්ත සමුදායන් තවමත් අසමමිතික ය; ප්‍රස්ථාරයක DBMS හි දත්ත තවමත් එකම දත්ත සිලෝ වේ. URI වෙනුවට String identifier මඟින් ප්‍රස්ථාර DBMS දෙකක් ඒකාබද්ධ කිරීමේ කාර්යය තවමත් ඒකාබද්ධ කාර්යයක් බවට පත් කරයි, RDF ගබඩා දෙකක් ඒකාබද්ධ කිරීම බොහෝ විට RDF ප්‍රස්ථාර දෙකක් ඒකාබද්ධ කිරීම දක්වා පැමිණේ. asemanticity හි තවත් පැතිකඩක් වන්නේ LPG ප්‍රස්ථාර ආකෘතියේ ප්‍රත්‍යාවර්තකතාව නොවන අතර, එම වේදිකාව භාවිතා කරමින් පාරදත්ත කළමනාකරණය කිරීම අපහසු වේ.

අවසාන වශයෙන්, ප්‍රස්ථාර DBMS වලට අනුමාන එන්ජින් හෝ රීති එන්ජින් නොමැත. එවැනි එන්ජින්වල ප්රතිඵල සංකීර්ණ විමසුම් මගින් ප්රතිනිෂ්පාදනය කළ හැකි නමුත්, SQL හි පවා මෙය කළ හැකිය.

කෙසේ වෙතත්, ප්‍රමුඛ පෙළේ RDF ගබඩා පද්ධතිවලට LPG ආකෘතියට සහය දැක්වීමට අපහසු නැත. Blazegraph හි එක් වරකදී යෝජනා කරන ලද වඩාත්ම ශක්තිමත් ප්‍රවේශය ලෙස සැලකේ: RDF* ආකෘතිය, RDF සහ LPG ඒකාබද්ධ කිරීම.

තවත්

ඔබට හබ්රේ හි පෙර ලිපියෙන් LPG ආකෘතිය සඳහා RDF ගබඩා සහාය ගැන වැඩිදුර කියවිය හැක: "දැන් RDF ගබඩාවට මොකද වෙන්නේ". දැනුම ප්‍රස්ථාර සහ දත්ත රෙදි ගැන වෙනම ලිපියක් කවදා හෝ ලියනු ඇතැයි මම බලාපොරොත්තු වෙමි. අවසාන කොටස, තේරුම් ගැනීමට පහසු වන පරිදි, කඩිමුඩියේ ලියා ඇත, කෙසේ වෙතත්, මාස හයකට පසුව පවා, මෙම සංකල්ප සමඟ සෑම දෙයක්ම වඩා පැහැදිලි නැත.

සාහිත්යය

  1. Halpin, H., Monnin, A. (eds.) (2014). දාර්ශනික ඉංජිනේරු විද්‍යාව: වෙබයේ දර්ශනයක් කරා
  2. Allemang, D., Hendler, J. (2011) Semantic Web for the Working Ontologist (2nd ed.)
  3. Staab, S., Studer, R. (eds.) (2009) Ontologies පිළිබඳ අත්පොත (2nd ed.)
  4. දැව, D. (සංස්කරණය). (2011) ව්‍යවසාය දත්ත සම්බන්ධ කිරීම
  5. Keet, M. (2018) ඔන්ටොලොජි ඉංජිනේරු විද්‍යාව පිළිබඳ හැඳින්වීමක්

මූලාශ්රය: www.habr.com

අදහස් එක් කරන්න