මෑතකදී ප්රකාශයට පත් කරන ලද මෙම පොතේ කොටසක් මහජනතාවට ඉදිරිපත් කිරීමට මම කැමැත්තෙමි:
ව්යවසායක ඔන්ටොලොජිකල් ආකෘති නිර්මාණය: ක්රම සහ තාක්ෂණය [පෙළ]: මොනොග්රැෆ් / [එස්. V. Gorshkov, S. S. Kralin, O. I. Mushtak සහ වෙනත් අය; විධායක සංස්කාරක S.V. Gorshkov]. - Ekaterinburg: Ural University Publishing House, 2019. - 234 p.: ill., table; 20 සෙ.මී.. - කර්තෘ. පිටුපස ටයිට් මත දක්වා ඇත. සමග. - ග්රන්ථ නාමාවලිය ch අවසානයේ. — ISBN 978-5-7996-2580-1: පිටපත් 200ක්.
මෙම ඛණ්ඩනය Habré හි පළ කිරීමේ අරමුණ හතර ගුණයකි:
- ඔහු ගෞරවනීය සේවාදායකයෙකු නොවන්නේ නම් කිසිවෙකුට මෙම පොත අතේ තබා ගැනීමට හැකි වනු ඇතැයි සිතිය නොහැක
SergeIndex ; එය අනිවාර්යයෙන්ම විකිණීමට නැත. - පෙළට නිවැරදි කිරීම් සිදු කර ඇත (ඒවා පහතින් උද්දීපනය කර නැත) සහ මුද්රිත මොනොග්රැෆ් ආකෘතියට ඉතා නොගැලපෙන එකතු කිරීම් සිදු කර ඇත: මාතෘකා සටහන් (ස්පොයිලර් යටතේ) සහ අධි සබැඳි.
- මට උවමනයි ප්රශ්න සහ අදහස් එකතු කරන්න, වෙනත් ඕනෑම ප්රකාශනයක සංශෝධිත පෝරමයක මෙම පාඨය ඇතුළත් කිරීමේදී ඒවා සැලකිල්ලට ගැනීම සඳහා.
- බොහෝ Semantic Web සහ Linked Data අනුගාමිකයින් තවමත් විශ්වාස කරන්නේ ඔවුන්ගේ කවය ඉතා පටු බව, ප්රධාන වශයෙන් සාමාන්ය ජනතාවට තවමත් Semantic Web සහ Linked Data අනුගාමිකයෙකු වීම කෙතරම් ශ්රේෂ්ඨද යන්න පැහැදිලි කර නොමැති බැවිනි. ඛණ්ඩනයේ කතුවරයා, ඔහු මෙම කවයට අයත් වුවද, මෙම මතය දරන්නේ නැත, කෙසේ වෙතත්, තවත් උත්සාහයක් ගැනීමට තමා බැඳී සිටින බව සලකයි.
එසේ නම්,
සෙමැන්ටික වෙබ්
අන්තර්ජාලයේ පරිණාමය පහත පරිදි නිරූපණය කළ හැකිය (හෝ පහත දැක්වෙන අනුපිළිවෙලෙහි පිහිටුවා ඇති එහි කොටස් ගැන කතා කරන්න):
- අන්තර්ජාලයේ ලේඛන. ප්රධාන තාක්ෂණයන් - Gopher, FTP, ආදිය.
අන්තර්ජාලය යනු දේශීය සම්පත් හුවමාරු කර ගැනීමේ ගෝලීය ජාලයකි. - අන්තර්ජාල ලේඛන. ප්රධාන තාක්ෂණයන් වන්නේ HTML සහ HTTP ය.
නිරාවරණය වන සම්පත් වල ස්වභාවය ඔවුන්ගේ සම්ප්රේෂණ මාධ්යයේ ලක්ෂණ සැලකිල්ලට ගනී. - අන්තර්ජාල දත්ත. ප්රධාන තාක්ෂණයන් - REST සහ SOAP API, XHR, ආදිය.
අන්තර්ජාල යෙදුම් යුගය, මිනිසුන් පමණක් නොව සම්පත් පාරිභෝගිකයන් බවට පත් වේ. - අන්තර්ජාල දත්ත. ප්රධාන තාක්ෂණයන් වන්නේ සම්බන්ධිත දත්ත තාක්ෂණයයි.
මෙම සිව්වන අදියර, දෙවන හා W3C හි අධ්යක්ෂ ප්රධාන තාක්ෂණයේ නිර්මාතෘ වන බර්නර්ස්-ලී විසින් පුරෝකථනය කරන ලද අතර, එය Semantic Web ලෙස හැඳින්වේ; සබැඳි දත්ත තාක්ෂණ සැලසුම් කර ඇත්තේ වෙබයේ දත්ත යන්ත්රයෙන් කියවිය හැකි පමණක් නොව, “යන්ත්රයෙන් තේරුම් ගත හැකි” බවට පත් කිරීමට ය.
පහත දැක්වෙන දේවලින්, දෙවන සහ සිව්වන අදියරවල ප්රධාන සංකල්ප අතර ලිපි හුවමාරුව පාඨකයාට වැටහෙනු ඇත:
- URLs URI වලට සමානයි,
- HTML හි ප්රතිසමය RDF වේ,
- HTML අධි සබැඳි RDF ලේඛනවල URI සිදුවීම් වලට සමාන වේ.
Semantic Web යනු නිශ්චිත ස්වයංසිද්ධ හෝ ලොබි ප්රවණතාවයකට වඩා අන්තර්ජාලයේ අනාගතය පිළිබඳ පද්ධතිමය දැක්මකි, නමුත් එයට මේවා සැලකිල්ලට ගත හැකිය. උදාහරණයක් ලෙස, Web 2.0 ලෙස හැඳින්වෙන වැදගත් ලක්ෂණයක් "පරිශීලක-උත්පාදිත අන්තර්ගතය" ලෙස සැලකේ. විශේෂයෙන්ම, W3C නිර්දේශය සැලකිල්ලට ගැනීම සඳහා කැඳවනු ලැබේ "
Semantic Web එක මිය ගිහින්ද?
ඔබ ප්රතික්ෂේප කරන්නේ නම්
පොදුවේ ගත් කල, කතුවරයාට විශාල පැතිරීම වළක්වන්නේ කුමක් දැයි පැවසිය නොහැක, නමුත් ඔහුට පුද්ගලික අත්දැකීම් මත කතා කළ හැකිය. එස්ඩබ්ලිව් ප්රහාරයේ තත්වයන් තුළ "පෙට්ටියෙන් පිටත" විසඳිය හැකි ගැටළු තිබේ, ඒවා එතරම් පුළුල් නොවූවත්. එහි ප්රතිඵලයක් වශයෙන්, මෙම කර්තව්යයන්ට මුහුණ දෙන අයට විසඳුමක් ලබා දිය හැකි අයට එරෙහිව බලකිරීමේ ක්රමයක් නොමැති අතර, දෙවැන්නාගේ ස්වාධීන විසඳුමක් ලබා දීම ඔවුන්ගේ ව්යාපාරික ආකෘතීන්ට පටහැනි වේ. එබැවින් අපි HTML විග්රහ කිරීම සහ විවිධ API එකට ඇලවීම දිගටම කරගෙන යමු.
කෙසේ වෙතත්, සබැඳි දත්ත තාක්ෂණයන් ප්රධාන ධාරාවෙන් ඔබ්බට පැතිරී ඇත; පොත, ඇත්ත වශයෙන්ම, මෙම යෙදුම් සඳහා කැප කර ඇත. දැනට, සම්බන්ධිත දත්ත ප්රජාව මෙම තාක්ෂණයන් වඩාත් පුළුල් වනු ඇතැයි අපේක්ෂා කරන්නේ ගාට්නර්ගේ පටිගත කිරීම් (හෝ ඔබ කැමති පරිදි ප්රකාශ කිරීම) වැනි ප්රවණතාවලට ස්තුති වන්නට ය. දැනුම ප්රස්තාර и දත්ත රෙදි. පහත සාකච්ඡා කර ඇති W3C ප්රමිතීන්ට අදාළ ඒවා මිස මෙම සංකල්පවල “බයිසිකල්” ක්රියාත්මක කිරීම සාර්ථක නොවනු ඇතැයි මම විශ්වාස කිරීමට කැමැත්තෙමි.
සම්බන්ධිත දත්ත
බර්නර්ස්-ලී සම්බන්ධිත දත්ත අර්ථකථනය කළේ "නිවැරදිව කරන ලද" වෙබ් අඩවිය ලෙසයි: එහි අවසාන අරමුණු සාක්ෂාත් කර ගැනීමට ඉඩ සලසන ප්රවේශයන් සහ තාක්ෂණයන් සමූහයකි. සම්බන්ධිත දත්ත බර්නර්ස්-ලී හි මූලික මූලධර්ම
මූලධර්මය 1. ආයතන නම් කිරීමට URI භාවිතා කිරීම.
URIs ප්රවේශයන් සඳහා වන දේශීය තන්තු හඳුනාගැනීම්වලට ප්රතිවිරුද්ධව ගෝලීය ආයතන හඳුනාගැනීම් වේ. පසුව, මෙම මූලධර්මය Google දැනුම ප්රස්තාර සටන් පාඨය තුළ වඩාත් හොඳින් ප්රකාශ විය.
මූලධර්මය 2. HTTP යෝජනා ක්රමය තුළ URI භාවිත කිරීම නිසා ඒවා ඉවත් කිරීමට හැකි වේ.
URI වෙත යොමු කිරීම මගින්, එම හැඟවුම්කාරකය පිටුපස ඇති සංඥාව ලබා ගැනීමට හැකි විය යුතුය (මෙහි ක්රියාකරුගේ නම සමඟ ඇති ප්රතිසමය පැහැදිලිය ").*
"C හි); වඩාත් නිවැරදිව, HTTP ශීර්ෂයේ අගය මත පදනම්ව - මෙම සංඥාවේ යම් නියෝජනයක් ලබා ගැනීමට Accept:
. සමහර විට, AR/VR යුගයේ පැමිණීමත් සමඟ, එය සම්පතම ලබා ගැනීමට හැකි වනු ඇත, නමුත් දැනට, බොහෝ විට, එය RDF ලේඛනයක් වනු ඇත, එය SPARQL විමසුමක් ක්රියාත්මක කිරීමේ ප්රතිඵලයකි. DESCRIBE
.
මූලධර්මය 3. W3C ප්රමිතීන් භාවිතා කිරීම - මූලික වශයෙන් RDF(S) සහ SPARQL - විශේෂයෙන්ම URIs dereferencing විට.
සම්බන්ධිත දත්ත තාක්ෂණ තොගයේ මෙම තනි “ස්ථර” ලෙසද හැඳින්වේ
මූලධර්මය 4. ආයතන විස්තර කිරීමේදී වෙනත් URI වෙත යොමු භාවිතය.
ස්වාභාවික භාෂාවෙන් සම්පතක් පිළිබඳ වාචික විස්තරයකට සීමා කිරීමට RDF ඔබට ඉඩ සලසයි, සහ සිව්වන මූලධර්මය මෙය නොකරන ලෙස ඉල්ලා සිටී. පළමු මූලධර්මය විශ්වීයව නිරීක්ෂණය කරන්නේ නම්, සම්පතක් විස්තර කිරීමේදී “විදේශීය” ඒවා ඇතුළුව වෙනත් අය වෙත යොමු කිරීමට හැකි වේ, එබැවින් දත්ත සම්බන්ධිත ලෙස හැඳින්වේ. ඇත්ත වශයෙන්ම, RDFS වචන මාලාවේ නම් කර ඇති URI භාවිතා කිරීම පාහේ නොවැළැක්විය හැකිය.
RDF
ත්රිත්ව ලෙස හැඳින්වෙන “විෂය-පුරෝකථනය-වස්තු” ආකාරයේ ප්රකාශයන් ආයතන සහ ඒවායේ සම්බන්ධතා පිළිබඳව සිදු කෙරේ. සරලම අවස්ථාවෙහිදී, විෂය, පුරෝකථනය සහ වස්තුව යන සියල්ලම URI වේ. එකම URI විවිධ ත්රිත්වවල විවිධ ස්ථානවල තිබිය හැක: විෂයයක්, පුරෝකථනයක් සහ වස්තුවක් වන්න; මේ අනුව, ත්රිත්ව RDF ප්රස්ථාරයක් ලෙස හඳුන්වන ප්රස්ථාර වර්ගයක් සාදයි.
විෂයයන් සහ වස්තූන් URI පමණක් නොව, ඊනියා ද විය හැකිය හිස් නෝඩ්, සහ වස්තූන් ද විය හැක වචනාර්ථයෙන්. අක්ෂර යනු තන්තු නිරූපණයකින් සහ වර්ගය ඇඟවීමකින් සමන්විත ප්රාථමික වර්ගවල අවස්ථා වේ.
වචනාර්ථ ලිවීමේ උදාහරණ (කැස්බෑ වාක්ය ඛණ්ඩයේ, ඒ ගැන වැඩි විස්තර පහතින්): "5.0"^^xsd:float
и "five"^^xsd:string
. වර්ගය සහිත අක්ෂර rdf:langString
භාෂා ටැගයකින් ද සමන්විත විය හැකිය; කැස්බෑවේ එය මෙසේ ලියා ඇත: "five"@en
и "пять"@ru
.
හිස් නෝඩ් යනු ගෝලීය හඳුනාගැනීම් නොමැති "නිර්නාමික" සම්පත් වන අතර, කෙසේ වෙතත්, ප්රකාශ කළ හැක; පැවැත්මේ විචල්ය වර්ගයකි.
ඉතින් (මෙය ඇත්ත වශයෙන්ම, RDF හි සමස්ත කරුණයි):
- විෂය URI හෝ හිස් නෝඩයකි,
- පුරෝකථනය URI වේ,
- වස්තුව යනු URI, හිස් නෝඩයක් හෝ වචනාර්ථයකි.
පුරෝකථන හිස් නෝඩ් විය නොහැක්කේ ඇයි?
විය හැකි හේතුව වන්නේ අවිධිමත් ලෙස තේරුම් ගැනීමට සහ ත්රිත්ව පළමු පෙළ පුරෝකථන තර්කයේ භාෂාවට පරිවර්තනය කිරීමට ඇති ආශාවයි. s p o
වගේ දෙයක් වගේ කොහෙද - පුරෝකථනය කරන්න, и - නියතයන්. මෙම අවබෝධයේ සලකුණු ලේඛනයේ ඇත "s p []
කොහෙද []
- හිස් නෝඩය, ලෙස පරිවර්තනය වනු ඇත කොහෙද - විචල්යය, නමුත් පරිවර්තනය කරන්නේ කෙසේද s [] o
? W3C නිර්දේශ තත්ත්වය සහිත ලේඛනය "
කෙසේ වෙතත්, මනු ස්පෝර්නි
RDF යනු වියුක්ත ආකෘතියකි. RDF විවිධ වාක්ය ඛණ්ඩ වලින් ලිවිය හැක (අනුක්රමික)
එකම RDF විවිධ ආකාරවලින් RDF/XML වෙත අනුක්රමික කළ හැක, එබැවින්, උදාහරණයක් ලෙස, XSD භාවිතයෙන් ලැබෙන XML වලංගු කිරීම හෝ XPath භාවිතයෙන් දත්ත උකහා ගැනීමට උත්සාහ කිරීම තේරුමක් නැත. ඒ හා සමානව, JSON-LD විසින් සාමාන්ය ජාවාස්ක්රිප්ට් සංවර්ධකයාගේ සාමාන්ය ජාවාස්ක්රිප්ට් සංවර්ධකයාගේ ජාවාස්ක්රිප්ට් හි තිත සහ හතරැස් වරහන් අංකනය භාවිතයෙන් RDF සමඟ වැඩ කිරීමට ඇති ආශාව තෘප්තිමත් කිරීමට අපහසුය (JSON-LD යාන්ත්රණයක් ඉදිරිපත් කිරීමෙන් එම දිශාවට ගමන් කරයි.
බොහෝ සින්ටැක්ස් දිගු URI කෙටි කිරීමට ක්රම ඉදිරිපත් කරයි. උදාහරණයක් ලෙස, දැන්වීමක් @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
කැස්බෑවේ පසුව ඔබට ඒ වෙනුවට ලිවීමට ඉඩ දෙනු ඇත <http://www.w3.org/1999/02/22-rdf-syntax-ns#type>
සාධාරණයි rdf:type
.
RDFS
rdf:type
, rdfs:subClassOf
, rdfs:domain
и rdfs:range
. උදාහරණයක් ලෙස RDFS ශබ්දකෝෂය භාවිතයෙන් පහත වලංගු ප්රකාශන ලිවිය හැක:
rdf:type rdf:type rdf:Property .
rdf:Property rdf:type rdfs:Class .
rdfs:Class rdfs:subClassOf rdfs:Resource .
rdfs:subClassOf rdfs:domain rdfs:Class .
rdfs:domain rdfs:domain rdf:Property .
rdfs:domain rdfs:range rdfs:Class .
rdfs:label rdfs:range rdfs:Literal .
RDFS යනු විස්තර සහ ආකෘතිකරණ වචන මාලාවකි, නමුත් එය සීමා කිරීමේ භාෂාවක් නොවේ (නිල පිරිවිතර සහ :author rdfs:range foaf:Person
ඒකේ තේරුම rdf:type
සියලු දේපල වටිනාකම් :author
- foaf:Person
, නමුත් මෙය කල්තියා පැවසිය යුතු බව ඉන් අදහස් නොවේ.
SPARQL
විමසුම මඟින් එවැනි විචල්ය අගයන් ලබා දෙන අතර එය සාම්පලවලට ආදේශ කළ විට විමසූ RDF ප්රස්ථාරයේ උප ප්රස්ථාරයක් (එහි ත්රිත්වවල උප කුලකයක්) ඇති කළ හැක. ත්රිත්ව විවිධ සාම්පලවල එකම නමේ විචල්යයන් එකම අගයන් තිබිය යුතුය.
උදාහරණයක් ලෙස, ඉහත RDFS axioms හතේ කට්ටලය ලබා දී ඇති විට, පහත විමසුම නැවත පැමිණෙනු ඇත rdfs:domain
и rdfs:range
අගයන් ලෙස ?s
и ?p
පිළිවෙලින්:
SELECT * WHERE {
?s ?p rdfs:Class .
?p ?p rdf:Property .
}
SPARQL ප්රකාශනාත්මක වන අතර එය ප්රස්තාර සංක්රමණය විස්තර කිරීමේ භාෂාවක් නොවන බව සඳහන් කිරීම වටී (කෙසේ වෙතත්, සමහර RDF ගබඩාවන් විමසුම් ක්රියාත්මක කිරීමේ සැලැස්ම සකස් කිරීමට ක්රම ඉදිරිපත් කරයි). එමනිසා, සමහර සම්මත ප්රස්ථාර ගැටළු, උදාහරණයක් ලෙස, කෙටිම මාර්ගය සොයා ගැනීම, SPARQL භාවිතා කිරීම ඇතුළුව, විසඳිය නොහැක.
SPARQL ලෝකයේ විවෘතභාවය පිළිබඳ උපකල්පනය බෙදා නොගන්නා අතර "අසාර්ථක ලෙස නිෂේධනය" ප්රවේශය අනුගමනය කරයි. FILTER NOT EXISTS {…}
. යාන්ත්රණය භාවිතයෙන් දත්ත බෙදා හැරීම සැලකිල්ලට ගනී
SPARQL ප්රවේශ ලක්ෂ්යය - SPARQL විමසුම් සැකසීමේ හැකියාව ඇති RDF ගබඩාවකි - දෙවන අදියරේ සිට සෘජු ප්රතිසමයක් නොමැත (මෙම ඡේදයේ ආරම්භය බලන්න). එය HTML පිටු ජනනය කරන ලද, නමුත් පිටතින් ප්රවේශ විය හැකි අන්තර්ගතය මත පදනම්ව, දත්ත සමුදායකට සමාන කළ හැක. SPARQL ප්රවේශ ලක්ෂ්යය තුන්වන අදියරේ සිට API ප්රවේශ ලක්ෂ්යයට වඩා සමාන නමුත් ප්රධාන වෙනස්කම් දෙකක් ඇත. පළමුව, “පරමාණුක” විමසුම් කිහිපයක් එකකට ඒකාබද්ධ කළ හැකිය (එය GraphQL හි ප්රධාන ලක්ෂණයක් ලෙස සැලකේ), සහ දෙවනුව, එවැනි API සම්පූර්ණයෙන්ම ස්වයං ලේඛනගත වේ (එය HATEOAS සාක්ෂාත් කර ගැනීමට උත්සාහ කළ දෙයයි).
විවාදාත්මක ප්රකාශය
RDF යනු වෙබයේ දත්ත ප්රකාශ කිරීමේ ක්රමයකි, එබැවින් RDF ගබඩාව DBMS ලේඛනයක් ලෙස සැලකිය යුතුය. RDF යනු ප්රස්ථාරයක් මිස ගසක් නොවන බැවින් ඒවා ප්රස්ථාර මත පදනම් වූ ඒවා බව ඇත්තකි. එය කිසිසේත්ම සාර්ථක වීම පුදුම සහගතය. කවුද හිතුවේ හිස් නෝඩ් ක්රියාත්මක කරන බුද්ධිමත් අය ඇති කියලා. කෝඩ් මෙතන
RDF දත්ත වෙත ප්රවේශය සංවිධානය කිරීමට අඩු අංග සම්පූර්ණ ක්රම ද ඇත, උදාහරණයක් ලෙස,
OWL
OWL හි විස්තරාත්මක තර්ක පිළිබඳ සංකල්ප පන්තිවලට අනුරූප වේ, භූමිකාවන් ගුණාංගවලට අනුරූප වේ, පුද්ගලයන් ඔවුන්ගේ පෙර නම රඳවා ගනී. Axioms axioms ලෙසද හැඳින්වේ.
උදාහරණයක් ලෙස, ඊනියා දී
Class: Human
Class: Parent
EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent
OWL ලිවීම සඳහා වෙනත් වාක්ය ඛණ්ඩ තිබේ
OWL RDF සමඟ ද්විත්ව සම්බන්ධතාවයක් ඇත. එක් අතකින්, එය RDFS දිගු කරන ශබ්දකෝෂයක් ලෙස සැලකිය හැකිය. අනෙක් අතට, එය RDF යනු අනුක්රමික ආකෘතියක් පමණක් වන වඩා බලවත් විධිමත්භාවයකි. සියලුම මූලික OWL ඉදිකිරීම් තනි RDF ත්රිත්වයක් භාවිතයෙන් ලිවිය නොහැක.
OWL ඉදිකිරීම් වල කුමන උප කුලකයක් භාවිතා කිරීමට අවසර තිබේද යන්න මත පදනම්ව, ඔවුන් ඊනියා ගැන කතා කරයි
OWL හි ප්රතිවිපාක අනුයුක්ත කිරීම සඳහා ප්රධාන මූලධර්ම වන්නේ විවෘත ලෝක උපකල්පනය අනුගමනය කිරීමයි.
ඔන්ටොලොජියෙහි පහත ඛණ්ඩනය අඩංගු වේ (මැන්චෙස්ටර් වාක්ය ඛණ්ඩයේ):
Class: manyChildren
EquivalentTo: Human that hasChild min 3
Individual: John
Types: Human
Facts: hasChild Alice, hasChild Bob, hasChild Carol
ජෝන්ට බොහෝ දරුවන් සිටින බව පවසා ඇති දෙයින් එය අනුගමනය කරයිද? ඇලිස් සහ බොබ් එකම පුද්ගලයා විය හැකි බැවින් UNA ප්රතික්ෂේප කිරීම අනුමාන එන්ජිමට මෙම ප්රශ්නයට සෘණාත්මකව පිළිතුරු දීමට බල කරයි. පහත සඳහන් දේ සිදු වීමට නම්, පහත සඳහන් ප්රත්යය එකතු කිරීම අවශ්ය වේ:
DifferentIndividuals: Alice, Bob, Carol, John
දැන් ඔන්ටොලොජි ඛණ්ඩයට පහත ස්වරූපය තිබිය යුතුය (ජෝන්ට බොහෝ දරුවන් සිටින බව ප්රකාශ කර ඇත, නමුත් ඔහුට සිටින්නේ දරුවන් දෙදෙනෙකු පමණි):
Class: manyChildren
EquivalentTo: Human that hasChild min 3
Individual: John
Types: Human, manyChildren
Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John
මෙම ඔන්ටොලොජි (අවලංගු දත්තවල සාක්ෂි ලෙස අර්ථ දැක්විය හැකි) නොගැලපේද? OWA පිළිගැනීමෙන් අනුමාන එන්ජිම සෘණාත්මකව ප්රතිචාර දැක්වීමට හේතු වනු ඇත: "කොතැනක හෝ" (වෙනත් ඔන්ටොලොජියක) කැරොල් ද ජෝන්ගේ දරුවා බව පැවසිය හැකිය.
මෙය සිදුවීමේ හැකියාව බැහැර කිරීම සඳහා, ජෝන් පිළිබඳ නව කරුණක් එකතු කරමු:
Individual: John
Facts: hasChild Alice, hasChild Bob, not hasChild Carol
අනෙක් දරුවන්ගේ පෙනුම බැහැර කිරීම සඳහා, “දරුවෙකු සිටින” දේපලෙහි සියලුම වටිනාකම් මිනිසුන් යැයි කියමු, ඔවුන්ගෙන් අපට ඇත්තේ හතරක් පමණි:
ObjectProperty: hasChild
Domain: Human
Сharacteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }
දැන් ඔන්ටොලොජිය පරස්පර විරෝධී වනු ඇත, එය අනුමාන එන්ජිම වාර්තා කිරීමට අසමත් නොවනු ඇත. අපට ඇති අවසාන ප්රත්යක්ෂයන් සමඟ, එක් අර්ථයකින්, ලෝකය “වසා” ඇති අතර, ජෝන් ඔහුගේම දරුවෙකු වීමේ හැකියාව බැහැර කරන්නේ කෙසේදැයි දකිමු.
ව්යවසාය දත්ත සම්බන්ධ කිරීම
සබැඳි දත්ත කට්ටලය ප්රවේශයන් සහ තාක්ෂණයන් මුලින් අදහස් කළේ වෙබයේ දත්ත ප්රකාශනය සඳහා ය. අභ්යන්තර ආයතනික පරිසරයක ඔවුන්ගේ භාවිතය දුෂ්කරතා ගණනාවකට මුහුණ දෙයි.
උදාහරණයක් ලෙස, සංවෘත ආයතනික පරිසරයක් තුළ, OWA සම්මත කිරීම සහ UNA ප්රතික්ෂේප කිරීම මත පදනම් වූ OWL හි අඩු කිරීමේ බලය, වෙබයේ විවෘත සහ බෙදා හරින ලද ස්වභාවය නිසා ගන්නා තීරණ ඉතා දුර්වල ය. සහ මෙහි පහත විසඳුම් හැකි ය.
- OWL ට අර්ථ ශාස්ත්රය ලබා දීම, OWA අත්හැරීම සහ UNA සම්මත කිරීම, අනුරූප නිමැවුම් එන්ජිම ක්රියාත්මක කිරීම ඇඟවුම් කරයි. - මේ මාර්ගය දිගේ
යනවා Stardog RDF ගබඩාව. - රීති එන්ජින් සඳහා OWL හි අඩු කිරීමේ හැකියාවන් අත්හැරීම. - Stardog සහාය
SWRL ; Jena සහ GraphDB පිරිනැමීමතමන්ගේම භාෂා නීති - OWL හි අඩු කිරීමේ හැකියාවන් ප්රතික්ෂේප කිරීම, ආකෘති නිර්මාණය සඳහා RDFS ට ආසන්න එක් හෝ තවත් උප කුලකයක් භාවිතා කිරීම. - මේ ගැන වැඩි විස්තර පහතින් බලන්න.
තවත් ගැටළුවක් වන්නේ දත්ත ගුණාත්මක ගැටළු සහ සම්බන්ධිත දත්ත තොගයේ දත්ත වලංගු කිරීමේ මෙවලම් නොමැතිකම පිළිබඳව ආයතනික ලෝකයට ඇති වැඩි අවධානයයි. මෙහි නිමැවුම් පහත පරිදි වේ.
- නැවතත්, සුදුසු අනුමාන එන්ජිමක් තිබේ නම්, සංවෘත ලෝක අර්ථ ශාස්ත්රය සහ අද්විතීය නම් සහිත OWL ඉදිකිරීම් වලංගු කිරීම සඳහා භාවිතා කරන්න.
- භාවිතා කරන්න
SHACL , Semantic Web Layer Cake ස්ථර ලැයිස්තුව ස්ථාවර කිරීමෙන් පසුව ප්රමිතිගත කර ඇත (කෙසේ වෙතත්, එය රීති එන්ජිමක් ලෙසද භාවිතා කළ හැක), හෝෂෙක්ස් . - සියල්ල අවසානයේ සිදු වන්නේ SPARQL විමසුම් වලින් බව වටහා ගැනීම, ඒවා භාවිතයෙන් ඔබේම සරල දත්ත වලංගු කිරීමේ යාන්ත්රණයක් නිර්මාණය කිරීම.
කෙසේ වෙතත්, අඩු කිරීමේ හැකියාවන් සහ වලංගු කිරීමේ මෙවලම් සම්පූර්ණයෙන් ප්රතික්ෂේප කිරීම පවා, සම්බන්ධිත දත්ත තොගය තරඟකාරීත්වයෙන් බැහැර කරයි, භූ දර්ශනයේ විවෘත සහ බෙදා හරින ලද වෙබ් - දත්ත ඒකාබද්ධ කිරීමේ කාර්යයන් සඳහා සමාන වේ.
සාමාන්ය ව්යවසාය තොරතුරු පද්ධතියක් ගැන කුමක් කිව හැකිද?
මෙය කළ හැකි නමුත්, ඇත්ත වශයෙන්ම, අදාළ තාක්ෂණයන් විසඳිය යුතු ගැටළු මොනවාදැයි ඔබ දැන සිටිය යුතුය. සාම්ප්රදායික තොරතුරු තාක්ෂණයේ දෘෂ්ටි කෝණයෙන් මෙම තාක්ෂණ තොගය පෙනෙන්නේ කෙසේද යන්න පෙන්වීමට සංවර්ධන සහභාගිවන්නන්ගේ සාමාන්ය ප්රතිචාරයක් මම මෙහි විස්තර කරමි. මට අලියාගේ උපමාව ටිකක් මතක් කරනවා.
- ව්යාපාර විශ්ලේෂක: RDF යනු සෘජුවම ගබඩා කර ඇති තාර්කික ආකෘතියක් වැනි දෙයකි.
- පද්ධති විශ්ලේෂක: RDF වගේ
EAV , දර්ශක පොකුරක් සහ පහසු විමසුම් භාෂාවක් සමඟ පමණි. - සංවර්ධක: හොඳයි, මේ සියල්ල පොහොසත් ආකෘතිය සහ අඩු කේතය යන සංකල්පවල ආත්මය තුළ ය,
කියවමින් සිටියේය මේ ගැන මෑතකදී. - ව්යාපෘති කළමනාකරු: ඔව් ඒකම තමයි
තොගය කඩා වැටීම !
ප්රායෝගිකව පෙන්නුම් කරන්නේ දත්ත බෙදා හැරීම සහ විෂමජාතිය සම්බන්ධ කාර්යයන් සඳහා තොගය බොහෝ විට භාවිතා වන බවයි, උදාහරණයක් ලෙස, MDM (Master Data Management) හෝ DWH (Data Warehouse) පන්ති පද්ධති තැනීමේදී. එවැනි ගැටළු ඕනෑම කර්මාන්තයක පවතී.
කර්මාන්ත-විශේෂිත යෙදුම් අනුව, සම්බන්ධිත දත්ත තාක්ෂණයන් පහත සඳහන් කර්මාන්තවල දැනට වඩාත් ජනප්රිය වේ.
- ජෛව වෛද්ය තාක්ෂණ (ඔවුන්ගේ ජනප්රියත්වය වසමෙහි සංකීර්ණත්වය හා සම්බන්ධ බව පෙනේ);
දැනට
“ජාතික වෛද්ය දැනුම පදනම” සංගමය විසින් සංවිධානය කරන ලද සම්මන්ත්රණයක් පසුගියදා “බෝයිලින් පොයින්ට්” හි පැවැත්විණි.
- සංකීර්ණ නිෂ්පාදන නිෂ්පාදනය සහ ක්රියාත්මක කිරීම (විශාල යාන්ත්රික ඉංජිනේරු විද්යාව, තෙල් සහ ගෑස් නිෂ්පාදනය; බොහෝ විට අපි කතා කරන්නේ සම්මතය ගැන ය
ISO 15926 );
දැනට
මෙන්න, ද, හේතුව විෂය ක්ෂේත්රයේ සංකීර්ණත්වය, විට, උදාහරණයක් ලෙස, ඉහළ අදියර, අපි තෙල් හා ගෑස් කර්මාන්තය ගැන කතා කරන්නේ නම්, සරල ගිණුම්කරණය සමහර CAD කාර්යයන් අවශ්ය වේ.
2008 දී, Chevron විසින් සංවිධානය කරන ලද නියෝජිත ස්ථාපන උත්සවයක් සිදු විය
ISO 15926, අවසානයේදී, තෙල් හා ගෑස් කර්මාන්තයට තරමක් බර බවක් පෙනෙන්නට තිබුණි (සහ යාන්ත්රික ඉංජිනේරු විද්යාවේ සමහර විට විශාල යෙදුමක් සොයාගෙන ඇත). ස්ටාටොයිල් (Equinor) පමණක් එයට හොඳින් සම්බන්ධ විය; නෝර්වේහි, සමස්තයක් වශයෙන්
- මූල්ය සංවිධාන (XBRL පවා SDMX සහ RDF Data Cube ontology හි දෙමුහුන් වර්ගයක් ලෙස සැලකිය හැක);
දැනට
වසර ආරම්භයේදී, LinkedIn විසින් “Force Majeure” රූපවාහිනී කතා මාලාවෙන් ඔහු දන්නා මූල්ය කර්මාන්තයේ සියලුම දැවැන්තයින්ගේ පුරප්පාඩු සමඟ කතුවරයාට සක්රියව ස්පෑම් කළේය: Goldman Sachs, JP Morgan Chase සහ/හෝ Morgan Stanley, Wells Fargo, SWIFT/Visa/Mastercard, Bank of America, Citigroup, Fed, Deutsche Bank... සමහරවිට හැමෝම හොයන්නේ තමන්ට එවන්න පුළුවන් කෙනෙක්ව වෙන්න ඇති.
HeadHunter හි, Sberbank පමණක් රසවත් දෙයක් හමු විය; එය "RDF වැනි දත්ත ආකෘතියක් සහිත EAV ගබඩා කිරීම" ගැන ය.
බොහෝ විට, දේශීය හා බටහිර මූල්ය ආයතනවල අනුරූප තාක්ෂණයන් සඳහා ඇති ආදරයේ ප්රමාණයේ වෙනස, දෙවැන්නෙහි ක්රියාකාරකම්වල අන්තර් ජාතික ස්වභාවය නිසා විය හැකිය. පෙනෙන විදිහට, රාජ්ය දේශසීමා හරහා ඒකාබද්ධ කිරීම සඳහා ගුණාත්මකව වෙනස් ආයතනික සහ තාක්ෂණික විසඳුම් අවශ්ය වේ.
- වාණිජ යෙදුම් සහිත ප්රශ්න-පිළිතුරු පද්ධති (IBM Watson, Apple Siri, Google Knowledge Graph);
දැනට
මාර්ගය වන විට, සිරියේ නිර්මාතෘ, තෝමස් ගෲබර්, ඔන්ටොලොජි (තොරතුරු තාක්ෂණ අර්ථයෙන්) "සංකල්පීය පිරිවිතරයක්" ලෙස අර්ථ දැක්වීමේ කතුවරයා වේ. මගේ මතය අනුව, මෙම නිර්වචනයේ ඇති වචන නැවත සකස් කිරීමෙන් එහි අර්ථය වෙනස් නොවේ, සමහර විට එය එහි නොමැති බව පෙන්නුම් කරයි.
- ව්යුහගත දත්ත ප්රකාශනය (වැඩි සාධාරණීකරණයක් සහිතව මෙය සබැඳි විවෘත දත්ත වෙත ආරෝපණය කළ හැක).
දැනට
සම්බන්ධිත දත්තවල විශාල රසිකයින් වන්නේ ඊනියා GLAM: ගැලරි, පුස්තකාල, ලේඛනාගාර, සහ කෞතුකාගාර. කොන්ග්රස් පුස්තකාලය MARC21 සඳහා ආදේශකයක් ප්රවර්ධනය කරන බව පැවසීම ප්රමාණවත්ය
සබැඳි විවෘත දත්ත ක්ෂේත්රයේ සාර්ථක ව්යාපෘතියක උදාහරණයක් ලෙස විකිදත්ත බොහෝ විට උපුටා දක්වයි - විකිපීඩියාවේ යන්ත්ර කියවිය හැකි අනුවාදයකි, එහි අන්තර්ගතය, DBPedia වලට ප්රතිවිරුද්ධව, ලිපි තොරතුරු කොටු වලින් ආයාත කිරීමෙන් ජනනය නොවේ, නමුත් අතින් අඩු වැඩි වශයෙන් නිර්මාණය කර ඇත (පසුව එම තොරතුරු පෙට්ටි සඳහා තොරතුරු මූලාශ්රයක් බවට පත් වේ).
ඔබ එය පරීක්ෂා කරන ලෙස ද අපි නිර්දේශ කරමු
එය එසේ වේවා, ගාට්නර්හි
ව්යවසාය දත්ත සම්බන්ධ කිරීම
අනාවැකි, අනාවැකි, අනාවැකි ...
ඓතිහාසික උනන්දුව නිසා, මම අපට උනන්දුවක් දක්වන තාක්ෂණයන් පිළිබඳ විවිධ වසර සඳහා ගාට්නර්ගේ අනාවැකි පහත වගුගත කර ඇත.
වසර | තාක්ෂණය | වාර්තාව | පිහිටීම | සානුවට අවුරුදු |
---|---|---|---|---|
2001 | සෙමැන්ටික වෙබ් | නැගී එන තාක්ෂණයන් | නවෝත්පාදන ප්රේරකය | 5-10 |
2006 | ආයතනික අර්ථකථන වෙබ් | නැගී එන තාක්ෂණයන් | පුම්බන ලද අපේක්ෂාවන්හි උච්චතම අවස්ථාව | 5-10 |
2012 | සෙමැන්ටික වෙබ් | විශාල දත්ත | පුම්බන ලද අපේක්ෂාවන්හි උච්චතම අවස්ථාව | > 10 |
2015 | සම්බන්ධිත දත්ත | උසස් විශ්ලේෂණ සහ දත්ත විද්යාව | කලකිරීමේ අගල | 5-10 |
2016 | ව්යවසාය ඔන්ටොලොජි කළමනාකරණය | නැගී එන තාක්ෂණයන් | කලකිරීමේ අගල | > 10 |
2018 | දැනුම ප්රස්තාර | නැගී එන තාක්ෂණයන් | නවෝත්පාදන ප්රේරකය | 5-10 |
කෙසේ වෙතත්, දැනටමත් ඇත
සෑම ප්රස්ථාරයක්ම පාහේ DBMS දැන් ආයතනික “දැනුම ප්රස්ථාරයක්” (“සම්බන්ධිත දත්ත” සමහර විට “සම්බන්ධිත දත්ත” මගින් ප්රතිස්ථාපනය වේ) ගොඩනැගීම සඳහා සුදුසු වේදිකාවක් ප්රකාශ කරයි, නමුත් එවැනි ප්රකාශයන් කෙතරම් සාධාරණද?
ප්රස්තාර දත්ත සමුදායන් තවමත් අසමමිතික ය; ප්රස්ථාරයක DBMS හි දත්ත තවමත් එකම දත්ත සිලෝ වේ. URI වෙනුවට String identifier මඟින් ප්රස්ථාර DBMS දෙකක් ඒකාබද්ධ කිරීමේ කාර්යය තවමත් ඒකාබද්ධ කාර්යයක් බවට පත් කරයි, RDF ගබඩා දෙකක් ඒකාබද්ධ කිරීම බොහෝ විට RDF ප්රස්ථාර දෙකක් ඒකාබද්ධ කිරීම දක්වා පැමිණේ. asemanticity හි තවත් පැතිකඩක් වන්නේ LPG ප්රස්ථාර ආකෘතියේ ප්රත්යාවර්තකතාව නොවන අතර, එම වේදිකාව භාවිතා කරමින් පාරදත්ත කළමනාකරණය කිරීම අපහසු වේ.
අවසාන වශයෙන්, ප්රස්ථාර DBMS වලට අනුමාන එන්ජින් හෝ රීති එන්ජින් නොමැත. එවැනි එන්ජින්වල ප්රතිඵල සංකීර්ණ විමසුම් මගින් ප්රතිනිෂ්පාදනය කළ හැකි නමුත්, SQL හි පවා මෙය කළ හැකිය.
කෙසේ වෙතත්, ප්රමුඛ පෙළේ RDF ගබඩා පද්ධතිවලට LPG ආකෘතියට සහය දැක්වීමට අපහසු නැත. Blazegraph හි එක් වරකදී යෝජනා කරන ලද වඩාත්ම ශක්තිමත් ප්රවේශය ලෙස සැලකේ: RDF* ආකෘතිය, RDF සහ LPG ඒකාබද්ධ කිරීම.
තවත්
ඔබට හබ්රේ හි පෙර ලිපියෙන් LPG ආකෘතිය සඳහා RDF ගබඩා සහාය ගැන වැඩිදුර කියවිය හැක:
සාහිත්යය
- Halpin, H., Monnin, A. (eds.) (2014). දාර්ශනික ඉංජිනේරු විද්යාව: වෙබයේ දර්ශනයක් කරා
- Allemang, D., Hendler, J. (2011) Semantic Web for the Working Ontologist (2nd ed.)
- Staab, S., Studer, R. (eds.) (2009) Ontologies පිළිබඳ අත්පොත (2nd ed.)
- දැව, D. (සංස්කරණය). (2011) ව්යවසාය දත්ත සම්බන්ධ කිරීම
- Keet, M. (2018) ඔන්ටොලොජි ඉංජිනේරු විද්යාව පිළිබඳ හැඳින්වීමක්
මූලාශ්රය: www.habr.com