Web Semantika u Data Konnessa. Korrezzjonijiet u żidiet

Nixtieq nippreżenta lill-pubbliku framment ta’ dan il-ktieb ippubblikat reċentement:

Immudellar ontoloġiku ta' intrapriża: metodi u teknoloġiji [Test]: monografija / [S. V. Gorshkov, S. S. Kralin, O. I. Mushtak u oħrajn; editur eżekuttiv S.V. Gorshkov]. - Ekaterinburg: Ural University Publishing House, 2019. - 234 p.: ill., tabella; 20 ċm - Awtur. indikat fuq it-tit ta' wara. Bil. — Biblijografija fl-aħħar tal-kap. — ISBN 978-5-7996-2580-1: 200 kopja.

L-iskop li jitpoġġa dan il-framment fuq Habré huwa erba' darbiet:

  • Mhux probabbli li xi ħadd ikun jista’ jżomm dan il-ktieb f’idejh jekk ma jkunx klijent ta’ persuna rispettata. SergeIndex; Żgur li mhux għall-bejgħ.
  • Saru korrezzjonijiet fit-test (mhumiex enfasizzati hawn taħt) u saru żidiet li ma tantx huma kompatibbli mal-format ta’ monografija stampata: noti topiċi (taħt spoilers) u hyperlinks.
  • Irrid jiġbru mistoqsijiet u kummenti, sabiex jitqiesu meta dan it-test jiġi inkluż f'forma riveduta fi kwalunkwe pubblikazzjoni oħra.
  • Ħafna aderenti tal-Web Semantika u tad-Dejta Konnessa għadhom jemmnu li ċ-ċirku tagħhom huwa tant dejjaq, prinċipalment minħabba li l-pubbliku ġenerali għadu ma ġiex spjegat sew kemm hu kbir li tkun aderenti tal-Web Semantika u d-Dejta Konnessa. L-awtur tal-framment, għalkemm jappartjeni għal dan iċ-ċirku, ma jżommx din l-opinjoni, iżda, madankollu, iqis lilu nnifsu obbligat li jagħmel tentattiv ieħor.

Allura,

Web Semantiku

L-evoluzzjoni tal-Internet tista 'tiġi rappreżentata kif ġej (jew tkellem dwar is-segmenti tiegħu li ġew iffurmati fl-ordni indikata hawn taħt):

  1. Dokumenti fuq l-Internet. Teknoloġiji ewlenin - Gopher, FTP, eċċ.
    L-Internet huwa netwerk globali għall-iskambju tar-riżorsi lokali.
  2. Dokumenti tal-Internet. It-teknoloġiji ewlenin huma HTML u HTTP.
    In-natura tar-riżorsi esposti tqis il-karatteristiċi tal-mezz ta' trażmissjoni tagħhom.
  3. Data tal-Internet. Teknoloġiji ewlenin - REST u SOAP API, XHR, eċċ.
    L-era tal-applikazzjonijiet tal-Internet, mhux biss in-nies isiru konsumaturi tar-riżorsi.
  4. Data tal-Internet. It-teknoloġiji ewlenin huma teknoloġiji Linked Data.
    Dan ir-raba 'stadju, imbassar minn Berners-Lee, il-kreatur tat-tieni teknoloġiji ewlenin u direttur tal-W3C, jissejjaħ il-Web Semantika; It-teknoloġiji tad-Data Konnessa huma ddisinjati biex id-data fuq il-web mhux biss tinqara mill-magna, iżda wkoll "li tinftiehem mill-magna."

Minn dak li ġej, il-qarrej jifhem il-korrispondenza bejn il-kunċetti ewlenin tat-tieni u r-raba 'stadji:

  • L-URLs huma analogi għall-URIs,
  • l-analogu ta 'HTML huwa RDF,
  • L-hyperlinks HTML huma simili għal okkorrenzi URI fid-dokumenti RDF.

Il-Web Semantika hija aktar viżjoni sistemika tal-ġejjieni tal-Internet milli xejra speċifika spontanja jew ta' lobbying, għalkemm tista' tqis dawn tal-aħħar. Pereżempju, karatteristika importanti ta’ dak li jissejjaħ Web 2.0 titqies bħala “kontenut iġġenerat mill-utent.” B’mod partikolari, ir-rakkomandazzjoni tad-W3C hija mitluba tqisha “Ontoloġija ta' Annotazzjoni tal-Web“u tali impriża bħal Solidu.

Is-Semantic Web Mejjet?

Jekk tirrifjuta aspettattivi mhux realistiċi, is-sitwazzjoni mal-web semantika hija bejn wieħed u ieħor l-istess bħal dik tal-komuniżmu matul iż-żminijiet tas-soċjaliżmu żviluppat (u jekk tiġix osservata l-lealtà lejn l-ordnijiet kondizzjonali ta 'Ilyich, ħalli kulħadd jiddeċiedi għalih innifsu). Magni tat-tiftix pjuttost b'suċċess iġiegħel lill-websajts jużaw RDFa u JSON-LD u huma stess jużaw teknoloġiji relatati ma’ dawk deskritti hawn taħt (Google Knowledge Graph, Bing Knowledge Graph).

F'termini ġenerali, l-awtur ma jistax jgħid x'qed jipprevjeni tixrid akbar, iżda jista 'jitkellem fuq il-bażi ta' esperjenza personali. Hemm problemi li jistgħu jiġu solvuti "barra mill-kaxxa" fil-kundizzjonijiet tal-offensiva SW, għalkemm mhumiex mifruxa ħafna. B’riżultat ta’ dan, dawk li jiffaċċjaw dawn il-kompiti m’għandhom l-ebda mezz ta’ sfurzar kontra dawk li huma kapaċi jipprovdu soluzzjoni, filwaqt li l-għoti indipendenti ta’ soluzzjoni ta’ dawn tal-aħħar tikkontradixxi l-mudelli tan-negozju tagħhom. Allura aħna nkomplu niparse HTML u kolla flimkien diversi APIs, xulxin shittier.

Madankollu, it-teknoloġiji tad-Data Konnessa nfirxu lil hinn mill-Web prinċipali; Il-ktieb, fil-fatt, huwa ddedikat għal dawn l-applikazzjonijiet. Bħalissa, il-komunità Linked Data tistenna li dawn it-teknoloġiji jsiru saħansitra aktar mifruxa grazzi għar-reġistrazzjoni (jew il-proklamazzjoni, kif tixtieq) ta’ Gartner ta’ xejriet bħal Grafiċi tal-Għarfien и Tessili tad-Data. Nixtieq nemmen li mhux se jkunu l-implimentazzjonijiet "rota" ta 'dawn il-kunċetti li se jkollhom suċċess, iżda dawk relatati mal-istandards W3C diskussi hawn taħt.

Data Konnessa

Berners-Lee iddefinixxa Linked Data bħala l-web semantiku "magħmul tajjeb": sett ta 'approċċi u teknoloġiji li jippermettulha tilħaq l-għanijiet aħħarija tagħha. Prinċipji bażiċi ta' Linked Data Berners-Lee enfasizzat dawn li ġejjin.

Prinċipju 1. L-użu ta' URIs biex issemmi entitajiet.

L-URIs huma identifikaturi ta' entità globali għall-kuntrarju ta' identifikaturi ta' string lokali għall-entrati. Sussegwentement, dan il-prinċipju ġie espress bl-aħjar mod fl-islogan tal-Google Knowledge Graph "affarijiet, mhux kordi".

Prinċipju 2. L-użu tal-URIs fl-iskema HTTP sabiex ikunu jistgħu jiġu dereferenziati.

Billi tirreferi għal URI, għandu jkun possibbli li tinkiseb is-sinifikat wara dak is-sinifikatur (l-analoġija mal-isem tal-operatur " hija ċara hawnhekk).*"f'Ċ); b'mod aktar preċiż, biex tikseb xi rappreżentazzjoni ta 'dan indikat - jiddependi fuq il-valur tal-header HTTP Accept:. Forsi, bil-miġja tal-era AR/VR, se jkun possibbli li tinkiseb ir-riżors innifsu, iżda għalissa, x'aktarx, se jkun dokument RDF, li huwa r-riżultat tal-eżekuzzjoni ta 'mistoqsija SPARQL DESCRIBE.

Prinċipju 3. Użu ta' standards W3C - primarjament RDF(S) u SPARQL - b'mod partikolari meta dereferencing URIs.

Dawn is-"saffi" individwali tal-munzell tat-teknoloġija Linked Data, magħrufa wkoll bħala Kejk tas-Saff tal-Web Semantiku, se jiġu deskritti hawn taħt.

Prinċipju 4. Użu ta' referenzi għal URIs oħra meta tiddeskrivi entitajiet.

RDF jippermettilek tillimita lilek innifsek għal deskrizzjoni verbali ta 'riżorsa fil-lingwa naturali, u r-raba' prinċipju jitlob li ma tagħmilx dan. Jekk l-ewwel prinċipju jiġi osservat universalment, isir possibbli meta tiddeskrivi riżorsa li tirreferi għal oħrajn, inklużi dawk "barranin", u huwa għalhekk li d-dejta tissejjaħ konnessa. Fil-fatt, huwa kważi inevitabbli li tuża URIs imsemmija fil-vokabularju RDFS.

R.F.D.

R.F.D. (Qafas ta' Deskrizzjoni tar-Riżorsi) huwa formaliżmu għad-deskrizzjoni ta' entitajiet interrelatati.

Dikjarazzjonijiet tat-tip "suġġett-predikat-oġġett", imsejħa triplets, isiru dwar entitajiet u r-relazzjonijiet tagħhom. Fl-aktar każ sempliċi, is-suġġett, il-predikat u l-oġġett huma kollha URIs. L-istess URI jista 'jkun f'pożizzjonijiet differenti fi triplets differenti: tkun suġġett, predicat, u oġġett; Għalhekk, it-tripletti jiffurmaw tip ta 'graff imsejjaħ graff RDF.

Is-suġġetti u l-oġġetti jistgħu jkunu mhux biss URIs, iżda wkoll l-hekk imsejħa nodi vojta, u l-oġġetti jistgħu jkunu wkoll letterali. Litterali huma każijiet ta 'tipi primittivi li jikkonsistu minn rappreżentazzjoni ta' string u indikazzjoni tat-tip.

Eżempji ta 'kitba letterali (fis-sintassi tal-Fekruna, aktar dwarha hawn taħt): "5.0"^^xsd:float и "five"^^xsd:string. Letterali bit-tip rdf:langString jista' jkun mgħammar ukoll b'tikketta tal-lingwa; f'Turtle hemm miktub hekk: "five"@en и "пять"@ru.

Nodi vojta huma riżorsi "anonimi" mingħajr identifikaturi globali, li dwarhom jistgħu, madankollu, isiru dikjarazzjonijiet; tip ta 'varjabbli eżistenzjali.

Allura (dan huwa, fil-fatt, il-punt kollu ta 'RDF):

  • is-suġġett huwa URI jew node vojta,
  • il-predikat huwa URI,
  • oġġett huwa URI, nodu vojt, jew letterali.

Għaliex il-predikati ma jistgħux ikunu nodi vojta?

Ir-raġuni probabbli hija x-xewqa li b'mod informali tifhem u tittraduċi triplet fil-lingwa tal-loġika tal-predikat tal-ewwel ordni s p o bħal xi ħaġa bħal Web Semantika u Data Konnessa. Korrezzjonijiet u żidietfejn Web Semantika u Data Konnessa. Korrezzjonijiet u żidiet - predikat, Web Semantika u Data Konnessa. Korrezzjonijiet u żidiet и Web Semantika u Data Konnessa. Korrezzjonijiet u żidiet - kostanti. Traċċi ta 'dan il-fehim jinsabu fid-dokument "LBase: Semantika għal-Lingwi tal-Web Semantika", li għandha l-istatus ta 'nota ta' grupp ta 'ħidma W3C. B'dan il-fehim, it-tripletta s p []fejn [] - node vojta, se jiġi tradott bħala Web Semantika u Data Konnessa. Korrezzjonijiet u żidietfejn Web Semantika u Data Konnessa. Korrezzjonijiet u żidiet - varjabbli, imma kif imbagħad tittraduċi s [] o? Dokument bi status ta' Rakkomandazzjoni W3C "RDF 1.1 Semantika” joffri metodu ieħor ta’ traduzzjoni, iżda xorta ma jqisx il-possibbiltà li l-predikati jkunu nodi vojta.

Madankollu, Manu Sporni permess.

RDF huwa mudell astratt. RDF jista' jinkiteb (serialized) f'diversi sintassi: RDF/XML, fekruna (l-aktar li jinqara mill-bniedem), JSON-LD, HDT (binarju).

L-istess RDF jista 'jiġi serializzat f'RDF/XML b'modi differenti, għalhekk, pereżempju, ma jagħmilx sens li jiġi vvalidat l-XML li jirriżulta bl-użu ta' XSD jew jipprova jiġbed data bl-użu ta 'XPath. Bl-istess mod, JSON-LD x'aktarx ma jissodisfax ix-xewqa tal-iżviluppatur medju ta' Javascript li jaħdem ma' RDF billi juża n-notazzjoni ta' tikek u parentesi kwadri ta' Javascript (għalkemm JSON-LD jimxi f'dik id-direzzjoni billi joffri mekkaniżmu tfassil).

Ħafna sintassi joffru modi biex jitqassru URIs twal. Per eżempju, ad @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> fil Fekruna mbagħad jippermettilek tikteb minflok <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> biss rdf:type.

RDFS

RDFS (RDF Schema) - vokabularju bażiku tal-immudellar, jintroduċi l-kunċetti ta 'proprjetà u klassi u proprjetajiet bħal rdf:type, rdfs:subClassOf, rdfs:domain и rdfs:range. Bl-użu tad-dizzjunarju RDFS, pereżempju, jistgħu jinkitbu l-espressjonijiet validi li ġejjin:

rdf:type         rdf:type         rdf:Property .
rdf:Property     rdf:type         rdfs:Class .
rdfs:Class       rdfs:subClassOf  rdfs:Resource .
rdfs:subClassOf  rdfs:domain      rdfs:Class .
rdfs:domain      rdfs:domain      rdf:Property .
rdfs:domain      rdfs:range       rdfs:Class .
rdfs:label       rdfs:range       rdfs:Literal .

RDFS huwa vokabularju ta' deskrizzjoni u mmudellar, iżda mhuwiex lingwa ta' restrizzjoni (għalkemm l-ispeċifikazzjoni uffiċjali u weraq possibbiltà ta’ użu bħal dan). Il-kelma "Skema" m'għandhiex tinftiehem fl-istess sens bħal fl-espressjoni "XML Schema". Pereżempju, :author rdfs:range foaf:Person ifisser li rdf:type il-valuri kollha tal-proprjetà :author - foaf:Person, iżda ma jfissirx li dan għandu jingħad minn qabel.

SPARQL

SPARQL (SPARQL Protocol u RDF Query Language) - lingwa għall-interrogazzjoni tad-dejta RDF. F'każ sempliċi, mistoqsija SPARQL hija sett ta' kampjuni li magħhom jitqabblu t-tripletti tal-graff li qed jiġi mistoqsija. Il-mudelli jista' jkun fihom varjabbli fil-pożizzjonijiet tas-suġġett, tal-predikat u tal-oġġett.

Il-mistoqsija se tirritorna tali valuri varjabbli li, meta jiġu sostitwiti fil-kampjuni, jistgħu jirriżultaw f'subgraf tal-graff RDF mistoqsija (subsett tat-triplets tiegħu). Varjabbli ta' l-istess isem f'kampjuni differenti ta' triplets għandu jkollhom l-istess valuri.

Per eżempju, minħabba s-sett ta 'hawn fuq ta' seba 'axioms RDFS, il-mistoqsija li ġejja terġa' lura rdfs:domain и rdfs:range bħala valuri ?s и ?p rispettivament:

SELECT * WHERE {
 ?s ?p rdfs:Class .
 ?p ?p rdf:Property .
}

Ta 'min jinnota li SPARQL huwa dikjarattiv u mhuwiex lingwa biex tiddeskrivi l-graff traversal (madankollu, xi repożitorji RDF joffru modi biex jaġġustaw il-pjan ta' eżekuzzjoni tal-mistoqsija). Għalhekk, xi problemi tal-graffs standard, pereżempju, is-sejba tal-iqsar triq, ma jistgħux jiġu solvuti fl-SPARQL, inkluż l-użu tal- mogħdijiet tal-proprjetà (iżda, għal darb'oħra, repożitorji RDF individwali joffru estensjonijiet speċjali biex isolvu dawn il-problemi).

SPARQL ma taqbilx mal-preżunzjoni ta’ ftuħ tad-dinja u jsegwi l-approċċ ta’ “negazzjoni bħala falliment”, li fih possibbli disinji bħal FILTER NOT EXISTS {…}. Id-distribuzzjoni tad-dejta titqies bl-użu tal-mekkaniżmu mistoqsijiet federati.

Il-punt ta' aċċess SPARQL - ħażna RDF li kapaċi tipproċessa mistoqsijiet SPARQL - m'għandu l-ebda analogi diretti mit-tieni stadju (ara l-bidu ta' dan il-paragrafu). Jista' jitqabbel ma' database, ibbażata fuq il-kontenut li tagħha ġew iġġenerati paġni HTML, iżda aċċessibbli għal barra. Il-punt ta 'aċċess SPARQL huwa aktar analogu għall-punt ta' aċċess API mit-tielet stadju, iżda b'żewġ differenzi ewlenin. L-ewwelnett, huwa possibbli li jiġu kkombinati bosta mistoqsijiet "atomiċi" f'wieħed (li hija meqjusa bħala karatteristika ewlenija ta 'GraphQL), u t-tieni, tali API hija kompletament awtodokumentata (li huwa dak li HATEOAS ippruvat tikseb).

Rimarka polemika

RDF huwa mod kif tippubblika data fuq il-web, għalhekk il-ħażna RDF għandha titqies bħala DBMS dokument. Veru, peress li RDF hija graff u mhux siġra, irriżultaw ukoll li huma bbażati fuq graff. Huwa tal-għaġeb li ħadmet fil-livelli kollha. Min kien jaħseb li jkun hemm nies intelliġenti li jimplimentaw nodi vojta. Codd hawn ma ħadmitx.

Hemm ukoll modi inqas sħaħ biex jiġi organizzat l-aċċess għad-dejta RDF, pereżempju, Frammenti tad-Data Konnessi (LDF) u Pjattaforma tad-Data Konnessa (LDP).

Kokka

Kokka (Lingwa tal-Ontoloġija tal-Web) - formaliżmu biex tirrappreżenta l-għarfien, verżjoni sintattika tal-loġika tad-deskrizzjoni Web Semantika u Data Konnessa. Korrezzjonijiet u żidiet (kullimkien hawn taħt huwa aktar korrett li tgħid OWL 2, l-ewwel verżjoni ta 'OWL kienet ibbażata fuq Web Semantika u Data Konnessa. Korrezzjonijiet u żidiet).

Kunċetti ta 'loġika deskrittiva f'OWL jikkorrispondu għal klassijiet, rwoli jikkorrispondu għal proprjetajiet, individwi jżommu l-isem preċedenti tagħhom. Axioms jissejħu wkoll axioms.

Per eżempju, fl-hekk imsejħa Sintassi ta' Manchester għan-notazzjoni OWL axioma diġà magħrufa lilna Web Semantika u Data Konnessa. Korrezzjonijiet u żidiet se jinkiteb hekk:

Class: Human
Class: Parent
   EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent

Hemm sintassi oħra għall-kitba OWL, bħal sintassi funzjonali, użat fl-ispeċifikazzjoni uffiċjali, u OWL/XML. Barra minn hekk, OWL jista 'jiġi serialized biex astratta sintassi RDF u aktar - fi kwalunkwe mis-sintassi speċifiċi.

OWL għandha relazzjoni doppja ma RDF. Min-naħa waħda, jista 'jitqies bħala tip ta' dizzjunarju li jestendi RDFS. Min-naħa l-oħra, huwa formaliżmu aktar qawwi li għalih RDF huwa biss format ta 'serialization. Mhux il-kostruzzjonijiet OWL elementari kollha jistgħu jinkitbu bl-użu ta' triplet RDF wieħed.

Skont liema subsett ta' kostruzzjonijiet OWL jitħallew jintużaw, huma jitkellmu dwar l-hekk imsejħa profili OWL. L-istandardizzati u l-aktar famużi huma OWL EL, OWL RL u OWL QL. L-għażla tal-profil taffettwa l-kumplessità komputazzjonali ta 'problemi tipiċi. Sett komplut ta' kostruzzjonijiet OWL li jikkorrispondu għal Web Semantika u Data Konnessa. Korrezzjonijiet u żidiet, imsejħa OWL DL. Xi drabi jitkellmu wkoll dwar OWL Full, li fih il-kostruzzjonijiet OWL jitħallew jintużaw bil-libertà sħiħa inerenti fl-RDF, mingħajr restrizzjonijiet semantiċi u komputazzjonali Web Semantika u Data Konnessa. Korrezzjonijiet u żidiet. Per eżempju, xi ħaġa tista 'tkun kemm klassi kif ukoll proprjetà. OWL sħiħ huwa indeċidibbli.

Il-prinċipji ewlenin għat-twaħħil tal-konsegwenzi fl-OWL huma l-adozzjoni tas-suppożizzjoni tad-dinja miftuħa. O.W.A.) u ċ-ċaħda tal-preżunzjoni ta' ismijiet uniċi (assunzjoni ta' isem uniku, WAĦDA). Hawn taħt ser naraw fejn dawn il-prinċipji jistgħu jwasslu u jintroduċu xi kostruzzjonijiet OWL.

Ħalli l-ontoloġija jkun fiha l-framment li ġej (fis-sintassi ta' Manchester):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human
   Facts: hasChild Alice, hasChild Bob, hasChild Carol

Minn dak li ntqal se jirriżulta li Ġwanni għandu ħafna wlied? Ir-rifjut tal-UNA se jġiegħel lill-magna tal-inferenza twieġeb din il-mistoqsija fin-negattiv, peress li Alice u Bob jistgħu jkunu l-istess persuna. Biex iseħħ dan li ġej, huwa meħtieġ li żżid l-axioma li ġejja:

DifferentIndividuals: Alice, Bob, Carol, John

Ħalli issa l-framment tal-ontoloġija jkollu l-forma li ġejja (Ġwanni huwa ddikjarat li għandu ħafna tfal, iżda għandu biss żewġt itfal):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human, manyChildren
   Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John

Din l-ontoloġija se tkun inkonsistenti (li tista’ tiġi interpretata bħala evidenza ta’ data invalida)? L-aċċettazzjoni tal-OWA tikkawża li l-magna tal-inferenza tirrispondi fin-negattiv: "x'imkien" ieħor (f'ontoloġija oħra) jista 'jingħad li Carol hija wkoll it-tifel ta' John.

Biex teskludi l-possibbiltà ta’ dan, ejja nżidu fatt ġdid dwar John:

Individual: John
   Facts: hasChild Alice, hasChild Bob, not hasChild Carol

Biex teskludi d-dehra ta 'tfal oħra, ejja ngħidu li l-valuri kollha tal-proprjetà "li jkollok tifel" huma nies, li minnhom għandna erbgħa biss:

ObjectProperty: hasChild
   Domain: Human
   Сharacteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }

Issa l-ontoloġija se ssir kontradittorja, li l-magna tal-inferenza mhux se tonqos milli tirrapporta. Bl-aħħar ta 'l-axioms għandna, f'ċertu sens, "magħluq" id-dinja, u ninnutaw kif il-possibbiltà li John ikun it-tifel tiegħu stess hija eskluża.

Linking tad-Dejta tal-Intrapriża

Is-sett ta' approċċi u teknoloġiji Linked Data kien oriġinarjament maħsub għall-pubblikazzjoni ta' data fuq il-Web. L-użu tagħhom f'ambjent korporattiv intern jiffaċċja għadd ta' diffikultajiet.

Pereżempju, f'ambjent korporattiv magħluq, is-setgħa deduttiva ta 'OWL ibbażata fuq l-adozzjoni ta' OWA u r-rifjut ta 'UNA, deċiżjonijiet minħabba n-natura miftuħa u mqassma tal-Web, hija dgħajfa wisq. U hawn is-soluzzjonijiet li ġejjin huma possibbli.

  • Dotazzjoni OWL b'semantika, li timplika l-abbandun ta 'OWA u l-adozzjoni ta' UNA, l-implimentazzjoni tal-magna tal-output korrispondenti. - F'din it-triq sejjer Ħażna Stardog RDF.
  • L-abbandun tal-kapaċitajiet deduttivi tal-OWL favur il-magni tar-regoli. — Stardog jappoġġja SWRL; Jena u GraphDB joffru stess lingwi regoli
  • Rifjut tal-kapaċitajiet deduttivi ta 'OWL, użu ta' subsett wieħed jew ieħor qrib RDFS għall-immudellar. - Ara aktar dwar dan hawn taħt.

Kwistjoni oħra hija l-fokus akbar li d-dinja korporattiva jista 'jkollha fuq kwistjonijiet ta' kwalità tad-dejta u n-nuqqas ta 'għodod ta' validazzjoni tad-dejta fil-munzell tad-Data Konnessa. L-outputs hawnhekk huma kif ġej.

  • Għal darb'oħra, uża għall-validazzjoni ta' kostruzzjonijiet OWL b'semantika dinja magħluqa u ismijiet uniċi jekk tkun disponibbli magna ta 'inferenza xierqa.
  • Użu SHACL, standardizzat wara li l-lista tas-saffi tal-kejk tas-saffi tal-Web Semantika tkun ġiet iffissata (madankollu, tista' tintuża wkoll bħala magna tar-regoli), jew Shex.
  • Nifhmu li kollox fl-aħħar mill-aħħar isir b'mistoqsijiet SPARQL, billi toħloq il-mekkaniżmu ta 'validazzjoni tad-dejta sempliċi tiegħek billi tużahom.

Madankollu, anki rifjut sħiħ ta 'kapaċitajiet deduttivi u għodod ta' validazzjoni tħalli l-munzell tad-Data Konnessa barra mill-kompetizzjoni f'kompiti li huma simili fil-pajsaġġ għall-web miftuħ u distribwit - fil-kompiti ta 'integrazzjoni tad-dejta.

Xi ngħidu dwar sistema ta 'informazzjoni ta' intrapriża regolari?

Dan huwa possibbli, iżda għandek, ovvjament, tkun konxju ta 'eżattament liema problemi se jkollhom isolvu t-teknoloġiji korrispondenti. Hawnhekk ser niddeskrivi reazzjoni tipika tal-parteċipanti tal-iżvilupp biex turi kif tidher din il-munzell tat-teknoloġija mil-lat tal-IT konvenzjonali. Ifakkarni ftit fil-parabbola tal-iljunfant:

  • Analista tan-negozju: RDF hija xi ħaġa bħal mudell loġiku maħżun direttament.
  • Analista tas-Sistemi: RDF huwa simili Estensjoni EAV, biss b'mazz ta 'indiċi u lingwa ta' mistoqsija konvenjenti.
  • iżviluppatur: ukoll, dan kollu huwa fl-ispirtu tal-kunċetti ta 'mudell għani u kodiċi baxx, kien qari dan l-aħħar dwar dan.
  • Maniġer tal-proġett: iva huwa l-istess jiġġarraf il-munzell!

Il-prattika turi li l-munzell jintuża l-aktar ta 'spiss f'kompiti relatati mad-distribuzzjoni u l-eteroġeneità tad-dejta, pereżempju, meta tibni sistemi ta' klassi MDM (Master Data Management) jew DWH (Data Warehouse). Problemi bħal dawn jeżistu fi kwalunkwe industrija.

F'termini ta 'applikazzjonijiet speċifiċi għall-industrija, it-teknoloġiji tad-Data Konnessa bħalissa huma l-aktar popolari fl-industriji li ġejjin.

  • teknoloġiji bijomediċi (fejn il-popolarità tagħhom tidher li hija relatata mal-kumplessità tad-dominju);

kurrenti

Il-"Boiling Point" reċentement ospitat konferenza organizzata mill-assoċjazzjoni "National Medical Knowledge Base" "Il-kombinazzjoni ta' ontoloġiji. Mit-teorija għall-applikazzjoni prattika".

  • produzzjoni u tħaddim ta’ prodotti kumplessi (inġinerija mekkanika kbira, produzzjoni taż-żejt u tal-gass; ħafna drabi qed nitkellmu dwar standard ISO 15926);

kurrenti

Hawnhekk ukoll, ir-raġuni hija l-kumplessità tal-qasam tas-suġġett, meta, pereżempju, fl-istadju upstream, jekk nitkellmu dwar l-industrija taż-żejt u tal-gass, il-kontabilità sempliċi teħtieġ xi funzjonijiet CAD.

Fl-2008, sar avveniment ta' installazzjoni rappreżentattiv, organizzat minn Chevron il-konferenza.

ISO 15926, fl-aħħar, deher daqsxejn tqil għall-industrija taż-żejt u tal-gass (u sabet forsi applikazzjoni akbar fl-inġinerija mekkanika). Statoil biss (Equinor) qabad sew fuqha; fin-Norveġja, kollu ekosistema. Oħrajn qed jippruvaw jagħmlu l-ħaġa tagħhom. Pereżempju, skont l-għajdut, il-Ministeru tal-Enerġija domestiku għandu l-intenzjoni li joħloq "mudell ontoloġiku kunċettwali tal-kumpless tal-fjuwil u l-enerġija", simili, apparentement, għal maħluqa għall-industrija tal-enerġija elettrika.

  • organizzazzjonijiet finanzjarji (anke XBRL jista 'jitqies bħala tip ta' ibridu ta 'SDMX u l-ontoloġija RDF Data Cube);

kurrenti

Fil-bidu tas-sena, LinkedIn b'mod attiv spammja lill-awtur b'postijiet vakanti minn kważi l-ġganti kollha tal-industrija finanzjarja, li jafhom mis-serje tat-TV "Force Majeure": Goldman Sachs, JPMorgan Chase u/jew Morgan Stanley, Wells Fargo, SWIFT/Visa/Mastercard, Bank of America, Citigroup, Fed, Deutsche Bank... Probabbilment kulħadd kien qed ifittex lil xi ħadd li jista' jibgħatlu Konferenza tal-Grafika tal-Għarfien. Pjuttost ftit irnexxielhom isibu: l-organizzazzjonijiet finanzjarji ħadu kollox filgħodu tal-ewwel jum.

Fuq HeadHunter, Sberbank biss sab xi ħaġa interessanti; kien dwar "Ħażna EAV b'mudell ta 'dejta bħal RDF."

Probabbilment, id-differenza fil-grad ta 'imħabba għat-teknoloġiji korrispondenti ta' istituzzjonijiet finanzjarji domestiċi u tal-Punent hija dovuta għan-natura transnazzjonali tal-attivitajiet ta 'dawn tal-aħħar. Apparentement, l-integrazzjoni bejn il-fruntieri statali teħtieġ soluzzjonijiet organizzattivi u tekniċi kwalitattivament differenti.

  • sistemi ta’ mistoqsija-tweġiba b’applikazzjonijiet kummerċjali (IBM Watson, Apple Siri, Google Knowledge Graph);

kurrenti

Mill-mod, il-kreatur ta 'Siri, Thomas Gruber, huwa l-awtur tad-definizzjoni stess tal-ontoloġija (fis-sens tal-IT) bħala "speċifikazzjoni ta' kunċettwali". Fl-opinjoni tiegħi, ir-rranġament mill-ġdid tal-kliem f'din id-definizzjoni ma jbiddilx it-tifsira tagħha, li forsi tindika li mhix hemm.

  • pubblikazzjoni ta’ data strutturata (b’ġustifikazzjoni akbar dan jista’ jiġi attribwit għal Linked Open Data).

kurrenti

Fannijiet kbar ta' Linked Data huma l-hekk imsejħa GLAM: Galleriji, Libreriji, Arkivji, u Mużewijiet. Biżżejjed ngħid li l-Librerija tal-Kungress qed tippromwovi sostitut għal MARC21 BIBFRAMELiema jipprovdi pedament għall-futur tad-deskrizzjoni biblijografika u, ovvjament, ibbażat fuq RDF.

Il-Wikidata spiss tissemma bħala eżempju ta’ proġett ta’ suċċess fil-qasam tal-Linked Open Data – tip ta’ verżjoni tal-Wikipedija li tinqara mill-magni, li l-kontenut tagħha, b’kuntrast ma’ DBPedia, ma jiġix iġġenerat mill-importazzjoni minn infoboxes tal-artikoli, iżda huwa maħluqa xi ftit jew wisq manwalment (u sussegwentement issir sors ta’ informazzjoni għall-istess infoboxes).

Nirrakkomandaw ukoll li tiċċekkjaha lista utenti tal-ħażna Stardog RDF fuq il-websajt Stardog fit-taqsima "Klijenti".

Kun hekk, f'Gartner Ċiklu Hype għal Teknoloġiji Emerġenti 2016 "Enterprise Taxonomy and Ontology Management" titqiegħed f'nofs inżul fil-wied tad-diżappunt bil-prospett li jintlaħaq "plateau ta 'produttività" mhux aktar kmieni minn 10 snin.

Konnessjoni tad-Data tal-Intrapriża

Tbassir, tbassir, tbassir...

Minn interess storiku, hawn taħt għamilt tabella t-tbassir ta’ Gartner għal diversi snin dwar it-teknoloġiji li jinteressawna.

Sena Технология Rapport Pożizzjoni Snin sal-plateau
2001 Web Semantiku Teknoloġiji emerġenti Trigger tal-Innovazzjoni 5-10
2006 Web Semantika Korporattiva Teknoloġiji emerġenti L-ogħla livell ta 'l-aspettattivi inflatati 5-10
2012 Web Semantiku Data Big L-ogħla livell ta 'l-aspettattivi inflatati > 10
2015 Data Konnessa Analitika Avvanzata u Xjenza tad-Data Ħawt tad-diżillużjoni 5-10
2016 Ġestjoni tal-Ontoloġija tal-Intrapriża Teknoloġiji emerġenti Ħawt tad-diżillużjoni > 10
2018 Grafiċi tal-Għarfien Teknoloġiji emerġenti Trigger tal-Innovazzjoni 5-10

Madankollu, diġà fil "Ċiklu tal-Hype..." 2018 dehret xejra oħra 'l fuq - Knowledge Graphs. Sar ċerta reinkarnazzjoni: DBMSs tal-graff, li għalihom l-attenzjoni tal-utenti u l-isforzi tal-iżviluppaturi rriżultaw li inbidlu, taħt l-influwenza tat-talbiet tal-ewwel u d-drawwiet tal-aħħar, bdew jieħdu l-kontorni u l-pożizzjonament tal-kompetituri predeċessuri tagħhom.

Kważi kull graff DBMS issa jiddikjara lilu nnifsu bħala pjattaforma adattata għall-bini ta '"graff ta' għarfien" korporattiv ("data konnessa" kultant tiġi sostitwita b' "data konnessa"), iżda kemm huma ġustifikati tali pretensjonijiet?

Id-databases tal-grafiċi għadhom asemantiċi; id-dejta f'DBMS tal-graff għadha l-istess silo tad-dejta. Identifikaturi ta 'string minflok URIs jagħmlu l-kompitu li jintegraw żewġ DBMSs graffs għadu kompitu ta' integrazzjoni, filwaqt li l-integrazzjoni ta 'żewġ ħwienet RDF ħafna drabi niżel għal sempliċiment jingħaqdu żewġ graffs RDF. Aspett ieħor ta 'asemanticity huwa n-nuqqas ta' riflessività tal-mudell tal-graff LPG, li jagħmilha diffiċli biex timmaniġġja l-metadata bl-użu tal-istess pjattaforma.

Fl-aħħarnett, DBMSs graffs m'għandhomx magni ta 'inferenza jew magni tar-regoli. Ir-riżultati ta 'magni bħal dawn jistgħu jiġu riprodotti billi tikkomplika l-mistoqsijiet, iżda dan huwa possibbli anke fl-SQL.

Madankollu, is-sistemi ewlenin tal-ħażna RDF m'għandhom l-ebda diffikultà biex jappoġġjaw il-mudell LPG. L-aktar approċċ solidu jitqies bħala dak propost f'ħin wieħed f'Blazegraph: il-mudell RDF*, li jgħaqqad RDF u LPG.

Aktar

Tista 'taqra aktar dwar l-appoġġ tal-ħażna RDF għall-mudell LPG fl-artikolu preċedenti dwar Habré: "X'qed jiġri bil-ħażna RDF issa". Nispera li xi darba jinkiteb artiklu separat dwar Knowledge Graphs u Data Fabric. L-aħħar taqsima, kif faċli biex tinftiehem, inkitbet bil-għaġla, madankollu, anke sitt xhur wara, kollox mhux ħafna aktar ċar b’dawn il-kunċetti.

Letteratura

  1. Halpin, H., Monnin, A. (eds.) (2014). Inġinerija Filosofika: Lejn Filosofija tal-Web
  2. Allemang, D., Hendler, J. (2011) Semantic Web for the Working Ontologist (it-2 ed.)
  3. Staab, S., Studer, R. (eds.) (2009) Manwal dwar Ontologies (it-2 ed.)
  4. Wood, D. (ed.). (2011) Linking Enterprise Data
  5. Keet, M. (2018) Introduzzjoni għall-Inġinerija tal-Ontoloġija

Sors: www.habr.com

Żid kumment