Web Semantika u Data Konnessa. Korrezzjonijiet u żidiet
Nixtieq nippreżenta lill-pubbliku framment ta’ dan il-ktieb ippubblikat reċentement:
Immudellar ontoloġiku ta' intrapriża: metodi u teknoloġiji [Test]: monografija / [S. V. Gorshkov, S. S. Kralin, O. I. Mushtak u oħrajn; editur eżekuttiv S.V. Gorshkov]. - Ekaterinburg: Ural University Publishing House, 2019. - 234 p.: ill., tabella; 20 ċm - Awtur. indikat fuq it-tit ta' wara. Bil. — Biblijografija fl-aħħar tal-kap. — ISBN 978-5-7996-2580-1: 200 kopja.
L-iskop li jitpoġġa dan il-framment fuq Habré huwa erba' darbiet:
Mhux probabbli li xi ħadd ikun jista’ jżomm dan il-ktieb f’idejh jekk ma jkunx klijent ta’ persuna rispettata. SergeIndex; Żgur li mhux għall-bejgħ.
Saru korrezzjonijiet fit-test (mhumiex enfasizzati hawn taħt) u saru żidiet li ma tantx huma kompatibbli mal-format ta’ monografija stampata: noti topiċi (taħt spoilers) u hyperlinks.
Irrid jiġbru mistoqsijiet u kummenti, sabiex jitqiesu meta dan it-test jiġi inkluż f'forma riveduta fi kwalunkwe pubblikazzjoni oħra.
Ħafna aderenti tal-Web Semantika u tad-Dejta Konnessa għadhom jemmnu li ċ-ċirku tagħhom huwa tant dejjaq, prinċipalment minħabba li l-pubbliku ġenerali għadu ma ġiex spjegat sew kemm hu kbir li tkun aderenti tal-Web Semantika u d-Dejta Konnessa. L-awtur tal-framment, għalkemm jappartjeni għal dan iċ-ċirku, ma jżommx din l-opinjoni, iżda, madankollu, iqis lilu nnifsu obbligat li jagħmel tentattiv ieħor.
Allura,
Web Semantiku
L-evoluzzjoni tal-Internet tista 'tiġi rappreżentata kif ġej (jew tkellem dwar is-segmenti tiegħu li ġew iffurmati fl-ordni indikata hawn taħt):
Dokumenti fuq l-Internet. Teknoloġiji ewlenin - Gopher, FTP, eċċ.
L-Internet huwa netwerk globali għall-iskambju tar-riżorsi lokali.
Dokumenti tal-Internet. It-teknoloġiji ewlenin huma HTML u HTTP.
In-natura tar-riżorsi esposti tqis il-karatteristiċi tal-mezz ta' trażmissjoni tagħhom.
Data tal-Internet. Teknoloġiji ewlenin - REST u SOAP API, XHR, eċċ.
L-era tal-applikazzjonijiet tal-Internet, mhux biss in-nies isiru konsumaturi tar-riżorsi.
Data tal-Internet. It-teknoloġiji ewlenin huma teknoloġiji Linked Data.
Dan ir-raba 'stadju, imbassar minn Berners-Lee, il-kreatur tat-tieni teknoloġiji ewlenin u direttur tal-W3C, jissejjaħ il-Web Semantika; It-teknoloġiji tad-Data Konnessa huma ddisinjati biex id-data fuq il-web mhux biss tinqara mill-magna, iżda wkoll "li tinftiehem mill-magna."
Minn dak li ġej, il-qarrej jifhem il-korrispondenza bejn il-kunċetti ewlenin tat-tieni u r-raba 'stadji:
L-URLs huma analogi għall-URIs,
l-analogu ta 'HTML huwa RDF,
L-hyperlinks HTML huma simili għal okkorrenzi URI fid-dokumenti RDF.
Il-Web Semantika hija aktar viżjoni sistemika tal-ġejjieni tal-Internet milli xejra speċifika spontanja jew ta' lobbying, għalkemm tista' tqis dawn tal-aħħar. Pereżempju, karatteristika importanti ta’ dak li jissejjaħ Web 2.0 titqies bħala “kontenut iġġenerat mill-utent.” B’mod partikolari, ir-rakkomandazzjoni tad-W3C hija mitluba tqisha “Ontoloġija ta' Annotazzjoni tal-Web“u tali impriża bħal Solidu.
Is-Semantic Web Mejjet?
Jekk tirrifjuta aspettattivi mhux realistiċi, is-sitwazzjoni mal-web semantika hija bejn wieħed u ieħor l-istess bħal dik tal-komuniżmu matul iż-żminijiet tas-soċjaliżmu żviluppat (u jekk tiġix osservata l-lealtà lejn l-ordnijiet kondizzjonali ta 'Ilyich, ħalli kulħadd jiddeċiedi għalih innifsu). Magni tat-tiftix pjuttost b'suċċess iġiegħel lill-websajts jużaw RDFa u JSON-LD u huma stess jużaw teknoloġiji relatati ma’ dawk deskritti hawn taħt (Google Knowledge Graph, Bing Knowledge Graph).
F'termini ġenerali, l-awtur ma jistax jgħid x'qed jipprevjeni tixrid akbar, iżda jista 'jitkellem fuq il-bażi ta' esperjenza personali. Hemm problemi li jistgħu jiġu solvuti "barra mill-kaxxa" fil-kundizzjonijiet tal-offensiva SW, għalkemm mhumiex mifruxa ħafna. B’riżultat ta’ dan, dawk li jiffaċċjaw dawn il-kompiti m’għandhom l-ebda mezz ta’ sfurzar kontra dawk li huma kapaċi jipprovdu soluzzjoni, filwaqt li l-għoti indipendenti ta’ soluzzjoni ta’ dawn tal-aħħar tikkontradixxi l-mudelli tan-negozju tagħhom. Allura aħna nkomplu niparse HTML u kolla flimkien diversi APIs, xulxin shittier.
Madankollu, it-teknoloġiji tad-Data Konnessa nfirxu lil hinn mill-Web prinċipali; Il-ktieb, fil-fatt, huwa ddedikat għal dawn l-applikazzjonijiet. Bħalissa, il-komunità Linked Data tistenna li dawn it-teknoloġiji jsiru saħansitra aktar mifruxa grazzi għar-reġistrazzjoni (jew il-proklamazzjoni, kif tixtieq) ta’ Gartner ta’ xejriet bħal Grafiċi tal-Għarfien и Tessili tad-Data. Nixtieq nemmen li mhux se jkunu l-implimentazzjonijiet "rota" ta 'dawn il-kunċetti li se jkollhom suċċess, iżda dawk relatati mal-istandards W3C diskussi hawn taħt.
Data Konnessa
Berners-Lee iddefinixxa Linked Data bħala l-web semantiku "magħmul tajjeb": sett ta 'approċċi u teknoloġiji li jippermettulha tilħaq l-għanijiet aħħarija tagħha. Prinċipji bażiċi ta' Linked Data Berners-Lee enfasizzat dawn li ġejjin.
Prinċipju 1. L-użu ta' URIs biex issemmi entitajiet.
L-URIs huma identifikaturi ta' entità globali għall-kuntrarju ta' identifikaturi ta' string lokali għall-entrati. Sussegwentement, dan il-prinċipju ġie espress bl-aħjar mod fl-islogan tal-Google Knowledge Graph "affarijiet, mhux kordi".
Prinċipju 2. L-użu tal-URIs fl-iskema HTTP sabiex ikunu jistgħu jiġu dereferenziati.
Billi tirreferi għal URI, għandu jkun possibbli li tinkiseb is-sinifikat wara dak is-sinifikatur (l-analoġija mal-isem tal-operatur " hija ċara hawnhekk).*"f'Ċ); b'mod aktar preċiż, biex tikseb xi rappreżentazzjoni ta 'dan indikat - jiddependi fuq il-valur tal-header HTTP Accept:. Forsi, bil-miġja tal-era AR/VR, se jkun possibbli li tinkiseb ir-riżors innifsu, iżda għalissa, x'aktarx, se jkun dokument RDF, li huwa r-riżultat tal-eżekuzzjoni ta 'mistoqsija SPARQL DESCRIBE.
Prinċipju 3. Użu ta' standards W3C - primarjament RDF(S) u SPARQL - b'mod partikolari meta dereferencing URIs.
Dawn is-"saffi" individwali tal-munzell tat-teknoloġija Linked Data, magħrufa wkoll bħala Kejk tas-Saff tal-Web Semantiku, se jiġu deskritti hawn taħt.
Prinċipju 4. Użu ta' referenzi għal URIs oħra meta tiddeskrivi entitajiet.
RDF jippermettilek tillimita lilek innifsek għal deskrizzjoni verbali ta 'riżorsa fil-lingwa naturali, u r-raba' prinċipju jitlob li ma tagħmilx dan. Jekk l-ewwel prinċipju jiġi osservat universalment, isir possibbli meta tiddeskrivi riżorsa li tirreferi għal oħrajn, inklużi dawk "barranin", u huwa għalhekk li d-dejta tissejjaħ konnessa. Fil-fatt, huwa kważi inevitabbli li tuża URIs imsemmija fil-vokabularju RDFS.
R.F.D.
R.F.D. (Qafas ta' Deskrizzjoni tar-Riżorsi) huwa formaliżmu għad-deskrizzjoni ta' entitajiet interrelatati.
Dikjarazzjonijiet tat-tip "suġġett-predikat-oġġett", imsejħa triplets, isiru dwar entitajiet u r-relazzjonijiet tagħhom. Fl-aktar każ sempliċi, is-suġġett, il-predikat u l-oġġett huma kollha URIs. L-istess URI jista 'jkun f'pożizzjonijiet differenti fi triplets differenti: tkun suġġett, predicat, u oġġett; Għalhekk, it-tripletti jiffurmaw tip ta 'graff imsejjaħ graff RDF.
Is-suġġetti u l-oġġetti jistgħu jkunu mhux biss URIs, iżda wkoll l-hekk imsejħa nodi vojta, u l-oġġetti jistgħu jkunu wkoll letterali. Litterali huma każijiet ta 'tipi primittivi li jikkonsistu minn rappreżentazzjoni ta' string u indikazzjoni tat-tip.
Eżempji ta 'kitba letterali (fis-sintassi tal-Fekruna, aktar dwarha hawn taħt): "5.0"^^xsd:float и "five"^^xsd:string. Letterali bit-tip rdf:langString jista' jkun mgħammar ukoll b'tikketta tal-lingwa; f'Turtle hemm miktub hekk: "five"@en и "пять"@ru.
Nodi vojta huma riżorsi "anonimi" mingħajr identifikaturi globali, li dwarhom jistgħu, madankollu, isiru dikjarazzjonijiet; tip ta 'varjabbli eżistenzjali.
Allura (dan huwa, fil-fatt, il-punt kollu ta 'RDF):
is-suġġett huwa URI jew node vojta,
il-predikat huwa URI,
oġġett huwa URI, nodu vojt, jew letterali.
Għaliex il-predikati ma jistgħux ikunu nodi vojta?
Ir-raġuni probabbli hija x-xewqa li b'mod informali tifhem u tittraduċi triplet fil-lingwa tal-loġika tal-predikat tal-ewwel ordni s p o bħal xi ħaġa bħal fejn - predikat, и - kostanti. Traċċi ta 'dan il-fehim jinsabu fid-dokument "LBase: Semantika għal-Lingwi tal-Web Semantika", li għandha l-istatus ta 'nota ta' grupp ta 'ħidma W3C. B'dan il-fehim, it-tripletta s p []fejn [] - node vojta, se jiġi tradott bħala fejn - varjabbli, imma kif imbagħad tittraduċi s [] o? Dokument bi status ta' Rakkomandazzjoni W3C "RDF 1.1 Semantika” joffri metodu ieħor ta’ traduzzjoni, iżda xorta ma jqisx il-possibbiltà li l-predikati jkunu nodi vojta.
RDF huwa mudell astratt. RDF jista' jinkiteb (serialized) f'diversi sintassi: RDF/XML, fekruna (l-aktar li jinqara mill-bniedem), JSON-LD, HDT (binarju).
L-istess RDF jista 'jiġi serializzat f'RDF/XML b'modi differenti, għalhekk, pereżempju, ma jagħmilx sens li jiġi vvalidat l-XML li jirriżulta bl-użu ta' XSD jew jipprova jiġbed data bl-użu ta 'XPath. Bl-istess mod, JSON-LD x'aktarx ma jissodisfax ix-xewqa tal-iżviluppatur medju ta' Javascript li jaħdem ma' RDF billi juża n-notazzjoni ta' tikek u parentesi kwadri ta' Javascript (għalkemm JSON-LD jimxi f'dik id-direzzjoni billi joffri mekkaniżmu tfassil).
Ħafna sintassi joffru modi biex jitqassru URIs twal. Per eżempju, ad @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> fil Fekruna mbagħad jippermettilek tikteb minflok <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> biss rdf:type.
RDFS
RDFS (RDF Schema) - vokabularju bażiku tal-immudellar, jintroduċi l-kunċetti ta 'proprjetà u klassi u proprjetajiet bħal rdf:type, rdfs:subClassOf, rdfs:domain и rdfs:range. Bl-użu tad-dizzjunarju RDFS, pereżempju, jistgħu jinkitbu l-espressjonijiet validi li ġejjin:
RDFS huwa vokabularju ta' deskrizzjoni u mmudellar, iżda mhuwiex lingwa ta' restrizzjoni (għalkemm l-ispeċifikazzjoni uffiċjali u weraq possibbiltà ta’ użu bħal dan). Il-kelma "Skema" m'għandhiex tinftiehem fl-istess sens bħal fl-espressjoni "XML Schema". Pereżempju, :author rdfs:range foaf:Person ifisser li rdf:type il-valuri kollha tal-proprjetà :author - foaf:Person, iżda ma jfissirx li dan għandu jingħad minn qabel.
SPARQL
SPARQL (SPARQL Protocol u RDF Query Language) - lingwa għall-interrogazzjoni tad-dejta RDF. F'każ sempliċi, mistoqsija SPARQL hija sett ta' kampjuni li magħhom jitqabblu t-tripletti tal-graff li qed jiġi mistoqsija. Il-mudelli jista' jkun fihom varjabbli fil-pożizzjonijiet tas-suġġett, tal-predikat u tal-oġġett.
Il-mistoqsija se tirritorna tali valuri varjabbli li, meta jiġu sostitwiti fil-kampjuni, jistgħu jirriżultaw f'subgraf tal-graff RDF mistoqsija (subsett tat-triplets tiegħu). Varjabbli ta' l-istess isem f'kampjuni differenti ta' triplets għandu jkollhom l-istess valuri.
Per eżempju, minħabba s-sett ta 'hawn fuq ta' seba 'axioms RDFS, il-mistoqsija li ġejja terġa' lura rdfs:domain и rdfs:range bħala valuri ?s и ?p rispettivament:
Ta 'min jinnota li SPARQL huwa dikjarattiv u mhuwiex lingwa biex tiddeskrivi l-graff traversal (madankollu, xi repożitorji RDF joffru modi biex jaġġustaw il-pjan ta' eżekuzzjoni tal-mistoqsija). Għalhekk, xi problemi tal-graffs standard, pereżempju, is-sejba tal-iqsar triq, ma jistgħux jiġu solvuti fl-SPARQL, inkluż l-użu tal- mogħdijiet tal-proprjetà (iżda, għal darb'oħra, repożitorji RDF individwali joffru estensjonijiet speċjali biex isolvu dawn il-problemi).
SPARQL ma taqbilx mal-preżunzjoni ta’ ftuħ tad-dinja u jsegwi l-approċċ ta’ “negazzjoni bħala falliment”, li fih possibbli disinji bħal FILTER NOT EXISTS {…}. Id-distribuzzjoni tad-dejta titqies bl-użu tal-mekkaniżmu mistoqsijiet federati.
Il-punt ta' aċċess SPARQL - ħażna RDF li kapaċi tipproċessa mistoqsijiet SPARQL - m'għandu l-ebda analogi diretti mit-tieni stadju (ara l-bidu ta' dan il-paragrafu). Jista' jitqabbel ma' database, ibbażata fuq il-kontenut li tagħha ġew iġġenerati paġni HTML, iżda aċċessibbli għal barra. Il-punt ta 'aċċess SPARQL huwa aktar analogu għall-punt ta' aċċess API mit-tielet stadju, iżda b'żewġ differenzi ewlenin. L-ewwelnett, huwa possibbli li jiġu kkombinati bosta mistoqsijiet "atomiċi" f'wieħed (li hija meqjusa bħala karatteristika ewlenija ta 'GraphQL), u t-tieni, tali API hija kompletament awtodokumentata (li huwa dak li HATEOAS ippruvat tikseb).
Rimarka polemika
RDF huwa mod kif tippubblika data fuq il-web, għalhekk il-ħażna RDF għandha titqies bħala DBMS dokument. Veru, peress li RDF hija graff u mhux siġra, irriżultaw ukoll li huma bbażati fuq graff. Huwa tal-għaġeb li ħadmet fil-livelli kollha. Min kien jaħseb li jkun hemm nies intelliġenti li jimplimentaw nodi vojta. Codd hawn ma ħadmitx.
Kokka (Lingwa tal-Ontoloġija tal-Web) - formaliżmu biex tirrappreżenta l-għarfien, verżjoni sintattika tal-loġika tad-deskrizzjoni (kullimkien hawn taħt huwa aktar korrett li tgħid OWL 2, l-ewwel verżjoni ta 'OWL kienet ibbażata fuq ).
Kunċetti ta 'loġika deskrittiva f'OWL jikkorrispondu għal klassijiet, rwoli jikkorrispondu għal proprjetajiet, individwi jżommu l-isem preċedenti tagħhom. Axioms jissejħu wkoll axioms.
Per eżempju, fl-hekk imsejħa Sintassi ta' Manchester għan-notazzjoni OWL axioma diġà magħrufa lilna se jinkiteb hekk:
Class: Human
Class: Parent
EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent
Hemm sintassi oħra għall-kitba OWL, bħal sintassi funzjonali, użat fl-ispeċifikazzjoni uffiċjali, u OWL/XML. Barra minn hekk, OWL jista 'jiġi serialized biex astratta sintassi RDF u aktar - fi kwalunkwe mis-sintassi speċifiċi.
OWL għandha relazzjoni doppja ma RDF. Min-naħa waħda, jista 'jitqies bħala tip ta' dizzjunarju li jestendi RDFS. Min-naħa l-oħra, huwa formaliżmu aktar qawwi li għalih RDF huwa biss format ta 'serialization. Mhux il-kostruzzjonijiet OWL elementari kollha jistgħu jinkitbu bl-użu ta' triplet RDF wieħed.
Skont liema subsett ta' kostruzzjonijiet OWL jitħallew jintużaw, huma jitkellmu dwar l-hekk imsejħa profili OWL. L-istandardizzati u l-aktar famużi huma OWL EL, OWL RL u OWL QL. L-għażla tal-profil taffettwa l-kumplessità komputazzjonali ta 'problemi tipiċi. Sett komplut ta' kostruzzjonijiet OWL li jikkorrispondu għal , imsejħa OWL DL. Xi drabi jitkellmu wkoll dwar OWL Full, li fih il-kostruzzjonijiet OWL jitħallew jintużaw bil-libertà sħiħa inerenti fl-RDF, mingħajr restrizzjonijiet semantiċi u komputazzjonali . Per eżempju, xi ħaġa tista 'tkun kemm klassi kif ukoll proprjetà. OWL sħiħ huwa indeċidibbli.
Il-prinċipji ewlenin għat-twaħħil tal-konsegwenzi fl-OWL huma l-adozzjoni tas-suppożizzjoni tad-dinja miftuħa. O.W.A.) u ċ-ċaħda tal-preżunzjoni ta' ismijiet uniċi (assunzjoni ta' isem uniku, WAĦDA). Hawn taħt ser naraw fejn dawn il-prinċipji jistgħu jwasslu u jintroduċu xi kostruzzjonijiet OWL.
Ħalli l-ontoloġija jkun fiha l-framment li ġej (fis-sintassi ta' Manchester):
Class: manyChildren
EquivalentTo: Human that hasChild min 3
Individual: John
Types: Human
Facts: hasChild Alice, hasChild Bob, hasChild Carol
Minn dak li ntqal se jirriżulta li Ġwanni għandu ħafna wlied? Ir-rifjut tal-UNA se jġiegħel lill-magna tal-inferenza twieġeb din il-mistoqsija fin-negattiv, peress li Alice u Bob jistgħu jkunu l-istess persuna. Biex iseħħ dan li ġej, huwa meħtieġ li żżid l-axioma li ġejja:
DifferentIndividuals: Alice, Bob, Carol, John
Ħalli issa l-framment tal-ontoloġija jkollu l-forma li ġejja (Ġwanni huwa ddikjarat li għandu ħafna tfal, iżda għandu biss żewġt itfal):
Class: manyChildren
EquivalentTo: Human that hasChild min 3
Individual: John
Types: Human, manyChildren
Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John
Din l-ontoloġija se tkun inkonsistenti (li tista’ tiġi interpretata bħala evidenza ta’ data invalida)? L-aċċettazzjoni tal-OWA tikkawża li l-magna tal-inferenza tirrispondi fin-negattiv: "x'imkien" ieħor (f'ontoloġija oħra) jista 'jingħad li Carol hija wkoll it-tifel ta' John.
Biex teskludi l-possibbiltà ta’ dan, ejja nżidu fatt ġdid dwar John:
Individual: John
Facts: hasChild Alice, hasChild Bob, not hasChild Carol
Biex teskludi d-dehra ta 'tfal oħra, ejja ngħidu li l-valuri kollha tal-proprjetà "li jkollok tifel" huma nies, li minnhom għandna erbgħa biss:
ObjectProperty: hasChild
Domain: Human
Сharacteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }
Issa l-ontoloġija se ssir kontradittorja, li l-magna tal-inferenza mhux se tonqos milli tirrapporta. Bl-aħħar ta 'l-axioms għandna, f'ċertu sens, "magħluq" id-dinja, u ninnutaw kif il-possibbiltà li John ikun it-tifel tiegħu stess hija eskluża.
Linking tad-Dejta tal-Intrapriża
Is-sett ta' approċċi u teknoloġiji Linked Data kien oriġinarjament maħsub għall-pubblikazzjoni ta' data fuq il-Web. L-użu tagħhom f'ambjent korporattiv intern jiffaċċja għadd ta' diffikultajiet.
Pereżempju, f'ambjent korporattiv magħluq, is-setgħa deduttiva ta 'OWL ibbażata fuq l-adozzjoni ta' OWA u r-rifjut ta 'UNA, deċiżjonijiet minħabba n-natura miftuħa u mqassma tal-Web, hija dgħajfa wisq. U hawn is-soluzzjonijiet li ġejjin huma possibbli.
Dotazzjoni OWL b'semantika, li timplika l-abbandun ta 'OWA u l-adozzjoni ta' UNA, l-implimentazzjoni tal-magna tal-output korrispondenti. - F'din it-triq sejjer Ħażna Stardog RDF.
L-abbandun tal-kapaċitajiet deduttivi tal-OWL favur il-magni tar-regoli. — Stardog jappoġġja SWRL; Jena u GraphDB joffru stesslingwi regoli
Rifjut tal-kapaċitajiet deduttivi ta 'OWL, użu ta' subsett wieħed jew ieħor qrib RDFS għall-immudellar. - Ara aktar dwar dan hawn taħt.
Kwistjoni oħra hija l-fokus akbar li d-dinja korporattiva jista 'jkollha fuq kwistjonijiet ta' kwalità tad-dejta u n-nuqqas ta 'għodod ta' validazzjoni tad-dejta fil-munzell tad-Data Konnessa. L-outputs hawnhekk huma kif ġej.
Għal darb'oħra, uża għall-validazzjoni ta' kostruzzjonijiet OWL b'semantika dinja magħluqa u ismijiet uniċi jekk tkun disponibbli magna ta 'inferenza xierqa.
Użu SHACL, standardizzat wara li l-lista tas-saffi tal-kejk tas-saffi tal-Web Semantika tkun ġiet iffissata (madankollu, tista' tintuża wkoll bħala magna tar-regoli), jew Shex.
Nifhmu li kollox fl-aħħar mill-aħħar isir b'mistoqsijiet SPARQL, billi toħloq il-mekkaniżmu ta 'validazzjoni tad-dejta sempliċi tiegħek billi tużahom.
Madankollu, anki rifjut sħiħ ta 'kapaċitajiet deduttivi u għodod ta' validazzjoni tħalli l-munzell tad-Data Konnessa barra mill-kompetizzjoni f'kompiti li huma simili fil-pajsaġġ għall-web miftuħ u distribwit - fil-kompiti ta 'integrazzjoni tad-dejta.
Xi ngħidu dwar sistema ta 'informazzjoni ta' intrapriża regolari?
Dan huwa possibbli, iżda għandek, ovvjament, tkun konxju ta 'eżattament liema problemi se jkollhom isolvu t-teknoloġiji korrispondenti. Hawnhekk ser niddeskrivi reazzjoni tipika tal-parteċipanti tal-iżvilupp biex turi kif tidher din il-munzell tat-teknoloġija mil-lat tal-IT konvenzjonali. Ifakkarni ftit fil-parabbola tal-iljunfant:
Analista tan-negozju: RDF hija xi ħaġa bħal mudell loġiku maħżun direttament.
Analista tas-Sistemi: RDF huwa simili Estensjoni EAV, biss b'mazz ta 'indiċi u lingwa ta' mistoqsija konvenjenti.
iżviluppatur: ukoll, dan kollu huwa fl-ispirtu tal-kunċetti ta 'mudell għani u kodiċi baxx, kien qari dan l-aħħar dwar dan.
Il-prattika turi li l-munzell jintuża l-aktar ta 'spiss f'kompiti relatati mad-distribuzzjoni u l-eteroġeneità tad-dejta, pereżempju, meta tibni sistemi ta' klassi MDM (Master Data Management) jew DWH (Data Warehouse). Problemi bħal dawn jeżistu fi kwalunkwe industrija.
F'termini ta 'applikazzjonijiet speċifiċi għall-industrija, it-teknoloġiji tad-Data Konnessa bħalissa huma l-aktar popolari fl-industriji li ġejjin.
teknoloġiji bijomediċi (fejn il-popolarità tagħhom tidher li hija relatata mal-kumplessità tad-dominju);
produzzjoni u tħaddim ta’ prodotti kumplessi (inġinerija mekkanika kbira, produzzjoni taż-żejt u tal-gass; ħafna drabi qed nitkellmu dwar standard ISO 15926);
kurrenti
Hawnhekk ukoll, ir-raġuni hija l-kumplessità tal-qasam tas-suġġett, meta, pereżempju, fl-istadju upstream, jekk nitkellmu dwar l-industrija taż-żejt u tal-gass, il-kontabilità sempliċi teħtieġ xi funzjonijiet CAD.
Fl-2008, sar avveniment ta' installazzjoni rappreżentattiv, organizzat minn Chevron il-konferenza.
ISO 15926, fl-aħħar, deher daqsxejn tqil għall-industrija taż-żejt u tal-gass (u sabet forsi applikazzjoni akbar fl-inġinerija mekkanika). Statoil biss (Equinor) qabad sew fuqha; fin-Norveġja, kollu ekosistema. Oħrajn qed jippruvaw jagħmlu l-ħaġa tagħhom. Pereżempju, skont l-għajdut, il-Ministeru tal-Enerġija domestiku għandu l-intenzjoni li joħloq "mudell ontoloġiku kunċettwali tal-kumpless tal-fjuwil u l-enerġija", simili, apparentement, għal maħluqa għall-industrija tal-enerġija elettrika.
organizzazzjonijiet finanzjarji (anke XBRL jista 'jitqies bħala tip ta' ibridu ta 'SDMX u l-ontoloġija RDF Data Cube);
kurrenti
Fil-bidu tas-sena, LinkedIn b'mod attiv spammja lill-awtur b'postijiet vakanti minn kważi l-ġganti kollha tal-industrija finanzjarja, li jafhom mis-serje tat-TV "Force Majeure": Goldman Sachs, JPMorgan Chase u/jew Morgan Stanley, Wells Fargo, SWIFT/Visa/Mastercard, Bank of America, Citigroup, Fed, Deutsche Bank... Probabbilment kulħadd kien qed ifittex lil xi ħadd li jista' jibgħatlu Konferenza tal-Grafika tal-Għarfien. Pjuttost ftit irnexxielhom isibu: l-organizzazzjonijiet finanzjarji ħadu kollox filgħodu tal-ewwel jum.
Fuq HeadHunter, Sberbank biss sab xi ħaġa interessanti; kien dwar "Ħażna EAV b'mudell ta 'dejta bħal RDF."
Probabbilment, id-differenza fil-grad ta 'imħabba għat-teknoloġiji korrispondenti ta' istituzzjonijiet finanzjarji domestiċi u tal-Punent hija dovuta għan-natura transnazzjonali tal-attivitajiet ta 'dawn tal-aħħar. Apparentement, l-integrazzjoni bejn il-fruntieri statali teħtieġ soluzzjonijiet organizzattivi u tekniċi kwalitattivament differenti.
sistemi ta’ mistoqsija-tweġiba b’applikazzjonijiet kummerċjali (IBM Watson, Apple Siri, Google Knowledge Graph);
kurrenti
Mill-mod, il-kreatur ta 'Siri, Thomas Gruber, huwa l-awtur tad-definizzjoni stess tal-ontoloġija (fis-sens tal-IT) bħala "speċifikazzjoni ta' kunċettwali". Fl-opinjoni tiegħi, ir-rranġament mill-ġdid tal-kliem f'din id-definizzjoni ma jbiddilx it-tifsira tagħha, li forsi tindika li mhix hemm.
pubblikazzjoni ta’ data strutturata (b’ġustifikazzjoni akbar dan jista’ jiġi attribwit għal Linked Open Data).
kurrenti
Fannijiet kbar ta' Linked Data huma l-hekk imsejħa GLAM: Galleriji, Libreriji, Arkivji, u Mużewijiet. Biżżejjed ngħid li l-Librerija tal-Kungress qed tippromwovi sostitut għal MARC21 BIBFRAMELiema jipprovdi pedament għall-futur tad-deskrizzjoni biblijografika u, ovvjament, ibbażat fuq RDF.
Il-Wikidata spiss tissemma bħala eżempju ta’ proġett ta’ suċċess fil-qasam tal-Linked Open Data – tip ta’ verżjoni tal-Wikipedija li tinqara mill-magni, li l-kontenut tagħha, b’kuntrast ma’ DBPedia, ma jiġix iġġenerat mill-importazzjoni minn infoboxes tal-artikoli, iżda huwa maħluqa xi ftit jew wisq manwalment (u sussegwentement issir sors ta’ informazzjoni għall-istess infoboxes).
Nirrakkomandaw ukoll li tiċċekkjaha lista utenti tal-ħażna Stardog RDF fuq il-websajt Stardog fit-taqsima "Klijenti".
Kun hekk, f'Gartner Ċiklu Hype għal Teknoloġiji Emerġenti 2016 "Enterprise Taxonomy and Ontology Management" titqiegħed f'nofs inżul fil-wied tad-diżappunt bil-prospett li jintlaħaq "plateau ta 'produttività" mhux aktar kmieni minn 10 snin.
Konnessjoni tad-Data tal-Intrapriża
Tbassir, tbassir, tbassir...
Minn interess storiku, hawn taħt għamilt tabella t-tbassir ta’ Gartner għal diversi snin dwar it-teknoloġiji li jinteressawna.
Sena
Технология
Rapport
Pożizzjoni
Snin sal-plateau
2001
Web Semantiku
Teknoloġiji emerġenti
Trigger tal-Innovazzjoni
5-10
2006
Web Semantika Korporattiva
Teknoloġiji emerġenti
L-ogħla livell ta 'l-aspettattivi inflatati
5-10
2012
Web Semantiku
Data Big
L-ogħla livell ta 'l-aspettattivi inflatati
> 10
2015
Data Konnessa
Analitika Avvanzata u Xjenza tad-Data
Ħawt tad-diżillużjoni
5-10
2016
Ġestjoni tal-Ontoloġija tal-Intrapriża
Teknoloġiji emerġenti
Ħawt tad-diżillużjoni
> 10
2018
Grafiċi tal-Għarfien
Teknoloġiji emerġenti
Trigger tal-Innovazzjoni
5-10
Madankollu, diġà fil "Ċiklu tal-Hype..." 2018 dehret xejra oħra 'l fuq - Knowledge Graphs. Sar ċerta reinkarnazzjoni: DBMSs tal-graff, li għalihom l-attenzjoni tal-utenti u l-isforzi tal-iżviluppaturi rriżultaw li inbidlu, taħt l-influwenza tat-talbiet tal-ewwel u d-drawwiet tal-aħħar, bdew jieħdu l-kontorni u l-pożizzjonament tal-kompetituri predeċessuri tagħhom.
Kważi kull graff DBMS issa jiddikjara lilu nnifsu bħala pjattaforma adattata għall-bini ta '"graff ta' għarfien" korporattiv ("data konnessa" kultant tiġi sostitwita b' "data konnessa"), iżda kemm huma ġustifikati tali pretensjonijiet?
Id-databases tal-grafiċi għadhom asemantiċi; id-dejta f'DBMS tal-graff għadha l-istess silo tad-dejta. Identifikaturi ta 'string minflok URIs jagħmlu l-kompitu li jintegraw żewġ DBMSs graffs għadu kompitu ta' integrazzjoni, filwaqt li l-integrazzjoni ta 'żewġ ħwienet RDF ħafna drabi niżel għal sempliċiment jingħaqdu żewġ graffs RDF. Aspett ieħor ta 'asemanticity huwa n-nuqqas ta' riflessività tal-mudell tal-graff LPG, li jagħmilha diffiċli biex timmaniġġja l-metadata bl-użu tal-istess pjattaforma.
Fl-aħħarnett, DBMSs graffs m'għandhomx magni ta 'inferenza jew magni tar-regoli. Ir-riżultati ta 'magni bħal dawn jistgħu jiġu riprodotti billi tikkomplika l-mistoqsijiet, iżda dan huwa possibbli anke fl-SQL.
Madankollu, is-sistemi ewlenin tal-ħażna RDF m'għandhom l-ebda diffikultà biex jappoġġjaw il-mudell LPG. L-aktar approċċ solidu jitqies bħala dak propost f'ħin wieħed f'Blazegraph: il-mudell RDF*, li jgħaqqad RDF u LPG.
Aktar
Tista 'taqra aktar dwar l-appoġġ tal-ħażna RDF għall-mudell LPG fl-artikolu preċedenti dwar Habré: "X'qed jiġri bil-ħażna RDF issa". Nispera li xi darba jinkiteb artiklu separat dwar Knowledge Graphs u Data Fabric. L-aħħar taqsima, kif faċli biex tinftiehem, inkitbet bil-għaġla, madankollu, anke sitt xhur wara, kollox mhux ħafna aktar ċar b’dawn il-kunċetti.
Letteratura
Halpin, H., Monnin, A. (eds.) (2014). Inġinerija Filosofika: Lejn Filosofija tal-Web
Allemang, D., Hendler, J. (2011) Semantic Web for the Working Ontologist (it-2 ed.)
Staab, S., Studer, R. (eds.) (2009) Manwal dwar Ontologies (it-2 ed.)
Wood, D. (ed.). (2011) Linking Enterprise Data
Keet, M. (2018) Introduzzjoni għall-Inġinerija tal-Ontoloġija