Semantiskais tÄ«meklis un saistÄ«tie dati. Labojumi un papildinÄjumi
VÄlos iepazÄ«stinÄt sabiedrÄ«bu ar Ŕīs nesen izdotÄs grÄmatas fragmentu:
UzÅÄmuma ontoloÄ£iskÄ modelÄÅ”ana: metodes un tehnoloÄ£ijas [Teksts]: monogrÄfija / [S. V. GorÅ”kovs, S. S. Kraļins, O. I. MuÅ”taks un citi; izpildredaktors S.V. GorÅ”kovs]. - Jekaterinburga: Ural University Publishing House, 2019. - 234 lpp.: il., tabula; 20 cm - Autors. norÄdÄ«ts uz muguras krÅ«tis. Ar. ā BibliogrÄfija nodaļas beigÄs. ā ISBN 978-5-7996-2580-1: 200 eks.
Diez vai kÄds spÄs turÄt Å”o grÄmatu rokÄs, ja viÅÅ” nebÅ«s cienÄ«jama klients SergeIndex; Tas noteikti nav pÄrdoÅ”anÄ.
TekstÄ veikti labojumi (zemÄk tie nav izcelti) un ar drukÄtas monogrÄfijas formÄtu ne pÄrÄk savienojami papildinÄjumi: aktuÄlÄs piezÄ«mes (zem spoileriem) un hipersaites.
ES gribu apkopot jautÄjumus un komentÄrus, lai tos Åemtu vÄrÄ, iekļaujot Å”o tekstu pÄrskatÄ«tÄ veidÄ citÄs publikÄcijÄs.
Daudzi semantiskÄ tÄ«mekļa un saistÄ«to datu piekritÄji joprojÄm uzskata, ka viÅu loks ir tik Å”aurs, galvenokÄrt tÄpÄc, ka plaÅ”ai sabiedrÄ«bai vÄl nav pienÄcÄ«gi izskaidrots, cik lieliski ir bÅ«t semantiskÄ tÄ«mekļa un saistÄ«to datu piekritÄjiem. Fragmenta autors, lai arÄ« pieder Å”im lokam, nepieturas pie Å”Äda viedokļa, tomÄr uzskata sevi par pienÄkumu izdarÄ«t vÄl vienu mÄÄ£inÄjumu.
TÄtad,
Semantiskais tīmeklis
Interneta attÄ«stÄ«bu var attÄlot Å”Ädi (vai runÄt par tÄ segmentiem, kas tika izveidoti tÄlÄk norÄdÄ«tajÄ secÄ«bÄ):
Dokumenti internetÄ. GalvenÄs tehnoloÄ£ijas - Gopher, FTP utt.
Internets ir globÄls tÄ«kls vietÄjo resursu apmaiÅai.
Interneta dokumenti. GalvenÄs tehnoloÄ£ijas ir HTML un HTTP.
AtklÄto resursu raksturs Åem vÄrÄ to pÄrraides vides Ä«paŔības.
Interneta dati. GalvenÄs tehnoloÄ£ijas - REST un SOAP API, XHR u.c.
Interneta lietojumprogrammu laikmets, ne tikai cilvÄki kļūst par resursu patÄrÄtÄjiem.
Interneta dati. GalvenÄs tehnoloÄ£ijas ir saistÄ«to datu tehnoloÄ£ijas.
Å o ceturto posmu, ko paredzÄja Berners-LÄ«, otrÄs pamattehnoloÄ£ijas radÄ«tÄjs un W3C direktors, sauc par semantisko tÄ«mekli; SaistÄ«to datu tehnoloÄ£ijas ir izstrÄdÄtas, lai padarÄ«tu datus tÄ«meklÄ« ne tikai maŔīnlasÄmus, bet arÄ« "maŔīnlasÄmus".
No tÄlÄk minÄtÄ lasÄ«tÄjs sapratÄ«s atbilstÄ«bu starp otrÄ un ceturtÄ posma galvenajiem jÄdzieniem:
URL ir līdzīgi URI,
HTML analogs ir RDF,
HTML hipersaites ir līdzīgas URI gadījumiem RDF dokumentos.
Semantiskais tÄ«meklis drÄ«zÄk ir sistÄmisks interneta nÄkotnes redzÄjums, nevis Ä«paÅ”a spontÄna vai lobÄta tendence, lai gan tas var Åemt vÄrÄ pÄdÄjo. PiemÄram, svarÄ«ga Ä«paŔība, ko sauc par Web 2.0, tiek uzskatÄ«ta par ālietotÄju Ä£enerÄtu saturuā. Jo Ä«paÅ”i W3C ieteikums tiek aicinÄts to Åemt vÄrÄ āTÄ«mekļa anotÄcijas ontoloÄ£ija"un tÄds uzÅÄmums kÄ Ciets.
Vai semantiskais tīmeklis ir miris?
Ja atsakÄs nereÄlas cerÄ«bas, situÄcija ar semantisko tÄ«mekli ir aptuveni tÄda pati kÄ ar komunismu attÄ«stÄ«tÄ sociÄlisma laikos (un vai tiek ievÄrota lojalitÄte IļjiÄa nosacÄ«tajiem pavÄlÄm, lai katrs izlemj pats). MeklÄtÄjprogrammas diezgan veiksmÄ«gi piespiest vietnes izmantot RDFa un JSON-LD un paÅ”as izmantot tehnoloÄ£ijas, kas saistÄ«tas ar tÄlÄk aprakstÄ«tajÄm (Google zinÄÅ”anu diagramma, Bing zinÄÅ”anu diagramma).
VispÄrÄ«gi runÄjot, autors nevar pateikt, kas kavÄ plaÅ”Äku izplatÄ«bu, taÄu viÅÅ” var runÄt, balstoties uz personÄ«go pieredzi. Ir problÄmas, kuras DR ofensÄ«vas apstÄkļos varÄtu atrisinÄt āno kastesā, lai gan tÄs nav Ä«paÅ”i izplatÄ«tas. RezultÄtÄ tiem, kas saskaras ar Å”iem uzdevumiem, nav nekÄdu piespieÅ”anas lÄ«dzekļu pret tiem, kas spÄj sniegt risinÄjumu, savukÄrt pÄdÄjo neatkarÄ«gÄ risinÄjuma nodroÅ”inÄÅ”ana ir pretrunÄ ar viÅu uzÅÄmÄjdarbÄ«bas modeļiem. TÄpÄc mÄs turpinÄm parsÄt HTML un salÄ«mÄt kopÄ dažÄdas API, vienu citu vÄl sÅ«dÄ«gÄk.
TomÄr saistÄ«to datu tehnoloÄ£ijas ir izplatÄ«juÅ”Äs Ärpus galvenÄ tÄ«mekļa; GrÄmata patiesÄ«bÄ ir veltÄ«ta Å”iem lietojumiem. PaÅ”laik saistÄ«to datu kopiena sagaida, ka Ŕīs tehnoloÄ£ijas kļūs vÄl plaÅ”Äkas, pateicoties Gartnera ierakstÄ«Å”anai (vai pasludinÄÅ”anai, kÄ vÄlaties) par tÄdÄm tendencÄm kÄ, piemÄram, ZinÄÅ”anu grafiki Šø Datu audums. GribÄtos ticÄt, ka veiksmÄ«gas bÅ«s nevis Å”o koncepciju āvelosipÄduā realizÄcijas, bet gan tÄs, kas saistÄ«tas ar tÄlÄk aplÅ«kotajiem W3C standartiem.
Saistītie dati
Berners-LÄ« definÄja saistÄ«tos datus kÄ semantisko tÄ«mekli, kas ir "pareizi izdarÄ«ts": pieeju un tehnoloÄ£iju kopums, kas ļauj sasniegt galvenos mÄrÄ·us. SaistÄ«to datu pamatprincipi Berners-LÄ« izcelts sekojoÅ”ais.
1. princips. URI izmantoŔana entītiju nosaukŔanai.
URI ir globÄlie entÄ«tiju identifikatori, nevis vietÄjie ierakstu virkÅu identifikatori. PÄc tam Å”is princips vislabÄk izpaudÄs Google Knowledge Graph sauklÄ« ālietas, nevis stÄ«gas'.
2. princips. URI izmantoÅ”ana HTTP shÄmÄ, lai uz tiem varÄtu noÅemt atsauces.
Atsaucoties uz URI, vajadzÄtu bÅ«t iespÄjai iegÅ«t apzÄ«mÄto aiz Ŕī apzÄ«mÄtÄja (Å”eit ir skaidra analoÄ£ija ar operatora nosaukumu).*" C); precÄ«zÄk, lai iegÅ«tu zinÄmu Ŕī apzÄ«mÄjuma attÄlojumu - atkarÄ«bÄ no HTTP galvenes vÄrtÄ«bas Accept:. IespÄjams, lÄ«dz ar AR/VR Äras atnÄkÅ”anu bÅ«s iespÄjams iegÅ«t paÅ”u resursu, bet pagaidÄm tas, visticamÄk, bÅ«s RDF dokuments, kas tapis SPARQL vaicÄjuma izpildes rezultÄtÄ. DESCRIBE.
3. princips. W3C standartu ā galvenokÄrt RDF(S) un SPARQL ā izmantoÅ”ana, jo Ä«paÅ”i, atsaucot URI.
Å ie atseviŔķie saistÄ«to datu tehnoloÄ£iju kopas āslÄÅiā, kas pazÄ«stami arÄ« kÄ SemantiskÄ tÄ«mekļa slÄÅa kÅ«ka, tiks aprakstÄ«ts tÄlÄk.
4. princips. AtsauÄu uz citiem URI izmantoÅ”ana, aprakstot entÄ«tijas.
RDF ļauj aprobežoties ar resursa verbÄlu aprakstu dabiskÄ valodÄ, un ceturtais princips aicina to nedarÄ«t. Ja vispÄrÄji tiek ievÄrots pirmais princips, aprakstot resursu kļūst iespÄjams atsaukties uz citiem, arÄ« uz āsveÅ”ajiemā, tÄpÄc dati tiek saukti par saistÄ«tiem. Faktiski ir gandrÄ«z neizbÄgami izmantot RDFS vÄrdnÄ«cÄ nosauktos URI.
RDF
RDF (Resource Description Framework) ir formÄlisms savstarpÄji saistÄ«tu entÄ«tiju aprakstÄ«Å”anai.
Par entÄ«tijÄm un to attiecÄ«bÄm tiek veidoti āsubjekta-predikÄta-objektaā tipa paziÅojumi, ko sauc par tripletiem. VienkÄrÅ”ÄkajÄ gadÄ«jumÄ subjekts, predikÄts un objekts ir visi URI. Viens un tas pats URI var atrasties dažÄdÄs pozÄ«cijÄs dažÄdos tripletos: ir subjekts, predikÄts un objekts; TÄdÄjÄdi tripleti veido sava veida grafiku, ko sauc par RDF grafiku.
Subjekti un objekti var bÅ«t ne tikai URI, bet arÄ« t.s tukÅ”i mezgli, un objekti var bÅ«t arÄ« burtiski. LiterÄļi ir primitÄ«vu tipu gadÄ«jumi, kas sastÄv no virknes attÄlojuma un tipa norÄdes.
LiterÄļu rakstÄ«Å”anas piemÄri (Turtle sintaksÄ, vairÄk par to zemÄk): "5.0"^^xsd:float Šø "five"^^xsd:string. LiterÄļi ar tipu rdf:langString var bÅ«t aprÄ«kots arÄ« ar valodas tagu; BruÅurupucis tas ir rakstÄ«ts Å”Ädi: "five"@en Šø "ŠæŃŃŃ"@ru.
TukÅ”ie mezgli ir āanonÄ«miā resursi bez globÄliem identifikatoriem, par kuriem tomÄr var izteikt apgalvojumus; eksistenciÄlie mainÄ«gie.
TÄtad (faktiski Ŕī ir visa RDF bÅ«tÄ«ba):
priekŔmets ir URI vai tukŔs mezgls,
predikÄts ir URI,
objekts ir URI, tukÅ”s mezgls vai literÄls.
KÄpÄc predikÄti nevar bÅ«t tukÅ”i mezgli?
IespÄjamais iemesls ir vÄlme neformÄli saprast un tulkot tripletu pirmÄs kÄrtas predikÄtu loÄ£ikas valodÄ s p o kÄ kaut kas lÄ«dzÄ«gs Kur - predikÄts, Šø - konstantes. Å Ä«s izpratnes pÄdas ir dokumentÄ "LBase: semantika semantiskÄ tÄ«mekļa valodÄm", kam ir W3C darba grupas piezÄ«mes statuss. Ar Å”o izpratni trÄ«nÄ«tis s p []Kur [] - tukÅ”s mezgls, tiks tulkots kÄ Kur - mainÄ«gs, bet kÄ tad tulkot s [] o? Dokuments ar W3C ieteikuma statusu "RDF 1.1 semantikaā piedÄvÄ citu tulkoÅ”anas metodi, taÄu joprojÄm neapsver iespÄju, ka predikÄti ir tukÅ”i mezgli.
RDF ir abstrakts modelis. RDF var rakstÄ«t (serializÄt) dažÄdÄs sintaksÄs: RDF/XML, BruÅurupucis (cilvÄkam lasÄmÄkais), JSON-LD, HDT (binÄrs).
To paÅ”u RDF var serializÄt RDF/XML formÄtÄ dažÄdos veidos, tÄpÄc, piemÄram, nav jÄgas apstiprinÄt iegÅ«to XML, izmantojot XSD, vai mÄÄ£inÄt iegÅ«t datus, izmantojot XPath. TÄpat maz ticams, ka JSON-LD apmierinÄs vidusmÄra Javascript izstrÄdÄtÄja vÄlmi strÄdÄt ar RDF, izmantojot Javascript punktu un kvadrÄtiekavÄs (lai gan JSON-LD virzÄs Å”ajÄ virzienÄ, piedÄvÄjot mehÄnismu ierÄmÄÅ”ana).
RDFS (RDF shÄma) - pamata modelÄÅ”anas vÄrdnÄ«ca, iepazÄ«stina ar Ä«paÅ”uma un klases jÄdzieniem un Ä«paŔībÄm, piemÄram, rdf:type, rdfs:subClassOf, rdfs:domain Šø rdfs:range. Izmantojot RDFS vÄrdnÄ«cu, piemÄram, var uzrakstÄ«t Å”Ädas derÄ«gas izteiksmes:
RDFS ir apraksta un modelÄÅ”anas vÄrdnÄ«ca, taÄu tÄ nav ierobežojoÅ”a valoda (lai gan oficiÄlÄ specifikÄcija un lapas Å”Ädas izmantoÅ”anas iespÄja). VÄrds "shÄma" nav jÄsaprot tÄdÄ paÅ”Ä nozÄ«mÄ kÄ izteiciens "XML shÄma". PiemÄram, :author rdfs:range foaf:Person nozÄ«mÄ to rdf:type visas Ä«paÅ”uma vÄrtÄ«bas :author SÄkot no foaf:Person, taÄu tas nenozÄ«mÄ, ka tas bÅ«tu jÄpasaka iepriekÅ”.
SPARQL
SPARQL (SPARQL Protocol and RDF Query Language) ā valoda RDF datu vaicÄÅ”anai. VienkÄrÅ”Ä gadÄ«jumÄ SPARQL vaicÄjums ir paraugu kopa, ar kuru tiek saskaÅoti vaicÄtÄ grafika tripleti. Raksti var saturÄt mainÄ«gos lielumus subjekta, predikÄta un objekta pozÄ«cijÄs.
VaicÄjums atgriezÄ«s tÄdas mainÄ«gÄs vÄrtÄ«bas, kuras, aizvietojot paraugos, var radÄ«t vaicÄtÄ RDF grafika apakÅ”grafu (tÄ tripletu apakÅ”kopu). Viena nosaukuma mainÄ«gajiem dažÄdos tripletu paraugos ir jÄbÅ«t vienÄdÄm vÄrtÄ«bÄm.
Ir vÄrts atzÄ«mÄt, ka SPARQL ir deklaratÄ«vs un nav valoda, lai aprakstÄ«tu grafu ŔķÄrsoÅ”anu (tomÄr daži RDF repozitoriji piedÄvÄ veidus, kÄ pielÄgot vaicÄjuma izpildes plÄnu). TÄpÄc dažas standarta grafikas problÄmas, piemÄram, Ä«sÄkÄ ceļa atraÅ”ana, nevar atrisinÄt SPARQL, tostarp izmantojot Ä«paÅ”umu ceļi (bet atkal atseviŔķas RDF krÄtuves piedÄvÄ Ä«paÅ”us paplaÅ”inÄjumus, lai atrisinÄtu Ŕīs problÄmas).
SPARQL nepiekrÄ«t pasaules atvÄrtÄ«bas prezumpcijai un ievÄro pieeju ānigÄcija kÄ neveiksmeā, kurÄ iespÄjams tÄdi dizaini kÄ FILTER NOT EXISTS {ā¦}. Datu izplatÄ«Å”ana tiek Åemta vÄrÄ, izmantojot mehÄnismu apvienotie vaicÄjumi.
SPARQL piekļuves punktam - RDF krÄtuvei, kas spÄj apstrÄdÄt SPARQL vaicÄjumus - nav tieÅ”u analogu no otrÄ posma (skatiet Ŕīs rindkopas sÄkumu). To var pielÄ«dzinÄt datu bÄzei, pamatojoties uz kuras saturu tika Ä£enerÄtas HTML lapas, taÄu tÄs ir pieejamas Ärpusei. SPARQL piekļuves punkts ir vairÄk analoÄ£isks API piekļuves punktam no treÅ”Ä posma, taÄu ar divÄm galvenajÄm atŔķirÄ«bÄm. PirmkÄrt, ir iespÄjams apvienot vairÄkus āatomiskusā vaicÄjumus vienÄ (kas tiek uzskatÄ«ts par galveno GraphQL Ä«paŔību), un, otrkÄrt, Å”Äda API ir pilnÄ«bÄ paÅ”dokumentÄjoÅ”a (to HATEOAS mÄÄ£inÄja panÄkt).
Polemiska piezīme
RDF ir veids, kÄ publicÄt datus tÄ«meklÄ«, tÄpÄc RDF uzglabÄÅ”ana ir jÄuzskata par dokumentu DBVS. Tiesa, tÄ kÄ RDF ir grafs, nevis koks, izrÄdÄ«jÄs, ka tie arÄ« ir balstÄ«ti uz grafiem. ApbrÄ«nojami, ka tas vispÄr izdevÄs. Kas to bÅ«tu domÄjis, ka bÅ«s gudri cilvÄki, kas ieviesÄ«s tukÅ”us mezglus. Menca ir klÄt tas neizdevÄs.
OWL (Web Ontology Language) - formÄlisms zinÄÅ”anu attÄloÅ”anai, apraksta loÄ£ikas sintaktiskÄ versija (visur zemÄk pareizÄk ir teikt OWL 2, pirmÄ OWL versija tika balstÄ«ta uz ).
AprakstoÅ”Äs loÄ£ikas jÄdzieni OWL atbilst klasÄm, lomas atbilst Ä«paŔībÄm, indivÄ«di saglabÄ savu iepriekÅ”Äjo nosaukumu. Aksiomas sauc arÄ« par aksiomÄm.
PiemÄram, tÄ sauktajÄ ManÄestras sintakse OWL apzÄ«mÄjumam mums jau zinÄma aksioma tiks rakstÄ«ts Å”Ädi:
Class: Human
Class: Parent
EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent
Ir arÄ« citas sintakses OWL rakstÄ«Å”anai, piemÄram funkcionÄlÄ sintakse, ko izmanto oficiÄlajÄ specifikÄcijÄ, un OWL/XML. TurklÄt OWL var serializÄt uz abstraktu RDF sintaksi un tÄlÄk - jebkurÄ no konkrÄtajÄm sintaksÄm.
OWL ir divÄjÄdas attiecÄ«bas ar RDF. No vienas puses, to var uzskatÄ«t par sava veida vÄrdnÄ«cu, kas paplaÅ”ina RDFS. No otras puses, tas ir spÄcÄ«gÄks formÄlisms, kuram RDF ir tikai serializÄcijas formÄts. Ne visas elementÄrÄs OWL konstrukcijas var uzrakstÄ«t, izmantojot vienu RDF tripletu.
AtkarÄ«bÄ no tÄ, kuru OWL konstrukciju apakÅ”kopu atļauts izmantot, tÄs runÄ par t.s OWL profili. StandartizÄtie un slavenÄkie ir OWL EL, OWL RL un OWL QL. Profila izvÄle ietekmÄ tipisko problÄmu skaitļoÅ”anas sarežģītÄ«bu. Pilns OWL konstrukciju komplekts, kas atbilst , ko sauc OWL DL. Dažreiz viÅi runÄ arÄ« par OWL Full, kurÄ OWL konstrukcijas ir atļauts izmantot ar pilnu brÄ«vÄ«bu, kas raksturÄ«ga RDF, bez semantiskiem un skaitļoÅ”anas ierobežojumiem. . PiemÄram, kaut kas var bÅ«t gan klase, gan Ä«paÅ”ums. OWL Full ir neizŔķirams.
Galvenie principi seku piesaistÄ«Å”anai OWL ir atvÄrtÄs pasaules pieÅÄmuma pieÅemÅ”ana. OWA) un unikÄlu nosaukumu prezumpcijas noraidÄ«Å”ana (unikÄlÄ nosaukuma pieÅÄmums, ONE). TÄlÄk mÄs redzÄsim, kur Å”ie principi var novest, un ieviesÄ«sim dažas OWL konstrukcijas.
Class: manyChildren
EquivalentTo: Human that hasChild min 3
Individual: John
Types: Human
Facts: hasChild Alice, hasChild Bob, hasChild Carol
Vai no teiktÄ izrietÄs, ka JÄnim ir daudz bÄrnu? AtteikÅ”anÄs no UNA liks secinÄjumu dzinÄjam atbildÄt uz Å”o jautÄjumu noliedzoÅ”i, jo Alise un Bobs var bÅ«t viena un tÄ pati persona. Lai notiktu sekojoÅ”ais, ir jÄpievieno Å”Äda aksioma:
DifferentIndividuals: Alice, Bob, Carol, John
Lai tagad ontoloÄ£ijas fragmentam ir Å”Äda forma (JÄnim ir daudz bÄrnu, bet viÅam ir tikai divi bÄrni):
Class: manyChildren
EquivalentTo: Human that hasChild min 3
Individual: John
Types: Human, manyChildren
Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John
Vai Ŕī ontoloÄ£ija bÅ«s nekonsekventa (ko var interpretÄt kÄ nederÄ«gu datu pierÄdÄ«jumu)? PieÅemot OWA, secinÄjumu dzinÄjs reaÄ£Äs noliedzoÅ”i: "kaut kur citur" (citÄ ontoloÄ£ijÄ) var teikt, ka Kerola arÄ« ir Džona bÄrns.
Lai to izslÄgtu, pievienosim jaunu faktu par Džonu:
Individual: John
Facts: hasChild Alice, hasChild Bob, not hasChild Carol
Lai izslÄgtu citu bÄrnu parÄdÄ«Å”anos, pieÅemsim, ka visas Ä«paÅ”uma vÄrtÄ«bas "bÄrnam" ir cilvÄki, no kuriem mums ir tikai Äetri:
ObjectProperty: hasChild
Domain: Human
Š”haracteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }
Tagad ontoloÄ£ija kļūs pretrunÄ«ga, par ko secinÄjumu dzinÄjs neziÅos. Ar pÄdÄjo no aksiomÄm mÄs savÄ ziÅÄ esam āaizvÄruÅ”iā pasauli un pamanÄm, kÄ tiek izslÄgta iespÄja, ka JÄnis ir viÅa paÅ”a bÄrns.
UzÅÄmuma datu sasaiste
SaistÄ«to datu pieeju un tehnoloÄ£iju kopums sÄkotnÄji bija paredzÄts datu publicÄÅ”anai tÄ«meklÄ«. To izmantoÅ”ana iekÅ”ÄjÄ korporatÄ«vajÄ vidÄ saskaras ar vairÄkÄm grÅ«tÄ«bÄm.
PiemÄram, slÄgtÄ korporatÄ«vajÄ vidÄ OWL deduktÄ«vÄ vara, kas balstÄ«ta uz OWA pieÅemÅ”anu un UNA noraidÄ«Å”anu, lÄmumiem tÄ«mekļa atvÄrtÄ un izplatÄ«tÄ rakstura dÄļ, ir pÄrÄk vÄja. Un Å”eit ir iespÄjami Å”Ädi risinÄjumi.
OWL pieŔķirÅ”ana ar semantiku, kas nozÄ«mÄ atteikÅ”anos no OWA un UNA pieÅemÅ”anu, atbilstoÅ”Ä izejas dzinÄja ievieÅ”anu. - Pa Å”o ceļu ir Stardog RDF krÄtuve.
AtteikÅ”anÄs no OWL dedukcijas iespÄjÄm par labu noteikumu dzinÄjiem. ā Stardog atbalsta SWRL; Jena un GraphDB piedÄvÄjums savuŃŠ·ŃŠŗŠø noteikumiem.
AtteikÅ”anÄs no OWL deduktÄ«vÄm iespÄjÄm, vienas vai otras apakÅ”kopas, kas ir tuvu RDFS, izmantoÅ”ana modelÄÅ”anai. - VairÄk par to skatiet tÄlÄk.
VÄl viena problÄma ir lielÄks uzsvars, ko var likt uz datu kvalitÄtes problÄmÄm korporatÄ«vajÄ pasaulÄ, un datu validÄcijas rÄ«ku trÅ«kums saistÄ«to datu kaudzÄ. Izvades Å”eit ir Å”Ädas.
Atkal izmantojiet OWL konstrukciju validÄcijai ar slÄgtas pasaules semantiku un unikÄliem nosaukumiem, ja ir pieejams atbilstoÅ”s secinÄjumu dzinÄjs.
Izmantot SHACL, standartizÄts pÄc tam, kad ir labots semantiskÄ tÄ«mekļa slÄÅa kÅ«kas slÄÅu saraksts (tomÄr to var izmantot arÄ« kÄ noteikumu dzinÄju), vai ShEx.
Saprotot, ka viss galu galÄ tiek darÄ«ts ar SPARQL vaicÄjumiem, izveidojot savu vienkÄrÅ”u datu validÄcijas mehÄnismu, izmantojot tos.
TomÄr pat pilnÄ«ga dedukcijas iespÄju un validÄcijas rÄ«ku noraidÄ«Å”ana atstÄj saistÄ«to datu kopu Ärpus konkurences uzdevumos, kas pÄc ainavas ir lÄ«dzÄ«gi atvÄrtajam un izplatÄ«tajam tÄ«meklim ā datu integrÄcijas uzdevumos.
KÄ ir ar parastu uzÅÄmuma informÄcijas sistÄmu?
Tas ir iespÄjams, taÄu jums, protams, ir jÄzina, kÄdas tieÅ”i problÄmas bÅ«s jÄatrisina attiecÄ«gajÄm tehnoloÄ£ijÄm. Å eit es aprakstÄ«Å”u tipisku attÄ«stÄ«bas dalÄ«bnieku reakciju, lai parÄdÄ«tu, kÄ Å”Ä« tehnoloÄ£iju kaudze izskatÄs no parastÄ IT viedokļa. Man nedaudz atgÄdina lÄ«dzÄ«bu par ziloni:
Biznesa analÄ«tiÄ·is: RDF ir kaut kas lÄ«dzÄ«gs tieÅ”i saglabÄtam loÄ£iskam modelim.
SistÄmu analÄ«tiÄ·is: RDF ir kÄ EAV, tikai ar virkni indeksu un Ärtu vaicÄjumu valodu.
Š : labi, tas viss ir bagÄta modeļa un zema koda koncepcijas garÄ, lasÄ«ja nesen par Å”o.
Prakse rÄda, ka steku visbiežÄk izmanto uzdevumos, kas saistÄ«ti ar datu izplatÄ«Å”anu un neviendabÄ«gumu, piemÄram, veidojot MDM (Master Data Management) vai DWH (Data Warehouse) klases sistÄmas. Å Ädas problÄmas pastÄv jebkurÄ nozarÄ.
RunÄjot par nozarei specifiskÄm lietojumprogrammÄm, saistÄ«to datu tehnoloÄ£ijas paÅ”laik ir vispopulÄrÄkÄs Å”ÄdÄs nozarÄs.
biomedicÄ«nas tehnoloÄ£ijas (kur to popularitÄte, Ŕķiet, ir saistÄ«ta ar jomas sarežģītÄ«bu);
sarežģītu produktu ražoÅ”ana un ekspluatÄcija (lielÄ maŔīnbÅ«ve, naftas un gÄzes ražoÅ”ana; visbiežÄk mÄs runÄjam par standarta ISO 15926);
strÄva
ArÄ« Å”eit iemesls ir mÄcÄ«bu jomas sarežģītÄ«ba, kad, piemÄram, iepriekÅ”ÄjÄ posmÄ, ja mÄs runÄjam par naftas un gÄzes nozari, vienkÄrÅ”ai grÄmatvedÄ«bai ir nepiecieÅ”amas dažas CAD funkcijas.
2008. gadÄ notika reprezentatÄ«vs instalÄcijas pasÄkums, ko organizÄja Chevron konference.
Galu galÄ ISO 15926 naftas un gÄzes nozarei Ŕķita nedaudz smags (un, iespÄjams, tas tika pielietots maŔīnbÅ«vÄ). PamatÄ«gi uzÄ·ÄrÄs tikai Statoil (Equinor), NorvÄÄ£ijÄ vesels ekosistÄma. Citi cenÅ”as darÄ«t savu. PiemÄram, saskaÅÄ ar baumÄm vietÄjÄ EnerÄ£Ätikas ministrija plÄno izveidot "kurinÄmÄ un enerÄ£ijas kompleksa konceptuÄlu ontoloÄ£isko modeli", kas, Ŕķiet, ir lÄ«dzÄ«gs radÄ«ts elektroenerÄ£ijas nozarei.
finanÅ”u organizÄcijas (pat XBRL var uzskatÄ«t par sava veida SDMX un RDF Data Cube ontoloÄ£ijas hibrÄ«du);
strÄva
LinkedIn gada sÄkumÄ autoram aktÄ«vi sÅ«tÄ«ja surogÄtpastu ar vakancÄm gandrÄ«z visos finanÅ”u industrijas gigantos, kurus viÅÅ” pazÄ«st no seriÄla āForce Majeureā: Goldman Sachs, JPMorgan Chase un/vai Morgan Stanley, Wells Fargo, SWIFT/Visa/Mastercard, Bank of America, Citigroup, Fed, Deutsche Bank... DroÅ”i vien katrs meklÄja kÄdu, kam varÄtu nosÅ«tÄ«t ZinÄÅ”anu grafika konference. Diezgan daudziem izdevÄs atrast: finanÅ”u organizÄcijas paÅÄma visu pirmÄs dienas rÄ«ts.
VietnÄ HeadHunter tikai Sberbank saskÄrÄs ar kaut ko interesantu; tas bija par "EAV krÄtuvi ar RDF lÄ«dzÄ«gu datu modeli".
IespÄjams, vietÄjÄs un Rietumu finanÅ”u institÅ«ciju mÄ«lestÄ«bas pret atbilstoÅ”Äm tehnoloÄ£ijÄm pakÄpes atŔķirÄ«ba ir saistÄ«ta ar pÄdÄjo darbÄ«bu transnacionÄlo raksturu. AcÄ«mredzot integrÄcijai pÄri valsts robežÄm ir nepiecieÅ”ami kvalitatÄ«vi atŔķirÄ«gi organizatoriskie un tehniskie risinÄjumi.
jautÄjumu-atbilžu sistÄmas ar komerciÄlÄm lietojumprogrammÄm (IBM Watson, Apple Siri, Google Knowledge Graph);
strÄva
Starp citu, Siri radÄ«tÄjs Tomass GrÅ«bers ir paÅ”as ontoloÄ£ijas definÄ«cijas (IT nozÄ«mÄ) kÄ ākonceptualizÄcijas specifikÄcijasā autors. ManuprÄt, vÄrdu pÄrkÄrtoÅ”ana Å”ajÄ definÄ«cijÄ nemaina tÄ nozÄ«mi, kas varbÅ«t norÄda, ka tÄ nav.
strukturÄtu datu publicÄÅ”ana (ar lielÄku pamatojumu to var attiecinÄt uz saistÄ«tajiem atvÄrtajiem datiem).
strÄva
Lieli saistÄ«to datu cienÄ«tÄji ir tÄ sauktais GLAM: galerijas, bibliotÄkas, arhÄ«vi un muzeji. Pietiek pateikt, ka Kongresa bibliotÄka veicina MARC21 aizstÄÅ”anu BIBFRAMEKurÅ” sniedz pamatu bibliogrÄfiskÄ apraksta nÄkotnei un, protams, pamatojoties uz RDF.
Vikidati bieži tiek minÄti kÄ piemÄrs veiksmÄ«gam projektam Linked Open Data jomÄ ā sava veida maŔīnlasÄma VikipÄdijas versija, kuras saturs, atŔķirÄ«bÄ no DBPedia, netiek Ä£enerÄts, importÄjot no rakstu infokastÄm, bet gan ir izveidots vairÄk vai mazÄk manuÄli (un pÄc tam kļūst par informÄcijas avotu tÄm paÅ”Äm informÄcijas kastÄm).
MÄs arÄ« iesakÄm to pÄrbaudÄ«t saraksts Stardog RDF krÄtuves lietotÄji Stardog tÄ«mekļa vietnes sadaÄ¼Ä āKlientiā.
Lai kÄ arÄ« bÅ«tu, GartnerÄ Hype cikls jaunÄm tehnoloÄ£ijÄm 2016 "UzÅÄmuma taksonomijas un ontoloÄ£ijas vadÄ«ba" atrodas vilÅ”anÄs ielejas vidÅ« ar izredzÄm sasniegt "ražīguma plato" ne agrÄk kÄ pÄc 10 gadiem.
UzÅÄmuma datu savienoÅ”ana
Prognozes, prognozes, prognozes...
VÄsturiskas intereses dÄļ es zemÄk esmu apkopojis Gartnera prognozes dažÄdiem gadiem par tehnoloÄ£ijÄm, kas mÅ«s interesÄ.
Gads
Š¢ŠµŃ Š½Š¾Š»Š¾Š³ŠøŃ
ZiÅot
Pozīcija
Gadi līdz plato
2001
Semantiskais tīmeklis
Emerging Technologies
InovÄcijas izraisÄ«tÄjs
5-10
2006
Korporatīvais semantiskais tīmeklis
Emerging Technologies
Uzpūsto cerību maksimums
5-10
2012
Semantiskais tīmeklis
Big Datu
Uzpūsto cerību maksimums
> 10
2015
Saistītie dati
UzlabotÄ analÄ«ze un datu zinÄtne
VilÅ”anÄs sile
5-10
2016
UzÅÄmuma ontoloÄ£ijas vadÄ«ba
Emerging Technologies
VilÅ”anÄs sile
> 10
2018
ZinÄÅ”anu grafiki
Emerging Technologies
InovÄcijas izraisÄ«tÄjs
5-10
TomÄr jau iekÅ”Ä "Hype Cycle..." 2018 ir parÄdÄ«jusies vÄl viena augÅ”upejoÅ”a tendence - ZinÄÅ”anu grafiki. Notika zinÄma reinkarnÄcija: grafu DBVS, uz kurÄm tika pÄrslÄgta lietotÄju uzmanÄ«ba un izstrÄdÄtÄju centieni, pirmÄ pieprasÄ«jumu un pÄdÄjo ieradumu ietekmÄ sÄka iegÅ«t kontÅ«ras un pozicionÄÅ”anu. savu priekÅ”gÄjÄju konkurentiem.
GandrÄ«z katrs grafiks DBVS tagad sevi pasludina par piemÄrotu platformu korporatÄ«vÄ āzinÄÅ”anu grafikaā veidoÅ”anai (āsaistÄ«tos datusā dažkÄrt aizstÄj ar āsavienotajiem datiemā), bet cik pamatoti ir Å”Ädi apgalvojumi?
Grafu datu bÄzes joprojÄm ir asemantiskas; dati diagrammÄ DBVS joprojÄm ir tas pats datu rezervuÄrs. Virknes identifikatori URI vietÄ padara divu grafiku DBVS integrÄciju par integrÄcijas uzdevumu, savukÄrt divu RDF krÄtuvju integrÄÅ”ana bieži vien ir vienkÄrÅ”a divu RDF grafiku sapludinÄÅ”ana. VÄl viens asemantiskuma aspekts ir LPG grafika modeļa nerefleksivitÄte, kas apgrÅ«tina metadatu pÄrvaldÄ«bu, izmantojot to paÅ”u platformu.
Visbeidzot, grafiku DBVS nav secinÄjumu dzinÄju vai noteikumu dzinÄju. Å Ädu dzinÄju rezultÄtus var reproducÄt, sarežģījot vaicÄjumus, taÄu tas ir iespÄjams pat SQL.
TomÄr vadoÅ”ajÄm RDF uzglabÄÅ”anas sistÄmÄm nav grÅ«tÄ«bu atbalstÄ«t LPG modeli. Par visnoturÄ«gÄko tiek uzskatÄ«ta Blazegraph vienÄ reizÄ piedÄvÄtÄ pieeja: RDF* modelis, kas apvieno RDF un LPG.