Web Semantikoa eta Lotutako Datuak. Zuzenketak eta gehiketak

Argitaratu berri den liburu honen zati bat jendaurrean aurkeztu nahi dut:

Enpresa baten modelizazio ontologikoa: metodoak eta teknologiak [Testua]: monografia / [S. V. Gorshkov, S. S. Kralin, O. I. Mushtak eta beste batzuk; S.V. Gorshkov editore exekutiboa]. - Ekaterinburg: Ural Unibertsitateko Argitaletxea, 2019. - 234 or.: ill., taula; 20 cm.- Egilea. atzeko titian adierazita. Horrekin. — Bibliografia kaparen amaieran. — ISBN 978-5-7996-2580-1: 200 ale.

Zati hau Habré-n argitaratzearen helburua laukoa da:

  • Nekez izango da inork liburu hau eskuetan edukitzea errespetatu baten bezeroa ez bada. SergeIndex; Zalantzarik gabe, ez dago salgai.
  • Testuari zuzenketak egin zaizkio (behean ez dira nabarmentzen) eta inprimatutako monografia baten formatuarekin oso bateragarriak ez diren gehiketak egin dira: gaurkotasun-oharrak (spoiler azpian) eta hiperestekak.
  • nahi dut bildu galderak eta iruzkinak, testu hau beste edozein argitalpenetan era berrituan sartzerakoan kontuan hartzeko.
  • Web Semantikoaren eta Linked Dataren atxikimendu askok oraindik uste dute beren zirkulua hain estua dela, batez ere publiko orokorrari oraindik behar bezala azaldu ez zaiolako zein handia den Web Semantikoaren eta Linked Dataren atxikimendua izatea. Zatiaren egileak, zirkulu honetakoa den arren, ez du iritzi horri eusten, baina, hala ere, beste saiakera bat egitera behartuta ikusten du bere burua.

Horrela,

Web semantikoa

Interneten bilakaera honela irudikatu daiteke (edo ondoren adierazitako ordenan eratu ziren bere segmentuez hitz egin):

  1. Dokumentuak Interneten. Teknologia nagusiak - Gopher, FTP, etab.
    Internet tokiko baliabideak trukatzeko sare global bat da.
  2. Interneteko dokumentuak. Teknologia nagusiak HTML eta HTTP dira.
    Jarritako baliabideen izaerak haien transmisio-bidearen ezaugarriak hartzen ditu kontuan.
  3. Interneteko datuak. Funtsezko teknologiak - REST eta SOAP API, XHR, etab.
    Interneteko aplikazioen garaian, pertsonak ez ezik baliabideen kontsumitzaile bihurtzen dira.
  4. Interneteko datuak. Funtsezko teknologiak Linked Data teknologiak dira.
    Berners-Leek, bigarren core teknologien sortzaile eta W3Cko zuzendariak, aurreikusitako laugarren etapa honi Web Semantikoa deitzen zaio; Linked Data teknologiak sareko datuak makinaz irakur daitezkeenak ez ezik, "makinaz ulergarriak" ere izan daitezen diseinatuta daude.

Jarraian, irakurleak bigarren eta laugarren faseko funtsezko kontzeptuen arteko korrespondentzia ulertuko du:

  • URLak URIen antzekoak dira,
  • HTMLren analogoa RDF da,
  • HTML hiperestekak RDF dokumentuetako URI agerraldien antzekoak dira.

Web Semantikoa Interneten etorkizunari buruzko ikuspegi sistemiko bat da, berezko edo lobby-ko joera zehatz bat baino, azken hauek kontuan har ditzakeen arren. Adibidez, Web 2.0 deritzonaren ezaugarri garrantzitsu bat "erabiltzaileek sortutako edukia" dela jotzen da. Bereziki, W3C gomendioa kontuan hartzeko deia egiten da "Web Oharra Ontologia"eta halako konpromiso bat Solid.

Web Semantikoa Hilda dago?

Ezezkoa baduzu itxaropen irrealistak, sare semantikoaren egoera, gutxi gorabehera, sozialismo garatuaren garaian komunismoaren berdina da (eta Ilitxen baldintzapeko aginduekiko leialtasuna betetzen den, bakoitzak bere kabuz erabaki dezala). Bilatzaileak nahiko arrakastaz webguneak RDFa eta JSON-LD erabiltzera behartu eta beraiek behean deskribatutakoekin erlazionatutako teknologiak erabiltzen dituzte (Google Knowledge Graph, Bing Knowledge Graph).

Orokorrean, egileak ezin du esan hedapen handiagoa eragozten duena, baina esperientzia pertsonalaren arabera hitz egin dezake. Badaude SW-ko ofentsibako baldintzetan «kutxatik kanpo» konpondu daitezkeen arazoak, oso hedatuta ez dauden arren. Ondorioz, zeregin horiei aurre egiten dietenek ez dute behartzeko modurik konponbidea emateko gai direnen aurka, eta azken honek irtenbide bat ematea independenteak euren negozio ereduak kontraesanean jartzen ditu. Beraz, HTML analizatzen eta hainbat API elkartzen jarraitzen dugu, bata bestea kakatsuagoa.

Hala ere, Linked Data teknologiak sare nagusitik haratago zabaldu dira; Liburua, hain zuzen ere, aplikazio horiei eskainia dago. Gaur egun, Linked Data komunitateak teknologia hauek are gehiago hedatuko direla espero du Gartnerrek (edo nahi duzun bezala aldarrikapena) bezalako joeren grabaketari esker. Ezagutza Grafikoak и Datuen ehuna. Sinetsi nahiko nuke ez direla kontzeptu hauen “bizikleta” inplementazioak izango arrakastatsuak izango, behean aztertutako W3C estandarrekin lotutakoak baizik.

Lotutako datuak

Berners-Lee-k Linked Data gisa definitu zuen "ondo eginda" web semantikoa: bere azken helburuak lortzeko aukera ematen dion ikuspegi eta teknologia multzoa. Linked Data Berners-Lee-ren oinarrizko printzipioak nabarmenduta urrengo.

1. printzipioa. URIak erabiltzea entitateak izendatzeko.

URIak entitate-identifikatzaile globalak dira, sarreretarako kate-identifikatzaile lokalen aurka. Ondoren, printzipio hori Google Knowledge Graph leloan adierazi zen ondoen.gauzak, ez kateak'.

2. printzipioa. HTTP eskeman URIak erabiltzea, erreferentzia kendu ahal izateko.

URI batean sartuz gero, adierazle horren atzean dagoen esanahia lortzea posible izan beharko litzateke (operadorearen izenaren analogia argia da hemen).*"C-n); zehatzago esanda, horren adierazpide bat lortzeko - HTTP goiburuaren balioaren arabera Accept:. Agian, AR/VR aroaren etorrerarekin, baliabidea bera eskuratzea posible izango da, baina oraingoz, ziurrenik, RDF dokumentu bat izango da, SPARQL kontsulta bat exekutatzeko emaitza dena. DESCRIBE.

3. printzipioa. W3C estandarrak erabiltzea, batez ere RDF(S) eta SPARQL, bereziki URIak deserreferentziatzean.

Linked Data teknologia pilaren banakako "geruza" hauek, izenez ere ezagutzen direnak Web semantikoaren geruza tarta, jarraian deskribatuko da.

4. printzipioa. Beste URI batzuen erreferentziak erabiltzea entitateak deskribatzerakoan.

RDFk baliabide baten hitzezko deskribapen batera mugatzeko aukera ematen du hizkuntza naturalean, eta laugarren printzipioak hau ez egiteko eskatzen du. Lehen printzipioa unibertsalki betetzen bada, baliabide bat deskribatzean posible egiten da beste batzuei erreferentzia egitea, "atzerrikoak" barne, eta horregatik datuei lotuta deitzen zaie. Izan ere, ia saihestezina da RDFS hiztegian izendatutako URIak erabiltzea.

RDF

RDF (Baliabideen Deskribapen Markoa) elkarrekin erlazionatutako entitateak deskribatzeko formalismo bat da.

“Subjektu-predikatu-objektu” motako adierazpenak, hirukoteak izenekoak, entitateei eta haien erlazioei buruz egiten dira. Kasurik sinpleenean, subjektua, predikatua eta objektua URIak dira. URI bera posizio ezberdinetan egon daiteke hirukote ezberdinetan: izan subjektua, predikatua eta objektua; Horrela, hirukoteak RDF grafo izeneko grafiko moduko bat osatzen dute.

Subjektuak eta objektuak URIak ez ezik, deiturikoak ere izan daitezke nodo hutsak, eta objektuak ere izan daitezke literalak. Literalak kate-adierazpen batez eta mota-adieraz osatutako mota primitiboen instantzia dira.

Literalak idazteko adibideak (Turtle sintaxian, horri buruz gehiago behean): "5.0"^^xsd:float и "five"^^xsd:string. Mota duten literalak rdf:langString hizkuntza etiketa batekin ere horni daiteke; Turtle-n honela idatzita dago: "five"@en и "пять"@ru.

Nodo hutsak identifikatzaile globalik gabeko baliabide “anonimoak” dira, eta horiei buruz, ordea, adierazpenak egin daitezke; aldagai existentzialak.

Beraz (hau da, hain zuzen ere, RDFren puntu osoa):

  • gaia URI bat edo nodo huts bat da,
  • predikatua URI bat da,
  • objektua URI bat, nodo huts bat edo literal bat da.

Zergatik ezin dira predikatuak nodo hutsak izan?

Arrazoia litekeena da hirukotea modu informalean ulertu eta lehen mailako predikatuen logikaren hizkuntzara itzultzeko nahia. s p o antzeko zerbait bezala Web Semantikoa eta Lotutako Datuak. Zuzenketak eta gehiketakNon Web Semantikoa eta Lotutako Datuak. Zuzenketak eta gehiketak - predikatua, Web Semantikoa eta Lotutako Datuak. Zuzenketak eta gehiketak и Web Semantikoa eta Lotutako Datuak. Zuzenketak eta gehiketak - konstanteak. Ulermen horren aztarnak dokumentuan daude "LBase: Web Semantikoko Hizkuntzetarako Semantika", W3C lan-taldearen ohar baten egoera duena. Ulertze horrekin, hirukotea s p []Non [] - nodo hutsa, honela itzuliko da Web Semantikoa eta Lotutako Datuak. Zuzenketak eta gehiketakNon Web Semantikoa eta Lotutako Datuak. Zuzenketak eta gehiketak - aldakorra, baina nola itzuli orduan s [] o? W3C gomendio egoera duen dokumentua "RDF 1.1 Semantika”-k beste itzulpen metodo bat eskaintzen du, baina oraindik ez du kontuan hartzen predikatuak nodo hutsak izateko aukera.

Hala ere, Manu Sporni baimenduta.

RDF eredu abstraktua da. RDF hainbat sintaxitan idatz daiteke (serializatu): RDF/XML, Turtle (gizakiena irakur daitekeena), JSON-LD, HDT (bitarra).

RDF bera RDF/XML-n serializatu daiteke modu ezberdinetan, beraz, adibidez, ez du zentzurik sortzen den XML XSD erabiliz balioztatzeak edo XPath erabiliz datuak ateratzen saiatzea. Era berean, JSON-LD-k nekez beteko du Javascript-en batez besteko garatzaileen RDFrekin lan egiteko nahia Javascript-en puntu eta kortxeteen idazkera erabiliz (nahiz eta JSON-LD norabide horretan mugitzen den mekanismo bat eskainiz). enkoadraketa).

Sintaxi gehienek URI luzeak laburtzeko moduak eskaintzen dituzte. Adibidez, iragarki bat @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> in Turtle-en ordez idazteko aukera emango dizu <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> besterik ez rdf:type.

RDFS

RDFS (RDF Schema) - modelatzeko oinarrizko hiztegia, propietate eta klase eta propietate kontzeptuak aurkezten ditu rdf:type, rdfs:subClassOf, rdfs:domain и rdfs:range. RDFS hiztegia erabiliz, adibidez, baliozko adierazpen hauek idatz daitezke:

rdf:type         rdf:type         rdf:Property .
rdf:Property     rdf:type         rdfs:Class .
rdfs:Class       rdfs:subClassOf  rdfs:Resource .
rdfs:subClassOf  rdfs:domain      rdfs:Class .
rdfs:domain      rdfs:domain      rdf:Property .
rdfs:domain      rdfs:range       rdfs:Class .
rdfs:label       rdfs:range       rdfs:Literal .

RDFS deskribapen eta modelizazio hiztegia da, baina ez da muga-hizkuntza bat (nahiz eta zehaztapen ofiziala eta hostoak erabilera hori egiteko aukera). "Eskema" hitza ez da "XML Schema" esapidearen zentzu berean ulertu behar. Adibidez, :author rdfs:range foaf:Person horrek esan nahi du rdf:type jabetza-balio guztiak :author - foaf:Person, baina ez du esan nahi hori aldez aurretik esan behar denik.

SPARQL

SPARQL (SPARQL Protocol and RDF Query Language) - RDF datuak kontsultatzeko hizkuntza. Kasu sinple batean, SPARQL kontsulta bat galdetzen ari den grafikoaren hirukoteak parekatzen diren lagin multzo bat da. Ereduek subjektu, predikatu eta objektu posizioetan aldagaiak izan ditzakete.

Kontsultak balio aldagaiak itzuliko ditu, laginetan ordezkatuz gero, kontsultatutako RDF grafikoaren azpigrafiko bat (bere hirukoteen azpimultzo bat) sor dezaketena. Hirukoteen lagin ezberdinetan izen bereko aldagaiek balio berdinak izan behar dituzte.

Adibidez, goiko zazpi RDFS axioma multzoa kontuan hartuta, hurrengo kontsulta itzuliko da rdfs:domain и rdfs:range balio gisa ?s и ?p hurrenez hurren:

SELECT * WHERE {
 ?s ?p rdfs:Class .
 ?p ?p rdf:Property .
}

Aipatzekoa da SPARQL deklaratiboa dela eta ez dela grafikoen zeharkaldia deskribatzeko hizkuntza bat (hala ere, RDF biltegi batzuek kontsultaren exekuzio plana doitzeko moduak eskaintzen dituzte). Hori dela eta, grafiko-arazo estandar batzuk, adibidez, bide laburrena aurkitzea, ezin dira SPARQL-en konpondu, besteak beste. jabetza bideak (baina, berriro ere, RDF biltegi indibidualek luzapen bereziak eskaintzen dituzte arazo hauek konpontzeko).

SPARQL-k ez du munduaren irekitasunaren presuntzioa partekatzen eta "ezeztapena porrot gisa" ikuspegia jarraitzen du, zeinean posible bezalako diseinuak FILTER NOT EXISTS {…}. Datuen banaketa mekanismoa erabiliz hartzen da kontuan kontsulta federatuak.

SPARQL sarbide-puntuak -SPARQL kontsultak prozesatzeko gai den RDF biltegiratze bat- ez du bigarren faseko analogo zuzenik (ikus paragrafo honen hasiera). Datu-base batekin pareka daiteke, HTML orriak sortu ziren edukietan oinarrituta, baina kanpotik eskura daiteke. SPARQL sarbide-puntua hirugarren faseko APIko sarbide-puntuaren antzekoagoa da, baina bi desberdintasun nagusirekin. Lehenik eta behin, posible da hainbat kontsulta "atomiko" bakar batean konbinatzea (GraphQLren funtsezko ezaugarritzat hartzen dena), eta, bigarrenik, horrelako API bat guztiz autodokumentatzen da (hori da HATEOAS lortzen saiatu zena).

Ohar polemikoa

RDF datuak sarean argitaratzeko modu bat da, beraz, RDF biltegiratzea dokumentu DBMStzat hartu behar da. Egia da, RDF grafiko bat denez eta ez zuhaitz bat, grafikoetan oinarritutakoak ere izan ziren. Harrigarria da batere funtzionatu izana. Nork pentsatuko zuen nodo hutsak ezarriko zituen pertsona adimentsuak egongo zirela. Codd hemen dago ez zuen funtzionatu.

RDF datuetarako sarbidea antolatzeko modu oso gutxi daude, adibidez, Lotutako datu-zatiak (LDF) eta Linked Data Platform (LDP).

OWL

OWL (Web Ontology Language) - ezagutza irudikatzeko formalismoa, deskribapen logikaren bertsio sintaktikoa Web Semantikoa eta Lotutako Datuak. Zuzenketak eta gehiketak (Beheko leku guztietan OWL 2 esatea zuzenagoa da, OWL-en lehen bertsioa oinarritu zen Web Semantikoa eta Lotutako Datuak. Zuzenketak eta gehiketak).

OWL-en logika deskribatzaileen kontzeptuak klaseei dagozkie, rolak propietateei dagozkie, gizabanakoek aurreko izena gordetzen dute. Axiomei axioma ere deitzen zaie.

Esaterako, deiturikoan Manchester sintaxia OWL notaziorako jada ezagutzen dugun axioma bat Web Semantikoa eta Lotutako Datuak. Zuzenketak eta gehiketak honela idatziko da:

Class: Human
Class: Parent
   EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent

OWL idazteko beste sintaxi batzuk daude, adibidez sintaxi funtzionala, zehaztapen ofizialean erabilia, eta HONTZA/XML. Gainera, OWL seriatu daiteke RDF sintaxi abstrakturako eta, gainera, sintaxi zehatzetako edozeinetan.

OWL-k harreman bikoitza du RDFrekin. Alde batetik, RDFS hedatzen duen hiztegi modukotzat har daiteke. Bestalde, formalismo indartsuagoa da, zeinaren RDF serializazio formatu bat besterik ez den. Ezin dira oinarrizko OWL eraikuntza guztiak RDF hirukote bakarra erabiliz idatzi.

OWL konstruktuen zein azpimultzo erabil daitekeen arabera, deiturikoak dira OWL profilak. Normalizatuak eta ospetsuenak OWL EL, OWL RL eta OWL QL dira. Profila aukeratzeak problema tipikoen konplexutasun konputazionalari eragiten dio. Honi dagozkion OWL konstruktu multzo osoa Web Semantikoa eta Lotutako Datuak. Zuzenketak eta gehiketak, OWL DL izenekoa. Batzuetan OWL Full-i buruz ere hitz egiten dute, zeinetan OWL eraikuntzak RDFren berezko askatasun osoarekin erabiltzeko baimena ematen baitute, murrizketa semantiko eta konputazional gabe. Web Semantikoa eta Lotutako Datuak. Zuzenketak eta gehiketak. Adibidez, zerbait klase bat eta propietate bat izan daiteke. OWL Full erabakiezina da.

OWL-n ondorioak eransteko funtsezko printzipioak mundu irekiaren suposizioa hartzea dira. O.W.A.) eta izen berezien presuntzioa baztertzea (izen bakarraren suposizioa, A). Jarraian, printzipio horiek nora eraman ditzaketen ikusiko dugu eta OWL eraikuntza batzuk sartuko ditugu.

Utzi ontologiak honako zati hau (Manchesterreko sintaxian):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human
   Facts: hasChild Alice, hasChild Bob, hasChild Carol

Esandakotik aterako al da Johnek seme-alaba asko dituela? UNAri uko egiteak inferentzia motorra galdera honi ezezkoan erantzutera behartuko du, Alice eta Bob pertsona bera izan daitezkeelako. Honako hau gauzatzeko, beharrezkoa da axioma hau gehitzea:

DifferentIndividuals: Alice, Bob, Carol, John

Izan bedi ontologia-zatiak forma hau (Johnek seme-alaba asko dituela deklaratzen da, baina bi seme-alaba baino ez ditu):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human, manyChildren
   Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John

Ontologia hau ez koherentea izango da (datu baliogabeen froga gisa interpreta daitekeena)? OWA onartzeak inferentzia motorrak ezezko erantzutea eragingo du: "nonbait" bestela (beste ontologia batean) ondo esan liteke Carol Johnen seme-alaba dela.

Honen aukera baztertzeko, gehitu dezagun Johni buruzko datu berri bat:

Individual: John
   Facts: hasChild Alice, hasChild Bob, not hasChild Carol

Beste haurren itxura baztertzeko, demagun jabetzaren balio guztiak "seme-alaba izatea" pertsonak direla, eta horietatik lau baino ez ditugu:

ObjectProperty: hasChild
   Domain: Human
   Сharacteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }

Orain ontologia kontraesankorra bihurtuko da, eta inferentzia motorrak ez du huts egingo. Azken axiomarekin, nolabait, mundua «itxi» dugu, eta ohartu nola baztertzen den John bere seme-alaba izateko aukera.

Enpresaren datuak lotzea

Linked Data planteamendu eta teknologien multzoa jatorrian datuak sarean argitaratzeko pentsatuta zegoen. Barne-ingurune korporatibo batean erabiltzeak hainbat zailtasun ditu.

Esaterako, ingurune korporatibo itxi batean, OWAren adopzioan eta UNAren arbuioan oinarritutako OWLren ahalmen deduktiboa, Webaren izaera ireki eta banatuaren ondoriozko erabakiak, ahulegia da. Eta hemen honako irtenbide hauek posible dira.

  • OWL semantikaz hornitzea, OWA baztertzea eta UNA hartzea, dagokion irteera-motorra ezartzea suposatuz. - Bide honetatik badoa Stardog RDF biltegiratzea.
  • OWL-en gaitasun deduktiboak alde batera uztea arau-motorren alde. — Stardog euskarriak SWRL; Jena eta GraphDB eskaintza propioa hizkuntza arauak
  • OWL-en gaitasun deduktiboei uko egitea, RDFStik hurbil dagoen azpimultzo bat edo beste erabiltzea modelatzeko. - Ikusi honi buruz gehiago behean.

Beste arazo bat da enpresen munduak datuen kalitatearen arazoetan izan dezakeen arreta handiagoa eta Linked Data pilako datuak baliozkotzeko tresnarik ez izatea. Hemen irteerak honako hauek dira.

  • Berriz ere, erabili mundu itxiko semantika eta izen esklusiboak dituzten OWL eraikuntzak baliozkotzeko, inferentzia motor egoki bat eskuragarri badago.
  • Erabili SHACL, Web Semantic Layer Cake geruzen zerrenda konpondu ondoren estandarizatua (hala ere, arau-motor gisa ere erabil daiteke), edo Shex.
  • Azken finean dena SPARQL kontsultekin egiten dela ulertzea, haiek erabiliz zure datuak baliozkotzeko mekanismo sinplea sortuz.

Dena den, gaitasun deduktiboei eta baliozkotze-tresnei erabat baztertuz gero, Linked Data pila lehiaketatik kanpo uzten dute paisaian web ireki eta banatuaren antzekoak diren zereginetan, datuen integrazio-zereginetan.

Zer gertatzen da enpresa-informazio sistema arrunt batekin?

Hori posible da, baina, noski, jakin beharko zenuke zer arazo konpondu beharko dituzten dagozkien teknologiek. Hemen garapen parte-hartzaileen erreakzio tipiko bat deskribatuko dut teknologia-pila hau nolakoa den erakusteko IT konbentzionalaren ikuspuntutik. Apur bat gogorarazten dit elefantearen parabola:

  • Negozio-analista: RDF zuzenean gordetako eredu logiko baten antzeko zerbait da.
  • Sistemen analista: RDF bezalakoa da EAV, indize sorta batekin eta kontsulta-lengoaia eroso batekin soilik.
  • Sustatzailearen: beno, hau guztia eredu aberatsaren eta kode baxuaren kontzeptuen izpirituan dago, irakurtzen ari zen berriki honi buruz.
  • Proiektuaren arduraduna: bai berdin da pila tolestuz!

Praktikak erakusten du pila gehien erabiltzen dela datuen banaketarekin eta heterogeneotasunarekin lotutako zereginetan, adibidez, MDM (Master Data Management) edo DWH (Data Warehouse) klase-sistemak eraikitzean. Halako arazoak edozein industriatan daude.

Industriako aplikazio espezifikoei dagokienez, Linked Data teknologiak gaur egun ezagunenak dira hurrengo industrietan.

  • teknologia biomedikoak (haien ospea domeinuaren konplexutasunarekin lotuta dagoela dirudi);

korronte

“Boiling Point”-ek “National Medical Knowledge Base” elkarteak antolatutako hitzaldia hartu du berriki.Ontologiak konbinatzea. Teoriatik aplikazio praktikora'.

  • Produktu konplexuen ekoizpena eta ustiapena (ingeniaritza mekaniko handia, petrolio eta gasaren ekoizpena; gehienetan estandarrez ari gara). ISO 15926);

korronte

Hemen ere arrazoia gaiaren konplexutasuna da, adibidez, gorako fasean, petrolioaren eta gasaren industriari buruz hitz egiten badugu, kontabilitate sinpleak CAD funtzio batzuk behar dituenean.

2008an, Chevronek antolatutako instalazio-ekitaldi adierazgarri bat egin zen kongresua.

ISO 15926, azkenean, pisu samarra iruditu zitzaion petrolioaren eta gasaren industriari (eta agian aplikazio handiagoa aurkitu zuen ingeniaritza mekanikoan). Statoil (Equinor) bakarrik lotu zitzaion erabat; Norvegian, osorik ekosistema. Beste batzuk beren gauzak egiten saiatzen ari dira. Adibidez, zurrumurruen arabera, etxeko Energia Ministerioak "erregaiaren eta energia-konplexuaren eredu ontologiko kontzeptual bat" sortu nahi du, itxuraz, antzekoa. energia elektrikoaren industriarako sortua.

  • finantza-erakundeak (XBRL ere SDMX eta RDF Data Cube ontologiaren hibrido modukotzat har daiteke);

korronte

Urte hasieran, LinkedIn-ek aktiboki spam egin zion egileari finantza-industriako ia erraldoi guztien lanpostu hutsekin, "Force Majeure" telesailetik ezagutzen dituenak: Goldman Sachs, JPMorgan Chase eta/edo Morgan Stanley, Wells Fargo, SWIFT/Visa/Mastercard, Bank of America, Citigroup, Fed, Deutsche Bank... Ziurrenik denek bidal zezakeen norbait bilatzen zuten. Knowledge Graph Jardunaldia. Gutxi batzuek aurkitzea lortu zuten: finantza erakundeek dena hartu zuten lehen eguneko goiza.

HeadHunter-en, Sberbankek bakarrik topatu zuen zerbait interesgarria; "EAV biltegiratzea RDF antzeko datu-eredu batekin" zen.

Seguruenik, etxeko eta mendebaldeko finantza-erakundeen dagozkien teknologiekiko maitasun-mailaren aldea azken horien jardueren izaera transnazionalari zor zaio. Dirudienez, estatu-mugetan zehar integrazioak antolakuntza eta irtenbide tekniko desberdinak behar ditu kualitatiboki.

  • galdera-erantzun sistemak aplikazio komertzialak dituztenak (IBM Watson, Apple Siri, Google Knowledge Graph);

korronte

Bide batez, Siriren sortzailea, Thomas Gruber, ontologiaren definizioaren egilea da (IT zentzuan) "kontzeptualizazio zehaztapen" gisa. Nire ustez, definizio honetako hitzak berrantolatzeak ez du bere esanahia aldatzen, eta horrek agian ez dagoela adierazten du.

  • datu egituratuak argitaratzea (justifikazio handiagoarekin Linked Open Data-ri egotzi diezaieke).

korronte

Linked Dataren zale handiak GLAM izenekoak dira: Galeriak, Liburutegiak, Artxiboak eta Museoak. Nahikoa da Kongresuko Liburutegia MARC21en ordezkoa sustatzen ari dela BITXEAZein deskribapen bibliografikoaren etorkizunerako oinarri bat eskaintzen du eta, noski, RDFn oinarrituta.

Linked Open Dataren alorreko proiektu arrakastatsu baten adibide gisa aipatzen da maiz Wikidata -makinaz irakur daitekeen Wikipediaren bertsio moduko bat, zeinaren edukia, DBPediaren aldean, ez baita artikuluen info-kutxetatik inportatuta sortzen, baizik eta. gutxi-asko eskuz sortua (eta, ondoren, informazio-iturri bihurtzen da infokutxa berberetarako).

Egiaztatzeko ere gomendatzen dizugu zerrenda Stardog RDF biltegiaren erabiltzaileak Stardog webgunean "Bezeroak" atalean.

Dena den, Gartner-en 2016ko Teknologia Emergenteetarako Hype Zikloa "Enpresen Taxonomia eta Ontologia Kudeaketa" etsipenaren haranera jaitsieraren erdian kokatzen da, 10 urte baino lehenago "produktibitate-lautada" batera iristeko aukerarekin.

Enpresaren datuak konektatzea

Iragarpenak, iragarpenak, iragarpenak...

Interes historikoagatik, Gartnerrek hainbat urtetarako egindako aurreikuspenak taularatu ditut azpian interesatzen zaizkigun teknologien inguruan.

Urtea Технология txosten Kargua Urteak lautadara
2001 Web semantikoa Teknologia Berriak Berrikuntzaren abiarazlea 5-10
2006 Web Semantiko Korporatiboa Teknologia Berriak Puztutako Itxaropenen gailurra 5-10
2012 Web semantikoa Big Datu Puztutako Itxaropenen gailurra > 10
2015 Lotutako datuak Analitika aurreratua eta Datuen Zientzia Desilusioaren aska 5-10
2016 Enpresen Ontologia Kudeaketa Teknologia Berriak Desilusioaren aska > 10
2018 Ezagutza Grafikoak Teknologia Berriak Berrikuntzaren abiarazlea 5-10

Hala ere, dagoeneko sartuta "Hype Zikloa..." 2018 goranzko beste joera bat agertu da - Knowledge Graphs. Berraragitze jakin bat gertatu zen: DBMS grafikoak, zeinetara erabiltzaileen arreta eta garatzaileen ahaleginak aldatu ziren, lehenengoaren eskaeren eta bigarrenaren ohituren eraginez, ingerada eta posizionamendua hartzen hasi ziren. beren aurreko lehiakideen artean.

Gaur egun DBMS ia grafiko guztiek "ezagutza grafikoa" korporatiboa eraikitzeko plataforma egokia deklaratzen dute ("lotutako datuak" batzuetan "konektatutako datuekin" ordezkatzen dira), baina zenbat justifikatuta daude horrelako erreklamazioak?

Grafikoen datu-baseak amantikoak dira oraindik; grafikoko DBMS bateko datuak datu-silo berdinak dira oraindik. URIen ordez kate-identifikatzaileek bi grafiko DBMS integratzeko zeregina integrazio-zeregin bat izaten jarraitzen dute, eta bi RDF dendak integratzea sarritan bi RDF grafiko batzea besterik ez da izaten. Asemantikotasunaren beste alderdi bat LPG grafiko-ereduaren erreflexibitatea da, eta horrek zaildu egiten du plataforma bera erabiliz metadatuak kudeatzea.

Azkenik, DBMS grafikoek ez dute inferentzia motorrik edo arau motorrik. Horrelako motoreen emaitzak kontsultak zailduz erreproduzi daitezke, baina hori posible da SQLn ere.

Hala ere, RDF biltegiratze-sistemek ez dute zailtasunik LPG eredua onartzen. Planteamendu sendoena Blazegraph-en garai batean proposatutakoa da: RDF* eredua, RDF eta LPG konbinatuz.

Gehiago

LPG eredurako RDF biltegiratze euskarriari buruz gehiago irakur dezakezu Habré-ri buruzko aurreko artikuluan: "Zer gertatzen ari da orain RDF biltegiarekin". Espero dut egunen batean aparteko artikulu bat idatziko dela Knowledge Graphs eta Data Fabric buruz. Azken atala, erraz ulertzen denez, presaka idatzi zen, baina, sei hilabete geroago ere, dena ez dago askoz argiago kontzeptu hauekin.

Literatura

  1. Halpin, H., Monnin, A. (arg.) (2014). Ingeniaritza filosofikoa: sarearen filosofia baterantz
  2. Allemang, D., Hendler, J. (2011) Working Ontologist for the Web Semantic (2. arg.)
  3. Staab, S., Studer, R. (arg.) (2009) Ontologiei buruzko eskuliburua (2. arg.)
  4. Wood, D. (arg.). (2011) Enpresen datuak lotzen
  5. Keet, M. (2018) An Introduction to Ontology Engineering

Iturria: www.habr.com

Gehitu iruzkin berria