Semantesch Web a verlinkt Daten. Korrekturen an Ergänzunge

Ech wëll dem Public e Fragment vun dësem kierzlech publizéierte Buch presentéieren:

Ontologesch Modelléierung vun enger Entreprise: Methoden an Technologien [Text]: Monographie / [S. V. Gorshkov, S. S. Kralin, O. I. Mushtak an anerer; executive editor S.V. Gorshkov]. - Ekaterinburg: Ural Universitéit Verlag, 2019. - 234 p.: ill., Dësch; 20 cm - Auteur. um Réck Titt uginn. Mat. - Bibliographie um Enn vum Ch. - ISBN 978-5-7996-2580-1: 200 Exemplare.

Den Zweck fir dëst Fragment op Habré ze posten ass véierfach:

  • Et ass onwahrscheinlech datt iergendeen dëst Buch an hiren Hänn halen kann wann hien net e Client vun engem respektéierten ass SergeIndex; Et ass definitiv net am Verkaf.
  • Korrekturen sinn am Text gemaach ginn (se sinn net hei ënnen markéiert) an Ergänzunge goufen gemaach, déi net ganz kompatibel mam Format vun enger gedréckter Monographie sinn: aktuell Notizen (ënner Spoiler) an Hyperlinks.
  • ech wëll sammelen Froen a Kommentaren, fir se ze berücksichtegen, wann dësen Text an enger iwwerschaffter Form an all aner Publikatiounen opgeholl gëtt.
  • Vill Semantic Web a Linked Data Anhänger gleewen nach ëmmer datt hire Krees sou schmuel ass, haaptsächlech well d'Allgemengheet nach net richteg erkläert gouf wéi super et ass en Adherent vum Semantic Web a Linked Data ze sinn. Den Auteur vum Fragment, obwuel hien zu dësem Krees gehéiert, hält dës Meenung net, awer hält sech trotzdem verpflicht fir en anere Versuch ze maachen.

An dofir,

Semantesch Web

D'Evolutioun vum Internet kann wéi follegt vertruede ginn (oder iwwer seng Segmenter schwätzen, déi an der Uerdnung hei ënnendrënner geformt goufen):

  1. Dokumenter um Internet. Schlëssel Technologien - Gopher, FTP, etc.
    Den Internet ass e globalt Netzwierk fir den Austausch vu lokale Ressourcen.
  2. Internet Dokumenter. Schlësseltechnologien sinn HTML an HTTP.
    D'Natur vun den ausgesate Ressourcen berücksichtegt d'Charakteristike vun hirem Iwwerdroungsmedium.
  3. Internet Daten. Schlësseltechnologien - REST a SOAP API, XHR, etc.
    D'Ära vun Internet Uwendungen, net nëmme Leit ginn Konsumenten vun Ressourcen.
  4. Internet Daten. Schlësseltechnologien sinn Linked Data Technologien.
    Dës véiert Etapp, virausgesot vum Berners-Lee, de Schëpfer vun den zweete Kärtechnologien an Direkter vum W3C, gëtt de Semantic Web genannt; Linked Data Technologien sinn entwéckelt fir Daten um Internet net nëmme Maschinn liesbar ze maachen, awer och "Maschinn verständlech."

Vun deem folgenden wäert de Lieser d'Korrespondenz tëscht de Schlësselkonzepter vun der zweeter a véierter Stuf verstoen:

  • URLen sinn analog zu URIs,
  • den Analog vun HTML ass RDF,
  • HTML Hyperlinks sinn ähnlech wéi URI Optriede an RDF Dokumenter.

De Semantic Web ass méi eng systemesch Visioun vun der Zukunft vum Internet wéi e spezifesche spontanen oder lobbieden Trend, obwuel et dës lescht berücksichtegt kann. Zum Beispill gëtt e wichtege Charakteristik vu wat Web 2.0 genannt gëtt als "Benotzergeneréierten Inhalt" ugesinn. Besonnesch ass d'W3C Empfehlung opgeruff et Rechnung ze huelen "Web Annotation Ontology"an esou eng Firma wéi staark.

Ass de semantesche Web dout?

Wann Dir refuséiert onrealistesch Erwaardungen, D'Situatioun mam semantesche Web ass ongeféier d'selwecht wéi mam Kommunismus an den Zäiten vum entwéckelte Sozialismus (an ob d'Loyalitéit un d'bedingte Bedéngungen vum Ilyich beobachtet gëtt, loosst jidderee fir sech selwer entscheeden). Sich Motore ganz erfollegräich forcéiere Websäite fir RDFa an JSON-LD ze benotzen a selwer benotzen Technologien am Zesummenhang mat deenen hei ënnendrënner beschriwwen (Google Knowledge Graph, Bing Knowledge Graph).

Am Allgemengen kann den Auteur net soen wat méi Verbreedung verhënnert, awer hie kann op Basis vu perséinlecher Erfahrung schwätzen. Et gi Problemer, déi "aus der Këscht" an de Konditioune vun der SW Offensiv geléist kënne ginn, obwuel se net ganz verbreet sinn. Als Resultat hunn déi, déi mat dësen Aufgabe konfrontéiert sinn, keng Zwangsmëttel géint déi, déi fäeg sinn eng Léisung ze bidden, während déi lescht onofhängeg Dispositioun vun enger Léisung hire Geschäftsmodell widdersprécht. Also mir fuere weider HTML ze parséieren a verschidde APIen zesummen ze pechen, een aneren schei.

Wéi och ëmmer, Linked Data Technologien hunn iwwer de Mainstream Web verbreet; D'Buch ass tatsächlech fir dës Uwendungen gewidmet. De Moment erwaart d'Linked Data Gemeinschaft datt dës Technologien nach méi verbreet ginn duerch dem Gartner seng Opnam (oder Proklamatioun, wéi Dir wëllt) vun Trends wéi z. Wëssen Grafiken и Daten Stoff. Ech géif gären gleewen datt et net d'"Vëlo" Implementatioune vun dëse Konzepter wäert sinn, déi erfollegräich sinn, awer déi am Zesummenhang mat de W3C Standards, déi hei ënnen diskutéiert ginn.

Verknëppelt Daten

Berners-Lee definéiert Linked Data als de semantesche Web "richteg gemaach": eng Rei vun Approchen an Technologien déi et erlaben hir ultimativ Ziler z'erreechen. Grondprinzipien vun verlinkt daten Berners-Lee markéiert déi folgend.

Prinzip 1. Benotzt URIs fir Entitéiten ze nennen.

URIs si global Entitéitsidentifizéierer am Géigesaz zu lokalen Stringidentifizéierer fir Entréen. Duerno gouf dëse Prinzip am Beschten am Google Knowledge Graph Slogan ausgedréckt "Saachen, net Strings".

Prinzip 2. Benotzt URIs am HTTP Schema sou datt se de-referenzéiert kënne ginn.

Andeems Dir op en URI referéiert, sollt et méiglech sinn d'Bedeitung hannert deem Bezeechner ze kréien (d'Analogie mam Numm vum Bedreiwer " ass hei kloer).*"an C); méi präzis, fir e puer Representatioun vun dësem bedeitend ze kréien - ofhängeg vum Wäert vum HTTP Header Accept:. Vläicht, mam Advent vun der AR / VR Ära, wäert et méiglech sinn d'Ressource selwer ze kréien, awer fir de Moment wäert et wahrscheinlech e RDF Dokument sinn, wat d'Resultat vun der Ausféierung vun enger SPARQL Ufro ass DESCRIBE.

Prinzip 3. D'Benotzung vu W3C Standards - haaptsächlech RDF(S) a SPARQL - besonnesch wann Dir URIs ofgeleet.

Dës individuell "Schichten" vum Linked Data Technologie Stack, och bekannt als Semantesch Web Layer Cake, wäert ënnert beschriwwe ginn.

Prinzip 4. Benotzung vu Referenzen op aner URIs wann Dir Entitéite beschreiwen.

RDF erlaabt Iech op eng mëndlech Beschreiwung vun enger Ressource an der natierlecher Sprooch ze limitéieren, an de véierte Prinzip rifft dëst net ze maachen. Wann den éischte Prinzip allgemeng beobachtet gëtt, ass et méiglech, wann Dir eng Ressource beschreiwt, op anerer ze referenzéieren, och "auslännesch", dofir ass d'Daten verbonnen genannt. Tatsächlech ass et bal inévitabel fir URIs ze benotzen, déi am RDFS Vokabulär genannt ginn.

R.F.D.

R.F.D. (Ressource Beschreiwung Framework) ass e Formalismus fir interrelated Entitéiten ze beschreiwen.

Aussoe vum Typ "Thema-Predikat-Objet", genannt Triplets, ginn iwwer Entitéiten an hir Bezéiungen gemaach. Am einfachsten Fall sinn d'Thema, Prädikat an Objet all URIs. Déi selwecht URI kann a verschiddene Positiounen a verschiddenen Triplets sinn: e Sujet, e Prädikat an en Objet sinn; Also bilden d'Tripleten eng Aart Grafik déi eng RDF-Grafik genannt gëtt.

Sujeten an Objete kann net nëmmen URI ginn, mä och sougenannte eidel Wirbelen, an Objete kënnen och sinn wuertwiertlech. Literal sinn Instanzen vu primitive Typen, déi aus enger Stringrepresentatioun an enger Typindikatioun besteet.

Beispiller fir literal Schreiwen (an der Turtle Syntax, méi doriwwer hei ënnen): "5.0"^^xsd:float и "five"^^xsd:string. Literatur mat Typ rdf:langString kann och mat engem Sprooch Tag ausgestatt ginn; an Turtle ass et esou geschriwwen: "five"@en и "пять"@ru.

Eidel Node sinn "anonym" Ressourcen ouni global Identifizéierer, iwwer déi Aussoe kënnen awer gemaach ginn; Zort vun existenziell Verännerlechen.

Also (dëst ass tatsächlech de ganze Punkt vum RDF):

  • Sujet ass en URI oder en eidelen Node,
  • de Prädikat ass en URI,
  • Objet ass en URI, en eidelen Node oder e wuertwiertlech.

Firwat kënne Prädikater net eidel Node sinn?

De méigleche Grond ass de Wonsch informell Triplett an d'Sprooch vun der éischter Uerdnung Prädikatlogik ze verstoen an ze iwwersetzen s p o wéi eppes wéi Semantesch Web a verlinkt Daten. Korrekturen an Ergänzungewou Semantesch Web a verlinkt Daten. Korrekturen an Ergänzunge - Prädikat, Semantesch Web a verlinkt Daten. Korrekturen an Ergänzunge и Semantesch Web a verlinkt Daten. Korrekturen an Ergänzunge - konstante. Spure vun dësem Verständnis sinn am Dokument "LBase: Semantik fir Sprooche vum Semantic Web", déi de Status vun enger W3C Aarbechtsgrupp Notiz huet. Mat dësem Verständnis, den Triplett s p []wou [] - eidel Node, gëtt als iwwersat Semantesch Web a verlinkt Daten. Korrekturen an Ergänzungewou Semantesch Web a verlinkt Daten. Korrekturen an Ergänzunge - Variabel, mee wéi dann iwwersetzen s [] o? Dokument mam W3C Empfehlungsstatus "RDF 1.1 Semantik" bitt eng aner Iwwersetzungsmethod, awer betruecht ëmmer nach net d'Méiglechkeet vu Prädikater eidel Noden ze sinn.

Allerdéngs Manu Sporni erlaabt.

RDF ass en abstrakte Modell. RDF ka geschriwwe ginn (serialiséiert) a verschiddene Syntaxen: RDF/XML, Schildkröt (meeschtens liesbar), JSON-LD, HDT (binär).

Deeselwechte RDF kann op verschidde Manéieren an RDF / XML serialiséiert ginn, sou datt et zum Beispill kee Sënn mécht de resultéierende XML mat XSD ze validéieren oder ze probéieren Daten mat XPath ze extrahieren. Ähnlech ass JSON-LD onwahrscheinlech dem duerchschnëttleche Javascript Entwéckler säi Wonsch zefridden ze stellen fir mat RDF ze schaffen mat Javascript's Punkt a Quadratklammer Notatioun (obwuel JSON-LD sech an déi Richtung bewegt andeems en e Mechanismus bitt cadrage).

Déi meescht Syntaxe bidden Weeër fir laang URIs ze verkierzen. Zum Beispill eng Annonce @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> an Turtle wäert Iech dann erlaben amplaz ze schreiwen <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> einfach rdf:type.

RDFS

RDFS (RDF Schema) - e Basismodelléierungsvokabulär, féiert d'Konzepter vu Besëtz a Klass an Eegeschafte wéi z. rdf:type, rdfs:subClassOf, rdfs:domain и rdfs:range. Mat dem RDFS Wierderbuch, zum Beispill, kënnen déi folgend valabel Ausdréck geschriwwe ginn:

rdf:type         rdf:type         rdf:Property .
rdf:Property     rdf:type         rdfs:Class .
rdfs:Class       rdfs:subClassOf  rdfs:Resource .
rdfs:subClassOf  rdfs:domain      rdfs:Class .
rdfs:domain      rdfs:domain      rdf:Property .
rdfs:domain      rdfs:range       rdfs:Class .
rdfs:label       rdfs:range       rdfs:Literal .

RDFS ass eng Beschreiwung a Modelléierungsvokabulär, awer ass keng Beschränkungssprooch (obwuel déi offiziell Spezifizéierung an Blieder Méiglechkeet vun esou Notzung). D'Wuert "Schema" soll net am selwechte Sënn verstane ginn wéi am Ausdrock "XML Schema". Zum Beispill, :author rdfs:range foaf:Person heescht dat rdf:type all Propriétéit Wäerter :author - foaf:Person, mee heescht net, datt dëst am Viraus gesot ginn soll.

SPARQL

SPARQL (SPARQL Protokoll a RDF Query Language) - eng Sprooch fir RDF Daten ze froen. An engem einfache Fall ass eng SPARQL Ufro eng Rei vu Proben, géint déi Triplets vun der ugefrote Grafik passen. Mustere kënnen Variabelen an Thema, Prädikat an Objektpositiounen enthalen.

D'Ufro gëtt sou variabel Wäerter zréck, déi, wann se an d'Proben ersat ginn, zu engem Ënnergraff vun der ugefrote RDF Grafik (en Ënnerdeel vu sengen Triplets) resultéiere kënnen. Variablen mam selwechten Numm a verschiddene Proben vun Triplets mussen déiselwecht Wäerter hunn.

Zum Beispill, mat dem uewe genannte Set vu siwe RDFS Axiomen, gëtt déi folgend Ufro zréck rdfs:domain и rdfs:range als Wäerter ?s и ?p respektiv:

SELECT * WHERE {
 ?s ?p rdfs:Class .
 ?p ?p rdf:Property .
}

Et ass derwäert ze bemierken datt SPARQL deklarativ ass an net eng Sprooch ass fir Grafiktraversal ze beschreiwen (awer e puer RDF Repositories bidden Weeër fir den Ufro Ausféierungsplang unzepassen). Dofir kënnen e puer Standardgrafikproblemer, zum Beispill, de kuerste Wee fannen, net am SPARQL geléist ginn, och d'Benotzung vum Propriétéit Weeër (awer, erëm, individuell RDF Repositories bidden speziell Extensiounen fir dës Probleemer ze léisen).

SPARQL deelt net d'Vermutung vun der Offenheet vun der Welt a follegt d'Approche "Negatioun als Versoen", an deem méiglech Designs wéi FILTER NOT EXISTS {…}. Dateverdeelung gëtt mat Hëllef vum Mechanismus berücksichtegt federéiert Ufroen.

De SPARQL Zougangspunkt - eng RDF-Späichere fäeg fir SPARQL-Ufroen ze veraarbechten - huet keng direkt Analoga vun der zweeter Stuf (kuckt den Ufank vun dësem Paragraf). Et kann mat enger Datebank verglach ginn, baséiert op den Inhalt vun deenen HTML Säiten generéiert goufen, awer no baussen zougänglech. De SPARQL Zougangspunkt ass méi analog zum API Zougangspunkt vun der drëtter Stuf, awer mat zwee Haaptdifferenzen. Als éischt ass et méiglech e puer "atomesch" Ufroen an eng ze kombinéieren (wat als Schlësselcharakteristik vu GraphQL ugesi gëtt), an zweetens ass sou eng API komplett selbstdokumentéierend (wat ass wat HATEOAS probéiert huet ze erreechen).

Polemesch Remarque

RDF ass e Wee fir Daten um Internet ze verëffentlechen, sou datt RDF Späichere soll als Dokument DBMS ugesi ginn. Richteg, well RDF eng Grafik ass an net e Bam, hunn se sech och als Grafikbaséiert erausgestallt. Et ass erstaunlech datt et iwwerhaapt geklappt huet. Wien hätt geduecht datt et schlau Leit géife ginn, déi eidel Noden ëmsetzen. Codd ass hei et huet net geklappt.

Et ginn och manner vollstänneg Weeër fir Zougang zu RDF Daten z'organiséieren, zum Beispill, Verknëppelt Daten Fragmenter (LDF) an Verknëppelt Datenplattform (LDP).

OWL

OWL (Web Ontology Language) - e Formalismus fir Wëssen ze representéieren, eng syntaktesch Versioun vun der Beschreiwungslogik Semantesch Web a verlinkt Daten. Korrekturen an Ergänzunge (iwwerall drënner ass et méi korrekt fir OWL 2 ze soen, déi éischt Versioun vum OWL baséiert op Semantesch Web a verlinkt Daten. Korrekturen an Ergänzunge).

Konzepter vun deskriptiver Logik am OWL entspriechen Klassen, Rollen entspriechen Eegeschaften, Individuen behalen hire fréiere Numm. Axiome ginn och Axiome genannt.

Zum Beispill, am sougenannte Manchester Syntax fir OWL Notatioun en Axiom, deen eis scho bekannt ass Semantesch Web a verlinkt Daten. Korrekturen an Ergänzunge wäert esou geschriwwe ginn:

Class: Human
Class: Parent
   EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent

Et ginn aner Syntaxe fir OWL ze schreiwen, wéi z funktionell Syntax, benotzt an der offizieller Spezifizéierung, an OWL/XML. Zousätzlech kann OWL serialiséiert ginn RDF Syntax ze abstrakt a weider - an engem vun de spezifesche Syntaxen.

OWL huet eng duebel Relatioun mat RDF. Engersäits kann et als eng Aart Wierderbuch ugesi ginn, déi RDFS verlängert. Op der anerer Säit ass et e méi mächtege Formalismus fir deen RDF just e Serialiséierungsformat ass. Net all elementar OWL Konstrukte kënnen mat engem eenzegen RDF Triplet geschriwwe ginn.

Ofhängeg vun deem Ënnerdeel vun OWL-Konstrukten erlaabt sinn ze benotzen, schwätze se vu sougenannten OWL Profiler. Déi standardiséiert a bekannteste sinn OWL EL, OWL RL an OWL QL. D'Wiel vum Profil beaflosst d'Computational Komplexitéit vun typesche Probleemer. E komplette Set vun OWL Konstruktiounen entspriechend Semantesch Web a verlinkt Daten. Korrekturen an Ergänzunge, genannt OWL DL. Heiansdo schwätze se och iwwer OWL Full, an deem OWL Konstrukter erlaabt sinn mat der voller Fräiheet, déi an RDF inherent ass, ouni semantesch a computational Restriktiounen ze benotzen Semantesch Web a verlinkt Daten. Korrekturen an Ergänzunge. Zum Beispill kann eppes souwuel eng Klass an eng Immobilie sinn. OWL Full ass onbestëmmbar.

D'Schlësselprinzipien fir Konsequenzen am OWL ze befestigen sinn d'Adoptioun vun der oppener Welt Viraussetzung. O.W.A.) an Ofleenung vun der Viraussetzung vun eenzegaartegen Nimm (eenzegaarteg Numm Viraussetzung, EE). Drënner wäerte mir gesinn wou dës Prinzipien féieren kënnen an e puer OWL Konstrukter aféieren.

Loosst d'Ontologie de folgende Fragment enthalen (am Manchester Syntax):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human
   Facts: hasChild Alice, hasChild Bob, hasChild Carol

Wäert et aus deem wat gesot ginn ass, datt de John vill Kanner huet? Oflehnung vun der UNA wäert den Inferenzmotor forcéieren dës Fro negativ ze beäntweren, well d'Alice an de Bob vläicht déiselwecht Persoun sinn. Fir déi folgend ze stattfannen, ass et néideg de folgenden Axiom ze addéieren:

DifferentIndividuals: Alice, Bob, Carol, John

Loosst elo d'Ontologie Fragment déi folgend Form hunn (John gëtt deklaréiert vill Kanner ze hunn, awer hien huet nëmmen zwee Kanner):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human, manyChildren
   Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John

Wäert dës Ontologie inkonsistent sinn (wat kann als Beweis vun ongülteg Daten interpretéiert ginn)? OWA akzeptéieren wäert dozou féieren datt den Inferenzmotor negativ reagéiert: "irgendwou" anescht (an enger anerer Ontologie) kann et gutt gesot ginn datt d'Carol och dem John säi Kand ass.

Fir d'Méiglechkeet vun dësem auszeschléissen, loosst eis en neie Fakt iwwer John derbäi:

Individual: John
   Facts: hasChild Alice, hasChild Bob, not hasChild Carol

Fir d'Erscheinung vun anere Kanner auszeschléissen, loosst eis soen datt all Wäerter vun der Immobilie "e Kand hunn" Leit sinn, vun deenen mir nëmme véier hunn:

ObjectProperty: hasChild
   Domain: Human
   Сharacteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }

Elo wäert d'Ontologie widderspréchlech ginn, wat den Inferenzmotor net versoen wäert ze berichten. Mat de leschte vun den Axiomen hu mir an engem Sënn d'Welt "zougemaach", a bemierken wéi d'Méiglechkeet vum John säin eegent Kand ausgeschloss ass.

Verknëppung Enterprise Daten

De Linked Data Set vun Approchen an Technologien war ursprénglech geduecht fir Daten um Internet ze publizéieren. Hir Notzung an engem internen Firmenëmfeld huet eng Rei Schwieregkeeten.

Zum Beispill, an engem zouene Firmenëmfeld, ass d'deduktiv Kraaft vun OWL baséiert op der Adoptioun vun OWA an der Oflehnung vun der UNA, Entscheedungen wéinst der oppener a verdeeler Natur vum Web, ze schwaach. An hei sinn déi folgend Léisunge méiglech.

  • D'OWL mat Semantik erginn, implizéiert d'Verloossung vum OWA an d'Adoptioun vun der UNA, d'Ëmsetzung vum entspriechende Outputmotor. - Laanscht dëse Wee geet Stardog RDF Stockage.
  • Verloossen OWLs deduktiv Fäegkeeten zugonschte vun Regelmotoren. - Stardog ënnerstëtzt SWRL; Jena an GraphDB Offer eegent Sproochen Regelen
  • Refus vun deduktiven Fäegkeeten vun OWL, Notzung vun engem oder aneren Ënnerdeel no bei RDFS fir Modelléierung. - Gesinn méi iwwer dëst ënnert.

En anert Thema ass de gréissere Fokus deen d'Gesellschaftswelt op Datequalitéitsprobleemer kann hunn an de Mangel un Datevalidatiounsinstrumenter am Linked Data Stack. D'Ausgaben hei sinn wéi follegt.

  • Nach eng Kéier, benotzt fir d'Validatioun vun OWL Konstrukter mat zougemaach Welt Semantik an eenzegaarteg Nimm wann e passenden Inferenzmotor verfügbar ass.
  • Benotzt SHACL, standardiséiert nodeems d'Lëscht vun de Semantic Web Layer Cake Schichten fixéiert gouf (awer, et kann och als Regelmotor benotzt ginn), oder SchEx.
  • Verstinn datt alles schlussendlech mat SPARQL Ufroen gemaach gëtt, erstellt Ären eegene einfachen Datevalidatiounsmechanismus mat hinnen.

Wéi och ëmmer, och eng komplett Oflehnung vun deduktiven Fäegkeeten a Validatiounsinstrumenter léisst de Linked Data Stack aus der Konkurrenz an Aufgaben, déi an der Landschaft ähnlech wéi dem oppenen a verdeelte Web sinn - an Datenintegratiounsaufgaben.

Wat iwwer e reguläre Enterprise Informatiounssystem?

Dëst ass méiglech, awer Dir sollt natierlech bewosst sinn, wéi eng Problemer déi entspriechend Technologien léisen mussen. Ech wäert hei eng typesch Reaktioun vun Entwécklung Participanten beschreiwen fir ze weisen, wéi dësen Technologie Stack aus der Siicht vun konventionell IT ausgesäit. Erënnert mech e bëssen un de Parabel vum Elefant:

  • Business Analyst: RDF ass eppes wéi en direkt gespäichert logesche Modell.
  • System Analyst: RDF ass wéi EAV, nëmme mat enger Rëtsch Indexen an enger praktescher Ufrosprooch.
  • Entwéckler: gutt, dëst ass alles am Geescht vun de Konzepter vu räiche Modell an nidderegen Code, war liesen kuerzem iwwer dëst.
  • Chef vum Projet: jo et ass d'selwecht de Stack zesummeklappen!

Praxis weist datt de Stack meeschtens an Aufgaben am Zesummenhang mat der Verdeelung an der Heterogenitéit vun Daten benotzt gëtt, zum Beispill beim Bau vun MDM (Master Data Management) oder DWH (Data Warehouse) Klassesystemer. Esou Problemer existéieren an all Industrie.

Wat d'Industriespezifesch Uwendungen ugeet, Linked Data Technologien sinn am Moment am populärsten an de folgende Industrien.

  • biomedizinesch Technologien (wou hir Popularitéit schéngt mat der Komplexitéit vum Domain verbonnen ze sinn);

aktuell

De "Boiling Point" huet viru kuerzem eng Konferenz organiséiert vun der Associatioun "National Medical Knowledge Base" "Ontologie kombinéiert. Vun Theorie bis praktesch Uwendung".

  • Produktioun an Operatioun vu komplexe Produkter (grouss mechanesch Ingenieur, Ueleg- a Gasproduktioun; meeschtens schwätzen mir iwwer Standard ISO 15926);

aktuell

Och hei ass de Grond d'Komplexitéit vum Fachberäich, wann zum Beispill an der Upstream Etapp, wa mir iwwer d'Ueleg- a Gasindustrie schwätzen, einfach Comptabilitéit e puer CAD Funktiounen erfuerdert.

Am Joer 2008 ass e representativ Installatiounsevenement, organiséiert vum Chevron, stattfonnt d'Konferenz.

Den ISO 15926 schénge schlussendlech e bësse schwéier fir d'Ueleg- a Gasindustrie (a fonnt vläicht méi grouss Uwendung am mechanesche Ingenieur). Nëmmen Statoil (Equinor) huet sech grëndlech drop ugeschloss; an Norwegen, e Ganzt Ökosystem. Anerer probéieren hir eege Saach ze maachen. Zum Beispill, laut Rumeuren, wëll den Innenministère fir Energie e "konzeptuellen ontologesche Modell vum Brennstoff- an Energiekomplex" erstellen, ähnlech, anscheinend, fir d'Elektresch Kraaftindustrie geschaf.

  • finanziell Organisatiounen (souguer XBRL kann als Hybrid vu SDMX an der RDF Data Cube Ontologie ugesi ginn);

aktuell

Am Ufank vum Joer huet LinkedIn den Auteur aktiv mat Vakanzen aus bal all de Risen vun der Finanzindustrie gespammelt, déi hien aus der Fernsehserie "Force Majeure" kennt: Goldman Sachs, JPMorgan Chase an/oder Morgan Stanley, Wells Fargo, SWIFT/Visa/Mastercard, Bank of America, Citigroup, Fed, Deutsche Bank... Wahrscheinlech huet jidderee no engem gesicht, un deen se kéint schécken Wëssensgraff Konferenz. Ganz e puer hunn et fonnt: Finanzorganisatiounen hunn alles iwwerholl moies vum éischten Dag.

Op HeadHunter ass nëmmen d'Sberbank eppes Interessantes fonnt; et war iwwer "EAV-Späichere mat engem RDF-ähnlechen Datemodell."

Wahrscheinlech ass den Ënnerscheed am Grad vun der Léift fir déi entspriechend Technologien vun Gewalt a westlech Finanzinstituter wéinst der transnationaler Natur vun der leschter Aktivitéit. Anscheinend erfuerdert d'Integratioun iwwer Staatsgrenzen qualitativ verschidden organisatoresch an technesch Léisungen.

  • Fro-Äntwert Systemer mat kommerziellen Uwendungen (IBM Watson, Apple Siri, Google Knowledge Graph);

aktuell

Iwwregens, de Schëpfer vu Siri, Thomas Gruber, ass den Auteur vun der ganzer Definitioun vun der Ontologie (am IT Sënn) als "Konzeptualiséierungsspezifikatioun." Menger Meenung no ännert d'Wierder an dëser Definitioun ëmarrangéieren hir Bedeitung net, wat vläicht beweist datt et net do ass.

  • Verëffentlechung vu strukturéierten Donnéeën (mat gréisserer Begrënnung kann dëst zu Linked Open Data zougeschriwwe ginn).

aktuell

Grouss Fans vu Linked Data sinn déi sougenannte GLAM: Galerien, Bibliothéiken, Archiven a Muséeën. Et ass genuch ze soen datt d'Bibliothéik vum Kongress en Ersatz fir MARC21 fördert BIBFRAME, wat bitt e Fundament fir d'Zukunft vun der bibliographescher Beschreiwung an, natierlech, baséiert op RDF.

Wikidata gëtt dacks als e Beispill vun engem erfollegräiche Projet am Beräich vun Linked Open Data zitéiert - eng Aart vu Maschinn liesbar Versioun vu Wikipedia, wou den Inhalt, am Géigesaz zu DBPedia, net duerch Import aus Artikelinfoboxen generéiert gëtt, mä ass méi oder manner manuell erstallt (a gëtt duerno eng Informatiounsquell fir déiselwecht Infoboxen).

Mir recommandéieren och datt Dir et iwwerpréift Lëscht Benotzer vun der Stardog RDF Stockage op der Stardog Websäit an der Rubrik "Clienten".

Sief dat wéi et ass, zu Gartner Hype Cycle fir Emerging Technologies 2016 "Enterprise Taxonomy and Ontology Management" ass an der Mëtt vun engem Ofstamung an den Dall vun der Enttäuschung plazéiert mat der Perspektiv fir e "Produktivitéitsplateau" net méi fréi wéi an 10 Joer z'erreechen.

Verbannen Enterprise Daten

Prognosen, Prognosen, Prognosen ...

Aus historeschen Interessi hunn ech ënnert dem Gartner seng Prognosen fir verschidde Joeren iwwer d'Technologien, déi eis interesséieren, tabuléiert.

Joer Technologie Bericht Positioun Joer bis Plateau
2001 Semantesch Web Nuete Technologien Innovatioun Ausléiser 5-10
2006 Corporate Semantic Web Nuete Technologien Peak vun opgeblosen Erwaardungen 5-10
2012 Semantesch Web Big Data Peak vun opgeblosen Erwaardungen > 10
2015 Verknëppelt Daten Fortgeschratt Analytics an Data Science Trog vun Desillusioun 5-10
2016 Enterprise Ontologie Management Nuete Technologien Trog vun Desillusioun > 10
2018 Wëssen Grafiken Nuete Technologien Innovatioun Ausléiser 5-10

Allerdéngs schonn an "Hype Cycle ..." 2018 en aneren Upward Trend ass opgetaucht - Knowledge Graphs. Eng gewësse Reinkarnatioun ass stattfonnt: Grafik DBMSs, op déi d'Opmierksamkeet vun de Benotzer an d'Efforte vun den Entwéckler sech gewiesselt hunn, ënner dem Afloss vun den Ufroe vun der fréierer an de Gewunnechten vun der leschter, ugefaang d'Konturen an d'Positionéierung ze huelen. vun hire Virgänger Konkurrenten.

Bal all Grafik DBMS deklaréiert sech elo als eng gëeegent Plattform fir eng Firmen "Wëssensgrafik" ze bauen ("verlinkt Daten" gëtt heiansdo duerch "verbonne Daten" ersat), awer wéi gerechtfäerdegt sinn esou Fuerderungen?

Grafikdatenbanken sinn nach ëmmer asemantesch; d'Donnéeën an enger Grafik DBMS sinn nach ëmmer deeselwechten Datesilo. String Identifizéierer amplaz vun URIs maachen d'Aufgab fir zwee Grafik DBMSs z'integréieren nach ëmmer eng Integratiounsaufgab, während d'Integratioun vun zwee RDF Geschäfter dacks erof geet op einfach zwee RDF Grafiken ze fusionéieren. En aneren Aspekt vun der Asemantitéit ass d'Net-Reflexivitéit vum LPG Grafikmodell, wat et schwéier mécht Metadaten mat der selwechter Plattform ze managen.

Schlussendlech hu Grafik DBMS keng Inferenzmotoren oder Regelmotoren. D'Resultater vun esou Motore kënne reproduzéiert ginn duerch komplizéiert Ufroen, awer dëst ass méiglech och a SQL.

Wéi och ëmmer, féierend RDF Späichersystemer hu keng Schwieregkeeten de LPG Modell z'ënnerstëtzen. Déi zoliddst Approche gëllt als déi, déi zu enger Zäit am Blazegraph proposéiert gouf: den RDF* Modell, deen RDF a LPG kombinéiert.

méi

Dir kënnt méi iwwer RDF-Speicherunterstëtzung fir de LPG-Modell am virege Artikel iwwer Habré liesen: "Wat geschitt elo mat RDF Späicheren". Ech hoffen enges Daags gëtt e separaten Artikel iwwer Knowledge Graphs an Data Fabric geschriwwen. Déi lescht Rubrik, wéi einfach ze verstoen, gouf séier geschriwwen, awer och sechs Méint méi spéit ass alles net vill méi kloer mat dëse Konzepter.

Literatur

  1. Halpin, H., Monnin, A. (eds.) (2014). Philosophical Engineering: Richtung eng Philosophie vum Web
  2. Allemang, D., Hendler, J. (2011) Semantic Web for the Working Ontologist (2nd ed.)
  3. Staab, S., Studer, R. (eds.) (2009) Handbook on Ontologies (2nd ed.)
  4. Wood, D. (ed.). (2011) Verknëppung Enterprise Daten
  5. Keet, M. (2018) An Introduction to Ontology Engineering

Source: will.com

Setzt e Commentaire