Web Semanticu è Dati Linked. Currezzione è aghjunte

Vogliu prisintà à l'attenzione di u publicu un frammentu di stu libru publicatu recentemente:

Modellazione ontologica di l'impresa : metudi è tecnulugia [Testu] : monografia / [S. V. Gorshkov, S. S. Kralin, O. I. Mushtak, è altri; editore esecutivo S. V. Gorshkov]. - Ekaterinburg: Casa editrice di l'Università Ural, 2019. - 234 p.: ill., tab.; 20 cm - Auth. listatu nantu à u spinu di tit. Cù. - Bibliografu. à a fine di ch. - ISBN 978-5-7996-2580-1 : 200 copie.

U scopu di stallà stu fragmentu nantu à Habré hè quattru volte:

  • Hè improbabile chì qualchissia hà da pudè tene stu libru in e so mani s'ellu ùn hè micca un cliente di un rispettatu. SergeIndex; Di sicuru, ùn hè micca in vendita.
  • E currezzione sò state fatte à u testu (ùn sò micca evidenziati quì sottu) è aghjunte sò state fatte chì ùn sò micca assai cumpatibili cù u formatu di a monografia stampata: note tematiche (sottu spoilers) è hyperlinks.
  • ti vogliu raccoglie dumande è cumentiper piglià in contu quandu stu testu hè inclusu in una forma rivista in ogni altra edizzioni.
  • Parechji aderenti di u Web Semanticu è di i Dati Linked anu sempre chì u so circhiu hè cusì strettu, soprattuttu perchè u publicu generale ùn hè ancu spiegatu bè quantu hè grande per esse un aderente di u Web Semanticu è Dati Linked. L'autore di u frammentu, ancu s'ellu appartene à stu cerculu, ùn aderisce micca à una tale opinione, ma, quantunque, si cunsidereghja ubligatoriu di fà un altru tentativu.

Cusì,

Web semanticu

L'evoluzione di l'Internet pò esse rapprisintata cum'è seguitu (o parlà di i so segmenti furmati in l'ordine seguente):

  1. Documenti nantu à Internet. Tecnulugie chjave - Gopher, FTP, etc.
    Internet hè una reta glubale per u scambiu di risorse lucali.
  2. Documenti Internet. Tecnulugie chjave sò HTML è HTTP.
    A natura di i risorsi esposti piglia in contu e caratteristiche di u mediu per a so trasmissione.
  3. Dati Internet. Tecnulugie chjave sò REST è SOAP API, XHR, etc.
    L'era di l'applicazioni Internet, micca solu e persone diventanu cunsumatori di risorse.
  4. dati internet. Tecnulugie chjave sò tecnulugii Linked Data.
    Sta quarta tappa, prevista da Berners-Lee, creatore di tecnulugii chjave di u sicondu è direttore di u W3C, hè chjamatu Web Semanticu; I tecnulugii Linked Data sò pensati per fà e dati nantu à u web micca solu leghjite da a macchina, ma ancu "comprensibili da a macchina".

Da ciò chì seguita, diventerà chjaru à u lettore chì i cuncetti chjave di a seconda è quarta tappa currispondenu:

  • analoghi di URL sò URI,
  • HTML hè analogu à RDF,
  • I hyperlinks HTML sò simili à e entrate URI in documenti RDF.

U Web Semanticu hè più di una visione sistematica di l'avvene di l'Internet chè una tendenza spontanea specifica o lobbyata, ancu s'ellu hè capaci di piglià in contu ancu questi ultimi. Per esempiu, una funzione impurtante di ciò chì hè chjamatu Web 2.0 hè cunsideratu cum'è "cuntenutu generatu da l'utilizatori". Hè dumandatu à piglià in contu, in particulare, a raccomandazione W3C "Ontologia di l'annotazione Web"è una tale impresa cum'è Parchet.

Hè mortu u Web Semanticu ?

Sì ricusate aspettative irrealistiche, A situazione cù u web semanticu hè quasi listessa cum'è cù u cumunismu in i tempi di u sucialismu sviluppatu (è chì ognunu decide per ellu stessu se a lealtà à i precetti cundiziunali di Ilich hè osservatu). I mutori di ricerca abbastanza successu furzà i siti web à utilizà RDFa è JSON-LD è elli stessi utilizanu tecnulugii ligati à quelli descritti quì sottu (Google Knowledge Graph, Bing Knowledge Graph).

In termini generali, l'autore ùn pò micca dì ciò chì impedisce a diffusione più grande, ma pò parlà nantu à a basa di l'esperienza persunale. Ci sò compiti chì seranu risolti "fora di scatula" in e cundizioni di l'offensiva SW, ancu s'ellu ùn hè micca assai massiva. In cunsiquenza, quelli chì anu questi compiti ùn anu micca i mezi di coercizione contru à quelli chì sò capaci di furnisce una suluzione, è l'ultimi stessi chì furnisce una suluzione da l'ultimi hè contru à i so mudelli di cummerciale. Allora cuntinuemu à analizà HTML è cola diverse API, una merda dopu l'altru.

In ogni casu, e tecnulugia di Linked Data si sò sparghje fora di u web di massa; U libru hè, in fattu, dedicatu à e so applicazioni. Attualmente, a cumunità di Linked Data aspetta chì sti tecnulugii diventenu ancu più diffusi grazia à Gartner chì fissa (o pruclamà, ciò chì vulete) tendenzi cum'è Grafichi di cunniscenza и tela di dati. Vogliu crede chì micca implementazioni "bicicletta" di sti cuncetti seranu riesciuti, ma quelli chì sò ligati à i normi W3C discututi quì sottu.

Dati cunnessi

Berners-Lee hà definitu Linked Data cum'è u Web Semanticu fattu bè: un inseme di approcci è tecnulugia per ottene i so scopi finali. Principi basi di Linked Data Berners-Lee individuatu seguenti.

Principiu 1. Utilizà URI per nome entità.

L'URI sò identificatori di entità globale in uppusizione à l'identificatori di stringa lucali di entrate. In seguitu, stu principiu hà trovu a so megliu espressione in u slogan di Google Knowledge Graph "cose, micca strings».

Principiu 2. Utilizà l'URI in u schema HTTP per ch'elli ponu esse dereferencing.

Facendu riferimentu à un URI, deve esse pussibule ottene u significante daretu à quellu significante (l'analogia cù u nome di l'operatore "*» in C); più precisamente, per avè qualchì rapprisintazione di questu significatu - secondu u valore di l'intestazione HTTP Accept:. Forsi cù l'avventu di l'era AR / VR, serà pussibule acquistà a risorsa stessu, ma per avà, assai prubabilmente, serà un documentu RDF chì hè u risultatu di una dumanda SPARQL. DESCRIBE.

Principiu 3. L'usu di i standard W3C - principalmente RDF(S) è SPARQL - in particulare quandu dereferencing URIs.

Questi "strati" individuali di a pila di tecnulugia Linked Data, cunnisciutu ancu Semantic Web Layer Cake, serà descrittu quì sottu.

Principiu 4. Utilizà riferimenti à altri URI quandu descrizanu entità.

RDF permette di limità à una descrizzione verbale di una risorsa in lingua naturale, è u quartu principiu chjama à ùn fà micca questu. Cù l'osservanza universale di u primu principiu, diventa pussibule di riferite à l'altri, cumpresi "alieni", quandu discrive una risorsa, per quessa chì i dati sò chjamati ligati. In fatti, hè quasi inevitabbile di utilizà URI chjamati in u dizziunariu RDFS.

RDF

RDF (Resource Description Framework) - un formalismu per a descrizzione di entità interrelate.

Circa l'entità è e so rilazioni, dichjarazioni di a forma "sugettu-predicatu-ughjettu" sò fatti, chjamati triplets. In u casu più simplice, u sughjettu, u predicatu è l'ughjettu sò tramindui URI. U listessu URI pò esse in diverse triplettes in diverse pusizioni: esse un sughjettu, un predicatu è un ughjettu; i triplets formanu cusì un tipu di graffiu chjamatu graphu RDF.

I sughjetti è l'uggetti ponu esse micca solu URI, ma ancu cusì chjamati nodi vacanti, è l'uggetti ponu ancu esse letterali. Literali sò casi di tipi primitivi, custituiti da una rapprisintazioni di stringa è una specificazione di tipu.

Esempii di scrittura letterali (in sintassi Turtle, più nantu à quì sottu): "5.0"^^xsd:float и "five"^^xsd:string. Litterali cù tipu rdf:langString pò ancu esse furnitu cù un tag di lingua, in Turtle hè scrittu cusì: "five"@en и "пять"@ru.

I nodi vacanti sò risorse "anonimi" senza identificatori glubale, chì, però, ponu esse affirmati; una sorta di variabili esistenziali.

Allora (questu, in fattu, hè tutta l'essenza di RDF):

  • u sughjettu hè un URI o un nodu viotu,
  • u predicatu hè un URI,
  • l'ughjettu hè un URI, un nodu viotu o un literale.

Perchè i predicati ùn ponu micca esse nodi vacanti?

U mutivu prubabile hè u desideriu di cumprenderà informalmente è traduce triplet in a lingua di a logica di predicate di primu ordine. s p o cum'è qualcosa cum'è Web Semanticu è Dati Linked. Currezzione è aghjunteinduve Web Semanticu è Dati Linked. Currezzione è aghjunte - predicatu, Web Semanticu è Dati Linked. Currezzione è aghjunte и Web Semanticu è Dati Linked. Currezzione è aghjunte - custanti. Ci sò tracce di tali capiscitura in u documentu "LBase: Semantica per e Lingue di u Web Semanticu", chì hà u statutu di una nota di u gruppu di travagliu W3C. Cù sta capiscitura, u triplet s p []induve [] - un node viotu, serà traduttu cum'è Web Semanticu è Dati Linked. Currezzione è aghjunteinduve Web Semanticu è Dati Linked. Currezzione è aghjunte - variabile, ma cumu dopu traduce s [] o? U documentu di raccomandazione W3C "RDF 1.1 Semantica” suggerisce un altru modu di traduzzione, ma ùn cunsidereghja ancu a pussibilità di i predicati esse nodi vacanti.

Tuttavia, Manu Sporny permessu.

RDF hè un mudellu astrattu. RDF pò esse scrittu (serializatu) in diverse sintassi: RDF/XML, Turtle (a più leggibile umana) JSON-LD, HDT (binariu).

U listessu RDF pò esse serializatu in RDF / XML in modu diffirenti, per quessa ùn hà micca sensu, per esempiu, per cunvalidà u XML resultanti cù XSD o pruvate d'estrattà dati cù XPath. In listessu modu, JSON-LD hè improbabile di suddisfà u desideriu di u sviluppatore Javascript mediu di travaglià cù RDF utilizendu a notazione di punti Javascript è parentesi quadrate (ancu se JSON-LD si move in quella direzzione offrendu un mecanismu). inquadramentu).

A maiò parte di sintassi offre modi per accurtà URI longu. Per esempiu, ad @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> in Turtle vi permetterà tandu di scrive invece <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> solu rdf:type.

RDFS

RDFS (Schema RDF) - vocabulariu di mudellu di basa, introduce i cuncetti di pruprietà è classi, è pruprietà cum'è rdf:type, rdfs:subClassOf, rdfs:domain и rdfs:range. Utilizendu u dizziunariu RDFS, per esempiu, e seguenti espressioni valide ponu esse scritte:

rdf:type         rdf:type         rdf:Property .
rdf:Property     rdf:type         rdfs:Class .
rdfs:Class       rdfs:subClassOf  rdfs:Resource .
rdfs:subClassOf  rdfs:domain      rdfs:Class .
rdfs:domain      rdfs:domain      rdf:Property .
rdfs:domain      rdfs:range       rdfs:Class .
rdfs:label       rdfs:range       rdfs:Literal .

RDFS hè un vocabulariu di descrizzione è di mudellu, ma ùn hè micca una lingua di limitazione (ancu se a specificazione ufficiale è foglie a pussibilità di tali usu). A parolla "Schema" ùn deve esse cumpresa in u stessu sensu cum'è in l'espressione "XML Schema". Per esempiu, :author rdfs:range foaf:Person significa chì rdf:type tutti i valori di pruprietà :author - foaf:Person, ma ùn significa micca chì questu deve esse dettu in anticipu.

SPARQL

SPARQL (SPARQL Protocol and RDF Query Language) hè una lingua di dumanda per i dati RDF. In un casu simplice, una query SPARQL hè un inseme di campioni contr'à i quali i triplets di u gràficu interrugatu sò assuciati. Variabili ponu esse posti in i pusizioni di sughjetti, predicati è oggetti in mudelli.

A dumanda restituverà tali valori variabili chì, quandu sò rimpiazzati in i campioni, ponu risultatu in un sottografu di u graficu RDF chì hè interrugatu (un sottumessu di i so triplets). Variabili di u listessu nome in diversi campioni di triplets deve avè i stessi valori.

Per esempiu, nantu à l'inseme di sette assiomi RDFS, a seguente dumanda torna rdfs:domain и rdfs:range cum'è valori ?s и ?p in conseguenza:

SELECT * WHERE {
 ?s ?p rdfs:Class .
 ?p ?p rdf:Property .
}

Hè da nutà chì SPARQL hè dichjarazione è ùn hè micca una lingua di traversu di graffiu (in ogni modu, certi repositori RDF offrenu modi per aghjustà u pianu di esecuzione di query). Dunque, certi prublemi di gràficu standard, cum'è truvà u percorsu più curtu, ùn ponu esse risolti in SPARQL, cumpresu cù u mecanismu. camini di pruprietà (ma, di novu, i repositori RDF individuali offrenu estensioni speciali per queste attività).

SPARQL ùn sparte micca a presunzione di l'apertura di u mondu è seguita l'approcciu di "negazione cum'è fallimentu", in quale pussibule strutture cum'è FILTER NOT EXISTS {…}. A distribuzione di dati hè presa in contu cù u mecanismu dumande federate.

U puntu d'accessu SPARQL, una tenda RDF capace di processà e dumande SPARQL, ùn hà micca analoghi diretti da a seconda tappa (vede u principiu di stu paràgrafu). Pò esse paragunatu à una basa di dati, basatu annantu à u cuntenutu di quale e pagine HTML sò stati generati, ma accessibile à l'esternu. U puntu d'accessu SPARQL hè più cum'è un puntu d'accessu API da a terza tappa, ma cù duie differenzi principali. Prima, hè pussibule cunghjuntà parechje dumande "atomiche" in una sola (chì hè cunsiderata una caratteristica chjave di GraphQL), è in segundu, una tale API hè cumplettamente documentata (chì HATEOAS hà pruvatu à ottene).

Osservazione polemica

RDF hè un modu di pubblicà dati nantu à u web, cusì i repositori RDF deve esse cunsideratu DBMS di documentu. True, postu chì RDF hè un graffiu, micca un arbre, sò diventati gràficu à u stessu tempu. Hè maravigghiusu chì hà travagliatu in tuttu. Quale averia pensatu chì ci sarianu persone intelligenti chì implementanu i nodi in biancu. Eccu Codd ùn hà micca travagliatu.

Ci hè ancu modi menu cumpleti per urganizà l'accessu à e dati RDF, per esempiu, Frammenti di dati cunnessi (LDF) è Piattaforma di Dati Linked (LDP).

OWL

OWL (Web Ontology Language) - un formalismu di rapprisintazioni di a cunniscenza, una versione sintattica di a logica descriptiva Web Semanticu è Dati Linked. Currezzione è aghjunte (in ogni locu sottu hè più currettu per dì OWL 2, a prima versione di OWL hè stata basata nantu à Web Semanticu è Dati Linked. Currezzione è aghjunte).

I cuncetti di logica di descrizzione in OWL currispondenu à classi, roli à pruprietà, l'individui conservanu u so nome anticu. L'assiomi sò ancu chjamati assiomi.

Per esempiu, in u cusì chjamatu Sintassi di Manchester per a notazione OWL, l'assioma chì avemu digià cunnisciutu Web Semanticu è Dati Linked. Currezzione è aghjunte sarà scrittu cusì:

Class: Human
Class: Parent
   EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent

Ci sò altre sintassi per scrive OWL, cum'è sintassi funziunale, utilizatu in a specificazione ufficiale, è OWL/XML. Inoltre, OWL pò esse serializatu in sintassi RDF astratta è in u futuru - in ogni sintassi specifichi.

OWL hè duie volte in relazione à RDF. Da una banda, pò esse vistu cum'è un tipu di dizziunariu chì estende RDFS. Per d 'altra banda, hè un formalismu più putente per quale RDF hè solu un furmatu di serializazione. Ùn sò micca tutti i custruzzioni elementari OWL ponu esse scritti cù un unicu triplet RDF.

Sicondu u subset di custruzzioni OWL sò permessi di esse usatu, si parla di cusì chjamatu profili OWL. I standardizati è più cunnisciuti sò OWL EL, OWL RL è OWL QL. A scelta di u prufilu influenza a cumplessità computazionale di i prublemi tipici. Un set cumpletu di disinni OWL per currisponde Web Semanticu è Dati Linked. Currezzione è aghjunte, hè chjamatu OWL DL. A volte si parla ancu di OWL Full, in quale i custruzzioni OWL sò permessi di esse utilizati cù a piena libertà inerente in RDF, senza restrizioni semantiche è computazionali. Web Semanticu è Dati Linked. Currezzione è aghjunte. Per esempiu, qualcosa pò esse una classa è una pruprietà. OWL Full ùn hè micca risolvibile.

I principii chjave di attaccà cunsequenze in OWL sò l'accettazione di l'assunzione di u mondu apertu (assunzione di u mondu apertu, O.W.A.) è u rifiutu di l'assunzione di u nome unicu, UNA). Quì sottu, vedemu ciò chì questi principii ponu purtà è intruduce alcune di e custruzzioni di OWL.

Chì l'ontologia cuntene u frammentu seguente (in a sintassi di Manchester):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human
   Facts: hasChild Alice, hasChild Bob, hasChild Carol

Serà da ciò chì hè statu dettu chì Ghjuvanni hà parechji figlioli ? Rejecting UNA forzà u mutore di inferenza per risponde à sta quistione in u negativu, postu chì Alice è Bob puderianu esse assai a stessa persona. Per fà ciò chì seguita, avemu bisognu di aghjunghje l'assioma chì seguita:

DifferentIndividuals: Alice, Bob, Carol, John

Avà chì u frammentu di l'ontologia hà a forma seguente (Ghjuvanni hè dichjaratu chì hà parechji figlioli, ma hà solu dui figlioli):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human, manyChildren
   Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John

Questa ontulugia serà inconsistente (chì pò esse interpretata cum'è evidenza di dati invalidi) ? L'accettazione di l'OWA farà chì u mutore d'inferenza risponda in negativu: "in un locu" altru (in una ontulugia diversa) si pò dì chì Carol hè ancu u zitellu di Ghjuvanni.

Per eliminà sta pussibilità, aghjustemu un novu fattu nantu à Ghjuvanni:

Individual: John
   Facts: hasChild Alice, hasChild Bob, not hasChild Carol

Per escludiri l'apparizione di l'altri figlioli, dicemu chì tutti i valori di a pruprietà "avè un zitellu" sò persone, di quale avemu solu quattru:

ObjectProperty: hasChild
   Domain: Human
   Сharacteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }

Avà l'ontologia diventerà inconsistente, chì u mutore di inferenza ùn falla micca di rapportà. Cù l'ultimu di l'assiomi, avemu un tipu di "chjusu" u mondu, è nutate cumu a pussibilità chì Ghjuvanni hè u so propiu figliolu hè sclusa.

Linking Enterprise Data

Un inseme di approcci è tecnulugia Linked Data era inizialmente destinatu à publicà e dati nantu à u web. Aduprà in un ambiente intracorporate face una quantità di difficultà.

Per esempiu, in un ambiente corporativu chjusu, u putere deductive di OWL basatu annantu à l'adopzione di OWA è u rifiutu di UNA, suluzioni guidate da a natura aperta è distribuita di u web, hè troppu debule. E quì i seguenti outputs sò pussibuli.

  • Dotà OWL cù semantica, chì implica u rifiutu di OWA è l'adopzione di UNA, l'implementazione di u mutore di inferenza currispondente. - longu sta strada va Repositoriu Stardog RDF.
  • Abbandunà u putere deduttivu di OWL in favore di i mutori di regula. - Supportu Stardog SWRL; Jena è GraphDB offerta propiu lingue regule.
  • U rifiutu di e capacità deductive di OWL, l'usu di unu o un altru sottumessu vicinu à RDFS per a mudeli. - Vede più nantu à questu quì sottu.

Un altru prublema hè l'attenzione più significativa chì u mondu corporativu pò dedicà à i prublemi di qualità di dati, è a mancanza di strumenti di validazione di dati in a pila di Dati Linked. I outputs sò i seguenti.

  • In novu, utilizendu custruzzioni OWL cù semantica di u mondu chjusu è unicità di nomi per cunvalidà s'ellu ci hè un mutore di inferenza adattatu.
  • Usu SHACL, standardizatu dopu chì a lista di strati Semantic Web Layer Cake hè stata fissata (in ogni modu, pò ancu esse usata cum'è un mutore di regula), o ShEx.
  • Realizà chì tuttu hè ultimamente fattu da e dumande SPARQL, creendu u vostru propiu mecanismu simplice di validazione di dati aduprendu.

In ogni casu, ancu un rifiutu cumpletu di e capacità deductive è l'arnesi di validazione abbanduneghja a pila di Dati Linked fora di a cumpetizione in i travaglii chì sò paisaghji simili à u web apertu è distribuitu - in e funzioni di integrazione di dati.

Chì ne dite di un sistema d'informazione corporativu regulare?

Questu hè pussibule, ma unu deve, sicuru, esse cuscenti di esattamente ciò chì i prublemi chì i tecnulugii appropritati anu da risolve. Descriveraghju quì una reazione tipica di i participanti di u sviluppu per dimustrà ciò chì sta pila di tecnulugia s'assumiglia da u puntu di vista di l'IT cunvinziunali. Mi ricorda un pocu a parabola di l'elefante:

  • Analista di cummerciale: RDF hè qualcosa cum'è un mudellu logicu direttamente almacenatu.
  • Analista di Sistemi: RDF hè cum'è EAV, solu cù una mansa d'indici è una lingua di query cunvene.
  • Sviluppatore: bè, hè tuttu in u spiritu di mudelli ricchi è cuncetti di codice bassu, lighjia annantu à pocu tempu.
  • Manager di prughjettu: Iè hè colapsendu a pila!

A pratica mostra chì a pila hè più spessu usata in i travaglii ligati à a distribuzione è l'eterogeneità di dati, per esempiu, quandu custruiscenu sistemi di a classa MDM (Master Data Management) o DWH (Data Warehouse). Tali prublemi sò in ogni industria.

In quantu à l'applicazioni specifiche di l'industria, e tecnulugia Linked Data sò attualmente più populari in i seguenti industrii.

  • tecnulugii biomedicali (induve a so popularità pare esse ligata à a cumplessità di u sughjettu);

tematicu

In u "Boiling Point" l'altru ghjornu, una cunferenza urganizata da l'associu "National Medical Knowledge Base" hè stata fatta ".Unificazione di l'ontologie. Da a teoria à l'applicazione pratica».

  • a fabricazione è u funziunamentu di i prudutti cumplessi (grande ingegneria, pruduzzione di petroliu è di gasu; più spessu hè un standard ISO 15926);

tematicu

Quì, ancu, u mutivu hè a cumplessità di u sughjettu, quandu, per esempiu, in u stadiu upstream, se parlemu di l'industria di l'oliu è di u gasu, una cuntabilità simplice hà bisognu à avè qualchì funzione CAD.

In u 2008, Chevron hà accoltu una stallazione rappresentativa a cunferenza.

L'ISO 15926 eventualmente pareva un pocu pesante à l'industria di u petroliu è di u gasu (è hà trovu quasi più usu in l'ingegneria meccanica). Solu Statoil (Equinor) s'hè attaccatu à ellu, in tutta a Norvegia ecosistema. Altri cercanu di fà u so propiu. Per esempiu, sicondu i rumuri, u Ministeru domesticu di l'Energia intende di creà un "mudellu ontologicu cuncettuale di u cumplessu di carburante è energia", simile, apparentemente, à creatu per l'industria di l'energia elettrica.

  • istituzioni finanziarii (ancu XBRL pò esse vistu cum'è un hibridu di SDMX è RDF Data Cube ontologia);

tematicu

LinkedIn à u principiu di l'annu attivamente spammed l'autore cù vacanti da quasi tutti i giganti di l'industria finanziaria, chì ellu cunnosce da a serie TV Suits: Goldman Sachs, JPMorgan Chase è / o Morgan Stanley, Wells Fargo, SWIFT / Visa / Mastercard, Bank of America, Citigroup, a Fed, Deutsche Bank... Probabilmente tutti cercavanu qualcunu per mandà. Cunferenza di u Graficu di Cunniscenza. Un pocu hà sappiutu truvà: l'istituzioni finanziarii occupanu tuttu primu ghjornu matina.

In HeadHunter, qualcosa interessante hè ghjuntu solu da Sberbank, si trattava di "almacenamiento EAV cù un mudellu di dati RDF-like".

Probabilmente, a diffarenza in u gradu d'amore per e tecnulugia currispundenti di l'istituzioni finanziarii domestiche è occidentali hè dovuta à a natura transnaziunale di l'attività di l'ultimi. Apparentemente, l'integrazione attraversu e fruntiere statali richiede suluzioni urganisazione è tecniche qualitativamente diverse.

  • sistemi di quistione-risposta chì anu applicazioni cummerciale (IBM Watson, Apple Siri, Google Knowledge Graph);

tematicu

A strada, u creatore di Siri, Thomas Gruber, hè l'autore di a definizione stessa di l'ontulugia (in u sensu IT) cum'è "specificazione di cuncepimentu". In u mo parè, u riarrangiamentu di e parolle in questa definizione ùn cambia micca u so significatu, chì, forsi, indica chì ùn hè micca quì.

  • pubblicazione di dati strutturati (per una bona raghjone questu pò esse digià attribuitu à Linked Open Data).

tematicu

I grandi fan di Linked Data sò u cusì chjamatu GLAM: Gallerie, Biblioteche, Archivi è Musei. Basta à dì quì chì per rimpiazzà MARC21, a Biblioteca di u Cungressu prumove BIBFRAME, chì furnisce una basa per u futuru di a descrizzione bibliografica è di sicuru basatu nantu à RDF.

Wikidata hè spessu citata cum'è un esempiu di un prughjettu di successu in u campu di Linked Open Data - un tipu di versione di Wikipedia leggibile in macchina, u cuntenutu di quale, in cuntrastu à DBPedia, ùn hè micca generatu da impurtà articuli da infoboxes, ma hè creatu più o menu manualmente (è in seguitu diventa una fonte d'infurmazioni per i stessi infoboxes).

Hè cunsigliatu ancu per rivisione a lista utilizatori di u repository Stardog RDF nantu à u situ web Stardog in a sezione "Clienti".

Sia cusì, in u Gartner "Hype Cycle for Emerging Technologies" 2016 "Enterprise Taxonomy and Ontology Management" hè situatu à mezu à una discesa in a valle di disappointment cù a pruspettiva di ghjunghje à un "plateau di produtividade" prima di 10 anni.

Cunnessu Dati Enterprise

Previsioni, predizioni, predizioni…

Fora di l'interessu storicu, aghju sintetizatu e previsioni di Gartner di parechji anni per e tecnulugia di interessu per noi in a tabella sottu.

Annu Tecnulugia Rapportu Posizione Anni à plateau
2001 Web semanticu Tecnulugia emergenti Trigger di l'innovazione 5-10
2006 Web semanticu corporativu Tecnulugia emergenti Peak of Inflated Expectations 5-10
2012 Web semanticu Big Data Peak of Inflated Expectations > 10
2015 Dati cunnessi Analisi Avanzata è Scienza di Dati Trough of Disillusion 5-10
2016 Gestione di l'ontologia di l'impresa Tecnulugia emergenti Trough of Disillusion > 10
2018 Grafichi di cunniscenza Tecnulugia emergenti Trigger di l'innovazione 5-10

Tuttavia, digià in "Hype Cycle..." 2018 un altru uptrend apparsu - Graficu di cunniscenza. Una certa reincarnazione hè accadutu: u graficu DBMS, à quale l'attenzione di l'utilizatori è e forze di i sviluppatori sò stati cambiati, sottu à l'influenza di e dumande di l'anzianu è l'abitudini di l'ultimi, cuminciaru à acquistà i contorni è u posizionamentu di i so predecessori cuncurrenti.

Quasi ogni graficu DBMS dice avà chì hè una piattaforma adatta per custruisce un "graficu di cunniscenza" corporativu ("dati ligati" hè qualchì volta rimpiazzatu da "dati cunnessi"), ma quantu sò ghjustificate tali rivendicazioni?

I basa di dati di gràficu sò sempre asemantichi, i dati in un DBMS graficu hè sempre u stessu silo di dati. L'identificatori di stringa invece di l'URI facenu u compitu di integrà dui DBMS di graficu sempre u listessu compitu di integrazione, mentre chì l'integrazione di dui repositori RDF hè spessu solu una questione di unisce dui grafici RDF. Un altru aspettu di l'asemanticità hè a non-reflexività di u mudellu di gràficu LPG, chì face difficiuli di gestisce i metadata cù a stessa plataforma.

Infine, i DBMS di graficu ùn anu micca mutori di inferenza o mutori di regula. I risultati di tali mutori ponu esse riproduciti complicà e dumande, ma questu hè pussibule ancu in SQL.

Tuttavia, i principali repositori RDF ùn anu micca prublemi à sustene u mudellu LPG. U più solidu hè l'approcciu prupostu à tempu in Blazegraph : u mudellu RDF*, chì combina RDF è GPL.

More

Pudete leghje più nantu à u supportu di u mudellu LPG da i almacenamenti RDF in l'articulu precedente nantu à Habré: "Chì succede avà cù i repositori RDF". About Knowledge Graphs and Data Fabric, speru chì un ghjornu un articulu separatu serà scrittu. A rùbbrica finali, cum'è faciule da capisce, hè stata scritta in fretta, ma ancu sei mesi dopu, sti cuncetti ùn sò micca assai più chjaru.

Letteratura

  1. Halpin, H., Monnin, A. (eds.) (2014). Ingegneria Filosofica: Versu una Filusufìa di u Web
  2. Allemang, D., Hendler, J. (2011) Semantic Web for the Working Ontologist (2nd ed.)
  3. Staab, S., Studer, R. (eds.) (2009) Handbook on Ontologies (2nd ed.)
  4. Wood, D. (ed.). (2011) Linking Enterprise Data
  5. Keet, M. (2018) Una Introduzione à l'Ingenieria Ontologica

Source: www.habr.com

Add a comment