Semantyske web en keppele gegevens. Korreksjes en tafoegings

Ik wol de oandacht fan it publyk in fragmint fan dit koartlyn publisearre boek presintearje:

Ontologyske modellering fan it bedriuw: metoaden en technologyen [Tekst]: monografy / [S. V. Gorshkov, S. S. Kralin, O. I. Mushtak, en oaren; útfierend redakteur S.V. Gorshkov]. - Jekaterinburg: Publishing House fan de Oeral Universiteit, 2019. - 234 p.: ill., tab.; 20 sm - Auth. oanjûn op 'e rêch fan tit. Mei. - Bibliograaf. oan 'e ein fan ch. - ISBN 978-5-7996-2580-1: 200 eksimplaren.

It doel fan it lizzen fan dit fragmint op Habré is fjouwerfâldich:

  • It is net wierskynlik dat immen sil wêze kinne om te hâlden dit boek yn 'e hannen as hy is gjin klant fan in respektearre SergeIndex; It is perfoarst net te keap.
  • Der binne korreksjes oanbrocht yn de tekst (se wurde hjirûnder net markearre) en der binne oanfollingen makke dy't net botte kompatibel binne mei it formaat fan de printe monografy: aktuele oantekeningen (ûnder spoilers) en hyperlinks.
  • Ik wol sammelje fragen en opmerkingsom dêr rekken mei te nimmen as dizze tekst yn in herziene foarm yn alle oare útjeften opnommen is.
  • In protte oanhingers fan semantysk web en keppele gegevens fiele noch altyd dat har rûnte sa smel is, benammen om't it grutte publyk noch net goed útlein is hoe geweldich it is om in oanhinger te wêzen fan it semantysk web en keppele gegevens. De skriuwer fan it fragmint, hoewol hy ta dizze rûnte heart, hâldt him net oan sa'n miening, mar achtet him dochs ferplichte om noch in poging te dwaan.

En sa,

Semantysk web

De evolúsje fan it ynternet kin wurde fertsjintwurdige as folget (of praat oer syn segminten foarme yn de folgjende folchoarder):

  1. Dokuminten op it ynternet. Key technologyen - Gopher, FTP, ensfh.
    It ynternet is in wrâldwide netwurk foar de útwikseling fan lokale boarnen.
  2. Ynternet dokuminten. Key technologyen binne HTML en HTTP.
    De aard fan 'e bleatstelde boarnen hâldt rekken mei de skaaimerken fan it medium foar har oerdracht.
  3. Ynternet gegevens. Key technologyen binne REST en SOAP API, XHR, ensfh.
    Yn it tiidrek fan ynternetapplikaasjes wurde net allinich minsken konsuminten fan boarnen.
  4. ynternet data. Key technologyen binne Linked Data technologyen.
    Dizze fjirde etappe, foarsein troch Berners-Lee, skepper fan wichtige technologyen fan 'e twadde en direkteur fan' e W3C, wurdt it Semantic Web neamd; Keppele gegevenstechnologyen binne ûntworpen om gegevens op it web net allinich masine-lêsber te meitsjen, mar ek "masine-begryplik".

Ut it folgjende sil de lêzer dúdlik wurde dat de kaaibegripen fan 'e twadde en fjirde etappe oerienkomme:

  • analogen fan URL binne URI's,
  • HTML is analoog oan RDF,
  • HTML-hyperlinks binne fergelykber mei URI-yngongen yn RDF-dokuminten.

Semantysk web is mear in systematyske fisy op 'e takomst fan it ynternet dan in spesifike spontane of lobbiede trend, hoewol it yn steat is om dizze lêste ek rekken te hâlden. Bygelyks, in wichtige eigenskip fan wat Web 2.0 neamd wurdt wurdt beskôge as "brûker-generearre ynhâld". It wurdt oproppen om dêr rekken mei te nimmen, benammen de W3C-oanbefelling "Web Annotaasje Ontology"en sa'n ûndernimming as Fêst.

Is it semantysk web dea?

As jo ​​wegerje unrealistyske ferwachtings, de sitewaasje mei it semantyske web is sawat itselde as by it kommunisme yn 'e dagen fan it ûntwikkele sosjalisme (en lit elk sels beslute oft de loyaliteit oan 'e betingstlike foarskriften fan Iljitsj yn acht wurdt). Sykmasines moai slagge websiden twinge om RDFa en JSON-LD te brûken en sels technologyen te brûken yn ferbân mei de hjirûnder beskreaune (Google Knowledge Graph, Bing Knowledge Graph).

Yn algemiene termen kin de skriuwer net sizze wat in gruttere fersprieding foarkomt, mar hy kin prate op basis fan persoanlike ûnderfining. D'r binne taken dy't "út it fak" wurde oplost yn 'e betingsten fan' e SW-offensyf, hoewol net heul massaal. As gefolch hawwe dejingen dy't dizze taken hawwe gjin middels fan twang tsjin dyjingen dy't in oplossing kinne leverje, en de lêsten sels in oplossing leverje troch de lêste is yn striid mei har bedriuwsmodellen. Dat wy geane troch mei it parsearjen fan HTML en lijm ferskate API's, de iene shittier nei de oare.

Linked Data technologyen hawwe lykwols ferspraat bûten it massaweb; It boek is trouwens wijd oan har tapassingen. Op it stuit ferwachtet de Linked Data-mienskip dat dizze technologyen noch wiidferspraat wurde mei Gartner fêststellen (of oankundigje, wat jo wolle) trends lykas Kennis Grafiken и data stof. Ik soe graach leauwe dat net "fyts" ymplemintaasje fan dizze konsepten sil wêze súksesfol, mar dy yn ferbân mei de W3C noarmen besprutsen hjirûnder.

Keppele gegevens

Berners-Lee definiearre keppele gegevens as it semantysk web dat goed dien is: in set fan oanpakken en technologyen om har ultime doelen te berikken. Basisprinsipes fan keppele gegevens Berners-Lee útsein folgjend.

Prinsipe 1. URI's brûke om entiteiten te neamen.

URI's binne globale entiteitsidentifikatoren yn tsjinstelling ta lokale string-identifikaasjes fan ynstjoerings. Dêrnei fûn dit prinsipe syn bêste útdrukking yn 'e Google Knowledge Graph slogan "dingen, net snaren".

Prinsipe 2. URI's brûke yn it HTTP-skema, sadat se derferearing kinne wurde.

Troch te ferwizen nei in URI, soe it mooglik wêze moatte om de betsjuttende efter dy betsjutting te krijen (de analogy mei de namme fan de operator "*» yn C); krekter, om wat foarstelling te krijen fan dit betsjuttend - ôfhinklik fan de wearde fan 'e HTTP-header Accept:. Miskien mei de komst fan it AR / VR-tiidrek sil it mooglik wêze om de boarne sels te krijen, mar foar no sil it wierskynlik in RDF-dokumint wêze dat it resultaat is fan in SPARQL-fraach DESCRIBE.

Prinsipe 3. Gebrûk fan W3C noarmen - yn it foarste plak RDF(S) en SPARQL - yn 't bysûnder by it ferwizen fan URI's.

Dizze yndividuele "lagen" fan 'e keppele gegevenstechnologystap, ek wol bekend as Semantyske Web Layer Cake, sil hjirûnder beskreaun wurde.

Prinsipe 4. Gebrûk fan ferwizings nei oare URI's by it beskriuwen fan entiteiten.

RDF lit jo josels beheine ta in ferbale beskriuwing fan in boarne yn natuerlike taal, en it fjirde prinsipe freget om dit net te dwaan. Mei universele neilibjen fan it earste prinsipe wurdt it mooglik om te ferwizen nei oaren, ynklusyf "frjemde", by it beskriuwen fan in boarne, en dêrom wurde de gegevens keppele neamd. Yn feite is it hast net te ûntkommen om URI's te brûken neamd yn it RDFS-wurdboek.

RDF

RDF (Resource Description Framework) - in formalisme foar it beskriuwen fan ûnderling besibbe entiteiten.

Oer entiteiten en harren relaasjes wurde útspraken makke fan 'e foarm "ûnderwerp-predikaat-objekt", neamd trijelingen. Yn it ienfâldichste gefal binne it ûnderwerp, predikaat en objekt beide URI's. Deselde URI kin yn ferskate trijelingen yn ferskate posysjes wêze: in ûnderwerp, in predikaat en in objekt wêze; de trijelingen foarmje dus in soarte fan grafyk dy't in RDF-grafyk hjit.

Underwerpen en objekten kin wêze net allinnich URIs, mar ek saneamde lege knopen, en objekten kinne ek wêze letterlike. Literalen binne eksimplaren fan primitive typen, besteande út in tekenrige foarstelling en in typespesifikaasje.

Foarbylden fan letterlik skriuwen (yn Turtle-syntaksis, mear oer dat hjirûnder): "5.0"^^xsd:float и "five"^^xsd:string. Letterlik mei type rdf:langString kin ek foarsjoen wurde fan in taaltag, yn Turtle stiet it sa: "five"@en и "пять"@ru.

Lege knopen binne "anonime" boarnen sûnder globale identifiers, dy't lykwols kinne wurde beweard; soarte fan eksistinsjele fariabelen.

Dus (dit is eins de hiele essinsje fan RDF):

  • it ûnderwerp is in URI as in lege knooppunt,
  • it predikaat is in URI,
  • objekt is in URI, in lege knooppunt, of in letterlike.

Wêrom kinne predikaten gjin lege knopen wêze?

De wierskynlike reden is de winsk om triplet ynformeel te begripen en oer te setten yn 'e taal fan earste-orde predikaatlogika. s p o lykas sokssawat Semantyske web en keppele gegevens. Korreksjes en tafoegingswêr Semantyske web en keppele gegevens. Korreksjes en tafoegings - predikaat, Semantyske web en keppele gegevens. Korreksjes en tafoegings и Semantyske web en keppele gegevens. Korreksjes en tafoegings - konstanten. D'r binne spoaren fan sa'n begryp yn it dokumint "LBase: Semantyk foar talen fan it semantysk web”, dy't de status hat fan in W3C-wurkgroepnota. Mei dit begryp, de trijeling s p []wêr [] - in lege knooppunt, sil oerset wurde as Semantyske web en keppele gegevens. Korreksjes en tafoegingswêr Semantyske web en keppele gegevens. Korreksjes en tafoegings - fariabele, mar hoe dan oersette s [] o? It W3C oanbefellingsdokumint "RDF 1.1 Semantyk” suggerearret in oare wize fan oersetten, mar tinkt dochs net de mooglikheid dat predikaten lege knopen binne.

Lykwols, Manu Sporny tastien.

RDF is in abstrakt model. RDF kin skreaun wurde (serialisearre) yn ferskate syntaksis: RDF/XML, Skyldpod (meast lêsber foar minsken) JSON-LD, HDT (binêr).

Deselde RDF kin serialisearre wurde yn RDF / XML op ferskate manieren, dus it makket gjin sin, bygelyks om de resultearjende XML te falidearjen mei XSD of besykje gegevens mei XPath te ekstrahearjen. Lykas is it net wierskynlik dat JSON-LD de winsk fan 'e gemiddelde Javascript-ûntwikkelder befrediget om mei RDF te wurkjen mei Javascript-dot en fjouwerkante beugelnotaasje (hoewol JSON-LD yn dy rjochting beweecht troch in meganisme oan te bieden framing).

De measte syntaksis biede manieren om lange URI's te koartsjen. Bygelyks, ad @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> yn Turtle sil dan tastean jo te skriuwen ynstee <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> just rdf:type.

RDFS

RDFS (RDF Schema) - basis wurdskat foar modellering, yntrodusearret de begripen fan eigendom en klasse, en eigenskippen lykas rdf:type, rdfs:subClassOf, rdfs:domain и rdfs:range. Mei it RDFS-wurdboek kinne bygelyks de folgjende jildige útdrukkingen skreaun wurde:

rdf:type         rdf:type         rdf:Property .
rdf:Property     rdf:type         rdfs:Class .
rdfs:Class       rdfs:subClassOf  rdfs:Resource .
rdfs:subClassOf  rdfs:domain      rdfs:Class .
rdfs:domain      rdfs:domain      rdf:Property .
rdfs:domain      rdfs:range       rdfs:Class .
rdfs:label       rdfs:range       rdfs:Literal .

RDFS is in beskriuwing en modellearwurdskat, mar is gjin beheiningstaal (hoewol't de offisjele spesifikaasje en leaves de mooglikheid fan sa'n gebrûk). It wurd "Skema" moat net yn deselde betsjutting begrepen wurde as yn 'e útdrukking "XML-skema". Bygelyks, :author rdfs:range foaf:Person betsjut dat rdf:type alle eigendom wearden :author - foaf:Person, mar betsjut net dat dit moat sein wurde fan tefoaren.

SPARQL

SPARQL (SPARQL-protokol en RDF Query Language) is in query-taal foar RDF-gegevens. Yn in ienfâldich gefal is in SPARQL-query in set fan samples dêr't de trijelingen fan 'e ûnderfrege grafyk oerienkomme. Fariabelen kinne pleatst wurde yn 'e posysjes fan ûnderwerpen, predikaten en objekten yn patroanen.

De query sil sokke fariabele wearden weromjaan dy't, as se ferfongen binne yn 'e samples, kinne resultearje yn in subgraf fan 'e RDF-grafyk dy't wurdt frege (in subset fan syn trijelingen). Fariabelen mei deselde namme yn ferskate samples fan triplets moatte deselde wearden hawwe.

Bygelyks, op 'e boppesteande set fan sân RDFS-aksioma's, soe de folgjende query weromkomme rdfs:domain и rdfs:range as wearden ?s и ?p respektivelik:

SELECT * WHERE {
 ?s ?p rdfs:Class .
 ?p ?p rdf:Property .
}

It is de muoite wurdich op te merken dat SPARQL deklaratyf is en gjin grafyske trochgongstaal is (mar guon RDF-repositories biede manieren om it query-útfierplan oan te passen). Dêrom kinne guon standertgrafykproblemen, lykas it finen fan it koartste paad, net oplost wurde yn SPARQL, ynklusyf it brûken fan it meganisme eigendom paden (mar, wer, yndividuele RDF-repositories biede spesjale tafoegings foar dizze taken).

SPARQL dielt net de oanname fan 'e iepenheid fan' e wrâld en folget de "negaasje as mislearring" oanpak, wêryn mooglik struktueren lykas FILTER NOT EXISTS {…}. Gegevensferdieling wurdt rekken holden mei it meganisme federearre queries.

It SPARQL-tagongspunt, in RDF-winkel dy't SPARQL-fragen kin ferwurkje, hat gjin direkte analogen fan 'e twadde etappe (sjoch it begjin fan dizze paragraaf). It kin fergelike wurde mei in databank, basearre op de ynhâld wêrfan HTML-siden binne oanmakke, mar tagonklik nei bûten. It SPARQL-tagongspunt is mear as in API-tagongspunt fan 'e tredde etappe, mar mei twa wichtige ferskillen. As earste is it mooglik om ferskate "atomyske" query's te kombinearjen yn ien (wat wurdt beskôge as in wichtich karakteristyk fan GraphQL), en twadde, sa'n API is folslein selsdokumintearre (wat HATEOAS besocht te berikken).

Polemyske opmerking

RDF is in manier om gegevens op it web te publisearjen, sadat RDF-repositories moatte wurde beskôge as dokumint DBMS's. Wier, om't RDF in grafyk is, gjin beam, bliken se tagelyk in grafyk te wêzen. It is geweldich dat it hielendal slagge is. Wa soe tocht hawwe dat d'r tûke minsken wêze soene dy't lege knopen ymplementearje. Hjir is Codd slagge net.

D'r binne ek minder folsleine manieren om tagong ta RDF-gegevens te organisearjen, bygelyks, Keppele gegevensfragminten (LDF) en Keppele Data Platfoarm (LDP).

ÛLE

ÛLE (Web Ontology Language) - in formalisme fan kennisfertsjintwurdiging, in syntaktyske ferzje fan beskriuwende logika Semantyske web en keppele gegevens. Korreksjes en tafoegings (oeral hjirûnder is it krekter om OWL 2 te sizzen, de earste ferzje fan OWL wie basearre op Semantyske web en keppele gegevens. Korreksjes en tafoegings).

De konsepten fan beskriuwingslogika yn OWL oerienkomme mei klassen, rollen oan eigenskippen, yndividuen behâlde har eardere namme. Axiomen wurde ek wol axiomen neamd.

Bygelyks, yn 'e saneamde Manchester syntaksis foar de OWL-notaasje, it axioma dat wy al kenne Semantyske web en keppele gegevens. Korreksjes en tafoegings sil sa skreaun wurde:

Class: Human
Class: Parent
   EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent

D'r binne oare syntaksis foar it skriuwen fan OWL, lykas funksjonele syntaksis, brûkt yn 'e offisjele spesifikaasje, en OWL/XML. Ek kin OWL wurde serialisearre yn abstrakte RDF-syntaksis en fierder - yn ien fan 'e spesifike syntaksis.

OWL is dûbeld yn relaasje ta RDF. Oan 'e iene kant kin it sjoen wurde as in soarte fan wurdboek dat RDFS útwreidet. Oan 'e oare kant is it in machtiger formalisme wêrfoar RDF gewoan in serialisaasjeformaat is. Net alle elemintêre OWL-konstruksjes kinne wurde skreaun mei in inkele RDF-triplet.

Ofhinklik fan hokker subset fan OWL-konstruksjes meie wurde brûkt, sprekt men fan saneamde OWL profilen. De standerdisearre en bekendste binne OWL EL, OWL RL en OWL QL. De kar fan profyl beynfloedet de berekkeningskompleksiteit fan typyske problemen. In folsleine set fan OWL-ûntwerpen om te passen Semantyske web en keppele gegevens. Korreksjes en tafoegings, hjit OWL DL. Soms sprekt men ek fan OWL Full, wêrby't OWL-konstruksjes mei de folsleine frijheid dy't yn RDF binne, sûnder semantyske en berekkeningsbeheinings brûkt wurde meie. Semantyske web en keppele gegevens. Korreksjes en tafoegings. Iets kin bygelyks sawol in klasse as in eigendom wêze. OWL Fol is ûnoplosber.

De kaaiprinsipes fan it taheakjen fan gefolgen yn OWL binne de akseptaasje fan 'e iepen wrâld oanname (iepen wrâld oanname, O.W.A.) en de ôfwizing fan 'e oanname fan' e unike namme, ONE). Hjirûnder sille wy sjen wêr't dizze begjinsels ta kinne liede en guon fan 'e konstruksjes fan OWL yntrodusearje.

Lit de ontology it folgjende fragmint befetsje (yn Manchester-syntaksis):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human
   Facts: hasChild Alice, hasChild Bob, hasChild Carol

Sil it folgje út wat sein is dat Johannes in protte bern hat? It ôfwizen fan UNA soe de konklúzjemotor twinge om dizze fraach negatyf te beantwurdzjen, om't Alice en Bob hiel goed deselde persoan kinne wêze. Foar it folgjende plakfine, moatte wy it folgjende axioma tafoegje:

DifferentIndividuals: Alice, Bob, Carol, John

Lit it ontologyfragmint no de folgjende foarm hawwe (Johannes wurdt ferklearre in protte bern te hawwen, mar hy hat mar twa bern):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human, manyChildren
   Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John

Sil dizze ontology ynkonsekwint wêze (wat kin wurde ynterpretearre as bewiis fan ûnjildiche gegevens)? It akseptearjen fan OWA sil de konklúzjemotor negatyf reagearje: "ergens" oars (yn in oare ontology) soe goed sein wurde kinne dat Carol ek it bern fan John is.

Om dizze mooglikheid te eliminearjen, litte wy in nij feit oer John tafoegje:

Individual: John
   Facts: hasChild Alice, hasChild Bob, not hasChild Carol

Om it uterlik fan oare bern út te sluten, litte wy sizze dat alle wearden fan it pân "in bern hawwe" binne minsken, wêrfan wy mar fjouwer hawwe:

ObjectProperty: hasChild
   Domain: Human
   Сharacteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }

No sil de ontology inkonsistint wurde, wat de konklúzjemotor net sil ûntbrekke. Mei de lêste fan 'e axioma's hawwe wy de wrâld sa'n bytsje "sletten", en sjogge hoe't de mooglikheid dat Johannes syn eigen bern is útsletten is.

Keppeling Enterprise Data

In set oanpakken en technologyen Linked Data wie oarspronklik bedoeld foar it publisearjen fan gegevens op it web. It brûken fan se yn in intracorporate omjouwing stiet foar in oantal swierrichheden.

Bygelyks, yn in sletten bedriuwsomjouwing is de deduktive krêft fan OWL basearre op it oannimmen fan OWA en de ôfwizing fan UNA, oplossings dreaun troch de iepen en ferspraat aard fan it web, te swak. En hjir binne de folgjende útgongen mooglik.

  • It jaan fan OWL mei semantyk, ymplisearret de ôfwizing fan OWA en it oannimmen fan UNA, de ymplemintaasje fan 'e korrespondearjende konklúzjemotor. - dit paad lâns giet Stardog RDF repository.
  • It ferlitten fan de deduktive krêft fan OWL yn it foardiel fan regelmotoren. - Stardog stipet SWRL; Jena en GraphDB biede eigen talen regels.
  • Ofwizing fan de deduktive mooglikheden fan OWL, it brûken fan ien of oare subset tichtby RDFS foar modellering. - Sjoch mear hjiroer hjirûnder.

In oar probleem is it wichtiger omtinken dat de bedriuwswrâld kin besteegje oan problemen mei gegevenskwaliteit en it gebrek oan ark foar gegevensvalidaasje yn 'e Linked Data-stapel. De útgongen binne as folget.

  • Nochris, it brûken fan OWL-konstruksjes mei semantyk yn 'e sletten wrâld en unykheid fan nammen om te falidearjen as d'r in passende ynferzjemotor is.
  • Gebrûk SHACL, standerdisearre neidat de list mei Semantic Web Layer Cake-lagen fêst is (lykwols kin it ek brûkt wurde as in regelsmotor), of ShEx.
  • It realisearjen fan dat alles úteinlik wurdt dien troch SPARQL-fragen, it meitsjen fan jo eigen ienfâldige gegevensvalidaasjemeganisme mei har.

Sels in folsleine ôfwizing fan deduktive mooglikheden en falidaasje-ark lit de keppele gegevens-stapel lykwols bûten konkurrinsje yn taken dy't lânskip fergelykber binne mei it iepen en ferspraat web - yn taken foar gegevensyntegraasje.

Hoe sit it mei in gewoan bedriuwsynformaasjesysteem?

Dit is mooglik, mar men moat fansels bewust wêze fan krekt hokker problemen de passende technologyen moatte oplosse. Ik sil hjir in typyske reaksje fan ûntwikkelingsdielnimmers beskriuwe om sjen te litten hoe't dizze technologystap der útsjocht út it eachpunt fan konvinsjonele IT. Doet my in bytsje tinken oan de gelikenis fan 'e oaljefant:

  • Business analist: RDF is wat as in direkt opslein logysk model.
  • Systems Analyst: RDF is like EAV, allinich mei in boskje yndeksen en in handige query-taal.
  • developer: goed, it is allegear yn 'e geast fan rike modellen en konsepten mei lege koade, oan it lêzen wie oer it koartlyn.
  • Projektlieder: ja dat is it it ynstoarten fan de steapel!

Praktyk lit sjen dat de steapel wurdt meast brûkt yn taken yn ferbân mei de distribúsje en heterogeniteit fan gegevens, Bygelyks, by it bouwen fan systemen fan de klasse MDM (Master Data Management) of DWH (Data Warehouse). Sokke problemen besteane yn elke yndustry.

Wat yndustry-spesifike applikaasjes oanbelanget, binne Linked Data-technologyen op it stuit it populêrst yn 'e folgjende yndustry.

  • biomedyske technologyen (wêr't har populariteit liket te relatearjen oan de kompleksiteit fan it fakgebiet);

aktueel

Yn it "Kookpunt" waard okkerdeis in konferinsje organisearre troch de feriening "National Medical Knowledge Base" hâlden "Unifikaasje fan ontologyen. Fan teory oant praktyske tapassing".

  • fabrikaazje en eksploitaasje fan komplekse produkten (grutte engineering, oalje- en gasproduksje; meastentiids is it in standert ISO 15926);

aktueel

Ek hjir is de reden de kompleksiteit fan it fakgebiet, as bygelyks yn 'e streamopstap, as wy prate oer de oalje- en gasindustry, in ienfâldige boekhâlding wat CAD-funksjes moat hawwe.

Yn 2008 hie Chevron in represintative ynstallaasje de konferinsje.

ISO 15926 like úteinlik in bytsje swier foar de oalje- en gasyndustry (en fûn hast mear gebrûk yn meganyske technyk). Allinnich Statoil (Equinor) rekke him yngeand oan, yn Noarwegen in gehiel ekosysteem. Oaren besykje har eigen ding te dwaan. Bygelyks, neffens geroften, is it ynlânske Ministearje fan Enerzjy fan doel om in "konseptueel ontologysk model fan it brânstof- en enerzjykompleks" te meitsjen, fergelykber, blykber, makke foar de elektryske enerzjy yndustry.

  • finansjele ynstellingen (sels XBRL kin sjoen wurde as in hybride fan SDMX en RDF Data Cube ontology);

aktueel

LinkedIn hat oan it begjin fan it jier de skriuwer aktyf spam mei fakatueres fan hast alle reuzen fan 'e finansjele yndustry, dy't hy ken fan' e TV-searje Suits: Goldman Sachs, JPMorgan Chase en/of Morgan Stanley, Wells Fargo, SWIFT/Visa/ Mastercard, Bank of America, Citigroup, de Fed, Deutsche Bank ... Elkenien socht wierskynlik nei immen om nei te stjoeren Knowledge Graph Conference. Hiel wat wisten te finen: finansjele ynstellingen besette alles earste dei moarns.

Op HeadHunter kaam wat nijsgjirrichs allinich fan Sberbank oer, it gie oer "EAV-opslach mei in RDF-like gegevensmodel."

Wierskynlik is it ferskil yn 'e graad fan leafde foar de oerienkommende technologyen fan ynlânske en westerske finansjele ynstellingen te tankjen oan it transnasjonaal karakter fan' e aktiviteiten fan 'e lêste. Blykber fereasket yntegraasje oer steatsgrinzen kwalitatyf ferskillende organisatoaryske en technyske oplossingen.

  • fraach-antwurd-systemen dy't kommersjele applikaasjes hawwe (IBM Watson, Apple Siri, Google Knowledge Graph);

aktueel

Trouwens, de skepper fan Siri, Thomas Gruber, is de skriuwer fan 'e tige definysje fan ontology (yn' e IT-sin) as in "konseptualisaasjespesifikaasje". Neffens my feroaret de weryndieling fan wurden yn dizze definysje de betsjutting net, wat miskien oanjout dat it der net is.

  • publikaasje fan strukturearre gegevens (mei goede reden kin dit al taskreaun wurde oan Linked Open Data).

aktueel

Grutte fans fan Linked Data binne de saneamde GLAM: Galleries, Libraries, Archives, and Musea. It is genôch om hjir te sizzen dat om MARC21 te ferfangen, de Library of Congress befoarderet BIBFRAME, dy't jout in basis foar de takomst fan bibliografyske beskriuwing en fansels basearre op RDF.

Wikidata wurdt gauris oanhelle as foarbyld fan in slagge projekt op it mêd fan Linked Open Data - in soarte fan masinelêsbere ferzje fan Wikipedia, wêrfan de ynhâld, yn tsjinstelling ta DBPedia, net oanmakke wurdt troch it ymportearjen fan artikels út ynfoboksen, mar is min of mear mei de hân makke (en wurdt dêrnei in boarne fan ynformaasje foar deselde ynfoboksen).

Ek oanrikkemandearre foar resinsje list brûkers fan it Stardog RDF-repository op 'e Stardog-webside yn' e seksje "Klanten".

Hoe dan ek, yn 'e Gartner "Hype Cycle foar Emerging Technologies" 2016 "Enterprise Taxonomy and Ontology Management" wurdt pleatst yn 'e midden fan in delgong yn' e delling fan teloarstelling mei it útsicht op it berikken fan in "produktiviteitsplato" net earder as yn 10 jier.

Ferbine Enterprise Data

Foarsizzingen, foarsizzingen, foarsizzingen ...

Ut histoarysk belang haw ik de prognosen fan Gartner fan ferskate jierren gearfette foar de technologyen fan belang foar ús yn 'e tabel hjirûnder.

Год Technology Melde Posysje Jierren nei plato
2001 Semantysk web Opkommende Technologies Ynnovaasje Trigger 5-10
2006 Corporate Semantic Web Opkommende Technologies Peak fan opblaasde ferwachtings 5-10
2012 Semantysk web Big Data Peak fan opblaasde ferwachtings > 10
2015 Keppele gegevens Avansearre Analytics en Data Science Trog fan desyllúzje 5-10
2016 Enterprise Ontology Management Opkommende Technologies Trog fan desyllúzje > 10
2018 Kennis Grafiken Opkommende Technologies Ynnovaasje Trigger 5-10

Lykwols, al yn "Hype Cycle ..." 2018 in oare uptrend ferskynde - Knowledge Graphs. In beskate reynkarnaasje fûn plak: grafyk DBMS, dêr't de oandacht fan brûkers en de krêften fan ûntwikkelders bliken te wikseljen, ûnder ynfloed fan 'e oanfragen fan' e eardere en de gewoanten fan 'e lêste, begon de kontoeren en posisjonearring te krijen. harren konkurrint foargongers.

Hast elke grafyk DBMS beweart no in gaadlik platfoarm te wêzen foar it bouwen fan in bedriuw "kennisgrafyk" ("keppele gegevens" wurdt soms ferfongen troch "ferbûne gegevens"), mar hoe rjochtfeardich binne sokke oanspraken?

Grafyske databases binne noch altyd asemantysk, de gegevens yn in grafyk DBMS binne noch altyd deselde gegevenssilo. Stringidentifikatoren ynstee fan URI's meitsje de taak fan it yntegrearjen fan twa grafyske DBMS's noch deselde yntegraasjetaak, wylst it yntegrearjen fan twa RDF-repositories faaks gewoan in kwestje is fan it gearfoegjen fan twa RDF-grafiken. In oar aspekt fan asemantiteit is de net-reflexiviteit fan it LPG-grafykmodel, wat it lestich makket om metadata te behearjen mei itselde platfoarm.

Uteinlik hawwe grafyske DBMS's gjin konklúzjemotoren of regelmotoren. De resultaten fan sokke motoren kinne wurde reprodusearre troch yngewikkelde queries, mar dit is mooglik sels yn SQL.

De liedende RDF-repositories hawwe lykwols gjin probleem om it LPG-model te stypjen. De meast solide is de oanpak dy't ien kear yn Blazegraph foarsteld is: it RDF*-model, dat RDF en LPG kombineart.

Mear

Jo kinne mear lêze oer de stipe fan it LPG-model troch RDF-opslach yn it foarige artikel oer Habré: "Wat bart der no mei RDF-repositories". Oer Knowledge Graphs en Data Fabric, ik hoopje dat der ien dei in apart artikel skreaun wurdt. De lêste paragraaf, lykas maklik te begripen, waard skreaun yn in haast, lykwols, sels seis moanne letter, dizze begripen binne net folle dúdliker.

Literatuer

  1. Halpin, H., Monnin, A. (eds.) (2014). Filosofyske yngenieur: nei in filosofy fan it web
  2. Allemang, D., Hendler, J. (2011) Semantic Web for the Working Ontologist (2e ed.)
  3. Staab, S., Studer, R. (eds.) (2009) Handbook on Ontologies (2e ed.)
  4. Wood, D. (ed.). (2011) Keppeling Enterprise Data
  5. Keet, M. (2018) An Introduction to Ontology Engineering

Boarne: www.habr.com

Add a comment