Gwe Semantig a Data Cysylltiedig. Cywiriadau ac ychwanegiadau

Hoffwn gyflwyno i’r cyhoedd ddarn o’r llyfr hwn a gyhoeddwyd yn ddiweddar:

Modelu ontolegol menter: dulliau a thechnolegau [Testun]: monograff / [S. V. Gorshkov, S. S. Kralin, O. I. Mushtak ac eraill; golygydd gweithredol S.V. Gorshkov]. - Ekaterinburg: Prifysgol Ural Publishing House, 2019. - 234 p.: ill., table; 20 cm.— Awdwr. a nodir ar y tit cefn. Gyda. —Llyfryddiaeth ar ddiwedd ch. — ISBN 978-5-7996-2580-1: 200 copi.

Mae pwrpas postio'r darn hwn ar Habré yn bedwarplyg:

  • Mae'n annhebygol y bydd unrhyw un yn gallu dal y llyfr hwn yn eu dwylo os nad yw'n gleient i berson uchel ei barch Mynegai Serge; Yn bendant nid yw ar werth.
  • Mae cywiriadau wedi'u gwneud i'r testun (nid ydynt wedi'u hamlygu isod) a gwnaed ychwanegiadau nad ydynt yn gydnaws iawn â fformat monograff printiedig: nodiadau amserol (o dan sbwylwyr) a hypergysylltiadau.
  • Rydw i eisiau casglu cwestiynau a sylwadau, er mwyn eu cymryd i ystyriaeth wrth gynnwys y testun hwn ar ffurf ddiwygiedig mewn unrhyw gyhoeddiadau eraill.
  • Mae llawer o ymlynwyr y We Semantig a Data Cysylltiedig yn dal i gredu bod eu cylch mor gul, yn bennaf oherwydd nad yw'r cyhoedd wedi'u hesbonio'n iawn eto pa mor wych yw bod yn ymlynwr i'r We Semantig a Data Cysylltiedig. Nid yw awdwr y dernyn, er ei fod yn perthyn i'r cylch hwn, yn arddel y farn hon, ond, er hyny, yn ystyried ei hun dan rwymedigaeth i wneyd ymgais arall.

Felly,

Gwe Semantig

Gellir cynrychioli esblygiad y Rhyngrwyd fel a ganlyn (neu siaradwch am ei segmentau a ffurfiwyd yn y drefn a nodir isod):

  1. Dogfennau ar y Rhyngrwyd. Technolegau allweddol - Gopher, FTP, ac ati.
    Mae'r Rhyngrwyd yn rhwydwaith byd-eang ar gyfer cyfnewid adnoddau lleol.
  2. Dogfennau rhyngrwyd. Technolegau allweddol yw HTML a HTTP.
    Mae natur yr adnoddau datguddiedig yn ystyried nodweddion eu cyfrwng trawsyrru.
  3. Data rhyngrwyd. Technolegau allweddol - REST a SOAP API, XHR, ac ati.
    Mae cyfnod cymwysiadau Rhyngrwyd, nid yn unig yn dod yn ddefnyddwyr adnoddau.
  4. Data rhyngrwyd. Technolegau Data Cysylltiedig yw technolegau allweddol.
    Gelwir y pedwerydd cam hwn, a ragfynegwyd gan Berners-Lee, crëwr yr ail dechnolegau craidd a chyfarwyddwr y W3C, yn We Semantaidd; Mae technolegau Data Cysylltiedig wedi’u cynllunio i wneud data ar y we nid yn unig yn ddarllenadwy gan beiriannau, ond hefyd yn “ddealladwy gan beiriant.”

O’r hyn sy’n dilyn, bydd y darllenydd yn deall y gyfatebiaeth rhwng cysyniadau allweddol yr ail a’r pedwerydd cam:

  • Mae URLs yn cyfateb i URIs,
  • yr analog o HTML yw RDF,
  • Mae hypergysylltiadau HTML yn debyg i ddigwyddiadau URI mewn dogfennau RDF.

Mae'r We Semantig yn fwy o weledigaeth systemig o ddyfodol y Rhyngrwyd na thuedd ddigymell neu lobïo benodol, er y gall gymryd y rhain i ystyriaeth. Er enghraifft, mae nodwedd bwysig o’r hyn a elwir yn Web 2.0 yn cael ei hystyried yn “gynnwys a gynhyrchir gan ddefnyddwyr.” Yn benodol, gofynnir i argymhelliad W3C ei gymryd i ystyriaeth “Ontoleg Anodi Gwe"ac ymgymeriad fel Solid.

Ydy'r We Semantig yn Farw?

Os byddwch yn gwrthod disgwyliadau afrealistig, mae’r sefyllfa gyda’r we semantig fwy neu lai’r un peth â’r sefyllfa gyda chomiwnyddiaeth yn ystod cyfnod sosialaeth ddatblygedig (ac os gwelir teyrngarwch i ofynion amodol Ilyich, gadewch i bawb benderfynu drostynt eu hunain). Peiriannau chwilio eithaf llwyddiannus gorfodi gwefannau i ddefnyddio RDFa a JSON-LD a'u hunain yn defnyddio technolegau sy'n gysylltiedig â'r rhai a ddisgrifir isod (Google Knowledge Graph, Bing Knowledge Graph).

Yn gyffredinol, ni all yr awdur ddweud beth sy'n atal lledaeniad mwy, ond gall siarad ar sail profiad personol. Mae yna broblemau y gellid eu datrys “allan o'r bocs” yn amodau'r ymosodiad SW, er nad ydynt yn gyffredin iawn. O ganlyniad, nid oes gan y rhai sy'n wynebu'r tasgau hyn unrhyw fodd o orfodi yn erbyn y rhai sy'n gallu darparu datrysiad, tra bod darpariaeth annibynnol yr olaf o ateb yn gwrth-ddweud eu modelau busnes. Felly rydyn ni'n parhau i ddosrannu HTML a gludo amrywiol APIs ynghyd, gyda'n gilydd yn fwy shittier.

Fodd bynnag, mae technolegau Data Cysylltiedig wedi lledaenu y tu hwnt i'r We brif ffrwd; Mae'r llyfr, mewn gwirionedd, yn ymroddedig i'r cymwysiadau hyn. Ar hyn o bryd, mae'r gymuned Data Cysylltiedig yn disgwyl i'r technolegau hyn ddod yn fwy eang fyth diolch i recordiad (neu gyhoeddiad, fel y dymunwch) Gartner o dueddiadau megis Graffiau Gwybodaeth и Ffabrig Data. Hoffwn gredu nad gweithrediad “beic” y cysyniadau hyn fydd yn llwyddiannus, ond y rhai sy'n ymwneud â safonau W3C a drafodir isod.

Data Cysylltiedig

Diffiniodd Berners-Lee Ddata Cysylltiedig fel y we semantig “wedi’i wneud yn iawn”: set o ddulliau a thechnolegau sy’n ei alluogi i gyflawni ei nodau terfynol. Egwyddorion sylfaenol Data Cysylltiedig Berners-Lee amlygwyd y canlynol.

Egwyddor 1. Defnyddio URI i enwi endidau.

Dynodwyr endid byd-eang yw URIs yn hytrach na dynodwyr llinynnol lleol ar gyfer cofnodion. Yn dilyn hynny, mynegwyd yr egwyddor hon orau yn slogan Graff Gwybodaeth Google “pethau, nid llinynnau'.

Egwyddor 2. Defnyddio URI yn y cynllun HTTP fel y gellir eu dadgyfeirio.

Wrth gyfeirio at URI, dylai fod yn bosibl cael yr arwydd y tu ôl i'r arwyddwr hwnnw (mae'r gyfatebiaeth ag enw'r gweithredwr " yn glir yma).*" yn C); yn fwy manwl gywir, i gael rhywfaint o gynrychiolaeth o hyn - yn dibynnu ar werth y pennawd HTTP Accept:. Efallai, gyda dyfodiad yr oes AR/VR, y bydd modd cael yr adnodd ei hun, ond am y tro, yn fwyaf tebygol, dogfen RDF fydd hi, sef canlyniad gweithredu ymholiad SPARQL DESCRIBE.

Egwyddor 3. Defnyddio safonau W3C - RDF(S) a SPARQL yn bennaf - yn arbennig wrth gyfeirio at URIs.

Mae'r “haenau” unigol hyn o'r pentwr technoleg Data Cysylltiedig, a elwir hefyd yn Cacen Semantig We Haen, yn cael ei ddisgrifio isod.

Egwyddor 4. Defnyddio cyfeiriadau at URIs eraill wrth ddisgrifio endidau.

Mae RDF yn caniatáu ichi gyfyngu'ch hun i ddisgrifiad llafar o adnodd mewn iaith naturiol, ac mae'r bedwaredd egwyddor yn galw am beidio â gwneud hyn. Os cedwir at yr egwyddor gyntaf yn gyffredinol, daw’n bosibl wrth ddisgrifio adnodd i gyfeirio at eraill, gan gynnwys rhai “tramor”, a dyna pam y gelwir y data yn gysylltiedig. Mewn gwirionedd, mae bron yn anochel defnyddio URIs a enwir yng ngeirfa RDFS.

RDF

RDF Mae (Fframwaith Disgrifiad Adnoddau) yn ffurfioldeb ar gyfer disgrifio endidau cydberthynol.

Gwneir datganiadau o'r math “pwnc-rhagfynegiad-gwrthrych”, a elwir yn dripledi, am endidau a'u perthnasoedd. Yn yr achos symlaf, mae'r gwrthrych, y rhagfynegiad a'r gwrthrych i gyd yn URI. Gall yr un URI fod mewn gwahanol swyddi mewn gwahanol dripledi : bod yn wrthddrych, yn rhagfynegiad, ac yn wrthddrych ; Felly, mae'r tripledi yn ffurfio math o graff a elwir yn graff RDF.

Gall pynciau a gwrthrychau fod nid yn unig yn URI, ond hefyd fel y'u gelwir nodau gwag, a gall gwrthrychau hefyd fod llythrennol. Mae llythrennol yn enghreifftiau o fathau cyntefig sy'n cynnwys cynrychioliad llinynnol a dynodiad math.

Enghreifftiau o ysgrifennu llythrennol (mewn cystrawen Turtle, mwy amdano isod): "5.0"^^xsd:float и "five"^^xsd:string. Llythrennau gyda math rdf:langString gellir ei gyfarparu â thag iaith hefyd; yn Turtle mae wedi'i ysgrifennu fel hyn: "five"@en и "пять"@ru.

Mae nodau gwag yn adnoddau “dienw” heb ddynodwyr byd-eang, y gellir, fodd bynnag, wneud datganiadau amdanynt; math o newidynnau dirfodol.

Felly (dyma, mewn gwirionedd, holl bwynt RDF):

  • mae'r pwnc yn URI neu'n nod gwag,
  • URI yw'r rhagfynegiad,
  • gwrthrych yw URI, nod gwag, neu llythrennol.

Pam na all rhagfynegiadau fod yn nodau gwag?

Y rheswm tebygol yw'r awydd i ddeall yn anffurfiol a chyfieithu tripledi i iaith rhesymeg trefn gyntaf. s p o fel rhywbeth fel Gwe Semantig a Data Cysylltiedig. Cywiriadau ac ychwanegiadaulle Gwe Semantig a Data Cysylltiedig. Cywiriadau ac ychwanegiadau - rhagfynegi, Gwe Semantig a Data Cysylltiedig. Cywiriadau ac ychwanegiadau и Gwe Semantig a Data Cysylltiedig. Cywiriadau ac ychwanegiadau - cysonion. Ceir olion y ddealltwriaeth hon yn y ddogfen “LBase: Semanteg ar gyfer Ieithoedd y We Semantaidd", sydd â statws nodyn gweithgor W3C. Gyda'r ddealltwriaeth hon, y tripled s p []lle [] — nôd gwag, yn cael ei gyfieithu fel Gwe Semantig a Data Cysylltiedig. Cywiriadau ac ychwanegiadaulle Gwe Semantig a Data Cysylltiedig. Cywiriadau ac ychwanegiadau - amrywiol, ond sut felly i gyfieithu s [] o? Dogfen gyda statws Argymhelliad W3C "RDF 1.1 Semanteg” yn cynnig dull cyfieithu arall, ond nid yw'n ystyried y posibilrwydd o fod yn nodau gwag o hyd.

Fodd bynnag, Manu Sporni caniateir.

Mae RDF yn fodel haniaethol. Gellir ysgrifennu RDF (cyfresi) mewn gwahanol gystrawenau: RDF/XML, Crwban (mwyaf darllenadwy dynol), JSON-LD, HDT (deuaidd).

Gellir cyfresoli'r un RDF i RDF/XML mewn gwahanol ffyrdd, felly, er enghraifft, nid yw'n gwneud unrhyw synnwyr i ddilysu'r XML canlyniadol gan ddefnyddio XSD na cheisio echdynnu data gan ddefnyddio XPath. Yn yr un modd, mae JSON-LD yn annhebygol o fodloni awydd datblygwr Javascript ar gyfartaledd i weithio gydag RDF gan ddefnyddio nodiant dot a braced sgwâr Javascript (er bod JSON-LD yn symud i'r cyfeiriad hwnnw trwy gynnig mecanwaith fframio).

Mae'r rhan fwyaf o gystrawenau yn cynnig ffyrdd o fyrhau URIau hir. Er enghraifft, hysbyseb @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> yn Crwban bydd wedyn yn caniatáu i chi ysgrifennu yn lle hynny <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> yn unig rdf:type.

RDFS

RDFS (Sgema RDF) - geirfa fodelu sylfaenol, yn cyflwyno cysyniadau eiddo a dosbarth a phriodweddau megis rdf:type, rdfs:subClassOf, rdfs:domain и rdfs:range. Gan ddefnyddio geiriadur RDFS, er enghraifft, gellir ysgrifennu'r ymadroddion dilys canlynol:

rdf:type         rdf:type         rdf:Property .
rdf:Property     rdf:type         rdfs:Class .
rdfs:Class       rdfs:subClassOf  rdfs:Resource .
rdfs:subClassOf  rdfs:domain      rdfs:Class .
rdfs:domain      rdfs:domain      rdf:Property .
rdfs:domain      rdfs:range       rdfs:Class .
rdfs:label       rdfs:range       rdfs:Literal .

Mae RDFS yn eirfa ddisgrifio a modelu, ond nid yw'n iaith gyfyngol (er bod y fanyleb swyddogol a dail posibilrwydd o ddefnydd o'r fath). Ni ddylid deall y gair "Schema" yn yr un ystyr ag yn yr ymadrodd "XML Schema". Er enghraifft, :author rdfs:range foaf:Person yn golygu hynny rdf:type holl werthoedd eiddo :author - foaf:Person, ond nid yw'n golygu y dylid dweud hyn ymlaen llaw.

SPARQL

SPARQL (Protocol SPARQL ac Iaith Ymholiad RDF) - iaith ymholiad ar gyfer data RDF. Mewn achos syml, mae ymholiad SPARQL yn set o samplau y mae tripledi o'r graff dan sylw yn cael eu paru yn eu herbyn. Gall patrymau gynnwys newidynnau mewn safleoedd pwnc, rhagfynegiad a gwrthrych.

Bydd yr ymholiad yn dychwelyd gwerthoedd newidiol o'r fath a all, o'u hamnewid yn y samplau, arwain at isgraff o'r graff RDF a holwyd (is-set o'i dripledi). Rhaid i newidynnau o'r un enw mewn gwahanol samplau o dripledi fod â'r un gwerthoedd.

Er enghraifft, o ystyried y set uchod o saith axiom RDFS, bydd yr ymholiad canlynol yn dychwelyd rdfs:domain и rdfs:range fel gwerthoedd ?s и ?p yn unol â hynny:

SELECT * WHERE {
 ?s ?p rdfs:Class .
 ?p ?p rdf:Property .
}

Mae'n werth nodi bod SPARQL yn ddatganiadol ac nad yw'n iaith ar gyfer disgrifio croesi graff (fodd bynnag, mae rhai cadwrfeydd RDF yn cynnig ffyrdd o addasu cynllun gweithredu ymholiad). Felly, ni ellir datrys rhai problemau graff safonol, er enghraifft, dod o hyd i'r llwybr byrraf, yn SPARQL, gan gynnwys defnyddio'r llwybrau eiddo (ond, unwaith eto, mae ystorfeydd RDF unigol yn cynnig estyniadau arbennig i ddatrys y problemau hyn).

Nid yw SPARQL yn rhannu’r rhagdybiaeth bod y byd yn agored ac mae’n dilyn y dull “negyddu fel methiant”, lle posibl dyluniadau megis FILTER NOT EXISTS {…}. Mae dosbarthiad data yn cael ei ystyried gan ddefnyddio'r mecanwaith ymholiadau ffederal.

Nid oes gan bwynt mynediad SPARQL - storfa RDF sy'n gallu prosesu ymholiadau SPARQL - analogau uniongyrchol o'r ail gam (gweler dechrau'r paragraff hwn). Gellir ei gymharu â chronfa ddata, yn seiliedig ar ei chynnwys y cynhyrchwyd tudalennau HTML, ond sy'n hygyrch i'r tu allan. Mae pwynt mynediad SPARQL yn fwy tebyg i bwynt mynediad API o'r trydydd cam, ond gyda dau brif wahaniaeth. Yn gyntaf, mae'n bosibl cyfuno sawl ymholiad “atomig” yn un (sy'n cael ei ystyried yn nodwedd allweddol o GraphQL), ac yn ail, mae API o'r fath yn gwbl hunanddogfennol (sef yr hyn y ceisiodd HATEOAS ei gyflawni).

Sylw polemical

Mae RDF yn ffordd o gyhoeddi data ar y we, felly dylid ystyried storio RDF yn ddogfen DBMS. Yn wir, gan mai graff yw RDF ac nid coeden, maent hefyd yn seiliedig ar graffiau. Mae'n anhygoel ei fod wedi gweithio allan o gwbl. Pwy fyddai wedi meddwl y byddai yna bobl glyfar a fyddai'n gweithredu nodau gwag. Mae Codd yma ni weithiodd allan.

Mae yna hefyd lai o ffyrdd llawn sylw i drefnu mynediad i ddata RDF, er enghraifft, Darnau Data Cysylltiedig (LDF) a Llwyfan Data Cysylltiedig (CDLl).

OWL

OWL (Iaith Ontoleg We) - ffurfioldeb ar gyfer cynrychioli gwybodaeth, fersiwn gystrawen o resymeg disgrifio Gwe Semantig a Data Cysylltiedig. Cywiriadau ac ychwanegiadau (ym mhobman isod mae'n fwy cywir dweud OWL 2, y seiliwyd y fersiwn gyntaf o OWL arno Gwe Semantig a Data Cysylltiedig. Cywiriadau ac ychwanegiadau).

Mae cysyniadau rhesymeg ddisgrifiadol yn OWL yn cyfateb i ddosbarthiadau, mae rolau'n cyfateb i briodweddau, mae unigolion yn cadw eu henw blaenorol. Gelwir axiomau hefyd yn axiomau.

Er enghraifft, yn yr hyn a elwir Cystrawen Manceinion ar gyfer nodiant OWL axiom sydd eisoes yn hysbys i ni Gwe Semantig a Data Cysylltiedig. Cywiriadau ac ychwanegiadau yn cael ei ysgrifennu fel hyn:

Class: Human
Class: Parent
   EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent

Mae cystrawenau eraill ar gyfer ysgrifennu OWL, megis cystrawen swyddogaethol, a ddefnyddir yn y fanyleb swyddogol, a OWL/XML. Yn ogystal, gellir cyfresoli OWL i gystrawen haniaethol RDF and further - yn unrhyw un o'r cystrawennau penodol.

Mae gan OWL berthynas ddeuol ag RDF. Ar y naill law, gellir ei ystyried fel rhyw fath o eiriadur sy'n ymestyn RDFS. Ar y llaw arall, mae'n ffurfioldeb mwy pwerus y mae RDF yn fformat cyfresoli yn unig ar ei gyfer. Ni ellir ysgrifennu pob llun OWL elfennol gan ddefnyddio un tripled RDF.

Yn dibynnu ar ba is-set o luniadau OWL y caniateir eu defnyddio, maen nhw'n siarad am yr hyn a elwir Proffiliau OWL. Y rhai safonol ac enwocaf yw OWL EL, OWL RL ac OWL QL. Mae'r dewis o broffil yn effeithio ar gymhlethdod cyfrifiannol problemau nodweddiadol. Set gyflawn o luniadau OWL sy'n cyfateb i Gwe Semantig a Data Cysylltiedig. Cywiriadau ac ychwanegiadau, a elwir OWL DL. Weithiau maent hefyd yn siarad am OWL Full, lle caniateir defnyddio lluniadau OWL gyda'r rhyddid llawn sy'n gynhenid ​​​​yn RDF, heb gyfyngiadau semantig a chyfrifiannol. Gwe Semantig a Data Cysylltiedig. Cywiriadau ac ychwanegiadau. Er enghraifft, gall rhywbeth fod yn ddosbarth ac yn eiddo. Mae OWL Llawn yn amhendant.

Yr egwyddorion allweddol ar gyfer cysylltu canlyniadau yn OWL yw mabwysiadu'r rhagdybiaeth byd agored. Mae O.W.A.) a gwrthod y rhagdybiaeth o enwau unigryw (tybiaeth enw unigryw, UN). Isod fe welwn i ble y gall yr egwyddorion hyn arwain a chyflwyno rhai lluniadau OWL.

Gadewch i'r ontoleg gynnwys y darn canlynol (yng nghystrawen Manceinion):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human
   Facts: hasChild Alice, hasChild Bob, hasChild Carol

A fydd yn dilyn o'r hyn a ddywedwyd bod gan John lawer o blant? Bydd gwrthod UNA yn gorfodi'r peiriant casglu i ateb y cwestiwn hwn yn negyddol, oherwydd mae'n bosibl iawn mai'r un person yw Alice a Bob. Er mwyn i'r canlynol ddigwydd, mae angen ychwanegu'r axiom canlynol:

DifferentIndividuals: Alice, Bob, Carol, John

Gadewch nawr i'r darn ontoleg gael y ffurf ganlynol (datganir bod gan John lawer o blant, ond dim ond dau o blant sydd ganddo):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human, manyChildren
   Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John

A fydd yr ontoleg hon yn anghyson (y gellir ei dehongli fel tystiolaeth o ddata annilys)? Bydd derbyn OWA yn achosi i'r injan casgliad ymateb yn y negyddol: "rhywle" arall (mewn ontoleg arall) mae'n ddigon posib y gellir dweud bod Carol hefyd yn blentyn i John.

I ddiystyru'r posibilrwydd o hyn, gadewch i ni ychwanegu ffaith newydd am John:

Individual: John
   Facts: hasChild Alice, hasChild Bob, not hasChild Carol

I eithrio ymddangosiad plant eraill, gadewch i ni ddweud bod holl werthoedd yr eiddo “cael plentyn” yn bobl, a dim ond pedwar ohonynt sydd gennym ni:

ObjectProperty: hasChild
   Domain: Human
   Сharacteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }

Nawr bydd yr ontoleg yn gwrth-ddweud ei gilydd, na fydd yr injan casgliad yn methu â rhoi gwybod amdano. Gyda'r olaf o'r axioms rydym wedi, mewn ffordd, "cau" y byd, a sylwi sut y mae'r posibilrwydd o John yn blentyn ei hun yn cael ei gau allan.

Cysylltu Data Menter

Bwriad gwreiddiol y set Data Cysylltiedig o ddulliau a thechnolegau oedd cyhoeddi data ar y We. Mae eu defnydd mewn amgylchedd corfforaethol mewnol yn wynebu nifer o anawsterau.

Er enghraifft, mewn amgylchedd corfforaethol caeedig, mae pŵer didynnu OWL yn seiliedig ar fabwysiadu OWA a gwrthod UNA, penderfyniadau oherwydd natur agored a gwasgaredig y We, yn rhy wan. Ac yma mae'r atebion canlynol yn bosibl.

  • Gwaddoli OWL â semanteg, gan awgrymu rhoi'r gorau i OWA a mabwysiadu UNA, gweithredu'r injan allbwn cyfatebol. - Ar hyd y llwybr hwn yn mynd Storfa Stardog RDF.
  • Rhoi'r gorau i alluoedd didynnu OWL o blaid peiriannau rheol. — Stardog yn cefnogi SWRL; Mae Jena a GraphDB yn cynnig ei hun ieithoedd rheolau
  • Gwrthod galluoedd didynnu OWL, defnyddio un neu'r llall is-set yn agos at RDFS ar gyfer modelu. - Gweler mwy am hyn isod.

Mater arall yw'r ffocws mwy y gall y byd corfforaethol ei gael ar faterion ansawdd data a'r diffyg offer dilysu data yn y stac Data Cysylltiedig. Mae'r allbynnau yma fel a ganlyn.

  • Unwaith eto, defnyddiwch ar gyfer dilysu lluniadau OWL gyda semanteg byd caeedig ac enwau unigryw os oes peiriant casglu priodol ar gael.
  • Defnyddio SHACL, wedi'i safoni ar ôl gosod y rhestr o haenau Cacen Haen Gwe Semantig (fodd bynnag, gellir ei ddefnyddio hefyd fel peiriant rheolau), neu ShEx.
  • Deall bod popeth yn cael ei wneud yn y pen draw gydag ymholiadau SPARQL, gan greu eich mecanwaith dilysu data syml eich hun gan eu defnyddio.

Fodd bynnag, mae hyd yn oed gwrthodiad llwyr o alluoedd didynnu ac offer dilysu yn gadael y pentwr Data Cysylltiedig allan o gystadleuaeth mewn tasgau sy'n debyg o ran tirwedd i'r we agored a dosbarthedig - mewn tasgau integreiddio data.

Beth am system gwybodaeth menter reolaidd?

Mae hyn yn bosibl, ond dylech, wrth gwrs, fod yn ymwybodol o'r union broblemau y bydd yn rhaid i'r technolegau cyfatebol eu datrys. Byddaf yn disgrifio yma ymateb nodweddiadol o gyfranogwyr datblygu i ddangos sut olwg sydd ar y pentwr technoleg hwn o safbwynt TG confensiynol. Yn fy atgoffa ychydig o ddameg yr eliffant:

  • Dadansoddwr busnes: Mae RDF yn rhywbeth fel model rhesymegol wedi'i storio'n uniongyrchol.
  • Dadansoddwr Systemau: RDF yn debyg EAV, dim ond gyda chriw o fynegeion ac iaith ymholiad gyfleus.
  • Datblygwr: wel, mae hyn i gyd yn ysbryd y cysyniadau o fodel cyfoethog a chod isel, yn darllen yn ddiweddar am hyn.
  • Rheolwr Prosiect: ydy mae'r un peth yn dymchwel y pentwr!

Mae ymarfer yn dangos bod y pentwr yn cael ei ddefnyddio amlaf mewn tasgau sy'n ymwneud â dosbarthiad a heterogenedd data, er enghraifft, wrth adeiladu systemau dosbarth MDM (Meistr Rheoli Data) neu DWH (Warws Data). Mae problemau o'r fath yn bodoli mewn unrhyw ddiwydiant.

O ran cymwysiadau sy'n benodol i'r diwydiant, mae technolegau Data Cysylltiedig ar hyn o bryd yn fwyaf poblogaidd yn y diwydiannau canlynol.

  • technolegau biofeddygol (lle mae'n ymddangos bod eu poblogrwydd yn gysylltiedig â chymhlethdod y maes);

presennol

Yn ddiweddar, cynhaliodd y “Berwbwynt” gynhadledd a drefnwyd gan y gymdeithas “Ganolfan Wybodaeth Feddygol Genedlaethol” “Cyfuno ontolegau. O theori i gymhwysiad ymarferol'.

  • cynhyrchu a gweithredu cynhyrchion cymhleth (peirianneg fecanyddol fawr, cynhyrchu olew a nwy; yn fwyaf aml rydym yn sôn am safon ISO 15926);

presennol

Yma, hefyd, y rheswm yw cymhlethdod y maes pwnc, pan, er enghraifft, ar y cam i fyny'r afon, os ydym yn siarad am y diwydiant olew a nwy, mae cyfrifo syml yn gofyn am rai swyddogaethau CAD.

Yn 2008, cynhaliwyd digwyddiad gosod cynrychioliadol, a drefnwyd gan Chevron y gynhadledd.

Roedd ISO 15926, yn y diwedd, yn ymddangos braidd yn drwm i'r diwydiant olew a nwy (a chanfod efallai mwy o gymhwysiad mewn peirianneg fecanyddol). Dim ond Statoil (Equinor) aeth i wirioni'n llwyr arno; yn Norwy, yn gyfan gwbl ecosystem. Mae eraill yn ceisio gwneud eu peth eu hunain. Er enghraifft, yn ôl sibrydion, mae'r Weinyddiaeth Ynni domestig yn bwriadu creu "model ontolegol cysyniadol o'r cyfadeilad tanwydd ac ynni," yn debyg, mae'n debyg, i creu ar gyfer y diwydiant pŵer trydan.

  • sefydliadau ariannol (gellir ystyried hyd yn oed XBRL yn fath o hybrid o SDMX ac ontoleg Cube Data RDF);

presennol

Ar ddechrau'r flwyddyn, bu LinkedIn yn sbamio'r awdur yn weithredol â swyddi gwag gan bron pob un o gewri'r diwydiant ariannol, y mae'n eu hadnabod o'r gyfres “Force Majeure”: Goldman Sachs, JPMorgan Chase a / neu Morgan Stanley, Wells Fargo, SWIFT /Visa/Mastercard, Bank of America, Citigroup, Fed, Deutsche Bank... Mae'n debyg bod pawb yn chwilio am rywun y gallent anfon ato Cynhadledd Graff Gwybodaeth. Llwyddodd ychydig iawn i ddod o hyd i: sefydliadau ariannol a gymerodd bopeth bore y dydd cyntaf.

Ar HeadHunter, dim ond Sberbank a ddaeth ar draws rhywbeth diddorol; roedd yn ymwneud â “Storfa EAV gyda model data tebyg i RDF.”

Yn ôl pob tebyg, mae'r gwahaniaeth yn y graddau o gariad at dechnolegau cyfatebol sefydliadau ariannol domestig a Gorllewinol oherwydd natur drawswladol gweithgareddau'r olaf. Yn ôl pob tebyg, mae integreiddio ar draws ffiniau gwladwriaethau yn gofyn am atebion sefydliadol a thechnegol ansoddol wahanol.

  • systemau cwestiwn-ateb gyda chymwysiadau masnachol (IBM Watson, Apple Siri, Google Knowledge Graph);

presennol

Gyda llaw, crëwr Siri, Thomas Gruber, yw awdur yr union ddiffiniad o ontoleg (yn yr ystyr TG) fel “manyleb cysyniadoli.” Yn fy marn i, nid yw aildrefnu'r geiriau yn y diffiniad hwn yn newid ei ystyr, sydd efallai'n dynodi nad yw yno.

  • cyhoeddi data strwythuredig (gyda mwy o gyfiawnhad gellir priodoli hyn i Ddata Agored Cysylltiedig).

presennol

Mae cefnogwyr mawr Data Cysylltiedig yn GLAM fel y'i gelwir: Orielau, Llyfrgelloedd, Archifau ac Amgueddfeydd. Digon yw dweud bod Llyfrgell y Gyngres yn hyrwyddo un yn lle MARC21 BIBFRAMEPa yn darparu sylfaen ar gyfer dyfodol disgrifiadau llyfryddol ac, wrth gwrs, yn seiliedig ar RDF.

Mae Wikidata yn cael ei ddyfynnu'n aml fel enghraifft o brosiect llwyddiannus ym maes Data Agored Cysylltiedig - math o fersiwn o Wikipedia y gellir ei darllen gan beiriant, nad yw ei chynnwys, yn wahanol i DBPedia, yn cael ei gynhyrchu trwy fewnforio o flychau gwybodaeth erthyglau, ond mae'n creu â llaw fwy neu lai (ac wedyn yn dod yn ffynhonnell gwybodaeth ar gyfer yr un blychau gwybodaeth).

Rydym hefyd yn argymell eich bod yn edrych arno список defnyddwyr storfa Stardog RDF ar wefan Stardog yn yr adran “Cwsmeriaid”.

Boed hyny fel y byddo, yn Gartner Cylch Hype ar gyfer Technolegau Newydd 2016 Rhoddir "Tacsonomeg Menter a Rheoli Ontoleg" yng nghanol disgyniad i ddyffryn siom gyda'r gobaith o gyrraedd "llwyfandir cynhyrchiant" heb fod yn gynharach nag mewn 10 mlynedd.

Cysylltu Data Menter

Rhagolygon, rhagolygon, rhagolygon...

O ddiddordeb hanesyddol, rwyf wedi tablu isod ragolygon Gartner ers blynyddoedd amrywiol ar y technolegau sydd o ddiddordeb i ni.

Blwyddyn Технология Adroddiad Swydd Blynyddoedd i lwyfandir
2001 Gwe Semantig Technolegau sy'n Dod i'r Amlwg Sbardun Arloesi 5-10
2006 Gwe Semantig Corfforaethol Technolegau sy'n Dod i'r Amlwg Uchafbwynt Disgwyliadau Chwyddedig 5-10
2012 Gwe Semantig Data Mawr Uchafbwynt Disgwyliadau Chwyddedig > 10
2015 Data Cysylltiedig Dadansoddeg Uwch a Gwyddor Data Cafn Dadrithiad 5-10
2016 Rheoli Ontoleg Menter Technolegau sy'n Dod i'r Amlwg Cafn Dadrithiad > 10
2018 Graffiau Gwybodaeth Technolegau sy'n Dod i'r Amlwg Sbardun Arloesi 5-10

Fodd bynnag, eisoes i mewn "Hype Cycle..." 2018 mae tuedd arall ar i fyny wedi ymddangos - Graffiau Gwybodaeth. Digwyddodd ailymgnawdoliad penodol: dechreuodd graff DBMSs, y trodd sylw defnyddwyr ac ymdrechion datblygwyr eu troi allan, o dan ddylanwad ceisiadau'r cyntaf ac arferion yr olaf, gymryd y cyfuchliniau a'r lleoliad. o'u cystadleuwyr rhagflaenol.

Mae bron pob graff DBMS bellach yn datgan ei hun yn llwyfan addas ar gyfer adeiladu “graff gwybodaeth” corfforaethol (“data cysylltiedig” weithiau’n cael ei ddisodli gan “ddata cysylltiedig”), ond i ba raddau y gellir cyfiawnhau honiadau o’r fath?

Mae cronfeydd data graff yn dal yn asemantig; mae'r data mewn graff DBMS yn dal i fod yr un seilo data. Mae dynodwyr llinynnol yn lle URI yn gwneud y dasg o integreiddio dau DBMS graff yn dal i fod yn dasg integreiddio, tra bod integreiddio dwy storfa RDF yn aml yn dibynnu ar uno dau graff RDF yn unig. Agwedd arall ar esmantigedd yw anhyblygrwydd y model graff LPG, sy'n ei gwneud hi'n anodd rheoli metadata gan ddefnyddio'r un platfform.

Yn olaf, nid oes gan DBMSs graff beiriannau casglu na pheiriannau rheol. Gellir atgynhyrchu canlyniadau peiriannau o'r fath trwy gymhlethu ymholiadau, ond mae hyn yn bosibl hyd yn oed yn SQL.

Fodd bynnag, nid yw systemau storio RDF blaenllaw yn cael unrhyw anhawster i gefnogi'r model LPG. Ystyrir mai'r dull mwyaf cadarn yw'r un a gynigiwyd ar un adeg yn Blazegraph: y model RDF*, sy'n cyfuno RDF ac LPG.

Mwy

Gallwch ddarllen mwy am gefnogaeth storio RDF ar gyfer y model LPG yn yr erthygl flaenorol ar Habré: "Beth sy'n digwydd gyda storfa RDF nawr". Rwy'n gobeithio un diwrnod y bydd erthygl ar wahân yn cael ei hysgrifennu am Graffiau Gwybodaeth a Ffabrig Data. Ysgrifennwyd yr adran olaf, fel sy'n hawdd ei deall, ar frys, fodd bynnag, hyd yn oed chwe mis yn ddiweddarach, nid yw popeth yn llawer cliriach gyda'r cysyniadau hyn.

Llenyddiaeth

  1. Halpin, H., Monnin, A. (gol.) (2014). Peirianneg Athronyddol: Tuag at Athroniaeth y We
  2. Allemang, D., Hendler, J. (2011) Gwe Semantaidd ar gyfer yr Ontolegydd Gweithio (2il arg.)
  3. Staab, S., Studer, R. (gol.) (2009) Llawlyfr Ontolegau (2il arg.)
  4. Wood, D. (gol.). (2011) Cysylltu Data Menter
  5. Keet, M. (2018) Cyflwyniad i Beirianneg Ontoleg

Ffynhonnell: hab.com

Ychwanegu sylw