Gréasán Séimeantach agus Sonraí Nasctha. Ceartuithe agus breisithe

Ba mhaith liom blúire den leabhar seo a foilsíodh le déanaí a chur i láthair an phobail:

Samhaltú ontological fiontair: modhanna agus teicneolaíochtaí [Téacs]: monagraf / [S. V. Gorshkov, S. S. Kralin, O. I. Mushtak agus daoine eile; eagarthóir feidhmiúcháin S.V. Gorshkov]. - Ekaterinburg: Teach Foilsitheoireachta Ollscoil Ural, 2019. - 234 lch.: tinn., tábla; 20 cm.— Údar. léirithe ar an gcioch cúil. Le. — Leabharliosta ag deireadh ch. — ISBN 978-5-7996-2580-1: 200 cóip.

Tá ceithre aidhm leis an blúire seo a chur ar Habré:

  • Ní dócha go mbeidh aon duine in ann an leabhar seo a choinneáil ina lámha mura cliant duine a bhfuil meas air Innéacs Serge; Is cinnte nach bhfuil sé ar díol.
  • Tá ceartúcháin déanta ar an téacs (níl siad aibhsithe thíos) agus tá breisithe déanta nach bhfuil ag luí go mór le formáid monagraif chlóite: nótaí tráthúla (faoi spoilers) agus hipearnasc.
  • ba mhaith liom ceisteanna agus tuairimí a bhailiú, chun iad a chur san áireamh agus an téacs seo á chur san áireamh i bhfoirm athbhreithnithe in aon fhoilseachán eile.
  • Creideann go leor leantóirí Gréasáin Séimeantacha agus Sonraí Nasctha go bhfuil a gciorcal chomh cúng sin, go príomha toisc nach bhfuil sé mínithe i gceart ag an bpobal i gcoitinne cé chomh iontach is atá sé a bheith ina cloí leis an nGréasán Séimeantach agus Sonraí Nasctha. Ní shealbhaíonn údar an bhlúire, cé go mbaineann sé leis an gciorcal seo, an tuairim seo, ach, mar sin féin, measann sé go bhfuil sé de dhualgas air iarracht eile a dhéanamh.

Mar sin,

Gréasán Séimeantach

Is féidir éabhlóid an Idirlín a léiriú mar seo a leanas (nó labhair faoi na codanna a cuireadh le chéile san ord a léirítear thíos):

  1. Doiciméid ar an Idirlíon. Príomhtheicneolaíochtaí - Gopher, FTP, etc.
    Is líonra domhanda é an tIdirlíon chun acmhainní áitiúla a mhalartú.
  2. Doiciméid idirlín. Is iad HTML agus HTTP na príomhtheicneolaíochtaí.
    Cuirtear saintréithe a meán tarchurtha san áireamh i nádúr na n-acmhainní nochta.
  3. Sonraí Idirlín. Príomhtheicneolaíochtaí - REST agus SOAP API, XHR, etc.
    Ré na n-iarratas Idirlín, ní hamháin go n-éiríonn daoine tomhaltóirí acmhainní.
  4. Sonraí Idirlín. Is teicneolaíochtaí Sonraí Nasctha iad na príomhtheicneolaíochtaí.
    Tugtar an Gréasán Séimeantach ar an gceathrú céim seo, atá tuartha ag Berners-Lee, cruthaitheoir an dara croí-theicneolaíochtaí agus stiúrthóir ar an W3C; Tá teicneolaíochtaí Sonraí Nasctha deartha chun sonraí a dhéanamh ar an ngréasán ní hamháin inléite ag meaisín, ach freisin “sothuigthe ag meaisín”.

Ón méid a leanas, tuigfidh an léitheoir an comhfhreagras idir príomhchoincheapa an dara agus an cheathrú céim:

  • Tá URLanna ar aon dul le URIanna,
  • is é RDF an t-analóg de HTML,
  • Tá hipearnaisc HTML cosúil le teagmhais URI i ndoiciméid RDF.

Is mó d’fhís shistéamach de thodhchaí an Idirlín an Gréasán Séimeantach ná treocht shonrach spontáineach nó stocaireachta, cé gur féidir leis na cinn deiridh sin a chur san áireamh. Mar shampla, meastar gur tréith thábhachtach den rud ar a dtugtar Web 2.0 ná “ábhar arna ghiniúint ag an úsáideoir”. Go háirithe, iarrtar ar mholadh W3C é a chur san áireamh “Ontology Nótaí Gréasáin” agus gnóthas den sórt sin mar Soladach.

An bhfuil an Gréasán Séimeantach marbh?

Má dhiúltaíonn tú ionchais neamhréadúil, tá an cás leis an ngréasán shéimeantach thart ar an gcéanna agus a bhí leis an gcumanachas le linn aimsir an tsóisialachais fhorbartha (agus cibé an bhfuil dílseacht d’orduithe coinníollach Ilyich faoi deara, lig do gach duine cinneadh a dhéanamh dó féin). Innill chuardaigh rathúil go leor iallach a chur ar láithreáin ghréasáin RDFa agus JSON-LD a úsáid agus iad féin a úsáid teicneolaíochtaí a bhaineann leo siúd a gcuirtear síos orthu thíos (Google Knowledge Graph, Bing Knowledge Graph).

I dtéarmaí ginearálta, ní féidir leis an údar a rá cad a chuireann cosc ​​​​ar scaipeadh níos mó, ach is féidir leis labhairt ar bhonn taithí phearsanta. Tá fadhbanna ann a d’fhéadfaí a réiteach “as an bhosca” i gcoinníollacha an ionsaithe SW, cé nach bhfuil siad an-fhorleathan. Mar thoradh air sin, níl aon mhodh comhéigin ag na daoine a bhfuil na tascanna seo ag dul dóibh ina gcoinne siúd atá in ann réiteach a sholáthar, agus tá soláthar neamhspleách réitigh ag teacht salach ar a samhlacha gnó. Mar sin leanaimid ar aghaidh ag parsáil HTML agus ag gliúáil APIs éagsúla le chéile, níos géire ar a chéile.

Mar sin féin, tá teicneolaíochtaí Sonraí Nasctha scaipthe thar an nGréasán príomhshrutha; Tá an leabhar, i ndáiríre, tiomanta do na hiarratais seo. Faoi láthair, tá an pobal Sonraí Nasctha ag súil go n-éireoidh na teicneolaíochtaí seo níos forleithne fós a bhuíochas do thaifeadadh (nó d’fhorógra, de réir mar is mian leat) a rinne Gartner ar threochtaí ar nós Graif Eolais и Fabraic Sonraí. Ba mhaith liom a chreidiúint nach feidhmiú “rothar” na gcoincheap seo a bheidh rathúil, ach iad siúd a bhaineann leis na caighdeáin W3C a phléitear thíos.

Sonraí Nasctha

Shainmhínigh Berners-Lee Sonraí Nasctha mar an ngréasán shéimeantach “déanta i gceart”: sraith cur chuige agus teicneolaíochtaí a ligeann dó a spriocanna deiridh a bhaint amach. Bunphrionsabail Sonraí Nasctha Berners-Lee aibhsithe méid seo a leanas.

Prionsabal 1. URIanna a úsáid chun aonáin a ainmniú.

Is aitheantóirí aonáin dhomhanda iad URIanna seachas aitheantóirí teaghrán logánta le haghaidh iontrálacha. Ina dhiaidh sin, is fearr an prionsabal seo a chur in iúl i mana Google Knowledge Graph “rudaí, ní teaghráin'.

Prionsabal 2. URIanna a úsáid sa scéim HTTP ionas gur féidir iad a dhí-thagairt.

Trí thagairt a dhéanamh do URI, ba cheart go bhféadfaí an comhartha taobh thiar den chomharthaitheoir sin a fháil (tá an analaí le hainm an oibreora " soiléir anseo).*" in C); níos cruinne, chun léiriú éigin de seo a fháil in iúl - ag brath ar luach an cheanntásc HTTP Accept:. B’fhéidir, le teacht na ré AR/VR, go mbeifear in ann an acmhainn féin a fháil, ach faoi láthair, is dócha, is doiciméad RDF a bheidh ann, a bhfuil mar thoradh ar cheist SPARQL a chur i gcrích. DESCRIBE.

Prionsabal 3. Úsáid a bhaint as caighdeáin W3C - RDF(S) agus SPARQL go príomha - go háirithe agus URIanna á ndíscriosadh.

Na “sraitheanna” aonair seo den chruach teicneolaíochta Sonraí Nasctha, ar a dtugtar freisin Císte Sraith Ghréasáin Shéimeantach, déanfar cur síos air thíos.

Prionsabal 4. Úsáid tagairtí do URIanna eile agus aonáin á gcur síos.

Ligeann RDF duit tú féin a theorannú do chur síos ó bhéal ar acmhainn i dteanga nádúrtha, agus éilíonn an ceathrú prionsabal gan é seo a dhéanamh. Má chloítear go huilíoch leis an gcéad phrionsabal, is féidir nuair a bhíonn cur síos á dhéanamh ar acmhainn tagairt a dhéanamh do dhaoine eile, lena n-áirítear cinn “eachtrannach”, agus sin an fáth a dtugtar na sonraí nasctha. Go deimhin, tá sé beagnach dosheachanta úsáid a bhaint as URIanna atá ainmnithe i stór focal an RDFS.

RDF

RDF Is foirmiúlacht é (Creat Cur Síos Acmhainne) chun cur síos a dhéanamh ar eintitis idirghaolmhara.

Déantar ráitis den chineál “ábhar-réamhthuar-réad”, ar a dtugtar triplets, maidir le haonáin agus a gcaidreamh. Sa chás is simplí, is URIanna uile an t-ábhar, an tuar, agus an réad. Is féidir leis an URI céanna a bheith i suímh éagsúla i dtrílets éagsúla: a bheith ina ábhar, tuar, agus réad; Mar sin, cruthaíonn na triplets cineál graf ar a dtugtar graf RDF.

Is féidir le hábhair agus rudaí a bheith ní hamháin URIanna, ach freisin mar a thugtar orthu nóid folamh, agus is féidir rudaí a bheith chomh maith litriúil. Is samplaí de chineálacha primitive iad liteartha ina bhfuil léiriú teaghrán agus tásc cineáil.

Samplaí de litreoireacht a scríobh (i gcomhréir Turtle, tuilleadh faoi thíos): "5.0"^^xsd:float и "five"^^xsd:string. Litreacha le cineál rdf:langString is féidir clib teanga a bheith feistithe air freisin; i Turtle tá sé scríofa mar seo: "five"@en и "пять"@ru.

Is acmhainní “gan ainm” iad nóid fholmha gan aitheantóirí domhanda, ar féidir ráitis a dhéanamh fúthu, áfach; cineál athróg eiseach.

Mar sin (is é seo, i ndáiríre, pointe iomlán RDF):

  • is ábhar URI nó nód folamh é,
  • is URI an tuar,
  • is éard atá i réad ná URI, nód folamh, nó litriúil.

Cén fáth nach féidir le tuar a bheith ina nóid fholmha?

Is í an chúis is dócha ná an fonn triplet a thuiscint go neamhfhoirmiúil agus a aistriú go teanga na loighic réamhordaithe den chéad ord. s p o cosúil le rud éigin cosúil le Gréasán Séimeantach agus Sonraí Nasctha. Ceartuithe agus breisitheI gcás ina Gréasán Séimeantach agus Sonraí Nasctha. Ceartuithe agus breisithe - tuar, Gréasán Séimeantach agus Sonraí Nasctha. Ceartuithe agus breisithe и Gréasán Séimeantach agus Sonraí Nasctha. Ceartuithe agus breisithe - tairisigh. Tá rianta den tuiscint seo sa doiciméad “LBase: Séimeantaic do Theangacha an Ghréasáin Shéimeantaigh", a bhfuil stádas nóta grúpa oibre W3C aige. Leis an tuiscint seo, an triplet s p []I gcás ina [] - nód folamh, a aistriú mar Gréasán Séimeantach agus Sonraí Nasctha. Ceartuithe agus breisitheI gcás ina Gréasán Séimeantach agus Sonraí Nasctha. Ceartuithe agus breisithe - athróg, ach conas mar sin a aistriú s [] o? Doiciméad le stádas Molta W3C "RDF 1.1 Séimeantaic” cuireann sé modh aistriúcháin eile ar fáil, ach ní mheasann sé go fóill go bhféadfaí nóid fholmha a thuar.

Mar sin féin, Manu Sporni ceadaithe.

Múnla teibí is ea RDF. Is féidir RDF a scríobh (sraitheach) i gcomhréireanna éagsúla: RDF/XML, Turtle (is inléite daonna), JSON-LD, HDT (dénártha).

Is féidir an RDF céanna a shraithiú isteach i RDF/XML ar bhealaí éagsúla, mar sin, mar shampla, ní dhéanann sé aon chiall an XML dá bharr a bhailíochtú trí úsáid a bhaint as XSD nó iarracht a dhéanamh sonraí a bhaint as XPath. Mar an gcéanna, ní dócha go sásóidh JSON-LD mian fhorbróra Javascript ar an meán oibriú le RDF ag baint úsáide as nodaireacht ponc agus lúibín cearnach Javascript (cé go mbogann JSON-LD sa treo sin trí mheicníocht a thairiscint frámaíocht).

Cuireann an chuid is mó de chomhréireanna bealaí ar fáil chun URIanna fada a ghiorrú. Mar shampla, fógra @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> i Turtle ligfidh tú ansin scríobh ina ionad <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> ach rdf:type.

RDFS

RDFS (Scéimre RDF) - stór focal bunúsach samhaltaithe, tugtar isteach coincheapa airí agus aicme agus airíonna mar rdf:type, rdfs:subClassOf, rdfs:domain и rdfs:range. Ag baint úsáide as foclóir RDFS, mar shampla, is féidir na habairtí bailí seo a leanas a scríobh:

rdf:type         rdf:type         rdf:Property .
rdf:Property     rdf:type         rdfs:Class .
rdfs:Class       rdfs:subClassOf  rdfs:Resource .
rdfs:subClassOf  rdfs:domain      rdfs:Class .
rdfs:domain      rdfs:domain      rdf:Property .
rdfs:domain      rdfs:range       rdfs:Class .
rdfs:label       rdfs:range       rdfs:Literal .

Is stór focal tuairiscithe agus samhaltaithe é RDFS, ach ní teanga shrianta í (cé go bhfuil an tsonraíocht oifigiúil agus duilleoga féidearthacht úsáide den sórt sin). Níor cheart an focal "Scéimre" a thuiscint sa chiall chéanna agus atá san abairt "Scéimre XML". Mar shampla, :author rdfs:range foaf:Person ciallaíonn sin rdf:type gach luach maoine :author - foaf:Person, ach ní chiallaíonn sé gur chóir é seo a rá roimh ré.

SPARQL

SPARQL (SPARQL Protocol agus RDF Query Language) - teanga chun sonraí RDF a cheistiú. I gcás simplí, is éard atá i gceist le fiosrú SPARQL ná sraith samplaí a ndéantar triplets den ghraf atá á cheistiú a mheaitseáil lena n-aghaidh. Féadfaidh athróga a bheith sna suíomhanna ábhair, réamhaithrise agus oibiachta.

Tabharfaidh an cheist ar ais luachanna athraitheacha den sórt sin a d’fhéadfadh, nuair a chuirtear ina n-ionad iad isteach sna samplaí, foghraf den ghraf RDF a ceistíodh (fothacar dá thríríní). Caithfidh na luachanna céanna a bheith ag athróga den ainm céanna i samplaí éagsúla de thríríní.

Mar shampla, i bhfianaise na sraithe thuas de sheacht aicsiom RDFS, fillfidh an cheist seo a leanas rdfs:domain и rdfs:range mar luachanna ?s и ?p faoi ​​seach:

SELECT * WHERE {
 ?s ?p rdfs:Class .
 ?p ?p rdf:Property .
}

Is fiú a thabhairt faoi deara gur ráiteasach é SPARQL agus nach teanga é chun cur síos a dhéanamh ar thrasnú graif (mar sin féin, cuireann roinnt stórtha RDF bealaí ar fáil chun plean forghníomhaithe na gceisteanna a choigeartú). Mar sin, ní féidir roinnt fadhbanna caighdeánacha grafa, mar shampla, an chonair is giorra a aimsiú, a réiteach in SPARQL, lena n-áirítear an cosáin maoine (ach, arís, tairgeann stórtha aonair RDF síntí speisialta chun na fadhbanna seo a réiteach).

Ní chomhionann SPARQL leis an toimhde maidir le hoscailteacht an domhain agus leanann sé an cur chuige “diúltú mar theip”, ina féidir dearaí ar nós FILTER NOT EXISTS {…}. Cuirtear dáileadh sonraí san áireamh ag baint úsáide as an meicníocht ceisteanna cónasctha.

Níl aon analógacha díreacha ag pointe rochtana SPARQL - stór RDF atá in ann ceisteanna SPARQL a phróiseáil - ón dara céim (féach tús na míre seo). Is féidir é a chur i gcomparáid le bunachar sonraí, bunaithe ar a bhfuil ann ar gineadh leathanaigh HTML, ach atá inrochtana don taobh amuigh. Tá pointe rochtana SPARQL níos comhchosúil le pointe rochtana API ón tríú céim, ach le dhá phríomhdhifríocht. Ar an gcéad dul síos, is féidir roinnt fiosruithe “adamhacha” a chomhcheangal i gceann amháin (a mheastar a bheith ina bpríomhthréith de GraphQL), agus ar an dara dul síos, tá API den sórt sin féin-dhoiciméadaithe go hiomlán (is é sin a rinne HATEOAS iarracht a bhaint amach).

Trácht Polaitiúil

Is bealach é RDF chun sonraí a fhoilsiú ar an ngréasán, mar sin ba cheart stóráil RDF a mheas mar dhoiciméad DBMS. Fíor, ós rud é gur graf é RDF agus ní crann, d'éirigh leo a bheith bunaithe ar ghraif freisin. Tá sé iontach gur oibrigh sé amach ar chor ar bith. Cé a cheapfadh go mbeadh daoine cliste ann a chuirfeadh nóid bhána i bhfeidhm. Tá Codd anseo níor oibrigh sé amach.

Tá níos lú bealaí lán-léirithe ann freisin chun rochtain ar shonraí RDF a eagrú, mar shampla, Blúirí Sonraí Nasctha (LDF) agus Ardán Sonraí Nasctha (LDP).

ULCHABHÁN

ULCHABHÁN (Teanga Ontology Gréasáin) - foirmiúlacht chun eolas a léiriú, leagan comhréire de loighic tuairisce Gréasán Séimeantach agus Sonraí Nasctha. Ceartuithe agus breisithe (i ngach áit thíos tá sé níos cruinne OWL 2 a rá, ar a raibh an chéad leagan de OWL bunaithe Gréasán Séimeantach agus Sonraí Nasctha. Ceartuithe agus breisithe).

Freagraíonn coincheapa na loighice tuairisciúla in OWL do ranganna, comhfhreagraíonn róil le hairíonna, coinníonn daoine aonair a n-ainm roimhe seo. Tugtar aicsiomaí ar aicsiom freisin.

Mar shampla, sa sin ar a dtugtar Comhréir Mhanchain le haghaidh nodaireacht OWL, aicsiom atá ar eolas againn cheana féin Gréasán Séimeantach agus Sonraí Nasctha. Ceartuithe agus breisithe scríobhfar mar seo:

Class: Human
Class: Parent
   EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent

Tá comhréireanna eile ann chun OWL a scríobh, mar comhréir feidhme, a úsáidtear sa tsonraíocht oifigiúil, agus OWL/XML. Ina theannta sin, is féidir OWL a serialized chun comhréir RDF a theibí agus a thuilleadh - in aon cheann de na comhréireanna sonracha.

Tá caidreamh déach ag OWL le RDF. Ar thaobh amháin, is féidir é a mheas mar chineál foclóir a leathnaíonn RDFS. Ar an láimh eile, is foirmiúlacht níos cumhachtaí é nach bhfuil in RDF ach formáid sraitheachaithe dó. Ní féidir gach bunléiriú OWL a scríobh trí úsáid a bhaint as triathán RDF amháin.

Ag brath ar an bhfo-thacar de thógálacha OWL a cheadaítear a úsáid, labhraíonn siad mar a thugtar orthu Próifílí OWL. Is iad OWL EL, OWL RL agus OWL QL na cinn chaighdeánaithe agus is cáiliúla. Bíonn tionchar ag rogha na próifíle ar chastacht ríomhaireachtúil na bhfadhbanna tipiciúla. Sraith iomlán de thógálacha OWL a fhreagraíonn do Gréasán Séimeantach agus Sonraí Nasctha. Ceartuithe agus breisithe, ar a dtugtar OWL DL. Uaireanta labhraíonn siad freisin faoi OWL Full, ina gceadaítear foirgnimh OWL a úsáid leis an tsaoirse iomlán is gné dhílis de RDF, gan srianta shéimeantacha agus ríomhaireachtúla. Gréasán Séimeantach agus Sonraí Nasctha. Ceartuithe agus breisithe. Mar shampla, is féidir le rud éigin a bheith ina rang agus ina réadmhaoin. Tá OWL Iomlán do-chinnte.

Is iad na príomhphrionsabail maidir le hiarmhairtí a cheangal in OWL ná glacadh le toimhde an domhain oscailte. OWA) agus diúltú don toimhde maidir le hainmneacha uathúla (toimhde ainm uathúil, AMHÁIN). Anseo thíos feicfimid cén áit ar féidir leis na prionsabail seo a bheith mar threoir agus roinnt tógálacha OWL a thabhairt isteach.

Bíodh an blúire seo a leanas san ontology (i gcomhréir Mhanchain):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human
   Facts: hasChild Alice, hasChild Bob, hasChild Carol

An leanfaidh sé ón méid atá ráite go bhfuil go leor leanaí ag Seán? Má dhiúltaítear UNA cuirfidh sé iallach ar an inneall tátal an cheist seo a fhreagairt go diúltach, ós rud é go bhféadfadh go mbeadh Alice agus Bob ar an duine céanna. Chun na nithe seo a leanas a dhéanamh, is gá an aicsiom seo a leanas a chur leis:

DifferentIndividuals: Alice, Bob, Carol, John

Lig anois go bhfuil an fhoirm seo a leanas ag an blúire ontology (dearbhaítear go bhfuil go leor leanaí ag John, ach níl ach beirt leanaí aige):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human, manyChildren
   Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John

An mbeidh an ontology seo neamh-chomhsheasmhach (is féidir a léirmhíniú mar fhianaise ar shonraí neamhbhailí)? Má ghlactar le OWA beidh an t-inneall tátal freagra diúltach: "áit éigin" eile (i ontology eile) d'fhéadfadh sé a rá go bhfuil Carol freisin leanbh John.

Chun an fhéidearthacht seo a chur as an áireamh, cuirimis fíric nua faoi Eoin leis:

Individual: John
   Facts: hasChild Alice, hasChild Bob, not hasChild Carol

Chun cuma leanaí eile a eisiamh, déanaimis a rá gur daoine iad luachanna uile na maoine “leanbh a bheith acu”, nach bhfuil againn ach ceathrar acu:

ObjectProperty: hasChild
   Domain: Human
   Сharacteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }

Anois beidh an ontology ag teacht salach ar a chéile, rud nach dteipfidh ar an inneall tátal a thuairisciú. Leis an gceann deireanach de na haicsiomaí ní mór dúinn, ar bhealach, “dúnta” an domhain, agus tugaimid faoi deara conas a chuirtear as an áireamh an fhéidearthacht gurb é Eoin a leanbh féin.

Sonraí Fiontair a Nascadh

Ba le haghaidh sonraí a fhoilsiú ar an nGréasán a bhí an tacar sonraí Nasctha de chineálacha cur chuige agus teicneolaíochtaí beartaithe ar dtús. Bíonn roinnt deacrachtaí os comhair a n-úsáide i dtimpeallacht chorparáideach inmheánach.

Mar shampla, i dtimpeallacht chorparáideach dúnta, tá cumhacht asbhainteach OWL bunaithe ar OWA a ghlacadh agus ar dhiúltú UNA, cinntí mar gheall ar nádúr oscailte agus dáilte an Ghréasáin, ró-lag. Agus anseo tá na réitigh seo a leanas is féidir.

  • Endowing OWL le semantics, le tuiscint a thréigean OWA agus glacadh le UNA, cur i bhfeidhm an innill aschuir comhfhreagrach. - Chomh maith leis an cosán ag teacht Stóráil Stardog RDF.
  • Tréigean cumais asbhainte OWL i bhfabhar na n-innill riail. - Tacaíonn Stardog SWRL; Tairgeann Jena agus GraphDB féin teangacha rialacha
  • Diúltú cumais asbhainte OWL, úsáid fothacar amháin nó eile gar do RDFS le haghaidh samhaltú. - Féach tuilleadh faoi seo thíos.

Saincheist eile is ea an fócas níos mó a d’fhéadfadh a bheith ag an saol corparáideach ar shaincheisteanna cáilíochta sonraí agus an easpa uirlisí bailíochtaithe sonraí sa stack Sonraí Nasctha. Seo a leanas na haschuir anseo.

  • Arís, bain úsáid as chun struchtúir OWL a bhailíochtú le séimeantaic dhomhanda dúnta agus ainmneacha uathúla má tá inneall tátail oiriúnach ar fáil.
  • Úsáid SHACL, caighdeánaithe tar éis an liosta de na sraitheanna Císte Sraithe Séimeantach Gréasáin a shocrú (áfach, is féidir é a úsáid freisin mar inneall rialacha), nó Shex.
  • A thuiscint go ndéantar gach rud ar deireadh thiar le fiosruithe SPARQL, do mheicníocht bailíochtaithe sonraí simplí féin a chruthú agus iad á n-úsáid.

Mar sin féin, fágann fiú diúltú iomlán ar chumais asbhainte agus uirlisí bailíochtaithe an Stack Sonraí Nasctha as an iomaíocht i dtascanna atá cosúil i dtírdhreach leis an ngréasán oscailte agus dáilte - i dtascanna comhtháthú sonraí.

Cad mar gheall ar chóras rialta faisnéise fiontair?

Tá sé seo indéanta, ach ba chóir duit, ar ndóigh, a bheith ar an eolas faoi na fadhbanna go díreach a bheidh le réiteach ag na teicneolaíochtaí comhfhreagracha. Déanfaidh mé cur síos anseo ar imoibriú tipiciúil na rannpháirtithe forbartha chun a thaispeáint cad é an chuma atá ar an gcruach teicneolaíochta seo ó thaobh na gnáth-TF de. Cuireann parabal an eilifint beagán i gcuimhne dom:

  • Anailísí gnó: Is é RDF rud éigin cosúil le samhail loighciúil a stóráiltear go díreach.
  • Anailísí Córais: Is cosúil le RDF EAV, gan ach braon innéacsanna agus teanga áisiúil ceiste.
  • Forbróir: go maith, tá sé seo go léir i spiorad na coincheapa a bhaineann le múnla saibhir agus cód íseal, ag léamh le déanaí faoi seo.
  • Bainisteoir tionscadáil: tá sé mar an gcéanna ag titim as an gcruach!

Léiríonn cleachtas go n-úsáidtear an chairn is minice i dtascanna a bhaineann le dáileadh agus ilchineálacht sonraí, mar shampla, nuair a bhíonn córais ranga MDM (Máistir Sonraí Bainistíochta) nó DWH (Stóras Sonraí) á dtógáil. Tá fadhbanna dá leithéid in aon tionscal.

I dtéarmaí feidhmchláir atá sonrach don tionscal, tá an-tóir ar theicneolaíochtaí Sonraí Nasctha sna tionscail seo a leanas faoi láthair.

  • teicneolaíochtaí bithleighis (i gcás inar dealraitheach go mbaineann a n-éileamh le castacht an fhearainn);

reatha

D’óstáil an “Fiuchphointe” comhdháil le déanaí a d’eagraigh an cumann “National Medical Knowledge Base” “Ontologies a chomhcheangal. Ó teoiric go feidhmiú praiticiúil'.

  • táirgeadh agus oibriú táirgí casta (innealtóireacht mheicniúil mhór, táirgeadh ola agus gáis; is minic a bhíonn muid ag caint faoi chaighdeánach ISO 15926);

reatha

Anseo, freisin, is é an chúis ná castacht an ábhair, nuair, mar shampla, ag an gcéim in aghaidh an tsrutha, má labhairt linn faoi thionscal ola agus gáis, éilíonn cuntasaíocht shimplí roinnt feidhmeanna CAD.

In 2008, reáchtáladh imeacht suiteála ionadaíoch, arna eagrú ag Chevron comhdháil.

Sa deireadh, ba chosúil go raibh ISO 15926 beagán trom ar an tionscal ola agus gáis (agus b'fhéidir go raibh feidhm níos mó aige in innealtóireacht mheicniúil). Níor bhain ach Statoil (Equinor) go mór leis; san Iorua, ina iomláine éiceachóras. Tá daoine eile ag iarraidh a rud féin a dhéanamh. Mar shampla, de réir ráflaí, tá sé beartaithe ag an Aireacht Fuinnimh intíre “samhail onteolaíoch choincheapúil den choimpléasc breosla agus fuinnimh” a chruthú, cosúil, de réir dealraimh, le cruthaithe don tionscal cumhachta leictreachais.

  • eagraíochtaí airgeadais (is féidir fiú XBRL a mheas mar chineál hibrideach de SDMX agus ontology Ciúb Sonraí RDF);

reatha

Ag tús na bliana, rinne LinkedIn spamáil go gníomhach ar an údar le folúntais ó beagnach gach fathach den tionscal airgeadais, a bhfuil aithne aige orthu ón tsraith teilifíse “Force Majeure”: Goldman Sachs, JPMorgan Chase agus / nó Morgan Stanley, Wells Fargo, SWIFT/Visa/Mastercard, Bank of America, Citigroup, Fed, Deutsche Bank... Is dócha go raibh gach duine ag lorg duine éigin a bhféadfaidís a sheoladh chucu. Comhdháil Ghraf Eolais. Go leor a bhainistiú a fháil: eagraíochtaí airgeadais ghlac gach rud maidin an chéad lá.

Ar HeadHunter, níor tháinig ach Sberbank trasna ar rud éigin suimiúil; bhain sé le “stóráil EAV le samhail sonraí cosúil le RDF.”

Is dócha gur de bharr nádúr trasnáisiúnta ghníomhaíochtaí na n-institiúidí airgeadais intíre agus an Iarthair atá an difríocht i ngrád na dteicneolaíochtaí comhfhreagracha. De réir dealraimh, teastaíonn réitigh eagraíochtúla agus theicniúla atá éagsúil go cáilíochtúil le comhtháthú trasna teorainneacha stáit.

  • córais ceisteanna-freagra le feidhmeanna tráchtála (IBM Watson, Apple Siri, Google Knowledge Graph);

reatha

Dála an scéil, is é cruthaitheoir Siri, Thomas Gruber, an t-údar ar an sainmhíniú ar ontology (sa chiall TF) mar "sonraíocht choincheapúil." Is é mo thuairim nach n-athraíonn atheagrú na bhfocal sa sainmhíniú seo a bhrí, rud a thugann le fios b’fhéidir nach bhfuil sé ann.

  • foilsiú sonraí struchtúrtha (le bonn cirt níos mó is féidir é seo a chur i leith Sonraí Oscailte Nasctha).

reatha

Is iad lucht leanúna mór Sonraí Nasctha an GLAM mar a thugtar air: Gailearaithe, Leabharlanna, Cartlanna agus Iarsmalanna. Is leor a rá go bhfuil Leabharlann na Comhdhála ag cur chun cinn ionadú do MARC21 Fráma LEABHARCén cuireann sé bunús le haghaidh cur síos bibleagrafaíochta amach anseo agus, ar ndóigh, bunaithe ar RDF.

Is minic a luaitear Wikidata mar shampla de thionscadal rathúil i réimse na Sonraí Oscailte Nasctha - leagan de Vicipéid atá inléite ag meaisín, nach bhfuil a inneachar, i gcodarsnacht le DBPedia, ginte trí allmhairiú ó bhoscaí faisnéise ailt, ach is é a cruthaíodh de láimh níos mó nó níos lú (agus ina dhiaidh sin a thiocfaidh chun bheith ina fhoinse faisnéise do na boscaí faisnéise céanna).

Molaimid freisin duit é a sheiceáil amach liosta úsáideoirí stór Stardog RDF ar shuíomh Gréasáin Stardog sa rannán “Custaiméirí”.

Bíodh sin mar atá, i nGartner Timthriall Hype le haghaidh Teicneolaíochtaí atá ag Teacht Chun Cinn 2016 Cuirtear "Tacsanomaíocht Fiontraíochta agus Bainistíocht Ontology" i lár a shliocht isteach i ngleann na díomá agus an t-ionchas go sroichfear "ardchlár táirgiúlachta" tráth nach luaithe ná i gceann 10 mbliana.

Sonraí Fiontair a Nascadh

Réamhaisnéisí, réamhaisnéisí, réamhaisnéisí...

As spéis stairiúil, tá táblaí tugtha agam thíos faoi réamhaisnéisí Gartner le blianta éagsúla ar na teicneolaíochtaí a bhfuil suim againn iontu.

Bliain Технология Tuarascáil Seasamh Blianta go hardchlár
2001 Gréasán Séimeantach Teicneolaíochtaí atá ag Teacht Chun Cinn Truicear Nuálaíochta 5-10
2006 Gréasán Séimeantach Corparáideach Teicneolaíochtaí atá ag Teacht Chun Cinn Buaic Ionchais Bhreisithe 5-10
2012 Gréasán Séimeantach Sonraí Big Buaic Ionchais Bhreisithe > 10
2015 Sonraí Nasctha Ardanailís agus Eolaíocht Sonraí Umar Disillusionment 5-10
2016 Bainistíocht Ontology Fiontair Teicneolaíochtaí atá ag Teacht Chun Cinn Umar Disillusionment > 10
2018 Graif Eolais Teicneolaíochtaí atá ag Teacht Chun Cinn Truicear Nuálaíochta 5-10

Mar sin féin, cheana féin i "Hipe-Rothaíocht..." 2018 tá treocht eile aníos le feiceáil - Graif Eolais. Tharla reincarnation áirithe: graf DBMSs, a d'iompaigh aird na n-úsáideoirí agus iarrachtaí na bhforbróirí amach, faoi thionchar iarratais an chéad cheann agus nósanna an dara ceann, thosaigh sé ag tógáil na comhrianta agus an tsuímh. dá n-iomaitheoirí a chuaigh roimhe.

Dearbhaíonn beagnach gach graf DBMS anois gur ardán oiriúnach é chun “graf eolais” corparáideach a thógáil (“sonraí nasctha” in ionad “sonraí nasctha” uaireanta), ach cén údar atá le héilimh dá leithéid?

Tá bunachair shonraí ghraif fós aisemantach; tá na sonraí i ngraf DBMS fós mar an gcéanna sonraí silo. Déanann aitheantóirí teaghrán in ionad URIanna an tasc chun dhá ghraif DBMS a chomhtháthú fós ina thasc lánpháirtithe, agus is minic a thagann dhá stór RDF a chomhtháthú le dhá ghraf RDF a chumasc. Gné eile den chomhsheanúlacht is ea neamh-athfhillteacht an tsamhail ghraif LPG, rud a fhágann go bhfuil sé deacair meiteashonraí a bhainistiú ag baint úsáide as an ardán céanna.

Ar deireadh, níl innill thátail ná innill riail ag DBMSanna grafacha. Is féidir torthaí inneall den sórt sin a atáirgeadh trí cheisteanna casta, ach is féidir é seo a dhéanamh fiú i SQL.

Mar sin féin, níl aon deacracht ag baint le córais stórála RDF le tacú leis an tsamhail LPG. Meastar gurb é an cur chuige is daingne ná an ceann a moladh ag aon am amháin i Blazegraph: an tsamhail RDF*, a chomhcheanglaíonn RDF agus LPG.

Níos mó

Is féidir leat tuilleadh a léamh faoi thacaíocht stórála RDF don tsamhail LPG san alt roimhe seo ar Habré: "Cad atá ag tarlú le stóráil RDF anois". Tá súil agam lá amháin go scríobhfar alt ar leith faoi Ghraif Eolais agus Fabraic Sonraí. Scríobhadh an t-alt deiridh, mar atá éasca le tuiscint, i Hurry, áfach, fiú sé mhí ina dhiaidh sin, níl gach rud i bhfad níos soiléire leis na coincheapa seo.

Litríocht

  1. Halpin, H., Monnin, A. (eag.) (2014). Innealtóireacht Fhealsúnach: I dtreo Fealsúnachta an Ghréasáin
  2. Allemang, D., Hendler, J. (2011) Gréasán Séimeantach don Ontologist Oibre (2ú eag.)
  3. Staab, S., Studer, R. (eag.) (2009) Handbook on Ontologies (2ú eag.)
  4. Adhmad, D. (eag.). (2011) Sonraí Fiontair a Nascadh
  5. Keet, M. (2018) Réamhrá don Innealtóireacht Oinceolaíochta

Foinse: will.com

Add a comment