Cad atá ar siúl le stórtha RDF anois?

Tá an Gréasán Séimeantach agus Sonraí Nasctha cosúil le spás amuigh: níl aon saol ann. Chun dul ann ar feadh tréimhse níos faide nó níos lú ama ... níl a fhios agam cad a dúirt siad leat mar leanbh mar fhreagra ar "Ba mhaith liom a bheith i mo spásaire." Ach is féidir leat breathnú ar a bhfuil ag tarlú agus tú ar an Domhan; Tá sé i bhfad níos éasca a bheith i do réalteolaí amaitéarach nó fiú mar ghairmí.

Díreoidh an t-alt ar threochtaí le déanaí, nach sine ná roinnt míonna, ó shaol na stórála RDF. Tá an meafar sa chéad mhír spreagtha ag an íomhá fógraíochta eipiciúil faoin gearrtha.


Pictiúr eipiciúil

Cad atá ar siúl le stórtha RDF anois?

I. GraphQL le haghaidh rochtana RDF

Deirteargo bhfuil sé mar aidhm ag GraphQL a bheith ina teanga rochtana bunachar sonraí uilíoch. Cad mar gheall ar an gcumas rochtain a fháil ar RDF ag baint úsáide as GraphQL?

As an mbosca cuirtear an deis seo ar fáil ag:

Mura dtugann an stór deis dá leithéid, is féidir é a chur i bhfeidhm go neamhspleách trí “réiteach” cuí a scríobh. Seo mar a rinne siad, mar shampla, i dtionscadal na Fraince Turasóireacht Sonraí. Nó is féidir leat a thuilleadh a scríobh rud ar bith, ach amháin a ghlacadh HyperGraphQL.

Ó thaobh cloí orthodox den Ghréasán Séimeantach agus Sonraí Nasctha, tá sé seo go léir, ar ndóigh, brónach, ós rud é gur cosúil go bhfuil sé deartha le haghaidh comhtháthú tógtha timpeall an chéad silo sonraí eile, agus nach bhfuil ardáin oiriúnacha (siopaí RDF, ar ndóigh) .

Tá dhá thuairim ag baint le comparáid a dhéanamh idir GraphQL agus SPARQL.

  • Ar thaobh amháin, is cosúil le GraphQL gaol i bhfad i gcéin de SPARQL: réitíonn sé na fadhbanna a bhaineann le hathshampláil agus iolrú na gceisteanna atá tipiciúil do REST - gan a, is dócha, ní bheadh ​​​​sé indéanta a bhreithniú teanga cheist, ar a laghad don ngréasán;
  • Ar an láimh eile, is cúis díomá é scéimre dhocht GraphQL. Dá réir sin, is cosúil go bhfuil a “introspectiveness” an-teoranta i gcomparáid le hathmhachnamhacht iomlán RDF. Agus níl aon analógach de chosáin maoine, mar sin níl sé fiú an-soiléir cén fáth go bhfuil sé "Graph-".

II. Cuibheoirí le haghaidh MongoDB

Treocht comhlántach leis an gceann roimhe seo.

  • I Stardog anois b'fhéidir - go háirithe, go léir ar an GraphQL céanna - mapáil sonraí MongoDB a chumrú i graif fíorúil RDF;
  • Tá Ontotext GraphDB le déanaí Ceadaíonn cuir isteach blúirí i SPARQL ar Cheist MongoDB.

Má labhraímid ar bhealach níos leithne faoi oiriúntóirí chuig foinsí JSON, a ligeann do níos mó nó níos lú “ar an eitilt” ionadaíocht a dhéanamh ar an JSON atá stóráilte sna foinsí seo mar RDF, is féidir linn a thabhairt chun cuimhne an fadbhunaithe SPARQL Gin, is féidir a choigeartú, mar shampla, a Apache Jena.

Agus achoimre á dhéanamh ar an gcéad dá threocht, is féidir linn a rá go léiríonn stórais RDF lán-ullmhacht le haghaidh comhtháthú agus feidhmiú i gcoinníollacha “marthanachta polyglot”. Tá sé ar eolas, áfach, go bhfuil an dara ceann seo fada as faisean, agus tá sé á chur in ionad ag teacht il-mhúnla. Cad mar gheall ar il-mhúnlú i saol na stórála RDF?

I mbeagán focal, aon bhealach. Ba mhaith liom alt ar leith a thiomnú don ábhar a bhaineann le DBMSanna ilmhúnla, ach faoi láthair is féidir a thabhairt faoi deara nach bhfuil aon DBMSanna ilmhúnla “bunaithe” ar shamhail ghraif faoi láthair (is féidir RDF a mheas mar chineál de) . Pléifear roinnt ilmhúnlú beag - tacaíocht stórála RDF le haghaidh múnla malartach graf LPG - i roinn V.

III. OLTP vs. OLAP

Mar sin féin, an Gartner céanna scríobhannis coinníoll sine qua non é an tsamhail sin go príomha seomraí oibriúcháin DBMS. Tá sé seo intuigthe: i gcás “stóráil ilathraithe”, tagann na príomhfhadhbanna chun cinn maidir le hidirbheartaíocht.

Ach cá bhfuil stórais RDF suite ar scála OLTP-OLAP? Thabharfainn freagra mar seo: níl ann ná anseo. Chun a chur in iúl cad chuige a bhfuil siad ceaptha, tá tríú giorrúchán ag teastáil. Mar rogha a mholfainn OLIP — Próiseáil Intleachtúil Ar Líne.

Mar sin féin, fós:

  • ní hiad na meicníochtaí comhtháthaithe le MongoDB a cuireadh i bhfeidhm i GraphDB ar a laghad beartaithe a bheith ag obair timpeall ar cheisteanna léirithe scríofa;
  • Téann Stardog níos faide agus go hiomlán athscríobhann inneall, arís leis an sprioc feidhmíocht taifeadta a fheabhsú.

Anois lig dom imreoir nua a thabhairt isteach sa mhargadh. Ó chruthaitheoirí IBM Netezza agus Amazon Redshift - AnzoGraph™. Cuireadh pictiúr ó fhógra do tháirge bunaithe air ag tús an ailt. Seasann AnzoGraph é féin mar réiteach GOLAP. Conas is maith leat SPARQL le feidhmeanna fuinneoige? —

SELECT ?month (COUNT(?event) OVER (PARTITION BY ?month) AS ?events) WHERE {  …  }

IV. RocksDB

Cheana féin níos airde bhí nasc ann le fógra Stardog 7 Beta, a dúirt go raibh Stardog chun RocksDB a úsáid mar bhunchóras stórála - stór eochair-luach, forc Facebook de LevelDB Google. Cén fáth gur fiú labhairt faoi threocht áirithe?

Ar an gcéad dul síos, ag déanamh moltóireachta alt Vicipéid, ní hamháin go ndéantar stórais RDF a “thrasphlandú” go RocksDB. Tá tionscadail ann chun RocksDB a úsáid mar inneall stórála in ArangoDB, MongoDB, MySQL agus MariaDB, Cassandra.

Ar an dara dul síos, cruthaítear tionscadail (is é sin, ní táirgí) ar ábhair ábhartha ar RocksDB.

Mar shampla, úsáideann eBay RocksDB i ardán do do “ghraf eolais”. Dála an scéil, tá sé greannmhar léamh: cuireadh tús le teanga na gceisteanna mar fhormáid dhúchais, ach le déanaí tá sí ag aistriú go mbeidh sí i bhfad níos cosúla le SPARQL. Mar a tharla sa joke: is cuma cé mhéad graf eolais a dhéanaimid, táimid fós ag deireadh le RDF.

Sampla eile - ceann a bhí le feiceáil cúpla mí ó shin Seirbhís Fiosrúcháin Staire Wikidata. Sular tugadh isteach é, b'éigean faisnéis stairiúil Wikidata a rochtain tríd MWAPI chuig an API caighdeánach Mediawiki. Anois is féidir go leor le SPARQL íon. “Faoi an cochall” tá RocksDB ann freisin. Dála an scéil, rinneadh WDHQS, is cosúil, ag an duine a d'iompórtáil Freebase isteach sa Google Knowledge Graph.

V. Tacaíocht LPG

Cuir i gcuimhne duit an phríomhdhifríocht idir graif LPG agus graif RDF.

In LPG, is féidir maoin scálach a shannadh do chásanna imeall, agus in RDF ní féidir iad a shannadh ach do “chineálacha” imeall (ach ní hamháin airíonna scálacha, ach gnáthnaisc freisin). Chuir an teorannú seo ar RDF i gcomparáid le GPL shárú teicníc shamhaltú amháin nó eile. Tá sé níos deacra teorainneacha GPL i gcomparáid le RDF a shárú, ach tá graif LPG níos cosúla le pictiúir ó théacsleabhar Harari ná le graif RDF, agus is é sin an fáth go dteastaíonn ó dhaoine iad.

Ar ndóigh, tá dhá chuid i gceist le “tacaíocht LPG”:

  1. athruithe a dhéanamh ar an tsamhail RDF a fhágann gur féidir struchtúir LPG a insamhladh inti;
  2. athruithe a dhéanamh ar theanga cheist an RDF a fhágann gur féidir rochtain a fháil ar shonraí sa mhúnla modhnaithe seo, nó an cumas chun fiosrúcháin a dhéanamh ar an tsamhail seo i dteangacha ceisteanna coitianta LPG a chur i bhfeidhm.

V.1. Múnla sonraí

Tá roinnt cur chuige féideartha anseo.

V.1.1. Maoin Singleton

Is dócha gurb é an cur chuige is liteartha maidir le comhchuibhiú RDF agus LPG maoin singleton:

  • In ionad, mar shampla, an tuar :isMarriedTo úsáidtear tuar :isMarriedTo1, :isMarriedTo2 agus mar sin de.
  • Ansin déantar na réamh-mheastacháin seo a bheith ina n-ábhar do thríríní nua: :isMarriedTo1 :since "2013-09-13"^^xsd:date etc
  • Is trí thríríní den fhoirm a bhunaítear nasc na gcásanna seo de thulasc le tuar coiteann :isMarriedTo1 rdf:singletonPropertyOf :isMarriedTo.
  • Is léir go rdf:singletonPropertyOf rdfs:subPropertyOf rdf:type, ach smaoinigh ar an bhfáth nár cheart duit scríobh :isMarriedTo1 rdf:type :isMarriedTo.

Réitítear fadhb na “tacaíochta LPG” anseo ag leibhéal an RDFS. Ní mór cinneadh den sórt sin a chur san áireamh sa chás cuí caighdeánach. D’fhéadfadh go mbeadh roinnt athruithe ag teastáil le haghaidh siopaí RDF a thacaíonn le hiarmhairtí a ghabhann leis, ach faoi láthair, is féidir smaoineamh ar Singleton Property mar theicníc shamhaltaithe eile.

V.1.2. Athchóiriú Déanta Ceart

Eascraíonn cur chuige nach bhfuil chomh naive as an tuiscint go bhfuil cásanna maoine intuartha go hiomlán ag triplets. Trí rud éigin a rá faoi triplets, beimid in ann labhairt faoi chásanna maoine.

Is é an ceann is láidre de na cineálacha cur chuige seo RDF*, nó RDR, rugadh i ndoimhneacht Blazegraph. Tá sé ón tús tofa duit féin agus AnzoGraph. Cinntear daingne an chur chuige sin laistigh dá chreat ar fáil athruithe comhfhreagracha i Séimeantaic RDF. Is é an pointe, áfach, thar a bheith simplí. I sraithiú Turtle ar RDF is féidir leat rud éigin mar seo a scríobh anois:

<<:bob :isMarriedTo :alice>> :since "2013-09-13"^^xsd:date .

V.1.3. Cur chuige eile

Ní féidir leat bac a chur ar shéimeantaic fhoirmiúil, ach glacadh leis go simplí go bhfuil aitheantóirí áirithe ag triplets, atá, ar ndóigh, ina URIs, agus go gcruthaíonn siad triplets nua leis na URIanna seo. Níl fágtha ach rochtain a thabhairt ar na URIanna seo in SPARQL. Mar sin thagann Réaltóg.

In Allegrograph chuaigh ar bhealach idirmheánach. Tá sé ar eolas go bhfuil aitheantóirí triplet in Allegrograph , ach nuair a bhíonn tréithe triple á gcur i bhfeidhm ní chloíonn siad amach. Mar sin féin, tá sé fós i bhfad ó shéimeantaic fhoirmiúil. Is fiú a thabhairt faoi deara nach URIanna iad tréithe triplet, agus ní féidir le luachanna na dtréithe sin a bheith ach liteartha freisin. Faigheann lucht leanúna LPG go díreach cad a bhí uathu. San fhormáid NQX atá deartha go speisialta, tá an chuma seo ar shampla atá cosúil leis an gceann thuas do RDF*:

:bob :marriedTo :alice {"since" : "2013-09-13"}

V.2. Teangacha ceist

Tar éis duit tacaíocht a thabhairt do LPG ar bhealach amháin nó ar bhealach eile ag leibhéal an mhúnla, ní mór duit é a dhéanamh indéanta fiosrúcháin a dhéanamh ar shonraí i múnla den sórt sin.

  • Tacaíonn Blazegraph le haghaidh fiosrúcháin RDF* SPARQL* и Gremlin. Breathnaíonn ceist SPARQL* mar seo:

 SELECT * { <<:bob :isMarriedTo ?wife>> :since ?since }

  • Tacaíonn Anzograph freisin SPARQL* agus tá sé chun tacú Cypher, teanga cheistiúcháin i Neo4j.
  • Tacaíonn Stardog lena chuid féin расширение SPARQL agus arís Gremlín. Is féidir leat an URI triplet agus “meta-fhaisnéis” a fháil in SPARQL ag baint úsáide as rud éigin mar seo:

SELECT * {
    BIND (stardog:identifier(:bob, :isMarriedTo, ?wife) AS ?id)
    ?id :since ?since
}

 SELECT * { ("since" ?since)  franz:attributesNameValue  ( :bob :marriedTo ?wife ) }

Dála an scéil, thacaigh GraphDB ag aon am amháin le Tinkerpop/Gremlin gan tacaíocht a thabhairt do LPG, ach stop sé seo i leagan 8.0 nó 8.1.

VI. Ceadúnais a theannú

Níor cuireadh aon bhreiseanna le déanaí leis an áit a dtrasnaíonn na tacair “siopa trí-rogha” agus “siopa trí-siopa foinse oscailte” a chéile. Tá na siopaí nua foinse oscailte RDF i bhfad ó bheith ina rogha maith le húsáid ó lá go lá, agus tá na siopaí triple nua ar mhaith liom a úsáid (cosúil le AnzoGraph) foinse dúnta. Ina ionad sin, is féidir linn labhairt faoi laghduithe ...

Ar ndóigh, níor dúnadh foinse oscailte san am atá caite, ach ní fheictear go mall i roinnt stórtha foinse oscailte a thuilleadh gur fiú iad a roghnú. Tá Virtuoso, a bhfuil eagrán foinse oscailte aige, báite, i mo thuairim, ina fhabhtanna. Cheannaigh AWS Blazegraph agus bhí sé mar bhunús le Amazon Neiptiún; níl sé soiléir anois an mbeidh scaoileadh amháin eile ar a laghad ann. Níl fágtha ach Jena...

Más rud é nach bhfuil foinse oscailte an-tábhachtach, ach ba mhaith leat ach chun iarracht a dhéanamh, ansin tá gach rud freisin níos lú rosy ná riamh. Mar shampla:

  • Réaltóg stadann an leagan saor in aisce a dháileadh (mar sin féin, tá tréimhse trialach an leagan rialta méadaithe faoi dhó);
  • в Scamall GraphDB, áit a bhféadfá plean bunúsach saor in aisce a roghnú roimhe seo, cuireadh clárúcháin úsáideora nua ar fionraí.

Go ginearálta, don ghnáthdhuine TF, tá spás ag éirí níos dorochtana agus níos mó, tá a fhorbairt ag éirí go leor corparáidí.

Foinse: will.com

Add a comment