Tá an Gréasán Séimeantach agus Sonraí Nasctha cosúil le spás amuigh: níl aon saol ann. Chun dul ann ar feadh tréimhse níos faide nó níos lú ama ... bhuel, níl a fhios agam cad a dúirt siad leat mar leanbh mar fhreagra ar "Ba mhaith liom a bheith i mo spásaire." Ach is féidir leat breathnú ar a bhfuil ag tarlú agus tú ar an Domhan; Tá sé i bhfad níos éasca a bheith i do réalteolaí amaitéarach nó fiú mar ghairmí.
Díreoidh an t-alt ar threochtaí le déanaí, nach sine ná roinnt míonna, ó shaol na stórála RDF. Bhí an meafar sa chéad mhír spreagtha ag an íomhá fógraíochta eipiciúil faoin gearrtha.
Pictiúr eipiciúil

I. GraphQL le haghaidh rochtana RDF
go bhfuil sé mar aidhm ag GraphQL a bheith ina teanga rochtana bunachar sonraí uilíoch. Cad mar gheall ar an gcumas rochtain a fháil ar RDF ag baint úsáide as GraphQL?
As an mbosca cuirtear an deis seo ar fáil ag:
- Réaltóg (, );
- táirgí TopQuadrant (, ).
Mura dtugann an stór deis dá leithéid, is féidir é a chur i bhfeidhm go neamhspleách trí “réiteach” cuí a scríobh. Seo mar a rinne siad, mar shampla, i dtionscadal na Fraince . Nó is féidir leat a thuilleadh a scríobh rud ar bith, ach amháin a ghlacadh .
Ó thaobh cloí orthodox den Ghréasán Séimeantach agus Sonraí Nasctha, tá sé seo go léir, ar ndóigh, brónach, ós rud é gur cosúil go bhfuil sé deartha le haghaidh comhtháthú tógtha timpeall an chéad silo sonraí eile, agus nach bhfuil ardáin oiriúnacha (siopaí RDF, ar ndóigh) .
Tá dhá thuairim ag baint le comparáid a dhéanamh idir GraphQL agus SPARQL.
- Ar thaobh amháin, is cosúil le GraphQL gaol i bhfad i gcéin de SPARQL: réitíonn sé na fadhbanna a bhaineann le hathshampláil agus iolrú na gceisteanna atá tipiciúil do REST - gan a, is dócha, ní bheadh sé indéanta a bhreithniú teanga cheist, ar a laghad don ngréasán;
- Ar an láimh eile, is cúis díomá é scéimre dhocht GraphQL. Dá réir sin, is cosúil go bhfuil a “introspectiveness” an-teoranta i gcomparáid le hathmhachnamhacht iomlán RDF. Agus níl aon analógach de chosáin maoine, mar sin níl sé fiú an-soiléir cén fáth go bhfuil sé "Graph-".
II. Cuibheoirí le haghaidh MongoDB
Treocht comhlántach leis an gceann roimhe seo.
- i Stardog anois - go háirithe, go léir ar an GraphQL céanna - mapáil sonraí MongoDB a chumrú i graif fíorúil RDF;
- Tá GraphDB le déanaí cuir isteach blúirí i SPARQL ar Cheist MongoDB.
Má labhraímid ar bhealach níos leithne faoi oiriúntóirí chuig foinsí JSON, a ligeann do níos mó nó níos lú “ar an eitilt” ionadaíocht a dhéanamh ar an JSON atá stóráilte sna foinsí seo mar RDF, is féidir linn a thabhairt chun cuimhne an fadbhunaithe , is féidir a choigeartú, , a Apache Jena.
Agus achoimre á dhéanamh ar an gcéad dá threocht, is féidir linn a rá go léiríonn stórais RDF lán-ullmhacht le haghaidh comhtháthú agus feidhmiú i gcoinníollacha “marthanachta polyglot”. Tá sé ar eolas, áfach, go bhfuil an dara ceann seo fada as faisean, agus tá sé á chur in ionad il-mhúnla. Cad mar gheall ar il-mhúnlú i saol na stórála RDF?
I mbeagán focal, aon bhealach. Ba mhaith liom alt ar leith a thiomnú don ábhar a bhaineann le DBMSanna ilmhúnla, ach faoi láthair is féidir a thabhairt faoi deara nach bhfuil aon DBMSanna ilmhúnla “bunaithe” ar shamhail ghraif faoi láthair (is féidir RDF a mheas mar chineál de) . Pléifear roinnt ilmhúnlú beag - tacaíocht stórála RDF le haghaidh múnla malartach graf LPG - i .
III. OLTP vs. OLAP
Mar sin féin, an Gartner céanna is coinníoll sine qua non é an tsamhail sin go príomha seomraí oibriúcháin DBMS. Tá sé seo intuigthe: i gcás “stóráil ilathraithe”, tagann na príomhfhadhbanna chun cinn maidir le hidirbheartaíocht.
Ach cá bhfuil stórais RDF suite ar scála OLTP-OLAP? Thabharfainn freagra mar seo: níl ann ná anseo. Chun a chur in iúl cad chuige a bhfuil siad ceaptha, tá tríú giorrúchán ag teastáil. Mar rogha a mholfainn OLIP — Próiseáil Intleachtúil Ar Líne.
Mar sin féin, fós:
- ní hiad na meicníochtaí comhtháthaithe le MongoDB a cuireadh i bhfeidhm i GraphDB ar a laghad a bheith ag obair timpeall ar cheisteanna léirithe scríofa;
- Téann Stardog níos faide agus go hiomlán inneall, arís leis an sprioc feidhmíocht taifeadta a fheabhsú.
Anois lig dom imreoir nua a thabhairt isteach sa mhargadh. ó chruthaitheoirí IBM Netezza agus Amazon Redshift - . Cuireadh pictiúr ó fhógra do tháirge bunaithe air ag tús an ailt. Seasann AnzoGraph é féin mar réiteach GOLAP. Conas is maith leat SPARQL le feidhmeanna fuinneoige? —
SELECT ?month (COUNT(?event) OVER (PARTITION BY ?month) AS ?events) WHERE { … }IV. RocksDB
Cheana féin níos airde le fógra Stardog 7 Beta, a dúirt go raibh Stardog chun RocksDB a úsáid mar bhunchóras stórála - stór eochair-luach, forc Facebook de LevelDB Google. Cén fáth gur fiú labhairt faoi threocht áirithe?
Ar an gcéad dul síos, ag déanamh moltóireachta , ní hamháin go ndéantar stórais RDF a “thrasphlandú” go RocksDB. Tá tionscadail ann chun RocksDB a úsáid mar inneall stórála in ArangoDB, MongoDB, MySQL agus MariaDB, Cassandra.
Ar an dara dul síos, cruthaítear tionscadail (is é sin, ní táirgí) ar ábhair ábhartha ar RocksDB.
Mar shampla, úsáideann eBay RocksDB i do do “ghraf eolais”. Dála an scéil, tá sé greannmhar léamh: cuireadh tús le teanga na gceisteanna mar fhormáid dhúchais, ach le déanaí tá sí ag aistriú go mbeidh sí i bhfad níos cosúla le SPARQL. Mar a tharla sa joke: is cuma cé mhéad graf eolais a dhéanaimid, táimid fós ag deireadh le RDF.
Sampla eile - ceann a bhí le feiceáil cúpla mí ó shin . Sular tugadh isteach é, b'éigean faisnéis stairiúil Wikidata a rochtain tríd chuig an API caighdeánach Mediawiki. Anois is féidir go leor le SPARQL íon. “Faoi an cochall” tá RocksDB ann freisin. Dála an scéil, rinneadh WDHQS, is cosúil, ag an duine a d'iompórtáil Freebase isteach sa Google Knowledge Graph.
V. Tacaíocht LPG
Cuir i gcuimhne duit an phríomhdhifríocht idir graif LPG agus graif RDF.
In LPG, is féidir maoin scálach a shannadh do chásanna imeall, agus in RDF ní féidir iad a shannadh ach do “chineálacha” imeall (ach ní hamháin airíonna scálacha, ach gnáthnaisc freisin). Chuir an teorannú seo ar RDF i gcomparáid le GPL teicníc shamhaltú amháin nó eile. Tá sé níos deacra teorainneacha GPL i gcomparáid le RDF a shárú, ach tá graif LPG níos cosúla le pictiúir ó théacsleabhar Harari ná le graif RDF, agus is é sin an fáth go dteastaíonn ó dhaoine iad.
Ar ndóigh, tá dhá chuid i gceist le “tacaíocht LPG”:
- athruithe a dhéanamh ar an tsamhail RDF a fhágann gur féidir struchtúir LPG a insamhladh inti;
- athruithe a dhéanamh ar theanga cheist an RDF a fhágann gur féidir rochtain a fháil ar shonraí sa mhúnla modhnaithe seo, nó an cumas chun fiosrúcháin a dhéanamh ar an tsamhail seo i dteangacha ceisteanna coitianta LPG a chur i bhfeidhm.
V.1. Múnla sonraí
Tá roinnt cur chuige féideartha anseo.
V.1.1. Maoin Singleton
Is dócha gurb é an cur chuige is liteartha maidir le comhchuibhiú RDF agus LPG :
- In ionad, mar shampla, an tuar
:isMarriedToúsáidtear tuar:isMarriedTo1,:isMarriedTo2agus mar sin de. - Ansin déantar na réamh-mheastacháin seo a bheith ina n-ábhar do thríríní nua:
:isMarriedTo1 :since "2013-09-13"^^xsd:dateetc - Is trí thríríní den fhoirm a bhunaítear nasc na gcásanna seo de thulasc le tuar coiteann
:isMarriedTo1 rdf:singletonPropertyOf :isMarriedTo. - Is léir go
rdf:singletonPropertyOf rdfs:subPropertyOf rdf:type, ach smaoinigh ar an bhfáth nár cheart duit scríobh:isMarriedTo1 rdf:type :isMarriedTo.
Réitítear fadhb na “tacaíochta LPG” anseo ag leibhéal an RDFS. Ní mór cinneadh den sórt sin a chur san áireamh sa chás cuí . D’fhéadfadh go mbeadh roinnt athruithe ag teastáil le haghaidh siopaí RDF a thacaíonn le hiarmhairtí a ghabhann leis, ach faoi láthair, is féidir smaoineamh ar Singleton Property mar theicníc shamhaltaithe eile.
V.1.2. Athchóiriú Déanta Ceart
Eascraíonn cur chuige nach bhfuil chomh naive as an tuiscint go bhfuil cásanna maoine intuartha go hiomlán ag triplets. Trí rud éigin a rá faoi triplets, beimid in ann labhairt faoi chásanna maoine.
Is é an ceann is láidre de na cineálacha cur chuige seo , nó RDR, i ndoimhneacht Blazegraph. Tá sé ón tús duit féin agus AnzoGraph. Cinntear daingne an chur chuige sin laistigh dá chreat athruithe comhfhreagracha i . Is é an pointe, áfach, thar a bheith simplí. I sraithiú Turtle ar RDF is féidir leat rud éigin mar seo a scríobh anois:
<<:bob :isMarriedTo :alice>> :since "2013-09-13"^^xsd:date .V.1.3. Cur chuige eile
Ní féidir leat bac a chur ar shéimeantaic fhoirmiúil, ach glacadh leis go simplí go bhfuil aitheantóirí áirithe ag triplets, atá, ar ndóigh, ina URIs, agus go gcruthaíonn siad triplets nua leis na URIanna seo. Níl fágtha ach rochtain a thabhairt ar na URIanna seo in SPARQL. Mar sin Réaltóg.
In Allegrograph ar bhealach idirmheánach. Tá sé ar eolas go bhfuil aitheantóirí triplet in Allegrograph , ach nuair a bhíonn tréithe triple á gcur i bhfeidhm ní chloíonn siad amach. Mar sin féin, tá sé fós i bhfad ó shéimeantaic fhoirmiúil. Is fiú a thabhairt faoi deara nach URIanna iad tréithe triplet, agus ní féidir le luachanna na dtréithe sin a bheith ach liteartha freisin. Faigheann lucht leanúna LPG go díreach cad a bhí uathu. San fhormáid NQX atá deartha go speisialta, tá an chuma seo ar shampla atá cosúil leis an gceann thuas do RDF*:
:bob :marriedTo :alice {"since" : "2013-09-13"}V.2. Teangacha ceist
Tar éis duit tacaíocht a thabhairt do LPG ar bhealach amháin nó ar bhealach eile ag leibhéal an mhúnla, ní mór duit é a dhéanamh indéanta fiosrúcháin a dhéanamh ar shonraí i múnla den sórt sin.
- Tacaíonn Blazegraph le haghaidh fiosrúcháin RDF* и . Breathnaíonn ceist SPARQL* mar seo:
SELECT * { <<:bob :isMarriedTo ?wife>> :since ?since }- Tacaíonn Anzograph freisin agus tá sé chun tacú , teanga cheistiúcháin i Neo4j.
- Tacaíonn Stardog lena chuid féin SPARQL agus Gremlín. Is féidir leat an URI triplet agus “meta-fhaisnéis” a fháil in SPARQL ag baint úsáide as rud éigin mar seo:
SELECT * {
BIND (stardog:identifier(:bob, :isMarriedTo, ?wife) AS ?id)
?id :since ?since
}- Tacaíonn Allegrograph lena chuid féin freisin SPARQL:
SELECT * { ("since" ?since) franz:attributesNameValue ( :bob :marriedTo ?wife ) }Dála an scéil, thacaigh GraphDB ag aon am amháin le Tinkerpop/Gremlin gan tacaíocht a thabhairt do LPG, ach stop sé seo i leagan 8.0 nó 8.1.
VI. Ceadúnais a theannú
Níor cuireadh aon bhreiseanna le déanaí leis an áit a dtrasnaíonn na tacair “siopa trí-rogha” agus “siopa trí-siopa foinse oscailte” a chéile. Tá na siopaí nua foinse oscailte RDF i bhfad ó bheith ina rogha maith le húsáid laethúil, agus tá na siopaí RDF nua ar mhaith liom a úsáid (cosúil le AnzoGraph) foinse dúnta. Ina ionad sin, is féidir linn fiú labhairt faoi laghduithe ...
Ar ndóigh, níor dúnadh foinse oscailte san am atá caite, ach ní fheictear go mall i roinnt stórtha foinse oscailte a thuilleadh gur fiú iad a roghnú. Tá Virtuoso, a bhfuil eagrán foinse oscailte aige, báite, i mo thuairim, ina fhabhtanna. Cheannaigh AWS Blazegraph agus bhí sé mar bhunús le Amazon Neiptiún; níl sé soiléir anois an mbeidh scaoileadh amháin eile ar a laghad ann. Níl fágtha ach Jena...
Más rud é nach bhfuil foinse oscailte an-tábhachtach, ach ba mhaith leat ach chun iarracht a dhéanamh, ansin tá gach rud freisin níos lú rosy ná riamh. Mar shampla:
- Réaltóg an leagan saor in aisce a dháileadh (mar sin féin, tá tréimhse trialach an leagan rialta méadaithe faoi dhó);
- в , áit a bhféadfá plean bunúsach saor in aisce a roghnú roimhe seo, tá clárúcháin úsáideoirí nua curtha ar fionraí.
Go ginearálta, don ghnáthdhuine TF, tá spás ag éirí níos dorochtana agus níos mó, tá a fhorbairt ag éirí go leor corparáidí.
Foinse: will.com
