Lìon Semantic agus Dàta Ceangailte. Ceartachaidhean agus cur-ris

Bu mhath leam criomag den leabhar seo a chaidh fhoillseachadh o chionn ghoirid a thaisbeanadh don phoball:

Modaileadh ontological iomairt: dòighean agus teicneòlasan [Text]: monograph / [S. V. Gorshkov, S. S. Kralin, O. I. Mushtak agus feadhainn eile; neach-deasachaidh gnìomh S.V. Gorshkov]. - Ekaterinburg: Taigh Foillseachaidh Oilthigh Ural, 2019. - 234 p.: tinn., clàr; 20 cm.— Ughdar. air a chomharrachadh air an cùl. Le. — Leabhar-chlàr aig deireadh ch. — ISBN 978-5-7996-2580-1: 200 leth-bhreac.

Tha ceithir adhbhar airson a’ chriomag seo a phostadh air Habré:

  • Chan eil e coltach gum bi e comasach dha duine an leabhar seo a chumail nan làmhan mura h-eil e na neach-dèiligidh aig a bheil spèis Clàr-innse Serge; Chan eil e gu cinnteach air a reic.
  • Chaidh ceartachaidhean a dhèanamh ris an teacsa (chan eil iad air an comharrachadh gu h-ìosal) agus chaidh cur-ris a dhèanamh nach eil gu math co-chòrdail ri cruth monograph clò-bhuailte: notaichean cuspaireil (fo spoilers) agus ceanglaichean eadar-lìn.
  • Tha mi ag iarraidh cruinnich ceistean agus beachdan, gus an aire a thoirt dhaibh nuair a thathar a’ toirt a-steach an teacsa seo ann an cruth ath-sgrùdaichte ann am foillseachaidhean sam bith eile.
  • Tha mòran de luchd-leanmhainn Semantic Web agus Dàta Ceangailte fhathast den bheachd gu bheil an cearcall aca cho cumhang, gu h-àraidh leis nach eil am poball san fharsaingeachd air a mhìneachadh gu ceart fhathast cho math sa tha e a bhith mar neach-leantainn an Lìon Semantic agus Dàta Ceangailte. Chan eil ùghdar a 'chriomag, ged a bhuineas e don chearcall seo, a' cumail a 'bheachd seo, ach, a dh' aindeoin sin, tha e den bheachd gu bheil e mar dhleastanas air oidhirp eile a dhèanamh.

Agus mar sin,

Lìon sìmplidh

Faodar mean-fhàs an eadar-lìn a riochdachadh mar a leanas (no bruidhinn mu na roinnean a chaidh a chruthachadh san òrdugh gu h-ìosal):

  1. Sgrìobhainnean air an eadar-lìon. Prìomh theicneòlasan - Gopher, FTP, msaa.
    Tha an eadar-lìn na lìonra cruinne airson iomlaid ghoireasan ionadail.
  2. Sgrìobhainnean eadar-lìon. Is e prìomh theicneòlasan HTML agus HTTP.
    Tha nàdar nan goireasan fosgailte a’ toirt aire do fheartan a’ mheadhan sgaoilidh aca.
  3. Dàta eadar-lìn. Prìomh theicneòlasan - REST agus SOAP API, XHR, msaa.
    Aig àm tagraidhean eadar-lìn, chan e a-mhàin gu bheil daoine gu bhith nan luchd-cleachdaidh ghoireasan.
  4. Dàta eadar-lìn. Is e prìomh theicneòlasan teicneòlas dàta ceangailte.
    Canar an Lìon Semantic ris a’ cheathramh ìre seo, air a ro-innse le Berners-Lee, neach-cruthachaidh an dàrna prìomh theicneòlasan agus stiùiriche an W3C; Tha teicneòlasan Dàta Ceangailte air an dealbhadh gus dàta a dhèanamh air an lìon chan ann a-mhàin le inneal furasta a leughadh, ach cuideachd “so-thuigsinn le inneal.”

Bho na leanas, tuigidh an leughadair an conaltradh eadar prìomh bhun-bheachdan an dàrna agus an ceathramh ìre:

  • Tha URLan co-chosmhail ri URIan,
  • is e RDF an analogue de HTML,
  • Tha ceanglaichean HTML coltach ri tachartasan URI ann an sgrìobhainnean RDF.

Tha an Lìon Semantic nas motha de shealladh siostamach air àm ri teachd an eadar-lìn na gluasad sònraichte gun spionnadh no coiteachadh, ged a dh’ fhaodas e aire a thoirt dhaibh sin. Mar eisimpleir, tha feart cudromach den rud ris an canar Web 2.0 air a mheas mar “susbaint air a ghineadh leis an neach-cleachdaidh.” Gu sònraichte, thathas ag iarraidh air moladh W3C aire a thoirt dha “Ontology notaichean lìn a"agus leithid de ghealladh solid.

A bheil an lìon Semantic marbh?

Ma dhiùltas tu sùileachadh neo-phractaigeach, tha an suidheachadh leis an lìon semantach timcheall air an aon rud ri co-mhaoineas aig amannan sòisealachd leasaichte (agus co-dhiù a thathas a’ cumail sùil air dìlseachd do chleachdaidhean cumhach Ilyich, leig leis a h-uile duine co-dhùnadh dhaibh fhèin). Innealan rannsachaidh gu math soirbheachail toirt air làraich-lìn RDFa agus JSON-LD a chleachdadh agus iad fhèin a’ cleachdadh theicneòlasan co-cheangailte ris an fheadhainn a tha air am mìneachadh gu h-ìosal (Google Knowledge Graph, Bing Knowledge Graph).

San fharsaingeachd, chan urrainn don ùghdar a ràdh dè a tha a 'cur casg air sgaoileadh nas motha, ach faodaidh e bruidhinn air bunait eòlas pearsanta. Tha duilgheadasan ann a dh’ fhaodadh a bhith air am fuasgladh “a-mach às a’ bhogsa ”ann an suidheachaidhean ionnsaigh an SW, ged nach eil iad gu math farsaing. Mar thoradh air an sin, chan eil dòigh aig an fheadhainn a tha mu choinneamh nan gnìomhan sin air co-èigneachadh an aghaidh an fheadhainn as urrainn fuasgladh a thoirt seachad, fhad ‘s a tha solar neo-eisimeileach an neach mu dheireadh de fhuasgladh a’ dol an-aghaidh na modalan gnìomhachais aca. Mar sin bidh sinn a’ cumail oirnn a’ parsadh HTML agus a’ glaodhadh ri chèile diofar APIan, a chèile nas shittier.

Ach, tha teicneòlasan Dàta Ceangailte air sgaoileadh nas fhaide na an lìon àbhaisteach; Tha an leabhar, gu dearbh, coisrigte dha na tagraidhean sin. An-dràsta, tha a’ choimhearsnachd Dàta Ceangailte an dùil gum fàs na teicneòlasan sin eadhon nas fharsainge le taing do chlàradh Gartner (no gairm, mar a thogras tu) de ghluasadan leithid Grafaichean eòlais и Fabric dàta. Bu mhath leam a chreidsinn nach e buileachadh “baidhsagal” de na bun-bheachdan sin a bhios soirbheachail, ach an fheadhainn co-cheangailte ri inbhean W3C air an tèid beachdachadh gu h-ìosal.

Dàta ceangailte

Mhìnich Berners-Lee Dàta Ceangailte mar an lìon semantach “air a dhèanamh ceart”: seata de dhòighean-obrach agus theicneòlasan a leigeas leis na h-amasan deireannach aige a choileanadh. Prionnsabalan bunaiteach Dàta Ceangailte Berners-Lee air a chomharrachadh na leanas.

Prionnsabal 1. A’ cleachdadh URIan gus buidhnean ainmeachadh.

Tha URIan nan aithnichearan eintiteas cruinneil seach aithnichearan sreang ionadail airson inntrigidhean. Às deidh sin, chaidh am prionnsapal seo a chuir an cèill ann an sluagh-ghairm Google Knowledge Graph “rudan, chan e sreangan".

Prionnsabal 2. A’ cleachdadh URIan san sgeama HTTP gus an tèid an dì-iomradh.

Le bhith a’ toirt iomradh air URI, bu chòir gum biodh e comasach an comharra a tha air cùl an neach-soidhnidh sin fhaighinn (tha an samhlachas ri ainm a’ ghnìomhaiche " soilleir an seo).*" ann an C); nas mionaidiche, gus beagan riochdachaidh den seo a chomharrachadh - a rèir luach bann-cinn HTTP Accept:. Is dòcha, le teachd na linn AR/VR, gum bi e comasach an goireas fhèin fhaighinn, ach airson a-nis, is coltaiche, is e sgrìobhainn RDF a bhios ann, a tha mar thoradh air iarrtas SPARQL a chuir an gnìomh. DESCRIBE.

Prionnsabal 3. Cleachdadh inbhean W3C - gu h-àraidh RDF(S) agus SPARQL - gu sònraichte nuair a thathar a’ cur cùl ri URIan.

Tha na “sreathan” fa leth sin den stac teicneòlas Dàta Ceangailte, ris an canar cuideachd Cèic Semantic Web Layer, thèid a mhìneachadh gu h-ìosal.

Prionnsabal 4. Cleachdadh iomraidhean air URIan eile nuair a thathar a’ toirt cunntas air buidhnean.

Leigidh RDF leat thu fhèin a chuingealachadh gu cunntas beòil air goireas ann an cànan nàdarrach, agus tha an ceathramh prionnsapal ag iarraidh gun a bhith a’ dèanamh seo. Ma tha a’ chiad phrionnsapal air a choimhead gu h-uile-choitcheann, bidh e comasach nuair a thathar a’ toirt cunntas air goireas iomradh a thoirt air feadhainn eile, a’ toirt a-steach feadhainn “cèin”, agus is e sin as coireach gu bheilear ag ainmeachadh an dàta ceangailte. Gu dearbh, tha e cha mhòr do-sheachanta a bhith a 'cleachdadh URIan air an ainmeachadh ann am briathrachas RDFS.

MLS a 'ciallachadh

MLS a 'ciallachadh (Frèam Tuairisgeul Goireas) na fhoirmeileachd airson cunntas a thoirt air buidhnean eadar-cheangailte.

Thathas a’ dèanamh aithrisean den t-seòrsa “cuspair-ro-innse-rud”, ris an canar triplets, mu bhuidhnean agus na dàimhean aca. Anns a 'chùis as sìmplidh, tha an cuspair, an ro-aithris, agus an nì uile nan URIan. Faodaidh an aon URI a bhith ann an diofar shuidheachaidhean ann an diofar thursan: a bhith na chuspair, na ro-innse, agus na nì; Mar sin, bidh na triplets a’ cruthachadh seòrsa de ghraf ris an canar graf RDF.

Faodaidh cuspairean agus nithean a bhith chan e a-mhàin URIs, ach cuideachd ris an canar sin nodan falamh, agus faodaidh nithean a bhith cuideachd litrichean. Tha litrichean nan eisimpleirean de sheòrsan prìomhadail anns a bheil riochdachadh sreang agus comharradh seòrsa.

Eisimpleirean de sgrìobhadh litrichean (ann an co-chòrdadh Turtle, barrachd mu dheidhinn gu h-ìosal): "5.0"^^xsd:float и "five"^^xsd:string. Litrichean le seòrsa rdf:langString faodar cuideachd taga cànain a uidheamachadh; ann an Turtle tha e sgrìobhte mar seo: "five"@en и "пять"@ru.

Tha nodan falamh nan goireasan “gun urra” às aonais aithnichearan cruinneil, air am faodar aithrisean a dhèanamh, ge-tà; seòrsa de chaochladairean bith-beò.

Mar sin (is e seo, gu dearbh, puing iomlan RDF):

  • is e cuspair URI no nód falamh,
  • tha an ro-aithris na URI,
  • Is e nì a th’ ann an URI, nód falamh, no litireil.

Carson nach urrainn dha comharran a bhith nan nodan falamh?

Is e an adhbhar as coltaiche am miann a bhith a’ tuigsinn agus ag eadar-theangachadh triplet gu neo-fhoirmeil gu cànan loidsig ciad-òrdugh. s p o coltach ri rud mar Lìon Semantic agus Dàta Ceangailte. Ceartachaidhean agus cur-riscàite Lìon Semantic agus Dàta Ceangailte. Ceartachaidhean agus cur-ris - ro-innse, Lìon Semantic agus Dàta Ceangailte. Ceartachaidhean agus cur-ris и Lìon Semantic agus Dàta Ceangailte. Ceartachaidhean agus cur-ris - seasmhach. Tha comharran den tuigse seo anns an sgrìobhainn “LBase: Semantics for Languages ​​of the Semantic Web", aig a bheil inbhe nota buidheann obrach W3C. Leis an tuigse seo, an triplet s p []càite [] — nód falamh, air eadar-theangachadh mar Lìon Semantic agus Dàta Ceangailte. Ceartachaidhean agus cur-riscàite Lìon Semantic agus Dàta Ceangailte. Ceartachaidhean agus cur-ris - caochlaideach, ach ciamar a nì thu eadar-theangachadh s [] o? Sgrìobhainn le inbhe Molaidh W3C"RDF 1.1 Semantics” a’ tabhann dòigh eadar-theangachaidh eile, ach chan eil e fhathast a’ beachdachadh air comasachd a bhith ann mar nodan falamh.

Ach, Manu Sporni ceadaichte.

Tha RDF na mhodail eas-chruthach. Faodar RDF a sgrìobhadh (sreathach) ann an diofar cho-aontaran: RDF/XML, Turtle (a 'chuid as motha a ghabhas leughadh le daoine), JSON-LD, HDT (dìneach).

Faodar an aon RDF a chuir a-steach do RDF / XML ann an diofar dhòighean, mar sin, mar eisimpleir, chan eil e ciallach an XML a thig às a dhearbhadh le bhith a’ cleachdadh XSD no feuchainn ri dàta a tharraing a-mach a’ cleachdadh XPath. Mar an ceudna, chan eil e coltach gum bi JSON-LD a’ sàsachadh miann cuibheasach leasaiche Javascript a bhith ag obair le RDF a’ cleachdadh dot agus comharra cam ceàrnagach Javascript (ged a ghluaiseas JSON-LD an taobh sin le bhith a’ tabhann uidheamachd frèamadh).

Bidh a’ mhòr-chuid de cho-aontaran a’ tabhann dhòighean air URIan fada a ghiorrachadh. Mar eisimpleir, sanas @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> ann an Turtle an uairsin leigidh sin dhut sgrìobhadh na àite <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> dìreach rdf:type.

RDFS

RDFS (RDF Schema) - briathrachas modail bunaiteach, a 'toirt a-steach bun-bheachdan seilbh agus clas agus feartan leithid rdf:type, rdfs:subClassOf, rdfs:domain и rdfs:range. A’ cleachdadh faclair RDFS, mar eisimpleir, faodar na h-abairtean dligheach a leanas a sgrìobhadh:

rdf:type         rdf:type         rdf:Property .
rdf:Property     rdf:type         rdfs:Class .
rdfs:Class       rdfs:subClassOf  rdfs:Resource .
rdfs:subClassOf  rdfs:domain      rdfs:Class .
rdfs:domain      rdfs:domain      rdf:Property .
rdfs:domain      rdfs:range       rdfs:Class .
rdfs:label       rdfs:range       rdfs:Literal .

Is e tuairisgeul agus briathrachas modail a th’ ann an RDFS, ach chan e cànan bacaidh a th’ ann (ged a tha an sònrachadh oifigeil agus duilleagan comas air a leithid de chleachdadh). Cha bu chòir am facal "Schema" a thuigsinn san aon dòigh ris an abairt "XML Schema". Mar eisimpleir, :author rdfs:range foaf:Person a' ciallachadh sin rdf:type gach luach seilbh :author - foaf:Person, ach chan eil sin a’ ciallachadh gum bu chòir seo a ràdh ro-làimh.

SPARQL

SPARQL (SPARQL Protocol agus RDF Query Language) - cànan airson dàta RDF a cheasnachadh. Ann an cùis shìmplidh, tha ceist SPARQL na sheata de shamhlaichean far a bheil triplets den ghraf a thathar a’ ceasnachadh air am maidseadh. Faodaidh caochladairean a bhith ann am pàtrain ann an suidheachadh cuspair, ro-innse, agus nithean.

Tillidh a’ cheist na luachan caochlaideach sin a dh’ fhaodadh, nuair a thèid an cur an àite nan sampallan, fo-sgrìobhadh den ghraf RDF a chaidh a cheasnachadh (fo-sheata de na triplets aige). Feumaidh na h-aon luachan a bhith aig caochladairean den aon ainm ann an diofar shamhlaichean de triplets.

Mar eisimpleir, leis an t-seata gu h-àrd de sheachd axioms RDFS, tillidh a’ cheist a leanas rdfs:domain и rdfs:range mar luachan ?s и ?p fa leth:

SELECT * WHERE {
 ?s ?p rdfs:Class .
 ?p ?p rdf:Property .
}

Is fhiach a bhith mothachail gu bheil SPARQL dearbhach agus nach e cànan a th’ ann airson cunntas a thoirt air tar-chuir graf (ge-tà, tha cuid de stòran RDF a’ tabhann dhòighean air plana gnìomh na ceiste atharrachadh). Mar sin, chan urrainnear cuid de dhuilgheadasan grafa àbhaisteach, mar eisimpleir, lorg an t-slighe as giorra, fhuasgladh ann an SPARQL, a’ gabhail a-steach cleachdadh na slighean seilbh (ach, a-rithist, tha tasgaidhean RDF fa leth a 'tairgse leudachaidhean sònraichte gus na duilgheadasan sin fhuasgladh).

Chan eil SPARQL a’ co-roinn ris a’ bheachd air fosgarrachd an t-saoghail agus tha e a’ leantainn an dòigh-obrach “àicheadh ​​mar fhàilligeadh”, anns a bheil comasach dealbhadh leithid FILTER NOT EXISTS {…}. Thathas a’ toirt aire do sgaoileadh dàta a’ cleachdadh an uidheamachd ceistean aonaichte.

Chan eil analogues dìreach aig an àite inntrigidh SPARQL - stòr RDF a tha comasach air ceistean SPARQL a làimhseachadh bhon dàrna ìre (faic toiseach a’ pharagraf seo). Faodar a choimeas ri stòr-dàta, stèidhichte air na tha de dhuilleagan HTML air an cruthachadh, ach ruigsinneach don taobh a-muigh. Tha puing-inntrigidh SPARQL nas coltaiche ri puing-inntrigidh API bhon treas ìre, ach le dà phrìomh eadar-dhealachadh. An toiseach, tha e comasach grunn cheistean “atamach” a chur còmhla ann an aon (a tha air a mheas mar phrìomh fheart de GraphQL), agus san dàrna àite, tha API mar sin gu tur fèin-chlàradh (is e sin a dh’ fheuch HATEOAS ri choileanadh).

Iomradh poileataigeach

Tha RDF na dhòigh air dàta fhoillseachadh air an lìon, agus mar sin bu chòir beachdachadh air stòradh RDF mar sgrìobhainn DBMS. Fìor, leis gur e graf a th ’ann an RDF agus chan e craobh, thionndaidh iad a-mach gu bhith stèidhichte air graf. Tha e iongantach gun do dh’ obraich e a-mach idir. Cò bhiodh air smaoineachadh gum biodh daoine sgairteil ann a chuireadh nodan bàn an gnìomh. Tha Codd an seo cha do dh'obraich e a-mach.

Tha cuideachd nas lugha de dhòighean làn-nochdadh ann airson ruigsinneachd air dàta RDF a chuir air dòigh, mar eisimpleir, Criomag dàta ceangailte (LDF) agus Àrd-ùrlar Dàta Ceangailte (LDP).

OWL

OWL (Cànan Ontology Lìn) - foirmeileachd airson eòlas a riochdachadh, dreach syntactic de loidsig tuairisgeul Lìon Semantic agus Dàta Ceangailte. Ceartachaidhean agus cur-ris (anns a h-uile àite gu h-ìosal tha e nas ceart OWL 2 a ràdh, bha a’ chiad dreach de OWL stèidhichte air Lìon Semantic agus Dàta Ceangailte. Ceartachaidhean agus cur-ris).

Tha bun-bheachdan loidsig tuairisgeulach ann an OWL a’ freagairt ri clasaichean, tha dreuchdan a’ freagairt ri feartan, bidh daoine fa leth a’ cumail an ainm roimhe. Canar axioms cuideachd ri axioms.

Mar eisimpleir, anns a 'cho-ainm Co-chòrdadh Manchester airson OWL notation an axiom a tha aithnichte dhuinn mu thràth Lìon Semantic agus Dàta Ceangailte. Ceartachaidhean agus cur-ris bithidh e sgrìobhta mar so :

Class: Human
Class: Parent
   EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent

Tha co-chòrdadh eile ann airson sgrìobhadh OWL, leithid co-chòrdadh gnìomhail, air a chleachdadh anns an t-sònrachadh oifigeil, agus OWL/XML. A bharrachd air an sin, faodar OWL a chuir ann an sreath gus co-chòrdadh RDF a thoirt air falbh agus nas fhaide - ann an gin de na co-chòrdadh sònraichte.

Tha dàimh dhùbailte aig OWL ri RDF. Air an aon làimh, faodar a mheas mar sheòrsa de fhaclair a tha a ‘leudachadh RDFS. Air an làimh eile, is e foirmealachd nas cumhachdaiche a th’ ann far nach eil ann an RDF ach cruth sreathach. Chan urrainnear a h-uile togail bunaiteach OWL a sgrìobhadh le bhith a’ cleachdadh aon triplet RDF.

A rèir dè an fho-sheata de thogalaichean OWL a tha ceadaichte a chleachdadh, tha iad a’ bruidhinn air mar a chanar riutha Pròifilean OWL. Is e an fheadhainn àbhaisteach agus as ainmeil OWL EL, OWL RL agus OWL QL. Bidh an roghainn pròifil a’ toirt buaidh air iom-fhillteachd coimpiutaireachd dhuilgheadasan àbhaisteach. Seata iomlan de dhealbhaidhean OWL a fhreagras air Lìon Semantic agus Dàta Ceangailte. Ceartachaidhean agus cur-ris, ris an canar OWL DL. Aig amannan bidh iad cuideachd a’ bruidhinn air OWL Full, anns a bheil cead aig togalaichean OWL a bhith air an cleachdadh leis an làn shaorsa a tha dualach do RDF, gun chuingealachaidhean semantach agus coimpiutaireachd. Lìon Semantic agus Dàta Ceangailte. Ceartachaidhean agus cur-ris. Mar eisimpleir, faodaidh rudeigin a bhith an dà chuid clas agus seilbh. Tha OWL Full neo-chinnteach.

Is e na prìomh phrionnsabalan airson builean a cheangal ann an OWL gabhail ri barail an t-saoghail fhosgailte. O.W.A.) agus a bhith a’ diùltadh gabhail ris a’ bheachd air ainmean gun samhail (beachd ainm gun samhail, AON). Gu h-ìosal chì sinn far am faod na prionnsapalan sin cuid de dhealbhaidhean OWL a stiùireadh agus a thoirt a-steach.

Biodh a’ chriomag a leanas anns an ontology (ann an co-chòrdadh Manchester):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human
   Facts: hasChild Alice, hasChild Bob, hasChild Carol

An lean e bho na chaidh a ràdh gu bheil mòran chloinne aig Iain? Le bhith a’ diùltadh UNA bheir sin air an einnsean co-dhùnaidh a’ cheist seo a fhreagairt ann an àicheil, oir is dòcha gur e Alice agus Bob an aon neach. Gus na leanas a dhèanamh, feumar an axiom a leanas a chur ris:

DifferentIndividuals: Alice, Bob, Carol, John

Leig a-nis gu bheil an cruth a leanas aig a’ chriomag ontology (tha e air ainmeachadh gu bheil mòran chloinne aig Iain, ach chan eil aige ach dithis chloinne):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human, manyChildren
   Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John

Am bi an ontology seo neo-chunbhalach (a dh’fhaodar a mhìneachadh mar fhianais air dàta neo-dhligheach)? Le bhith a’ gabhail ri OWA bheir sin air an einnsean co-dhùnaidh freagairt anns an àicheil: “àiteigin” eile (ann an ontology eile) faodar a ràdh gu bheil Carol cuideachd na leanabh aig Iain.

Gus casg a chuir air seo, leig dhuinn fìrinn ùr a chuir ris mu Iain:

Individual: John
   Facts: hasChild Alice, hasChild Bob, not hasChild Carol

Gus casg a chuir air coltas clann eile, canaidh sinn gu bheil a h-uile luach den togalach “le leanabh” nan daoine, agus chan eil againn ach ceithir:

ObjectProperty: hasChild
   Domain: Human
   Сharacteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }

A-nis bidh an ontology a 'dol an aghaidh a chèile, rud nach toir an einnsean co-dhùnaidh aithris. Leis an fhear mu dheireadh de na h-axioms tha sinn, ann an seagh, air “dùnadh” an t-saoghail, agus mothachadh mar a tha comasachd Iain a bhith na leanabh aige fhèin air a chuir a-mach.

A’ ceangal Dàta Iomairt

Bha an seata Dàta Ceangailte de dhòighean-obrach agus theicneòlasan an dùil bho thùs airson dàta fhoillseachadh air an lìon. Tha grunn dhuilgheadasan mu choinneamh an cleachdadh ann an àrainneachd chorporra a-staigh.

Mar eisimpleir, ann an àrainneachd chorporra dùinte, tha cumhachd lùghdachaidh OWL stèidhichte air gabhail ri OWA agus diùltadh UNA, co-dhùnaidhean air sgàth nàdar fosgailte agus sgaoilte an Lìon, ro lag. Agus an seo tha na fuasglaidhean a leanas comasach.

  • A’ buileachadh OWL le semantics, a’ ciallachadh gun tèid OWA a thrèigsinn agus gabhail ri UNA, buileachadh an einnsean toraidh co-fhreagarrach. — Air an t-slighe so a ’dol Stòradh Stardog RDF.
  • A 'trèigsinn comasan deductive OWL ann am fàbhar einnseanan riaghailt. - Stardog a’ toirt taic SWRL; Bidh Jena agus GraphDB a’ tabhann fhèin cànainean riaghailtean
  • A’ diùltadh comasan lùghdachaidh OWL, cleachdadh aon no fo-sheata eile faisg air RDFS airson modaladh. - Faic barrachd mu dheidhinn seo gu h-ìosal.

Is e cùis eile am fòcas nas motha a dh’ fhaodadh a bhith aig an t-saoghal chorporra air cùisean càileachd dàta agus dìth innealan dearbhaidh dàta anns a’ chruach Dàta Ceangailte. Tha na toraidhean an seo mar a leanas.

  • A-rithist, cleachd airson dearbhadh air togalaichean OWL le semantics cruinne dùinte agus ainmean gun samhail ma tha einnsean co-dhùnaidh iomchaidh ri fhaighinn.
  • Cleachd SHACL, àbhaisteach às deidh an liosta de shreathan cèic Semantic Web Layer a bhith air a shuidheachadh (ge-tà, faodar a chleachdadh cuideachd mar einnsean riaghailtean), no Shex.
  • A’ tuigsinn gu bheil a h-uile càil air a dhèanamh mu dheireadh le ceistean SPARQL, a’ cruthachadh an inneal dearbhaidh dàta sìmplidh agad fhèin gan cleachdadh.

Ach, tha eadhon diùltadh iomlan de chomasan lùghdachaidh agus innealan dearbhaidh a’ fàgail a’ chruach Dàta Ceangailte a-mach à farpais ann an gnìomhan a tha coltach ri cruth-tìre ris an lìon fhosgailte agus sgaoilte - ann an gnìomhan amalachaidh dàta.

Dè mu dheidhinn siostam fiosrachaidh iomairt cunbhalach?

Tha seo comasach, ach bu chòir dhut, gu dearbh, a bhith mothachail air dè na duilgheadasan a dh'fheumas na teicneòlasan co-fhreagarrach fhuasgladh. Bheir mi cunntas an seo air freagairt àbhaisteach de chom-pàirtichean leasachaidh gus sealltainn cò ris a tha an stac teicneòlais seo coltach bho shealladh IT gnàthach. A’ cuimhneachadh beagan de chosamhlachd an ailbhein dhomh:

  • Mion-sgrùdaire gnìomhachais: Tha RDF rudeigin mar mhodail loidsigeach air a stòradh gu dìreach.
  • Neach-sgrùdaidh Siostaman: Tha RDF coltach EAV, dìreach le dòrlach de chlàran-amais agus cànan ceist iomchaidh.
  • -leasachaidh: uill, tha seo uile ann an spiorad bun-bheachdan modail beairteach agus còd ìosal, a ’leughadh o chionn ghoirid mu dheidhinn seo.
  • Manaidsear pròiseict: tha e mar an ceudna a' tuiteam air a' chruaich!

Tha cleachdadh a’ sealltainn gu bheil a’ chruach mar as trice air a chleachdadh ann an gnìomhan co-cheangailte ri cuairteachadh agus ioma-ghnèitheachd dàta, mar eisimpleir, nuair a thathar a’ togail siostaman clas MDM (Master Data Management) no DWH (Data Warehouse). Tha duilgheadasan mar seo ann an gnìomhachas sam bith.

A thaobh thagraidhean a tha sònraichte don ghnìomhachas, tha teicneòlasan Dàta Ceangailte an-dràsta air am mòr-chòrdte anns na gnìomhachasan a leanas.

  • teicneòlasan bith-mheidigeach (far a bheil coltas gu bheil am mòr-chòrdte aca co-cheangailte ri iom-fhillteachd an fhearainn);

gnàthach

O chionn ghoirid chùm an “Boiling Point” co-labhairt air a chuir air dòigh leis a’ chomann “National Medical Knowledge Base” “A 'cur ri chèile ontologies. Bho theòiridh gu cleachdadh practaigeach".

  • cinneasachadh agus obrachadh thoraidhean iom-fhillte (innleadaireachd meacanaigeach mòr, cinneasachadh ola is gas; mar as trice bidh sinn a ’bruidhinn mu dheidhinn àbhaisteach ISO 15926);

gnàthach

An seo, cuideachd, is e an t-adhbhar iom-fhillteachd a 'chuspair, nuair, mar eisimpleir, aig ìre suas an abhainn, ma bhios sinn a' bruidhinn mu ghnìomhachas na h-ola is a 'ghas, feumaidh cunntasachd sìmplidh cuid de ghnìomhan CAD.

Ann an 2008, chaidh tachartas stàlaidh riochdachaidh a chuir air dòigh le Chevron a ’cho-labhairt.

Bha coltas gu robh ISO 15926, aig a’ cheann thall, caran trom air gnìomhachas na h-ola is a’ ghas (agus lorg iad is dòcha barrachd feum ann an innleadaireachd meacanaigeach). Cha robh ach Statoil (Equinor) air a cheangal gu mòr ris; ann an Nirribhidh, gu h-iomlan eag-shiostam. Tha cuid eile a’ feuchainn ris an rud aca fhèin a dhèanamh. Mar eisimpleir, a rèir fathannan, tha Ministreachd an Cumhachd dachaigheil an dùil “modail ontological bun-bheachdail den ionad connaidh is lùtha,” a chruthachadh coltach, a rèir choltais, ri a chruthachadh airson gnìomhachas cumhachd an dealain.

  • buidhnean ionmhais (faodar eadhon XBRL a mheas mar sheòrsa de hybrid de SDMX agus ontology RDF Data Cube);

gnàthach

Aig toiseach na bliadhna, bha LinkedIn gu gnìomhach a’ spamadh an ùghdar le dreuchdan bho cha mhòr a h-uile fuamhaire ann an gnìomhachas an ionmhais, air a bheil e eòlach bhon t-sreath Tbh “Force Majeure”: Goldman Sachs, JPMorgan Chase agus / no Morgan Stanley, Wells Fargo, SWIFT/Visa/Mastercard, Bank of America, Citigroup, Fed, Deutsche Bank... Is dòcha gu robh a h-uile duine a' coimhead airson cuideigin a chuireadh iad thuige Co-labhairt Graf Eòlas. Chaidh aig grunnan dhiubh a lorg: ghabh buidhnean ionmhais a h-uile càil madainn a 'chiad latha.

Air HeadHunter, cha do nochd ach Sberbank rudeigin inntinneach; bha e mu dheidhinn “stòradh EAV le modal dàta coltach ri RDF.”

Is dòcha gu bheil an eadar-dhealachadh anns an ìre de ghaol airson teicneòlasan co-fhreagarrach ionadan ionmhais dachaigheil agus an Iar mar thoradh air nàdar thar-nàiseanta gnìomhachd an neach mu dheireadh. A rèir choltais, tha amalachadh thar chrìochan stàite a’ feumachdainn fuasglaidhean eagrachaidh agus teicnigeach a tha eadar-dhealaichte gu càileachdail.

  • siostaman freagairt cheistean le tagraidhean malairteach (IBM Watson, Apple Siri, Google Knowledge Graph);

gnàthach

Air an t-slighe, tha neach-cruthachaidh Siri, Thomas Gruber, na ùghdar air an fhìor mhìneachadh air ontology (anns an t-seadh IT) mar “sònrachadh bun-bheachd.” Na mo bheachd-sa, chan eil ath-eagrachadh nam faclan anns a’ mhìneachadh seo ag atharrachadh a bhrìgh, rud is dòcha a’ nochdadh nach eil e ann.

  • foillseachadh dàta structaraichte (le barrachd fìreanachaidh faodar seo a chur air sgàth Dàta Fosgailte Ceangailte).

gnàthach

Is e luchd-leantainn mòr Dàta Ceangailte an t-ainm GLAM: Gailearaidhean, Leabharlannan, Tasglannan is Taighean-tasgaidh. Gu leòr a ràdh gu bheil Leabharlann na Còmhdhalach a’ brosnachadh fear eile airson MARC21 BIBFRAME, a tha a’ toirt bunait airson tuairisgeul leabhar-leabhraichean san àm ri teachd agus, gu dearbh, stèidhichte air RDF.

Tha Wikidata gu tric air ainmeachadh mar eisimpleir de phròiseact soirbheachail ann an raon Dàta Fosgailte Ceangailte - seòrsa de dhreach de Wikipedia a ghabhas leughadh le inneal, agus chan eil an susbaint aige, an taca ri DBPedia, air a chruthachadh le in-mhalairt bho bhogsaichean fiosrachaidh artaigil, ach a tha air a chruthachadh barrachd no nas lugha le làimh (agus an uairsin bidh e na thùs fiosrachaidh airson na h-aon bhogsaichean fiosrachaidh).

Tha sinn cuideachd a’ moladh gun dèan thu sgrùdadh air liosta luchd-cleachdaidh stòr Stardog RDF air làrach-lìn Stardog anns an roinn “Customers”.

Biodh sin mar a dh' fhaodas e, ann an Gartner Cearcall Hype airson Teicneòlasan Ùra 2016 Tha "Enterprise Taxonomy and Ontology Management" air a chuir ann am meadhan teàrnadh a-steach do ghleann briseadh-dùil leis an dùil gun ruigear "àrd-ùrlar cinneasachd" gun a bhith nas tràithe na ann an 10 bliadhna.

A’ ceangal dàta iomairt

Ro-innsean, ro-innsean, ro-innsean...

A-mach à ùidh eachdraidheil, tha mi air clàr a dhèanamh fo ro-innsean Gartner airson grunn bhliadhnaichean air na teicneòlasan anns a bheil ùidh againn.

Bliadhna Teicneòlas Aithisg Suidheachadh Bliadhnaichean gu àrd-ùrlar
2001 Lìon sìmplidh Teicneòlasan a tha a ’tighinn am bàrr Ùr-ghnàthachadh Tionnsgalachd 5-10
2006 Lìon Semantic Corporra Teicneòlasan a tha a ’tighinn am bàrr Sùgh nan dùilean àrdaichte 5-10
2012 Lìon sìmplidh Dàta Mòr Sùgh nan dùilean àrdaichte > 10
2015 Dàta ceangailte Mion-sgrùdadh adhartach agus Saidheans Dàta Trough an Disillusionment 5-10
2016 Stiùireadh Ontology iomairt Teicneòlasan a tha a ’tighinn am bàrr Trough an Disillusionment > 10
2018 Grafaichean eòlais Teicneòlasan a tha a ’tighinn am bàrr Ùr-ghnàthachadh Tionnsgalachd 5-10

Ach, mar-thà ann an "Hype Cycle..." 2018 tha gluasad eile suas air nochdadh - Grafaichean Eòlais. Chaidh ath-sgeadachadh sònraichte a dhèanamh: graf DBMS, ris an do thionndaidh aire luchd-cleachdaidh agus oidhirpean luchd-leasachaidh gu bhith air an tionndadh, fo bhuaidh iarrtasan a ’chiad fhear agus cleachdaidhean an fheadhainn mu dheireadh, thòisich iad a’ gabhail ris na cumaidhean agus an suidheachadh. de na farpaisich a bh’ aca roimhe.

Tha cha mhòr a h-uile graf DBMS a-nis ag ainmeachadh gu bheil e na àrd-ùrlar iomchaidh airson “graf eòlais” corporra a thogail (tha “dàta ceangailte” uaireannan air a chuir na àite le “dàta ceangailte”), ach dè cho reusanta ‘s a tha na tagraidhean sin?

Tha stòran-dàta graf fhathast asemantic; tha an dàta ann an graf DBMS fhathast mar an aon silo dàta. Bidh aithnichearan sreang an àite URIan a’ dèanamh a’ ghnìomh airson dà ghraf DBMS a thoirt a-steach fhathast mar ghnìomh amalachaidh, agus bidh amalachadh dà bhùth RDF gu tric a’ tighinn sìos gu dìreach dà ghraf RDF a chur còmhla. Is e taobh eile de cho-sheòrsachd neo-ath-fhilleadh a’ mhodail graf LPG, a tha ga dhèanamh duilich meata-dàta a riaghladh a’ cleachdadh an aon àrd-ùrlar.

Mu dheireadh, chan eil einnseanan co-dhùnaidh no einnseanan riaghlaidh aig DBMS graf. Faodar toraidhean nan einnseanan sin ath-riochdachadh le bhith a’ dèanamh cheistean iom-fhillte, ach tha seo comasach eadhon ann an SQL.

Ach, chan eil duilgheadas sam bith aig prìomh shiostaman stòraidh RDF taic a thoirt don mhodail LPG. Thathas den bheachd gur e an dòigh-obrach as daingeann an tè a chaidh a mholadh aig aon àm ann am Blazegraph: am modail RDF*, a’ cothlamadh RDF agus LPG.

Tuilleadh

Faodaidh tu barrachd a leughadh mu thaic stòraidh RDF airson modal LPG san artaigil roimhe air Habré: "Dè tha tachairt le stòradh RDF a-nis". Tha mi an dòchas aon latha gun tèid artaigil air leth a sgrìobhadh mu Ghrafaichean Eòlais agus Stuth Dàta. Chaidh an earrann mu dheireadh, mar a tha furasta a thuigsinn, a sgrìobhadh ann an cabhag, ge-tà, eadhon sia mìosan às deidh sin, chan eil a h-uile dad mòran nas soilleire leis na bun-bheachdan sin.

Litreachas

  1. Halpin, H., Monnin, A. (deas.) (2014). Innleadaireachd Feallsanachail: A dh’ ionnsaigh Feallsanachd an Lìon
  2. Allemang, D., Hendler, J. (2011) Lìon Semantic airson an Ontologist Obrach (2na deas.)
  3. Staab, S., Studer, R. (deas.) (2009) Leabhar-làimhe air Ontologies (2na deas.)
  4. Wood, D. (deas.). (2011) A’ ceangal Dàta Iomairt
  5. Keet, M. (2018) Ro-ràdh do Innleadaireachd Ontology

Source: www.habr.com

Cuir beachd ann