Malpera Semantîk û Daneyên Girêdayî. Serrastkirin û zêdekirin

Ez dixwazim parçeyek ji vê pirtûka ku nû hatiye çapkirin pêşkêşî raya giştî bikim:

Modela ontolojîk a pargîdaniyek: rêbaz û teknolojiyên [Text]: monografî / [S. V. Gorşkov, S. S. Kralin, O. I. Mushtak û yên din; edîtorê rêveber S.V. Gorshkov]. - Ekaterinburg: Weşanxaneya Zanîngeha Ural, 2019. - 234 r.: nexweş., tablo; 20 cm - Nivîskar. li ser tîrêja piştê hatî destnîşan kirin. Bi. - Bîbliyografî di dawiya ch. — ISBN 978-5-7996-2580-1: 200 nusxe.

Armanca şandina vê perçeyê li ser Habré çar alî ye:

  • Ne mimkûn e ku kesek bikaribe vê pirtûkê di destên xwe de bigire ger ne muwekîlê rêzdar be SergeIndex; Ew bê guman ne li firotanê ye.
  • Serrastkirin li metnê hatine kirin (ew li jêr nehatine ronî kirin) û lêzêdekirinên ku bi formata monografyayek çapkirî re pir ne lihevhatî ne hatine kirin: notên mijarê (di bin spoileran de) û hîperlînk.
  • li mêj da min hûn nedîtine pirs û şîroveyan berhev bikin, ji bo ku dema ku vê nivîsê bi rengek nûvekirî di nav weşanên din de têxe ber çavê wan.
  • Gelek pêgirên Web Semantic û Daneyên Girêdayî hîn jî bawer dikin ku dora wan ew qas teng e, nemaze ji ber ku ji raya giştî re hîn bi rêkûpêk nehatiye rave kirin ka çiqas mezin e ku meriv pêgirê Mala Semantîk û Daneyên Girêdayî be. Nivîskarê beşê, her çend ew ji vê xelekê ye jî, bi vê ramanê nagire, lê dîsa jî, xwe mecbûr dibîne ku hewildanek din bike.

Û vî awayî,

Tevna Semantîkî

Pêşveçûna Înternetê dikare bi vî rengî were temsîl kirin (an jî li ser beşên wê yên ku bi rêza ku li jêr hatî destnîşan kirin biaxivin):

  1. Belgeyên li ser Înternetê. Teknolojiyên sereke - Gopher, FTP, hwd.
    Înternet toreke cîhanî ye ji bo pevguhertina çavkaniyên herêmî.
  2. Belgeyên Înternetê. Teknolojiyên sereke HTML û HTTP ne.
    Xwezaya çavkaniyên eşkerekirî taybetmendiyên navgîniya ragihandina wan digire ber çav.
  3. Daneyên Înternetê. Teknolojiyên sereke - REST û SOAP API, XHR, hwd.
    Serdema sepanên Înternetê, ne tenê mirov dibin xerîdarên çavkaniyan.
  4. Daneyên Înternetê. Teknolojiyên sereke teknolojiyên Daneyên Girêdayî ne.
    Ev qonaxa çaremîn, ku ji hêla Berners-Lee, afirînerê teknolojiyên bingehîn ên duyemîn û derhênerê W3C ve hatî pêşbînîkirin, jê re tê gotin Weba Semantîk; Teknolojiyên Daneyên Girêdayî ji bo ku daneya li ser tevneyê ne tenê bi makîneyê were xwendin, lê di heman demê de "makîne-fêmkirî" jî çêbikin.

Ji ya ku li jêr tê, xwendevan dê pêwendiya di navbera têgehên sereke yên qonaxên duyemîn û çaremîn de fam bike:

  • URL bi URI-yan re analog in,
  • analoga HTML RDF ye,
  • Hîperlînkên HTML di belgeyên RDF de dişibin bûyerên URI-yê.

Malpera Semantîk ji meyla spontan an lobiyê ya taybetî bêtir nêrînek pergalî ya paşeroja Înternetê ye, her çend ew dikare van paşîn bigire ber çavan. Mînakî, taybetmendiyek girîng a ku jê re Web 2.0 tê gotin wekî "naveroka ku ji hêla bikarhêner ve hatî hilberandin" tête hesibandin. Bi taybetî, pêşniyara W3C tê xwestin ku ew li ber çavan bigire "Ontolojiya Annotasyona Webê"û peymanek weha Liserxwe.

Ma Semantic Web Mirî ye?

Ger hûn red bikin hêviyên ne rasteqîne, rewşa tevna semantîk bi qasî ya komunîzmê ya di dema sosyalîzma pêşketî de ye (û dilsoziya bi şert û mercên Îlyîç re tê dîtin, bila her kes bi xwe biryarê bide). motorên lêgerînê pir serkeftî malperan mecbûr dikin ku RDFa û JSON-LD bikar bînin û xwe teknolojiyên girêdayî yên ku li jêr têne diyar kirin bikar bînin (Grafê Zanînê ya Google, Grafika Zanînê ya Bing).

Bi gelemperî, nivîskar nikare bêje ku çi rê li ber belavbûna mezintir digire, lê ew dikare li ser bingeha ezmûna kesane biaxive. Pirsgirêkên ku di şert û mercên êrîşa SW de "ji derveyî sindoqê" werin çareser kirin hene, her çend ew pir ne berfireh bin. Di encamê de, yên ku bi van karan re rû bi rû ne, li hember kesên ku dikarin çareseriyê peyda bikin, ti rêyên zorê nînin, lêbelê pêşkêşkirina serbixwe ya çareseriyê berevajî modelên karsaziya wan e. Ji ber vê yekê em berdewam dikin ku HTML-ê pars bikin û API-yên cihêreng bi hev ve zeliqînin, hevûdu şittir.

Lêbelê, teknolojiyên Daneyên Girêdayî ji Webê ya sereke belav bûne; Pirtûk, bi rastî, ji bo van sepanan hatiye veqetandin. Heya nuha, civata Daneyên Girêdayî li bendê ye ku ev teknolojiyên hanê bi saya tomarkirina Gartner (an ragihandina, wekî ku hûn dixwazin) hîn berfirehtir bibin. Grafikên Zanînê и Fabric Data. Ez dixwazim bawer bikim ku dê ne pêkanînên "bisîkletê" yên van têgînan be, lê yên ku bi standardên W3C yên ku li jêr têne nîqaş kirin ve girêdayî ne.

Daneyên girêdayî

Berners-Lee Daneyên Girêdayî wekî tevna semantîk "rast kirin" pênase kir: komek nêzîkatî û teknolojiyên ku dihêle ku ew bigihîje armancên xwe yên dawî. Prensîbên bingehîn ên Daneyên Girêdayî Berners-Lee ronî kirin jêrîn.

Prensîba 1. Bikaranîna URI-yan ji bo navên saziyan.

URI li hember nasnameyên rêzikên herêmî yên ji bo têketinê, nasnavên yekîtiyê yên gerdûnî ne. Dûv re, ev prensîba herî baş di slogana Grafika Zanînê ya Google de hate diyar kirin "tişt, ne têl".

Prensîba 2. URI-yên di pilana HTTP-ê de bikar bînin da ku ew werin jêbirin.

Bi vegotina URI-yê, pêdivî ye ku meriv bikaribe nîşana li pişt wê nîşankerê bi dest bixe (analojiya bi navê operator " li vir eşkere ye).*"di C); Zêdetir, ji bo ku hin nûnertiya vê nîşankirî bistînin - li gorî nirxa sernavê HTTP-ê ve girêdayî ye Accept:. Dibe ku, bi hatina serdema AR/VR re, ew ê mimkun be ku çavkaniyê bixwe bi dest bixe, lê heya niha, bi îhtîmalek mezin, ew ê bibe belgeyek RDF, ku encama pêkanîna pirsek SPARQL ye. DESCRIBE.

Prensîba 3. Bikaranîna standardên W3C - di serî de RDF (S) û SPARQL - bi taybetî dema ku URI-yê jêbirin.

Van "qatên" ferdî yên stoka teknolojiya Daneyên Girêdayî, ku jê re jî tê zanîn Semantic Web Layer Cake, dê li jêr were vegotin.

Prensîba 4. Bikaranîna referansên URI-yên din dema danasîna saziyan.

RDF destûrê dide te ku hûn xwe bi vegotina devkî ya çavkaniyek bi zimanê xwezayî sînordar bikin, û prensîba çaremîn bang dike ku hûn vê yekê nekin. Ger prensîba yekem bi gerdûnî were dîtin, dema danasîna çavkaniyek gengaz dibe ku meriv ji yên din re, di nav de yên "biyanî" jî vebêje, ji ber vê yekê ji daneyan re têkildar tê gotin. Di rastiyê de, hema hema neçar e ku meriv URI-yên ku di ferhenga RDFS-ê de bi nav kirin bikar bînin.

RDF

RDF (Çarçoveya Danasîna Çavkaniyê) formalîzmek e ji bo danasîna hebûnên bi hev ve girêdayî ye.

Daxuyaniyên ji cureya "subjekt-predikat-objekt", ku jê re sêqat tê gotin, li ser hebûn û têkiliyên wan têne kirin. Di rewşa herî hêsan de, kirde, pêşdar, û bireser hemî URI ne. Heman URI dikare di sêçikên cihêreng de di pozîsyonên cihê de be: bireser, pêşdaçek û bireser be; Bi vî rengî, sêçik celebek grafikek ku jê re grafika RDF tê gotin ava dikin.

Mijar û tişt ne tenê URI, lê di heman demê de jê re têne gotin girêkên vala, û tişt jî dikarin bibin literals. Literal mînakên celebên seretayî ne ku ji temsîla rêzê û nîşanek tîpê pêk tên.

Nimûneyên nivîsandina biwêj (di hevoksaziya Turtle de, li jêr bêtir li ser wê): "5.0"^^xsd:float и "five"^^xsd:string. Peyvên bi tîp rdf:langString dikare bi nîşanek zimanî jî were saz kirin; di Turtle de wiha tê nivîsandin: "five"@en и "пять"@ru.

Girêkên vala çavkaniyên "nenas" ên bê nasnameyên gerdûnî ne, ku di derheqê wan de, lêbelê, gotin dikarin bêne kirin; cure guherbarên hebûnî.

Ji ber vê yekê (ev, bi rastî, tevahiya xala RDF ye):

  • mijar URI an nodek vala ye,
  • pêşdaçek URI ye,
  • Tiştek URI, girêkek vala, an biwêjek e.

Çima pêşdar nikarin girêkên vala bin?

Sedema muhtemel ew e ku bi awayekî nefermî têgihîştin û wergerandina sêsêyan li zimanê mantiqa pêşdarazê rêza yekem e. s p o wek tiştekî wek Malpera Semantîk û Daneyên Girêdayî. Serrastkirin û zêdekirinko Malpera Semantîk û Daneyên Girêdayî. Serrastkirin û zêdekirin - pêşdaraz, Malpera Semantîk û Daneyên Girêdayî. Serrastkirin û zêdekirin и Malpera Semantîk û Daneyên Girêdayî. Serrastkirin û zêdekirin - berdewam. Şopên vê têgihiştinê di belgeyê de ne"LBase: Semantîk ji bo Zimanên Malpera Semantîk", ku statûya têbîniyek koma xebatê ya W3C heye. Bi vê têgihiştinê re sêqat s p []ko [] - girêka vala, dê wekî were wergerandin Malpera Semantîk û Daneyên Girêdayî. Serrastkirin û zêdekirinko Malpera Semantîk û Daneyên Girêdayî. Serrastkirin û zêdekirin - guhêrbar, lê paşê çawa tê wergerandin s [] o? Belgeya bi statûya Pêşniyara W3C "RDF 1.1 Semantîk” Rêbazek din a wergerê pêşkêş dike, lê dîsa jî îhtîmala ku pêşdaraz girêkên vala bin nahesibîne.

Lêbelê, Manu Sporni destûr kirin.

RDF modelek razber e. RDF dikare di nav hevoksaziyên cihêreng de were nivîsandin (serialîzekirin): RDF/XML, Req (pirtirîn mirov tê xwendin), JSON-LD, HDT (binary).

Heman RDF dikare bi awayên cihêreng di nav RDF/XML de were serialîzekirin, ji ber vê yekê, mînakî, ne wate ye ku meriv XML-ya encam bi karanîna XSD-ê verast bike an jî hewl bide ku daneyan bi karanîna XPath derxîne. Di heman demê de, JSON-LD ne mimkûn e ku xwesteka pêşdebirê Javascript-ê ya navînî ya ku bi RDF-ê re bi karanîna nîgara xal û çargoşe ya Javascript-ê bixebite têr bike (her çend JSON-LD bi pêşkêşkirina mekanîzmayek di wî alî de dimeşe. çarçovekirin).

Pir hevoksaz awayên kurtkirina URI-yên dirêj pêşkêş dikin. Mînakî, reklamek @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> li Turtle wê hingê dê destûrê bide te ku li şûna wê binivîsî <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> tenê rdf:type.

RDFS

RDFS (RDF Schema) - peyvsaziyek bingehîn a modelkirinê, têgehên milk û çîn û taybetmendiyên wekî rdf:type, rdfs:subClassOf, rdfs:domain и rdfs:range. Mînakî, bi karanîna ferhenga RDFS, bêjeyên derbasdar ên jêrîn dikarin werin nivîsandin:

rdf:type         rdf:type         rdf:Property .
rdf:Property     rdf:type         rdfs:Class .
rdfs:Class       rdfs:subClassOf  rdfs:Resource .
rdfs:subClassOf  rdfs:domain      rdfs:Class .
rdfs:domain      rdfs:domain      rdf:Property .
rdfs:domain      rdfs:range       rdfs:Class .
rdfs:label       rdfs:range       rdfs:Literal .

RDFS peyvek danasîn û modelkirinê ye, lê ne zimanek sînordar e (her çend taybetmendiya fermî û pelên îmkana karanîna weha). Divê peyva "Schema" di heman wateyê de neyê fam kirin ku di îfadeya "XML Schema" de. Bo nimûne, :author rdfs:range foaf:Person tê wateya ku rdf:type hemû nirxên milkê :author - foaf:Person, lê nayê wê wateyê ku divê ev ji pêş de were gotin.

SPARQL

SPARQL (Protokola SPARQL û Zimanê Pirsînê ya RDF) - zimanek ji bo lêpirsîna daneyên RDF. Di rewşek hêsan de, pirsek SPARQL komek nimûneyan e ku li hember wan sêçikên grafika ku têne pirsîn têne hev kirin. Şablon dikarin di pozîsyonên bireser, pêşdaraz û bireserê de guherbaran hebin.

Lêpirsîn dê nirxên guhêrbar ên weha vegerîne ku, dema ku di nav nimûneyan de were veguheztin, dikare bibe binegrafek grafika RDF-ya pirskirî (binkomek sêçikên wê). Guherbarên bi heman navî di nimûneyên cihê yên sêçikan de divê xwedî heman nirxan bin.

Mînakî, ji rêza jor a heft axiomên RDFS hatî dayîn, dê pirsa jêrîn vegere rdfs:domain и rdfs:range wek nirxan ?s и ?p herwiha:

SELECT * WHERE {
 ?s ?p rdfs:Class .
 ?p ?p rdf:Property .
}

Hêjayî gotinê ye ku SPARQL diyarker e û ne zimanek e ji bo danasîna gera grafîkê (lêbelê, hin depoyên RDF awayên sererastkirina plansaziya darvekirina pirsê pêşkêş dikin). Ji ber vê yekê, hin pirsgirêkên grafîkî yên standard, mînakî, dîtina riya herî kurt, di SPARQL de nayên çareser kirin, tevî karanîna riyên milkê (lê, dîsa, depoyên RDF yên kesane ji bo çareserkirina van pirsgirêkan dirêjkirinên taybetî pêşkêş dikin).

SPARQL pêşnûmeya vekirîbûna cîhanê parve nake û nêzîkatiya "nerazîbûnê wekî têkçûn" dişopîne, ku tê de derîmkan sêwiranên wekî FILTER NOT EXISTS {…}. Dabeşkirina daneyê bi karanîna mekanîzmayê tête hesibandin pirsên federal.

Xala gihîştinê ya SPARQL - hilanînek RDF-ya ku jêhatî ye pirsên SPARQL-ê hilîne - ji qonaxa duyemîn ve analogên rasterast tune (li destpêka vê paragrafê binêre). Ew dikare wekî databasek, li ser bingeha naveroka ku rûpelên HTML-ê hatine çêkirin, lê ji derve re bigihîje, were hevber kirin. Xala gihîştina SPARQL ji qonaxa sêyem bi xala gihîştina API-ê re bêtir analog e, lê bi du cûdahiyên sereke. Ya yekem, mimkun e ku meriv çend pirsên "atomî" di yek de (ya ku wekî taybetmendiyek bingehîn a GraphQL tê hesibandin) bi hev re bike, û ya duyemîn jî, API-yek wusa bi tevahî xwe-belgekirî ye (ya ku HATEOAS hewl da ku bigihîje).

Gotina polemîkî

RDF rêyek e ku meriv daneyan li ser tevneyê belav dike, ji ber vê yekê hilanîna RDF divê wekî belgeyek DBMS were hesibandin. Rast e, ji ber ku RDF grafek e û ne darek e, ew jî wekî grafîk-based derketin. Ev ecêb e ku ew bi tevahî xebitî. Kê dê bifikirî ku dê mirovên jîr hebin ku dê girêkên vala bicîh bînin. Codd li vir e bi ser neket.

Di heman demê de awayên kêm-taybetmend hene ku meriv gihîştina daneyên RDF organîze bike, mînakî, Parçeyên Daneyên Girêdayî (LDF) û Platforma Daneyên Girêdayî (LDP).

KÛND

KÛND (Zimanê Ontolojiya Malperê) - formalîzmek ji bo temsîlkirina zanînê, guhertoyek hevoksaziya mantiqa ravekirinê Malpera Semantîk û Daneyên Girêdayî. Serrastkirin û zêdekirin (li her derê jêrîn rasttir e ku meriv bêje OWL 2, guhertoya yekem a OWL li ser bingeha Malpera Semantîk û Daneyên Girêdayî. Serrastkirin û zêdekirin).

Têgînên mantiqên raveker ên di OWL de bi çînan re têkildar in, rol bi taybetmendiyan re têkildar in, kes navê xwe yê berê diparêzin. Ji aksîoman re aksîom jî tê gotin.

Ji bo nimûne, di nav de hevoksaziya Manchester ji bo nîşana OWL axiomek ku jixwe ji me re tê zanîn Malpera Semantîk û Daneyên Girêdayî. Serrastkirin û zêdekirin dê wiha bê nivîsandin:

Class: Human
Class: Parent
   EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent

Ji bo nivîsandina OWL hevoksên din hene, wek hevoksaziya fonksiyonel, di taybetmendiya fermî de tê bikar anîn, û OWL/XML. Wekî din, OWL dikare were serialîzekirin ji bo hevoksaziya RDF-ya razber û bêtir - di yek ji hevoksaziyên taybetî de.

OWL bi RDF re têkiliyek dualî heye. Ji aliyekî ve, ew dikare wekî celebek ferhengek ku RDFS-ê dirêj dike were hesibandin. Ji hêla din ve, ew formalîzmek bihêztir e ku ji bo wê RDF tenê formatek serialkirinê ye. Ne hemî avahiyên OWL yên bingehîn dikarin bi karanîna sêyek RDF-ê yekane bêne nivîsandin.

Bi ve girêdayî ye ku kîjan binkomê avakirina OWL-ê destûr tê bikar anîn, ew bi vî rengî diaxivin profîlên OWL. Ya standardkirî û herî navdar OWL EL, OWL RL û OWL QL ne. Hilbijartina profîlê bandorê li tevliheviya hesabkirinê ya pirsgirêkên tîpîk dike. Komek bêkêmasî ya avahiyên OWL yên têkildar Malpera Semantîk û Daneyên Girêdayî. Serrastkirin û zêdekirin, bi navê OWL DL. Carinan ew li ser OWL Full jî diaxivin, ku tê de avahîyên OWL destûr didin ku bi azadîya tam ya ku di RDF-ê de ye, bêyî sînorkirinên semantîkî û hesabker werin bikar anîn. Malpera Semantîk û Daneyên Girêdayî. Serrastkirin û zêdekirin. Mînakî, tiştek dikare hem çînek û hem jî milk be. OWL Full nediyar e.

Prensîbên sereke yên ji bo girêdana encamên di OWL de pejirandina ramana cîhana vekirî ne. O.W.A.) û redkirina texmîna navên yekta (texmîna navên yekta, ONE). Li jêr em ê bibînin ku van prensîban dikarin li ku derê rêve bibin û hin avahiyên OWL destnîşan bikin.

Bila ontolojî perçeya jêrîn hebe (di hevoksaziya Manchesterê de):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human
   Facts: hasChild Alice, hasChild Bob, hasChild Carol

Ma ji tiştên ku hatine gotin dê derkeve holê ku Yûhenna gelek zarokên wî hene? Redkirina UNA dê zorê bide motora encamdanê ku bersiva vê pirsê neyînî bide, ji ber ku Alice û Bob dibe ku heman kes bin. Ji bo ku tiştên jêrîn pêk werin, pêdivî ye ku axioma jêrîn lê zêde bike:

DifferentIndividuals: Alice, Bob, Carol, John

Bila niha perçeya ontolojiyê xwediyê forma jêrîn be (Yûhenna tê gotin ku gelek zarokên wî hene, lê tenê du zarokên wî hene):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human, manyChildren
   Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John

Dê ev ontolojî nakok be (ku dikare wekî delîlên daneyên nederbasdar were şîrove kirin)? Qebûlkirina OWA dê bibe sedem ku motora encamdanê bi neyînî bersivê bide: "li cîhek din" (di ontolojîyek din de) baş dibe ku were gotin ku Carol jî zarokê John e.

Ji bo ku îhtîmala vê yekê ji holê rakin, em di derbarê Yûhenna de rastiyek nû lê zêde bikin:

Individual: John
   Facts: hasChild Alice, hasChild Bob, not hasChild Carol

Ji bo derxistina xuyangiya zarokên din, em bibêjin ku hemî nirxên milkê "xwedî zarok" in, ji wan tenê çar kes in:

ObjectProperty: hasChild
   Domain: Human
   Сharacteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }

Naha ontolojî dê bibe nakok, ku motora encamdanê dê rapor neke. Bi axiomên paşîn re, di wateyekê de, me cîhan "girtî" kir, û bala xwe dayê ka çawa îhtîmala ku Yûhenna zarokê xwe be ji holê radibe.

Girêdana Daneyên Enterprise

Koma Daneyên Girêdayî yên nêzîkatî û teknolojiyên destpêkê ji bo weşandina daneyan li ser Webê bû. Bikaranîna wan di hawîrdorek pargîdaniya navxweyî de bi gelek dijwariyan re rû bi rû dimîne.

Mînakî, di hawîrdorek pargîdanî ya girtî de, hêza dakêşanê ya OWL-ê li ser bingeha pejirandina OWA û redkirina UNA, biryarên ji ber xwezaya vekirî û belavbûyî ya Webê, pir qels e. Û li vir çareseriyên jêrîn mimkun in.

  • Zehfkirina OWL bi semantîk, tê wateya terikandina OWA û pejirandina UNA, bicîhkirina motora derketinê ya têkildar. - Li ser vê rêyê hilanînê Stardog RDF.
  • Di berjewendiya motorên qaîdeyê de dev ji kapasîteyên dakêşanê yên OWL berdidin. - Stardog piştgirî dike SWRL; Jena û GraphDB pêşkêş dikin xwe zimanan qaîdeyên
  • Redkirina kapasîteyên dakêşanê yên OWL, karanîna yek an binkeyek din a nêzî RDFS ji bo modelkirinê. - Li ser vê yekê li jêr bêtir bibînin.

Pirsgirêkek din baldariya mezintir e ku cîhana pargîdanî dibe ku li ser pirsgirêkên kalîteya daneyê û nebûna amûrên pejirandina daneyê di stûna Daneyên Girêdayî de hebe. Berhemên li vir wiha ne.

  • Dîsa, heke motorek encamek guncan hebe, ji bo pejirandina avahiyên OWL bi semantîkên cîhana girtî û navên bêhempa bikar bînin.
  • Bikar bînin SHACL, piştî ku navnîşa qatên Cake Layera Semantic Web hate sererast kirin standardîze kirin (lêbelê, ew dikare wekî motora qaîdeyan jî were bikar anîn), an ShEx.
  • Fêm kirin ku her tişt di dawiyê de bi pirsên SPARQL ve tê kirin, mekanîzmaya pejirandina daneya xweya hêsan bi karanîna wan diafirîne.

Lêbelê, tewra redkirina bêkêmasî ya kapasîteyên dakêşanê û amûrên erêkirinê jî Daneyên Girêdayî ji pêşbaziyê dûr dixe di peywirên ku di perestgehê de dişibin tevna vekirî û belavbûyî - di peywirên entegrasyona daneyê de.

Li ser pergala agahdariya pargîdaniya birêkûpêk çi ye?

Ev gengaz e, lê divê hûn, bê guman, hay jê hebin ka çi pirsgirêkên teknolojiyên têkildar dê çareser bikin. Ez ê li vir reaksiyonek tîpîk a beşdarên pêşkeftinê diyar bikim da ku destnîşan bikim ka ev stoka teknolojiyê ji hêla IT-ya kevneşopî ve çawa dixuye. Piçek mesela fîl tîne bîra min:

  • Analîstê karsaziyê: RDF tiştek mîna modelek mentiqî ya rasterast hatî hilanîn e.
  • Analystê pergalê: RDF wek e EAV, tenê bi komek pêdekek û zimanek pirsê ya hêsan.
  • Pêşvebir: Belê, ev hemî di ruhê têgehên modela dewlemend û koda kêm de ye, dixwend dawî li ser vê.
  • Rêveberê Projeyê: erê wisa ye hilweşandina stikê!

Pratîk destnîşan dike ku stack bi gelemperî di karên ku bi belavkirin û heterojeniya daneyan ve girêdayî ne, tê bikar anîn, mînakî, dema ku pergalên çîna MDM (Rêveberiya Daneyên Master) an DWH (Dangeh Warehouse) ava dikin. Pirsgirêkên weha di her pîşesaziyê de hene.

Di warê serîlêdanên pîşesaziyê-taybetî de, teknolojiyên Daneyên Girêdayî niha di pîşesaziyên jêrîn de herî populer in.

  • teknolojiyên bijîjkî (ku populerbûna wan bi tevliheviya domainê re têkildar xuya dike);

vêga

"Xala Kelandinê" di van demên dawî de konferansek ku ji hêla komeleya "Bingeha Zanyarî ya Bijîşkî ya Neteweyî" ve hatî organîze kirin.Lihevkirina ontolojiyên. Ji teoriyê heya serîlêdana pratîkî".

  • hilberandin û xebitandina hilberên tevlihev (endezyariya mekanîkî ya mezin, hilberîna neft û gazê; pir caran em li ser standard diaxivin ISO 15926);

vêga

Li vir jî, sedem tevliheviya qada mijarê ye, dema ku, mînakî, di qonaxa jorîn de, heke em li ser pîşesaziya neft û gazê biaxivin, hesabkirina hêsan hin fonksiyonên CAD hewce dike.

Di 2008 de, bûyerek sazkirina nûnerê, ku ji hêla Chevron ve hatî organîze kirin, pêk hat konferansê.

ISO 15926, di dawiyê de, ji pîşesaziya neft û gazê re hinekî giran xuya bû (û dibe ku di endezyariya mekanîkî de serîlêdana mezintir dît). Tenê Statoil (Equinor) bi tevahî pê ve girêdayî bû; li Norwêcê, tevahî ekosîstem. Yên din hewl didin ku karê xwe bikin. Mînakî, li gorî gotegotan, Wezareta Enerjiyê ya navxweyî dixwaze ku "modelek ontolojîk a têgehî ya kompleksa sotemenî û enerjiyê" biafirîne, mîna ku, xuya ye. ji bo pîşesaziya elektrîkê hate afirandin.

  • rêxistinên darayî (tewra XBRL dikare wekî celebek hîbrîdê ya SDMX û ontolojiya Kubaya Daneyên RDF were hesibandin);

vêga

Di destpêka salê de, LinkedIn bi awayekî aktîf valahiya nivîskarê hema hema ji hemî dêwên pîşesaziya darayî, yên ku ew ji rêzefîlma TV "Force Majeure" nas dike, spam kir: Goldman Sachs, JPMorgan Chase û/an Morgan Stanley, Wells Fargo, SWIFT/Visa/Mastercard, Bank of America, Citigroup, Fed, Deutsche Bank... Dibe ku her kes li kesekî digeriya ku bikaribe jê re bişîne. Konferansa Grafika Zanînê. Pir hindik karîbûn bibînin: rêxistinên darayî her tişt girtin sibeha roja yekem.

Li ser HeadHunter, tenê Sberbank rastî tiştek balkêş hat; ew li ser "depokirina EAV bi modelek daneya mîna RDF-ê" bû.

Dibe ku, cûdahiya asta hezkirina ji bo teknolojiyên têkildar ên saziyên darayî yên navxweyî û rojavayî ji ber xwezaya transneteweyî ya çalakiyên paşîn e. Xuya ye ku entegrasyona li derveyî sînorên dewletê çareseriyên rêxistinî û teknîkî yên bi kalîte cuda hewce dike.

  • pergalên pirs-bersiv bi sepanên bazirganî (IBM Watson, Apple Siri, Google Knowledge Graph);

vêga

Bi awayê, afirînerê Siri, Thomas Gruber, nivîskarê pênaseya ontolojiyê (di wateya IT-ê de) wekî "taybetmendiyek têgehî" ye. Bi dîtina min, ji nû ve rêzkirina peyvan di vê pênaseyê de wateya wê naguhere, ku dibe ku nîşan bide ku ew ne li wir e.

  • weşandina daneyên sazkirî (bi rastdariyek mezintir ev dikare ji Daneyên Vekirî yên Girêdayî re were veqetandin).

vêga

Temaşevanên mezin ên Daneyên Girêdayî yên ku jê re tê gotin GLAM in: Galerî, Pirtûkxane, Arşîv û Muzexane. Bes e ku meriv bêje ku Pirtûkxaneya Kongreyê cîhgirek ji bo MARC21 pêşve dike BIBFRAME, kîjan bingehek ji bo pêşeroja danasîna bîbliyografîk peyda dike û, bê guman, li ser bingeha RDF.

Wikidata bi gelemperî wekî mînakek projeyek serketî di warê Daneyên Vekirî yên Girêdayî de tête binav kirin - celebek guhertoyek Wîkîpediya ya ku ji hêla makîneyê ve tê xwendin, naveroka wê, berevajî DBPedia, ji hêla îtxalkirina ji qutiyên agahdariya gotarê ve nayê çêkirin, lê ew e. kêm-zêde bi destan hatî afirandin (û dûv re ji bo heman infoboxan dibe çavkaniyek agahdarî).

Em jî pêşniyar dikin ku hûn wê kontrol bikin lîsteya bikarhênerên hilanîna Stardog RDF li ser malpera Stardog di beşa "Xerîdar" de.

Weha be, li Gartner Cycle Hype for Emerging Technology 2016 "Rêveberiya Taxonomî û Ontolojiya Pargîdaniyê" di nîvê daketinek li geliyê bêhêvîbûnê de bi perspektîfa ku di 10 salan de zûtir bigihîje "deştek hilberînê".

Girêdana Daneyên Enterprise

Pêşbîn, pêşbîn, pêşbîn...

Ji ber eleqeya dîrokî, min li jêr pêşbîniyên Gartner ji bo salên cihêreng li ser teknolojiyên ku me eleqedar dikin, tablo kiriye.

Sala Teknolojiyê Nûçe Rewş Salên ber bi deştê
2001 Tevna Semantîkî Teknolojiyên nû derdikevin Innovation Trigger 5-10
2006 Malpera Semantîk a Pargîdanî Teknolojiyên nû derdikevin Peak ji Hêviyên Enflated 5-10
2012 Tevna Semantîkî Daneyên mezin Peak ji Hêviyên Enflated > 10
2015 Daneyên girêdayî Analîtîk û Zanistiya Daneyên Pêşkeftî Xala Bêhêvîbûnê 5-10
2016 Rêveberiya Ontolojiya Enterprise Teknolojiyên nû derdikevin Xala Bêhêvîbûnê > 10
2018 Grafikên Zanînê Teknolojiyên nû derdikevin Innovation Trigger 5-10

Lêbelê, jixwe di "Hype Cycle..." 2018 meyleke din a bilindbûnê derketiye - Grafên Zanînê. Hin vejînek pêk hat: DBMS-yên grafîkî, yên ku bala bikarhêneran û hewildanên pêşdebiran jê re vediguhezin, di bin bandora daxwazên yên berê û adetên yên paşîn de, dest bi xêzkirin û pozîsyonê kirin. ji hevrikên xwe yên berê.

Hema hema her grafîka DBMS naha xwe wekî platformek guncan ji bo avakirina "grafika zanînê" ya pargîdanî ("daneyên girêdayî" carinan bi "daneyên girêdayî" tê guheztin), lê îddîayên weha çiqas rastdar in?

Daneyên grafîkî hîn jî asmantîk in; Daneyên di grafek DBMS de hîn jî heman siloya daneyê ye. Nasnameyên string li şûna URI-yê peywira yekkirina du grafikên DBMS-ê hîn jî wekî peywirek entegrasyonê dikin, di heman demê de yekkirina du dikanên RDF bi gelemperî bi tenê yekkirina du grafikên RDF-ê tê. Aliyek din a asmantîzmê ne-refleksbûna modela grafiya LPG-ê ye, ku rêveberiya metadata bi karanîna heman platformê dijwar dike.

Di dawiyê de, DBMS-yên grafîkî ne motorên encamdanê an motorên qaîdeyê ne. Encamên motorên weha dikarin bi tevlihevkirina pirsan ji nû ve werin hilberandin, lê ev di SQL de jî gengaz e.

Lêbelê, pergalên hilanîna RDF-ya pêşeng di piştgirîkirina modela LPG-ê de dijwariyek tune. Nêzîkatiya herî zexm ew e ku yek carî di Blazegraph de tê pêşniyar kirin: modela RDF*, ku RDF û LPG-ê tevdigere.

zêde

Hûn dikarin di gotara berê ya li ser Habré de li ser piştgiriya hilanînê RDF-ê ji bo modela LPG-ê bêtir bixwînin: "Niha bi hilanîna RDF re çi diqewime". Ez hêvî dikim ku rojek dê gotarek cuda li ser Grafikên Zanînê û Fabrîka Daneyê were nivîsandin. Beşa paşîn, wekî ku hêsan tê fam kirin, bi lez hate nivîsandin, lêbelê, şeş meh şûnda jî, her tişt bi van têgehan ne zelaltir e.

Wêjeyê

  1. Halpin, H., Monnin, A. (weş.) (2014). Endezyariya Felsefeyê: Berbi Felsefeya Webê
  2. Allemang, D., Hendler, J. (2011) Weba Semantîk ji bo Ontologê Xebatê (2nd.)
  3. Staab, S., Studer, R. (weş.) (2009) Handbook on Ontologies (2nd ed.)
  4. Wood, D. (ed.). (2011) Girêdana Daneyên Enterprise
  5. Keet, M. (2018) Destpêkek Endezyariya Ontolojiyê

Source: www.habr.com

Add a comment