Wavuti ya Semantiki na Data Iliyounganishwa. Marekebisho na nyongeza

Ningependa kuwasilisha kwa umma kipande cha kitabu hiki kilichochapishwa hivi majuzi:

Muundo wa kiontolojia wa biashara: mbinu na teknolojia [Nakala]: monograph / [S. V. Gorshkov, S. S. Kralin, O. I. Mushtak na wengine; mhariri mtendaji S.V. Gorshkov]. - Ekaterinburg: Nyumba ya Uchapishaji ya Chuo Kikuu cha Ural, 2019. - 234 p.: mgonjwa., meza; 20 cm - Mwandishi. imeonyeshwa kwenye titi ya nyuma. Na. - Bibliografia mwishoni mwa ch. - ISBN 978-5-7996-2580-1: nakala 200.

Madhumuni ya kuchapisha kipande hiki kwa Habre ni mara nne:

  • Haiwezekani kwamba mtu yeyote ataweza kushika kitabu hiki mikononi mwake ikiwa yeye si mteja wa mtu anayeheshimiwa SergeIndex; Hakika haiuzwi.
  • Marekebisho yamefanywa kwa maandishi (hayajaangaziwa hapa chini) na nyongeza zimefanywa ambazo haziendani sana na muundo wa monograph iliyochapishwa: maelezo ya mada (chini ya waharibifu) na viungo.
  • nataka kukusanya maswali na maoni, ili kuyazingatia wakati wa kutia ndani maandishi haya katika fomu iliyorekebishwa katika vichapo vingine vyovyote.
  • Wafuasi wengi wa Mtandao wa Semantiki na Data Zilizounganishwa bado wanaamini kwamba mzunguko wao ni finyu sana, hasa kwa sababu umma kwa ujumla bado haujafafanuliwa ipasavyo jinsi inavyofaa kuwa mfuasi wa Mtandao wa Semantiki na Data Zilizounganishwa. Mwandishi wa kipande hicho, ingawa yeye ni wa mduara huu, hana maoni haya, lakini, hata hivyo, anajiona kuwa ni wajibu wa kufanya jaribio lingine.

Hivyo,

Mtandao wa Semantic

Mageuzi ya Mtandao yanaweza kuwakilishwa kama ifuatavyo (au kuzungumza juu ya sehemu zake ambazo ziliundwa kwa mpangilio ulioonyeshwa hapa chini):

  1. Nyaraka kwenye mtandao. Teknolojia muhimu - Gopher, FTP, nk.
    Mtandao ni mtandao wa kimataifa wa kubadilishana rasilimali za ndani.
  2. Nyaraka za mtandao. Teknolojia muhimu ni HTML na HTTP.
    Hali ya rasilimali zilizojitokeza huzingatia sifa za njia yao ya maambukizi.
  3. Data ya mtandao. Teknolojia muhimu - REST na API ya SABUNI, XHR, n.k.
    enzi ya maombi ya mtandao, si tu watu kuwa watumiaji wa rasilimali.
  4. Data ya mtandao. Teknolojia muhimu ni Teknolojia za Data Zilizounganishwa.
    Hatua hii ya nne, iliyotabiriwa na Berners-Lee, muundaji wa teknolojia ya pili ya msingi na mkurugenzi wa W3C, inaitwa Mtandao wa Semantic; Teknolojia za Data Zilizounganishwa zimeundwa kufanya data kwenye wavuti sio tu kusomeka kwa mashine, bali pia "kueleweka kwa mashine."

Kutoka kwa kile kinachofuata, msomaji ataelewa mawasiliano kati ya dhana kuu za hatua ya pili na ya nne:

  • URL ni sawa na URIs,
  • analog ya HTML ni RDF,
  • Viungo vya HTML ni sawa na matukio ya URI katika hati za RDF.

Wavuti ya Semantiki ni dira ya kimfumo zaidi ya mustakabali wa Mtandao kuliko mwelekeo mahususi wa hiari au ulioshawishiwa, ingawa inaweza kutilia maanani haya ya pili. Kwa mfano, sifa muhimu ya kile kinachoitwa Web 2.0 inachukuliwa kuwa "maudhui yanayotokana na mtumiaji." Hasa, pendekezo la W3C linaitwa kulizingatia "Ontolojia ya Maelezo ya Wavuti"na ahadi kama vile Mango.

Je, Mtandao wa Semantic Umekufa?

Ukikataa matarajio yasiyo ya kweli, hali ya mtandao wa kisemantiki ni takriban sawa na ukomunisti wakati wa ujamaa ulioendelea (na ikiwa uaminifu kwa maagizo ya masharti ya Ilyich unazingatiwa, kila mtu ajiamulie mwenyewe). Injini za utafutaji kwa mafanikio kabisa kulazimisha tovuti kutumia RDFa na JSON-LD na zenyewe zitumie teknolojia zinazohusiana na zile zilizoelezwa hapa chini (Grafu ya Maarifa ya Google, Grafu ya Maarifa ya Bing).

Kwa ujumla, mwandishi hawezi kusema nini kinachozuia kuenea zaidi, lakini anaweza kuzungumza kwa misingi ya uzoefu wa kibinafsi. Kuna shida ambazo zinaweza kutatuliwa "nje ya boksi" katika hali ya kukera kwa SW, ingawa hazijaenea sana. Matokeo yake, wale ambao wanakabiliwa na kazi hizi hawana njia za kulazimishwa dhidi ya wale wanaoweza kutoa suluhisho, wakati utoaji wa kujitegemea wa mwisho wa ufumbuzi unapingana na mifano yao ya biashara. Kwa hivyo tunaendelea kuchanganua HTML na kuunganisha API mbalimbali, moja kwa moja mbaya zaidi.

Hata hivyo, teknolojia za Data Zilizounganishwa zimeenea zaidi ya Mtandao wa kawaida; Kitabu, kwa kweli, kimejitolea kwa programu hizi. Kwa sasa, jumuiya ya Data Iliyounganishwa inatarajia teknolojia hizi kuenea zaidi kutokana na kurekodi kwa Gartner (au tangazo, upendavyo) ya mitindo kama vile Grafu za Maarifa ΠΈ Kitambaa cha data. Ningependa kuamini kwamba haitakuwa utekelezaji wa "baiskeli" wa dhana hizi ambazo zitafaulu, lakini zile zinazohusiana na viwango vya W3C vilivyojadiliwa hapa chini.

Data Iliyounganishwa

Berners-Lee alifafanua Data Iliyounganishwa kama mtandao wa kisemantiki "uliofanywa kwa haki": seti ya mbinu na teknolojia zinazoiruhusu kufikia malengo yake ya mwisho. Kanuni za msingi za Data Iliyounganishwa Berners-Lee imeangaziwa zifwatazo.

Kanuni ya 1. Kutumia URI kutaja vyombo.

URIs ni vitambulishi vya huluki duniani kote kinyume na vitambulishi vya kamba vya ndani vya maingizo. Baadaye, kanuni hii ilionyeshwa vyema zaidi katika kauli mbiu ya Grafu ya Google Knowledge β€œmambo, si masharti'.

Kanuni ya 2. Kutumia URIs katika mpango wa HTTP ili ziweze kuondolewa marejeleo.

Kwa kupata URI, itawezekana kupata kiashiria kilicho nyuma ya kiashirio hicho (mfano na jina la mwendeshaji uko wazi hapa).*"katika C); kwa usahihi zaidi, kupata uwakilishi fulani wa hii iliyoashiriwa - kulingana na thamani ya kichwa cha HTTP Accept:. Labda, pamoja na ujio wa enzi ya AR/VR, itawezekana kupata rasilimali yenyewe, lakini kwa sasa, uwezekano mkubwa, itakuwa hati ya RDF, ambayo ni matokeo ya kutekeleza swala la SPARQL. DESCRIBE.

Kanuni ya 3. Matumizi ya viwango vya W3C - kimsingi RDF(S) na SPARQL - haswa wakati wa kuondoa URI.

"Tabaka" hizi za kibinafsi za safu ya teknolojia ya Data Iliyounganishwa, pia inajulikana kama Keki ya Tabaka la Wavuti la Semantic, itaelezwa hapa chini.

Kanuni ya 4. Matumizi ya marejeleo kwa URI zingine wakati wa kuelezea huluki.

RDF hukuruhusu kujiwekea kikomo kwa maelezo ya maneno ya rasilimali katika lugha asilia, na kanuni ya nne inaita kutofanya hivi. Ikiwa kanuni ya kwanza inazingatiwa ulimwenguni pote, inawezekana wakati wa kuelezea rasilimali kutaja wengine, ikiwa ni pamoja na "kigeni", ndiyo sababu data inaitwa iliyounganishwa. Kwa kweli, ni karibu kuepukika kutumia URI zilizotajwa katika msamiati wa RDFS.

RDF

RDF (Mfumo wa Maelezo ya Nyenzo-rejea) ni utaratibu rasmi wa kuelezea huluki zinazohusiana.

Taarifa za aina ya "somo-predicate-object", inayoitwa triplets, hufanywa kuhusu vyombo na mahusiano yao. Katika hali rahisi, mada, kihusishi, na kitu zote ni URIs. URI sawa inaweza kuwa katika nafasi tofauti katika sehemu tatu tofauti: kuwa somo, kiima, na kitu; Kwa hivyo, sehemu tatu huunda aina ya grafu inayoitwa grafu ya RDF.

Mada na vitu vinaweza kuwa sio URI tu, bali pia kinachojulikana nodi tupu, na vitu vinaweza pia kuwa halisi. Literals ni mifano ya aina za zamani zinazojumuisha uwakilishi wa kamba na kiashirio cha aina.

Mifano ya maandishi halisi (katika syntax ya Turtle, zaidi juu yake hapa chini): "5.0"^^xsd:float ΠΈ "five"^^xsd:string. Maandishi yenye aina rdf:langString pia inaweza kuwekwa na lebo ya lugha; katika Turtle imeandikwa kama hii: "five"@en ΠΈ "ΠΏΡΡ‚ΡŒ"@ru.

Nodi tupu ni rasilimali "zisizojulikana" bila vitambulisho vya kimataifa, kuhusu taarifa ambazo zinaweza, hata hivyo, kufanywa; aina ya vigezo kuwepo.

Kwa hivyo (hii ni, kwa kweli, hatua nzima ya RDF):

  • mada ni URI au nodi tupu,
  • kihusishi ni URI,
  • kitu ni URI, nodi tupu, au halisi.

Kwa nini viambishi haviwezi kuwa nodi tupu?

Sababu inayowezekana ni hamu ya kuelewa kwa njia isiyo rasmi na kutafsiri sehemu tatu katika lugha ya mantiki ya kihusishi cha mpangilio wa kwanza. s p o kama kitu kama Wavuti ya Semantiki na Data Iliyounganishwa. Marekebisho na nyongezaAmbapo Wavuti ya Semantiki na Data Iliyounganishwa. Marekebisho na nyongeza - kitabiri, Wavuti ya Semantiki na Data Iliyounganishwa. Marekebisho na nyongeza ΠΈ Wavuti ya Semantiki na Data Iliyounganishwa. Marekebisho na nyongeza - mara kwa mara. Athari za ufahamu huu ziko kwenye hati "Lmsingi: Semantiki za Lugha za Wavuti za Semantiki", ambayo ina hadhi ya noti ya kikundi kazi cha W3C. Kwa ufahamu huu, utatu s p []Ambapo [] - nodi tupu, itatafsiriwa kama Wavuti ya Semantiki na Data Iliyounganishwa. Marekebisho na nyongezaAmbapo Wavuti ya Semantiki na Data Iliyounganishwa. Marekebisho na nyongeza - kutofautiana, lakini jinsi ya kutafsiri s [] o? Hati iliyo na hali ya Mapendekezo ya W3C "RDF 1.1 Semantiki” inatoa mbinu nyingine ya kutafsiri, lakini bado haizingatii uwezekano wa vihusishi kuwa nodi tupu.

Walakini, Manu Sporni ruhusiwa.

RDF ni mfano wa kufikirika. RDF inaweza kuandikwa (kupangwa) katika syntaxes mbalimbali: RDF/XML, Turtle (inasomwa zaidi na binadamu), JSON-LD, HDT (binary).

RDF hiyo hiyo inaweza kusasishwa kuwa RDF/XML kwa njia tofauti, kwa hivyo, kwa mfano, haina maana kuhalalisha XML inayotokana kwa kutumia XSD au kujaribu kutoa data kwa kutumia XPath. Vile vile, JSON-LD haina uwezekano wa kukidhi hamu ya wastani ya msanidi programu wa Javascript kufanya kazi na RDF kwa kutumia nukuu ya Javascript na mabano ya mraba (ingawa JSON-LD inasonga upande huo kwa kutoa utaratibu. kutunga).

Sintaksia nyingi hutoa njia za kufupisha URI ndefu. Kwa mfano, tangazo @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> katika Turtle basi itakuruhusu kuandika badala yake <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> tu rdf:type.

RDFS

RDFS (RDF Schema) - msamiati wa msingi wa modeli, huleta dhana za mali na darasa na mali kama vile rdf:type, rdfs:subClassOf, rdfs:domain ΠΈ rdfs:range. Kwa kutumia kamusi ya RDFS, kwa mfano, misemo halali ifuatayo inaweza kuandikwa:

rdf:type         rdf:type         rdf:Property .
rdf:Property     rdf:type         rdfs:Class .
rdfs:Class       rdfs:subClassOf  rdfs:Resource .
rdfs:subClassOf  rdfs:domain      rdfs:Class .
rdfs:domain      rdfs:domain      rdf:Property .
rdfs:domain      rdfs:range       rdfs:Class .
rdfs:label       rdfs:range       rdfs:Literal .

RDFS ni maelezo na msamiati wa kielelezo, lakini sio lugha ya kikwazo (ingawa vipimo rasmi na majani uwezekano wa matumizi kama haya). Neno "Schema" halipaswi kueleweka kwa maana sawa na katika usemi "Schema ya XML". Kwa mfano, :author rdfs:range foaf:Person maana yake rdf:type thamani zote za mali :author - foaf:Person, lakini haimaanishi kwamba hii inapaswa kusemwa mapema.

SPARQL

SPARQL (Itifaki ya SPARQL na Lugha ya Maswali ya RDF) - lugha ya kuuliza data ya RDF. Katika hali rahisi, hoja ya SPARQL ni seti ya sampuli ambazo sehemu tatu za grafu inayoulizwa zinalingana. Sampuli zinaweza kuwa na viambajengo katika nafasi za somo, kihusishi na kitu.

Hoja itarejesha thamani zinazobadilika ambazo, zinapobadilishwa kwenye sampuli, zinaweza kusababisha sehemu ndogo ya grafu ya RDF iliyoulizwa (sehemu ndogo ya vipande vyake vitatu). Vigezo vya jina moja katika sampuli tofauti za sehemu tatu lazima ziwe na thamani sawa.

Kwa mfano, kwa kuzingatia seti iliyo hapo juu ya axioms saba za RDFS, swali lifuatalo litarudi rdfs:domain ΠΈ rdfs:range kama maadili ?s ΠΈ ?p ipasavyo:

SELECT * WHERE {
 ?s ?p rdfs:Class .
 ?p ?p rdf:Property .
}

Inafaa kukumbuka kuwa SPARQL ni ya kutangaza na si lugha ya kuelezea utepetevu wa grafu (hata hivyo, baadhi ya hazina za RDF hutoa njia za kurekebisha mpango wa utekelezaji wa hoja). Kwa hivyo, shida zingine za kawaida za grafu, kwa mfano, kutafuta njia fupi zaidi, haziwezi kutatuliwa katika SPARQL, pamoja na kutumia njia za mali (lakini, tena, hazina za RDF za kibinafsi hutoa upanuzi maalum wa kutatua shida hizi).

SPARQL haishiriki dhana ya uwazi wa ulimwengu na inafuata mbinu ya "kukanusha kama kushindwa", ambapo inawezekana miundo kama vile FILTER NOT EXISTS {…}. Usambazaji wa data unazingatiwa kwa kutumia utaratibu maswali yaliyoshirikishwa.

Sehemu ya kufikia ya SPARQL - hifadhi ya RDF inayoweza kushughulikia hoja za SPARQL - haina mlinganisho wa moja kwa moja kutoka hatua ya pili (tazama mwanzo wa aya hii). Inaweza kulinganishwa na hifadhidata, kulingana na yaliyomo ambayo kurasa za HTML zilitolewa, lakini zinapatikana kwa nje. Sehemu ya kufikia ya SPARQL inafanana zaidi na kituo cha kufikia API kutoka hatua ya tatu, lakini ikiwa na tofauti kuu mbili. Kwanza, inawezekana kuchanganya maswali kadhaa ya "atomiki" kuwa moja (ambayo inachukuliwa kuwa sifa kuu ya GraphQL), na pili, API kama hiyo inajiandikisha kabisa (ambayo ndiyo HATEOAS ilijaribu kufikia).

Maoni ya kisiasa

RDF ni njia ya kuchapisha data kwenye wavuti, kwa hivyo hifadhi ya RDF inapaswa kuzingatiwa kuwa hati ya DBMS. Ukweli, kwa kuwa RDF ni grafu na sio mti, pia iligeuka kuwa ya msingi wa graph. Inashangaza kwamba ilifanya kazi hata kidogo. Nani angefikiria kuwa kutakuwa na watu wenye akili ambao wangetekeleza nodi tupu. Codd yuko hapa haikufaulu.

Pia kuna njia zisizo kamili za kupanga ufikiaji wa data ya RDF, kwa mfano, Vipande vya Data Vilivyounganishwa (LDF) na Jukwaa la Data lililounganishwa (LDP).

OWL

OWL (Lugha ya Ontolojia ya Wavuti) - utaratibu rasmi wa kuwakilisha maarifa, toleo la kisintaksia la mantiki ya maelezo Wavuti ya Semantiki na Data Iliyounganishwa. Marekebisho na nyongeza (kila mahali hapa chini ni sahihi zaidi kusema OWL 2, toleo la kwanza la OWL lilitokana na Wavuti ya Semantiki na Data Iliyounganishwa. Marekebisho na nyongeza).

Dhana za mantiki ya maelezo katika OWL yanahusiana na madarasa, majukumu yanahusiana na mali, watu binafsi huhifadhi jina lao la awali. Axioms pia huitwa axioms.

Kwa mfano, katika kinachojulikana Sintaksia ya Manchester kwa nukuu ya OWL msemo ambao tayari unajulikana kwetu Wavuti ya Semantiki na Data Iliyounganishwa. Marekebisho na nyongeza itaandikwa hivi:

Class: Human
Class: Parent
   EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent

Kuna sintaksia zingine za kuandika OWL, kama vile sintaksia inayofanya kazi, kutumika katika vipimo rasmi, na OWL/XML. Zaidi ya hayo, OWL inaweza kuwa serialized kwa muhtasari wa syntax ya RDF na zaidi - katika syntaxes yoyote maalum.

OWL ana uhusiano wa pande mbili na RDF. Kwa upande mmoja, inaweza kuzingatiwa kama aina ya kamusi inayopanua RDFS. Kwa upande mwingine, ni urasmi wenye nguvu zaidi ambao RDF ni umbizo la usanifu tu. Sio miundo yote ya msingi ya OWL inayoweza kuandikwa kwa kutumia sehemu tatu ya RDF.

Kulingana na sehemu gani ya ujenzi wa OWL inaruhusiwa kutumika, wanazungumza juu ya kinachojulikana Wasifu wa OWL. Sanifu na maarufu zaidi ni OWL EL, OWL RL na OWL QL. Uchaguzi wa wasifu huathiri ugumu wa computational wa matatizo ya kawaida. Seti kamili ya miundo ya OWL inayolingana na Wavuti ya Semantiki na Data Iliyounganishwa. Marekebisho na nyongeza, inayoitwa OWL DL. Wakati mwingine pia huzungumza juu ya OWL Kamili, ambayo muundo wa OWL unaruhusiwa kutumika kwa uhuru kamili uliopo katika RDF, bila vizuizi vya semantic na computational. Wavuti ya Semantiki na Data Iliyounganishwa. Marekebisho na nyongeza. Kwa mfano, kitu kinaweza kuwa darasa na mali. OWL Kamili hawezi kuamua.

Kanuni muhimu za kuambatisha matokeo katika OWL ni kupitishwa kwa dhana ya ulimwengu wazi. O.W.A.) na kukataliwa kwa dhana ya majina ya kipekee ( dhana ya kipekee ya jina, ONE) Hapo chini tutaona ambapo kanuni hizi zinaweza kuongoza na kutambulisha baadhi ya miundo ya OWL.

Acha ontolojia iwe na kipande kifuatacho (katika sintaksia ya Manchester):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human
   Facts: hasChild Alice, hasChild Bob, hasChild Carol

Je, itafuata yale ambayo yamesemwa kwamba John ana watoto wengi? Kukataa UNA kutalazimisha injini ya makisio kujibu swali hili kwa njia hasi, kwa kuwa Alice na Bob wanaweza kuwa watu sawa. Ili yafuatayo yafanyike, ni muhimu kuongeza axiom ifuatayo:

DifferentIndividuals: Alice, Bob, Carol, John

Wacha sasa kipande cha ontolojia kiwe na muundo ufuatao (John anatangazwa kuwa na watoto wengi, lakini ana watoto wawili tu):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human, manyChildren
   Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John

Je, ontolojia hii itakuwa haiendani (ambayo inaweza kufasiriwa kama ushahidi wa data batili)? Kukubali OWA kutasababisha injini ya uelekezaji kujibu kwa hasi: "mahali pengine" pengine (katika ontolojia nyingine) inaweza kusemwa kuwa Carol pia ni mtoto wa John.

Ili kuondoa uwezekano wa hili, hebu tuongeze ukweli mpya kuhusu Yohana:

Individual: John
   Facts: hasChild Alice, hasChild Bob, not hasChild Carol

Ili kuwatenga kuonekana kwa watoto wengine, wacha tuseme kwamba maadili yote ya mali "kuwa na mtoto" ni watu, ambao tuna nne tu:

ObjectProperty: hasChild
   Domain: Human
   Π‘haracteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }

Sasa ontolojia itapingana, ambayo injini ya uelekezaji haitashindwa kuripoti. Na wa mwisho wa axioms tuna, kwa maana, "kufunga" ulimwengu, na ona jinsi uwezekano wa Yohana kuwa mtoto wake mwenyewe unavyotengwa.

Kuunganisha Data ya Biashara

Seti ya Data Iliyounganishwa ya mbinu na teknolojia ilikusudiwa awali kuchapisha data kwenye Wavuti. Matumizi yao katika mazingira ya ndani ya ushirika yanakabiliwa na shida kadhaa.

Kwa mfano, katika mazingira yaliyofungwa ya shirika, nguvu ya upunguzaji ya OWL kulingana na kupitishwa kwa OWA na kukataliwa kwa UNA, maamuzi kutokana na hali ya wazi na iliyosambazwa ya Wavuti, ni dhaifu sana. Na hapa suluhisho zifuatazo zinawezekana.

  • Kumpa OWL semantiki, ikimaanisha kuachwa kwa OWA na kupitishwa kwa UNA, utekelezaji wa injini ya pato inayolingana. - Kando ya njia hii inakuja Hifadhi ya Stardog RDF.
  • Kuacha uwezo wa kupunguza wa OWL ili kupendelea injini za sheria. - Stardog inasaidia SWRL; Jena na GraphDB ofa mwenyewe lugha kanuni
  • Kukataliwa kwa uwezo wa kupunguka wa OWL, matumizi ya kitengo kidogo kimoja au kingine karibu na RDFS kwa uundaji wa muundo. - Tazama zaidi juu ya hii hapa chini.

Suala jingine ni mkazo zaidi ambao ulimwengu wa shirika unaweza kuwa nao katika masuala ya ubora wa data na ukosefu wa zana za uthibitishaji wa data katika mrundikano wa Data Zilizounganishwa. Matokeo hapa ni kama ifuatavyo.

  • Tena, tumia uthibitishaji wa miundo ya OWL iliyo na semantiki za ulimwengu zilizofungwa na majina ya kipekee ikiwa injini inayofaa ya makisio inapatikana.
  • Matumizi ya SHACL, iliyosanifishwa baada ya orodha ya tabaka za Keki za Tabaka la Wavuti la Semantic kusasishwa (hata hivyo, inaweza pia kutumika kama injini ya sheria), au ShEx.
  • Kuelewa kuwa kila kitu hatimaye hufanywa na maswali ya SPARQL, na kuunda utaratibu wako rahisi wa uthibitishaji wa data ukitumia.

Hata hivyo, hata kukataliwa kabisa kwa uwezo wa kupunguza na zana za uthibitishaji huacha mrundikano wa Data Zilizounganishwa nje ya ushindani katika majukumu ambayo yanafanana katika mlalo kwa wavuti wazi na iliyosambazwa - katika kazi za kuunganisha data.

Vipi kuhusu mfumo wa habari wa biashara wa kawaida?

Hii inawezekana, lakini unapaswa, kwa kweli, kuwa na ufahamu wa shida gani teknolojia zinazolingana zitasuluhisha. Nitaelezea hapa mmenyuko wa kawaida wa washiriki wa maendeleo ili kuonyesha jinsi msururu huu wa teknolojia unavyoonekana kutoka kwa mtazamo wa IT ya kawaida. Inanikumbusha kidogo mfano wa tembo:

  • Mchambuzi wa biashara: RDF ni kitu kama kielelezo cha kimantiki kilichohifadhiwa moja kwa moja.
  • Mchambuzi wa Mifumo: RDF ni kama EAV, tu na kundi la faharasa na lugha rahisi ya kuuliza.
  • Π Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊ: Kweli, hii yote ni katika roho ya dhana ya mfano tajiri na nambari ya chini, soma hivi karibuni kuhusu hili.
  • Meneja wa mradi: ndio ni sawa kuporomosha stack!

Mazoezi yanaonyesha kuwa stack hutumiwa mara nyingi katika kazi zinazohusiana na usambazaji na utofauti wa data, kwa mfano, wakati wa kujenga mifumo ya darasa ya MDM (Usimamizi Mkuu wa Data) au DWH (Ghala la Data). Shida kama hizo zipo katika tasnia yoyote.

Kwa upande wa programu mahususi za sekta, teknolojia za Data Zilizounganishwa kwa sasa ni maarufu zaidi katika tasnia zifuatazo.

  • teknolojia za matibabu (ambapo umaarufu wao unaonekana kuwa unahusiana na utata wa kikoa);

sasa

"Boiling Point" hivi majuzi iliandaa mkutano ulioandaliwa na chama cha "National Medical Knowledge Base""Kuchanganya ontolojia. Kutoka kwa nadharia hadi matumizi ya vitendo'.

  • uzalishaji na uendeshaji wa bidhaa ngumu (uhandisi mkubwa wa mitambo, uzalishaji wa mafuta na gesi; mara nyingi tunazungumza juu ya kiwango ISO 15926);

sasa

Hapa, pia, sababu ni ugumu wa eneo la somo, wakati, kwa mfano, katika hatua ya juu ya mto, ikiwa tunazungumzia kuhusu sekta ya mafuta na gesi, uhasibu rahisi unahitaji baadhi ya kazi za CAD.

Mnamo 2008, hafla ya ufungaji wa mwakilishi, iliyoandaliwa na Chevron, ilifanyika mkutano.

ISO 15926, mwishowe, ilionekana kuwa nzito kidogo kwa tasnia ya mafuta na gesi (na labda ilipata matumizi makubwa zaidi katika uhandisi wa mitambo). Ni Statoil (Equinor) pekee ndiyo iliyonasa juu yake; huko Norway, kwa ujumla mfumo wa ikolojia. Wengine wanajaribu kufanya mambo yao wenyewe. Kwa mfano, kulingana na uvumi, Wizara ya Nishati ya ndani inakusudia kuunda "mfano wa dhana ya ontolojia ya tata ya mafuta na nishati," sawa, inaonekana, iliyoundwa kwa tasnia ya nishati ya umeme.

  • mashirika ya kifedha (hata XBRL inaweza kuchukuliwa kuwa aina ya mseto wa SDMX na ontolojia ya RDF Data Cube);

sasa

Mwanzoni mwa mwaka, LinkedIn ilimtuma mwandishi kwa barua taka na nafasi za karibu kutoka kwa wakubwa wote wa tasnia ya kifedha, ambao anawajua kutoka kwa safu ya Televisheni "Force Majeure": Goldman Sachs, JPMorgan Chase na/au Morgan Stanley, Wells Fargo, SWIFT/Visa/Mastercard, Bank of America, Citigroup, Fed, Deutsche Bank... Huenda kila mtu alikuwa akitafuta mtu ambaye angeweza kumtuma Mkutano wa Grafu ya Maarifa. Wachache walifanikiwa kupata: mashirika ya kifedha yalichukua kila kitu asubuhi ya siku ya kwanza.

Kwenye HeadHunter, ni Sberbank pekee iliyopata kitu cha kufurahisha; ilikuwa ni kuhusu "Hifadhi ya EAV yenye muundo wa data kama RDF."

Pengine, tofauti katika kiwango cha upendo kwa teknolojia sambamba ya taasisi za fedha za ndani na za Magharibi ni kutokana na hali ya kimataifa ya shughuli za mwisho. Inavyoonekana, ujumuishaji katika mipaka ya serikali unahitaji suluhisho tofauti za shirika na kiufundi.

  • mifumo ya majibu ya maswali na maombi ya kibiashara (IBM Watson, Apple Siri, Google Knowledge Graph);

sasa

Kwa njia, muundaji wa Siri, Thomas Gruber, ndiye mwandishi wa ufafanuzi wa ontolojia (kwa maana ya IT) kama "uainishaji wa dhana." Kwa maoni yangu, kupanga upya maneno katika ufafanuzi huu haibadilishi maana yake, ambayo labda inaonyesha kwamba haipo.

  • uchapishaji wa data iliyopangwa (kwa uhalali mkubwa zaidi hii inaweza kuhusishwa na Data Huria Iliyounganishwa).

sasa

Mashabiki wakubwa wa Data Iliyounganishwa ni ile inayoitwa GLAM: Matunzio, Maktaba, Kumbukumbu, na Makumbusho. Inatosha kusema kwamba Maktaba ya Congress inakuza uingizwaji wa MARC21 BIBFRAMEAmbayo hutoa msingi wa mustakabali wa maelezo ya biblia na, bila shaka, kulingana na RDF.

Wikidata mara nyingi hutajwa kama mfano wa mradi uliofanikiwa katika uwanja wa Data Huria Iliyounganishwa - aina ya toleo linalosomeka na mashine la Wikipedia, maudhui ambayo, tofauti na DBPedia, hayatoleshwi kwa kuagiza kutoka kwa masanduku ya habari ya makala, lakini ni. imeundwa zaidi au kidogo kwa mikono (na baadaye inakuwa chanzo cha habari kwa visanduku sawa vya habari).

Tunapendekeza pia uangalie orodha watumiaji wa hifadhi ya Stardog RDF kwenye tovuti ya Stardog katika sehemu ya "Wateja".

Kuwa hivyo iwezekanavyo, katika Gartner Mzunguko wa Hype kwa Teknolojia Zinazoibuka 2016 "Taxonomia ya Biashara na Usimamizi wa Ontolojia" imewekwa katikati ya mteremko kwenye bonde la kukatishwa tamaa kwa matarajio ya kufikia "uwanda wa tija" mapema zaidi ya miaka 10.

Kuunganisha Data ya Biashara

Utabiri, utabiri, utabiri...

Kutokana na maslahi ya kihistoria, nimeorodhesha chini ya utabiri wa Gartner kwa miaka mbalimbali kuhusu teknolojia zinazotuvutia.

Mwaka ВСхнология Ripoti Nafasi Miaka kwa Plateau
2001 Mtandao wa Semantic Teknolojia zinazoibuka Kichochezi cha Ubunifu 5-10
2006 Wavuti ya Semantiki ya Biashara Teknolojia zinazoibuka Kilele cha Matarajio ya Kuongezeka 5-10
2012 Mtandao wa Semantic Big Data Kilele cha Matarajio ya Kuongezeka > 10
2015 Data Iliyounganishwa Uchanganuzi wa Kina na Sayansi ya Data Njia ya Kukatishwa tamaa 5-10
2016 Usimamizi wa Ontolojia ya Biashara Teknolojia zinazoibuka Njia ya Kukatishwa tamaa > 10
2018 Grafu za Maarifa Teknolojia zinazoibuka Kichochezi cha Ubunifu 5-10

Walakini, tayari ndani "Mzunguko wa Hype..." 2018 mwelekeo mwingine wa juu umeonekana - Grafu za Maarifa. Kuzaliwa upya fulani kulifanyika: DBMS za grafu, ambayo umakini wa watumiaji na juhudi za watengenezaji zilibadilika, chini ya ushawishi wa maombi ya wa zamani na tabia za mwisho, zilianza kuchukua mtaro na nafasi. ya washindani wao waliotangulia.

Takriban kila grafu ya DBMS sasa inajitangaza kuwa jukwaa linalofaa kwa ajili ya kujenga "grafu ya maarifa" ya shirika ("data iliyounganishwa" wakati mwingine hubadilishwa na "data iliyounganishwa"), lakini ni jinsi gani madai kama hayo yana haki?

Hifadhidata za grafu bado hazina maana; data katika grafu DBMS bado ni silo sawa ya data. Vitambulishi vya kamba badala ya URIs hufanya kazi ya kuunganisha DBMS za grafu mbili bado kuwa kazi ya ujumuishaji, huku kuunganisha maduka mawili ya RDF mara nyingi huja kwa kuunganisha kwa urahisi grafu mbili za RDF. Kipengele kingine cha usawaziko ni kutobadilika tena kwa mfano wa grafu ya LPG, ambayo inafanya kuwa vigumu kudhibiti metadata kwa kutumia jukwaa sawa.

Hatimaye, DBMS za grafu hazina injini za uelekezaji au injini za sheria. Matokeo ya injini kama hizo yanaweza kutolewa tena kwa maswali magumu, lakini hii inawezekana hata katika SQL.

Walakini, mifumo inayoongoza ya uhifadhi wa RDF haina shida kuunga mkono mfano wa LPG. Mbinu thabiti zaidi inachukuliwa kuwa ile iliyopendekezwa kwa wakati mmoja katika Blazegraph: mfano wa RDF*, unaochanganya RDF na LPG.

zaidi

Unaweza kusoma zaidi juu ya usaidizi wa uhifadhi wa RDF kwa mfano wa LPG katika nakala iliyotangulia juu ya HabrΓ©: "Ni nini kinaendelea na hifadhi ya RDF sasa". Natumaini siku moja makala tofauti itaandikwa kuhusu Grafu za Maarifa na Kitambaa cha Data. Sehemu ya mwisho, kama ilivyo rahisi kuelewa, iliandikwa kwa haraka, hata hivyo, hata miezi sita baadaye, kila kitu sio wazi zaidi na dhana hizi.

Fasihi

  1. Halpin, H., Monnin, A. (wahariri) (2014). Uhandisi wa Falsafa: Kuelekea Falsafa ya Wavuti
  2. Allemang, D., Hendler, J. (2011) Wavuti ya Semantiki kwa Daktari wa Ontolojia Anayefanya Kazi ( toleo la 2)
  3. Staab, S., Studer, R. (wahariri) (2009) Mwongozo wa Ontolojia (toleo la 2)
  4. Wood, D. (mh.). (2011) Kuunganisha Data ya Biashara
  5. Keet, M. (2018) Utangulizi wa Uhandisi wa Ontolojia

Chanzo: mapenzi.com

Kuongeza maoni