Wavuti ya Semantiki na Data Iliyounganishwa. Marekebisho na nyongeza
Ningependa kuwasilisha kwa umma kipande cha kitabu hiki kilichochapishwa hivi majuzi:
Muundo wa kiontolojia wa biashara: mbinu na teknolojia [Nakala]: monograph / [S. V. Gorshkov, S. S. Kralin, O. I. Mushtak na wengine; mhariri mtendaji S.V. Gorshkov]. - Ekaterinburg: Nyumba ya Uchapishaji ya Chuo Kikuu cha Ural, 2019. - 234 p.: mgonjwa., meza; 20 cm - Mwandishi. imeonyeshwa kwenye titi ya nyuma. Na. - Bibliografia mwishoni mwa ch. - ISBN 978-5-7996-2580-1: nakala 200.
Madhumuni ya kuchapisha kipande hiki kwa Habre ni mara nne:
Haiwezekani kwamba mtu yeyote ataweza kushika kitabu hiki mikononi mwake ikiwa yeye si mteja wa mtu anayeheshimiwa SergeIndex; Hakika haiuzwi.
Marekebisho yamefanywa kwa maandishi (hayajaangaziwa hapa chini) na nyongeza zimefanywa ambazo haziendani sana na muundo wa monograph iliyochapishwa: maelezo ya mada (chini ya waharibifu) na viungo.
nataka kukusanya maswali na maoni, ili kuyazingatia wakati wa kutia ndani maandishi haya katika fomu iliyorekebishwa katika vichapo vingine vyovyote.
Wafuasi wengi wa Mtandao wa Semantiki na Data Zilizounganishwa bado wanaamini kwamba mzunguko wao ni finyu sana, hasa kwa sababu umma kwa ujumla bado haujafafanuliwa ipasavyo jinsi inavyofaa kuwa mfuasi wa Mtandao wa Semantiki na Data Zilizounganishwa. Mwandishi wa kipande hicho, ingawa yeye ni wa mduara huu, hana maoni haya, lakini, hata hivyo, anajiona kuwa ni wajibu wa kufanya jaribio lingine.
Hivyo,
Mtandao wa Semantic
Mageuzi ya Mtandao yanaweza kuwakilishwa kama ifuatavyo (au kuzungumza juu ya sehemu zake ambazo ziliundwa kwa mpangilio ulioonyeshwa hapa chini):
Nyaraka kwenye mtandao. Teknolojia muhimu - Gopher, FTP, nk.
Mtandao ni mtandao wa kimataifa wa kubadilishana rasilimali za ndani.
Nyaraka za mtandao. Teknolojia muhimu ni HTML na HTTP.
Hali ya rasilimali zilizojitokeza huzingatia sifa za njia yao ya maambukizi.
Data ya mtandao. Teknolojia muhimu - REST na API ya SABUNI, XHR, n.k.
enzi ya maombi ya mtandao, si tu watu kuwa watumiaji wa rasilimali.
Data ya mtandao. Teknolojia muhimu ni Teknolojia za Data Zilizounganishwa.
Hatua hii ya nne, iliyotabiriwa na Berners-Lee, muundaji wa teknolojia ya pili ya msingi na mkurugenzi wa W3C, inaitwa Mtandao wa Semantic; Teknolojia za Data Zilizounganishwa zimeundwa kufanya data kwenye wavuti sio tu kusomeka kwa mashine, bali pia "kueleweka kwa mashine."
Kutoka kwa kile kinachofuata, msomaji ataelewa mawasiliano kati ya dhana kuu za hatua ya pili na ya nne:
URL ni sawa na URIs,
analog ya HTML ni RDF,
Viungo vya HTML ni sawa na matukio ya URI katika hati za RDF.
Wavuti ya Semantiki ni dira ya kimfumo zaidi ya mustakabali wa Mtandao kuliko mwelekeo mahususi wa hiari au ulioshawishiwa, ingawa inaweza kutilia maanani haya ya pili. Kwa mfano, sifa muhimu ya kile kinachoitwa Web 2.0 inachukuliwa kuwa "maudhui yanayotokana na mtumiaji." Hasa, pendekezo la W3C linaitwa kulizingatia "Ontolojia ya Maelezo ya Wavuti"na ahadi kama vile Mango.
Je, Mtandao wa Semantic Umekufa?
Ukikataa matarajio yasiyo ya kweli, hali ya mtandao wa kisemantiki ni takriban sawa na ukomunisti wakati wa ujamaa ulioendelea (na ikiwa uaminifu kwa maagizo ya masharti ya Ilyich unazingatiwa, kila mtu ajiamulie mwenyewe). Injini za utafutaji kwa mafanikio kabisa kulazimisha tovuti kutumia RDFa na JSON-LD na zenyewe zitumie teknolojia zinazohusiana na zile zilizoelezwa hapa chini (Grafu ya Maarifa ya Google, Grafu ya Maarifa ya Bing).
Kwa ujumla, mwandishi hawezi kusema nini kinachozuia kuenea zaidi, lakini anaweza kuzungumza kwa misingi ya uzoefu wa kibinafsi. Kuna shida ambazo zinaweza kutatuliwa "nje ya boksi" katika hali ya kukera kwa SW, ingawa hazijaenea sana. Matokeo yake, wale ambao wanakabiliwa na kazi hizi hawana njia za kulazimishwa dhidi ya wale wanaoweza kutoa suluhisho, wakati utoaji wa kujitegemea wa mwisho wa ufumbuzi unapingana na mifano yao ya biashara. Kwa hivyo tunaendelea kuchanganua HTML na kuunganisha API mbalimbali, moja kwa moja mbaya zaidi.
Hata hivyo, teknolojia za Data Zilizounganishwa zimeenea zaidi ya Mtandao wa kawaida; Kitabu, kwa kweli, kimejitolea kwa programu hizi. Kwa sasa, jumuiya ya Data Iliyounganishwa inatarajia teknolojia hizi kuenea zaidi kutokana na kurekodi kwa Gartner (au tangazo, upendavyo) ya mitindo kama vile Grafu za Maarifa ΠΈ Kitambaa cha data. Ningependa kuamini kwamba haitakuwa utekelezaji wa "baiskeli" wa dhana hizi ambazo zitafaulu, lakini zile zinazohusiana na viwango vya W3C vilivyojadiliwa hapa chini.
Data Iliyounganishwa
Berners-Lee alifafanua Data Iliyounganishwa kama mtandao wa kisemantiki "uliofanywa kwa haki": seti ya mbinu na teknolojia zinazoiruhusu kufikia malengo yake ya mwisho. Kanuni za msingi za Data Iliyounganishwa Berners-Lee imeangaziwa zifwatazo.
Kanuni ya 1. Kutumia URI kutaja vyombo.
URIs ni vitambulishi vya huluki duniani kote kinyume na vitambulishi vya kamba vya ndani vya maingizo. Baadaye, kanuni hii ilionyeshwa vyema zaidi katika kauli mbiu ya Grafu ya Google Knowledge βmambo, si masharti'.
Kanuni ya 2. Kutumia URIs katika mpango wa HTTP ili ziweze kuondolewa marejeleo.
Kwa kupata URI, itawezekana kupata kiashiria kilicho nyuma ya kiashirio hicho (mfano na jina la mwendeshaji uko wazi hapa).*"katika C); kwa usahihi zaidi, kupata uwakilishi fulani wa hii iliyoashiriwa - kulingana na thamani ya kichwa cha HTTP Accept:. Labda, pamoja na ujio wa enzi ya AR/VR, itawezekana kupata rasilimali yenyewe, lakini kwa sasa, uwezekano mkubwa, itakuwa hati ya RDF, ambayo ni matokeo ya kutekeleza swala la SPARQL. DESCRIBE.
Kanuni ya 3. Matumizi ya viwango vya W3C - kimsingi RDF(S) na SPARQL - haswa wakati wa kuondoa URI.
"Tabaka" hizi za kibinafsi za safu ya teknolojia ya Data Iliyounganishwa, pia inajulikana kama Keki ya Tabaka la Wavuti la Semantic, itaelezwa hapa chini.
Kanuni ya 4. Matumizi ya marejeleo kwa URI zingine wakati wa kuelezea huluki.
RDF hukuruhusu kujiwekea kikomo kwa maelezo ya maneno ya rasilimali katika lugha asilia, na kanuni ya nne inaita kutofanya hivi. Ikiwa kanuni ya kwanza inazingatiwa ulimwenguni pote, inawezekana wakati wa kuelezea rasilimali kutaja wengine, ikiwa ni pamoja na "kigeni", ndiyo sababu data inaitwa iliyounganishwa. Kwa kweli, ni karibu kuepukika kutumia URI zilizotajwa katika msamiati wa RDFS.
RDF
RDF (Mfumo wa Maelezo ya Nyenzo-rejea) ni utaratibu rasmi wa kuelezea huluki zinazohusiana.
Taarifa za aina ya "somo-predicate-object", inayoitwa triplets, hufanywa kuhusu vyombo na mahusiano yao. Katika hali rahisi, mada, kihusishi, na kitu zote ni URIs. URI sawa inaweza kuwa katika nafasi tofauti katika sehemu tatu tofauti: kuwa somo, kiima, na kitu; Kwa hivyo, sehemu tatu huunda aina ya grafu inayoitwa grafu ya RDF.
Mada na vitu vinaweza kuwa sio URI tu, bali pia kinachojulikana nodi tupu, na vitu vinaweza pia kuwa halisi. Literals ni mifano ya aina za zamani zinazojumuisha uwakilishi wa kamba na kiashirio cha aina.
Mifano ya maandishi halisi (katika syntax ya Turtle, zaidi juu yake hapa chini): "5.0"^^xsd:float ΠΈ "five"^^xsd:string. Maandishi yenye aina rdf:langString pia inaweza kuwekwa na lebo ya lugha; katika Turtle imeandikwa kama hii: "five"@en ΠΈ "ΠΏΡΡΡ"@ru.
Nodi tupu ni rasilimali "zisizojulikana" bila vitambulisho vya kimataifa, kuhusu taarifa ambazo zinaweza, hata hivyo, kufanywa; aina ya vigezo kuwepo.
Kwa hivyo (hii ni, kwa kweli, hatua nzima ya RDF):
mada ni URI au nodi tupu,
kihusishi ni URI,
kitu ni URI, nodi tupu, au halisi.
Kwa nini viambishi haviwezi kuwa nodi tupu?
Sababu inayowezekana ni hamu ya kuelewa kwa njia isiyo rasmi na kutafsiri sehemu tatu katika lugha ya mantiki ya kihusishi cha mpangilio wa kwanza. s p o kama kitu kama Ambapo - kitabiri, ΠΈ - mara kwa mara. Athari za ufahamu huu ziko kwenye hati "Lmsingi: Semantiki za Lugha za Wavuti za Semantiki", ambayo ina hadhi ya noti ya kikundi kazi cha W3C. Kwa ufahamu huu, utatu s p []Ambapo [] - nodi tupu, itatafsiriwa kama Ambapo - kutofautiana, lakini jinsi ya kutafsiri s [] o? Hati iliyo na hali ya Mapendekezo ya W3C "RDF 1.1 Semantikiβ inatoa mbinu nyingine ya kutafsiri, lakini bado haizingatii uwezekano wa vihusishi kuwa nodi tupu.
RDF ni mfano wa kufikirika. RDF inaweza kuandikwa (kupangwa) katika syntaxes mbalimbali: RDF/XML, Turtle (inasomwa zaidi na binadamu), JSON-LD, HDT (binary).
RDF hiyo hiyo inaweza kusasishwa kuwa RDF/XML kwa njia tofauti, kwa hivyo, kwa mfano, haina maana kuhalalisha XML inayotokana kwa kutumia XSD au kujaribu kutoa data kwa kutumia XPath. Vile vile, JSON-LD haina uwezekano wa kukidhi hamu ya wastani ya msanidi programu wa Javascript kufanya kazi na RDF kwa kutumia nukuu ya Javascript na mabano ya mraba (ingawa JSON-LD inasonga upande huo kwa kutoa utaratibu. kutunga).
Sintaksia nyingi hutoa njia za kufupisha URI ndefu. Kwa mfano, tangazo @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> katika Turtle basi itakuruhusu kuandika badala yake <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> tu rdf:type.
RDFS
RDFS (RDF Schema) - msamiati wa msingi wa modeli, huleta dhana za mali na darasa na mali kama vile rdf:type, rdfs:subClassOf, rdfs:domain ΠΈ rdfs:range. Kwa kutumia kamusi ya RDFS, kwa mfano, misemo halali ifuatayo inaweza kuandikwa:
RDFS ni maelezo na msamiati wa kielelezo, lakini sio lugha ya kikwazo (ingawa vipimo rasmi na majani uwezekano wa matumizi kama haya). Neno "Schema" halipaswi kueleweka kwa maana sawa na katika usemi "Schema ya XML". Kwa mfano, :author rdfs:range foaf:Person maana yake rdf:type thamani zote za mali :author - foaf:Person, lakini haimaanishi kwamba hii inapaswa kusemwa mapema.
SPARQL
SPARQL (Itifaki ya SPARQL na Lugha ya Maswali ya RDF) - lugha ya kuuliza data ya RDF. Katika hali rahisi, hoja ya SPARQL ni seti ya sampuli ambazo sehemu tatu za grafu inayoulizwa zinalingana. Sampuli zinaweza kuwa na viambajengo katika nafasi za somo, kihusishi na kitu.
Hoja itarejesha thamani zinazobadilika ambazo, zinapobadilishwa kwenye sampuli, zinaweza kusababisha sehemu ndogo ya grafu ya RDF iliyoulizwa (sehemu ndogo ya vipande vyake vitatu). Vigezo vya jina moja katika sampuli tofauti za sehemu tatu lazima ziwe na thamani sawa.
Kwa mfano, kwa kuzingatia seti iliyo hapo juu ya axioms saba za RDFS, swali lifuatalo litarudi rdfs:domain ΠΈ rdfs:range kama maadili ?s ΠΈ ?p ipasavyo:
Inafaa kukumbuka kuwa SPARQL ni ya kutangaza na si lugha ya kuelezea utepetevu wa grafu (hata hivyo, baadhi ya hazina za RDF hutoa njia za kurekebisha mpango wa utekelezaji wa hoja). Kwa hivyo, shida zingine za kawaida za grafu, kwa mfano, kutafuta njia fupi zaidi, haziwezi kutatuliwa katika SPARQL, pamoja na kutumia njia za mali (lakini, tena, hazina za RDF za kibinafsi hutoa upanuzi maalum wa kutatua shida hizi).
SPARQL haishiriki dhana ya uwazi wa ulimwengu na inafuata mbinu ya "kukanusha kama kushindwa", ambapo inawezekana miundo kama vile FILTER NOT EXISTS {β¦}. Usambazaji wa data unazingatiwa kwa kutumia utaratibu maswali yaliyoshirikishwa.
Sehemu ya kufikia ya SPARQL - hifadhi ya RDF inayoweza kushughulikia hoja za SPARQL - haina mlinganisho wa moja kwa moja kutoka hatua ya pili (tazama mwanzo wa aya hii). Inaweza kulinganishwa na hifadhidata, kulingana na yaliyomo ambayo kurasa za HTML zilitolewa, lakini zinapatikana kwa nje. Sehemu ya kufikia ya SPARQL inafanana zaidi na kituo cha kufikia API kutoka hatua ya tatu, lakini ikiwa na tofauti kuu mbili. Kwanza, inawezekana kuchanganya maswali kadhaa ya "atomiki" kuwa moja (ambayo inachukuliwa kuwa sifa kuu ya GraphQL), na pili, API kama hiyo inajiandikisha kabisa (ambayo ndiyo HATEOAS ilijaribu kufikia).
Maoni ya kisiasa
RDF ni njia ya kuchapisha data kwenye wavuti, kwa hivyo hifadhi ya RDF inapaswa kuzingatiwa kuwa hati ya DBMS. Ukweli, kwa kuwa RDF ni grafu na sio mti, pia iligeuka kuwa ya msingi wa graph. Inashangaza kwamba ilifanya kazi hata kidogo. Nani angefikiria kuwa kutakuwa na watu wenye akili ambao wangetekeleza nodi tupu. Codd yuko hapa haikufaulu.
OWL (Lugha ya Ontolojia ya Wavuti) - utaratibu rasmi wa kuwakilisha maarifa, toleo la kisintaksia la mantiki ya maelezo (kila mahali hapa chini ni sahihi zaidi kusema OWL 2, toleo la kwanza la OWL lilitokana na ).
Dhana za mantiki ya maelezo katika OWL yanahusiana na madarasa, majukumu yanahusiana na mali, watu binafsi huhifadhi jina lao la awali. Axioms pia huitwa axioms.
Kwa mfano, katika kinachojulikana Sintaksia ya Manchester kwa nukuu ya OWL msemo ambao tayari unajulikana kwetu itaandikwa hivi:
Class: Human
Class: Parent
EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent
OWL ana uhusiano wa pande mbili na RDF. Kwa upande mmoja, inaweza kuzingatiwa kama aina ya kamusi inayopanua RDFS. Kwa upande mwingine, ni urasmi wenye nguvu zaidi ambao RDF ni umbizo la usanifu tu. Sio miundo yote ya msingi ya OWL inayoweza kuandikwa kwa kutumia sehemu tatu ya RDF.
Kulingana na sehemu gani ya ujenzi wa OWL inaruhusiwa kutumika, wanazungumza juu ya kinachojulikana Wasifu wa OWL. Sanifu na maarufu zaidi ni OWL EL, OWL RL na OWL QL. Uchaguzi wa wasifu huathiri ugumu wa computational wa matatizo ya kawaida. Seti kamili ya miundo ya OWL inayolingana na , inayoitwa OWL DL. Wakati mwingine pia huzungumza juu ya OWL Kamili, ambayo muundo wa OWL unaruhusiwa kutumika kwa uhuru kamili uliopo katika RDF, bila vizuizi vya semantic na computational. . Kwa mfano, kitu kinaweza kuwa darasa na mali. OWL Kamili hawezi kuamua.
Kanuni muhimu za kuambatisha matokeo katika OWL ni kupitishwa kwa dhana ya ulimwengu wazi. O.W.A.) na kukataliwa kwa dhana ya majina ya kipekee ( dhana ya kipekee ya jina, ONE) Hapo chini tutaona ambapo kanuni hizi zinaweza kuongoza na kutambulisha baadhi ya miundo ya OWL.
Acha ontolojia iwe na kipande kifuatacho (katika sintaksia ya Manchester):
Class: manyChildren
EquivalentTo: Human that hasChild min 3
Individual: John
Types: Human
Facts: hasChild Alice, hasChild Bob, hasChild Carol
Je, itafuata yale ambayo yamesemwa kwamba John ana watoto wengi? Kukataa UNA kutalazimisha injini ya makisio kujibu swali hili kwa njia hasi, kwa kuwa Alice na Bob wanaweza kuwa watu sawa. Ili yafuatayo yafanyike, ni muhimu kuongeza axiom ifuatayo:
DifferentIndividuals: Alice, Bob, Carol, John
Wacha sasa kipande cha ontolojia kiwe na muundo ufuatao (John anatangazwa kuwa na watoto wengi, lakini ana watoto wawili tu):
Class: manyChildren
EquivalentTo: Human that hasChild min 3
Individual: John
Types: Human, manyChildren
Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John
Je, ontolojia hii itakuwa haiendani (ambayo inaweza kufasiriwa kama ushahidi wa data batili)? Kukubali OWA kutasababisha injini ya uelekezaji kujibu kwa hasi: "mahali pengine" pengine (katika ontolojia nyingine) inaweza kusemwa kuwa Carol pia ni mtoto wa John.
Ili kuondoa uwezekano wa hili, hebu tuongeze ukweli mpya kuhusu Yohana:
Individual: John
Facts: hasChild Alice, hasChild Bob, not hasChild Carol
Ili kuwatenga kuonekana kwa watoto wengine, wacha tuseme kwamba maadili yote ya mali "kuwa na mtoto" ni watu, ambao tuna nne tu:
ObjectProperty: hasChild
Domain: Human
Π‘haracteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }
Sasa ontolojia itapingana, ambayo injini ya uelekezaji haitashindwa kuripoti. Na wa mwisho wa axioms tuna, kwa maana, "kufunga" ulimwengu, na ona jinsi uwezekano wa Yohana kuwa mtoto wake mwenyewe unavyotengwa.
Kuunganisha Data ya Biashara
Seti ya Data Iliyounganishwa ya mbinu na teknolojia ilikusudiwa awali kuchapisha data kwenye Wavuti. Matumizi yao katika mazingira ya ndani ya ushirika yanakabiliwa na shida kadhaa.
Kwa mfano, katika mazingira yaliyofungwa ya shirika, nguvu ya upunguzaji ya OWL kulingana na kupitishwa kwa OWA na kukataliwa kwa UNA, maamuzi kutokana na hali ya wazi na iliyosambazwa ya Wavuti, ni dhaifu sana. Na hapa suluhisho zifuatazo zinawezekana.
Kumpa OWL semantiki, ikimaanisha kuachwa kwa OWA na kupitishwa kwa UNA, utekelezaji wa injini ya pato inayolingana. - Kando ya njia hii inakuja Hifadhi ya Stardog RDF.
Kuacha uwezo wa kupunguza wa OWL ili kupendelea injini za sheria. - Stardog inasaidia SWRL; Jena na GraphDB ofa mwenyewelugha kanuni
Kukataliwa kwa uwezo wa kupunguka wa OWL, matumizi ya kitengo kidogo kimoja au kingine karibu na RDFS kwa uundaji wa muundo. - Tazama zaidi juu ya hii hapa chini.
Suala jingine ni mkazo zaidi ambao ulimwengu wa shirika unaweza kuwa nao katika masuala ya ubora wa data na ukosefu wa zana za uthibitishaji wa data katika mrundikano wa Data Zilizounganishwa. Matokeo hapa ni kama ifuatavyo.
Tena, tumia uthibitishaji wa miundo ya OWL iliyo na semantiki za ulimwengu zilizofungwa na majina ya kipekee ikiwa injini inayofaa ya makisio inapatikana.
Matumizi ya SHACL, iliyosanifishwa baada ya orodha ya tabaka za Keki za Tabaka la Wavuti la Semantic kusasishwa (hata hivyo, inaweza pia kutumika kama injini ya sheria), au ShEx.
Kuelewa kuwa kila kitu hatimaye hufanywa na maswali ya SPARQL, na kuunda utaratibu wako rahisi wa uthibitishaji wa data ukitumia.
Hata hivyo, hata kukataliwa kabisa kwa uwezo wa kupunguza na zana za uthibitishaji huacha mrundikano wa Data Zilizounganishwa nje ya ushindani katika majukumu ambayo yanafanana katika mlalo kwa wavuti wazi na iliyosambazwa - katika kazi za kuunganisha data.
Vipi kuhusu mfumo wa habari wa biashara wa kawaida?
Hii inawezekana, lakini unapaswa, kwa kweli, kuwa na ufahamu wa shida gani teknolojia zinazolingana zitasuluhisha. Nitaelezea hapa mmenyuko wa kawaida wa washiriki wa maendeleo ili kuonyesha jinsi msururu huu wa teknolojia unavyoonekana kutoka kwa mtazamo wa IT ya kawaida. Inanikumbusha kidogo mfano wa tembo:
Mchambuzi wa biashara: RDF ni kitu kama kielelezo cha kimantiki kilichohifadhiwa moja kwa moja.
Mchambuzi wa Mifumo: RDF ni kama EAV, tu na kundi la faharasa na lugha rahisi ya kuuliza.
Π Π°Π·ΡΠ°Π±ΠΎΡΡΠΈΠΊ: Kweli, hii yote ni katika roho ya dhana ya mfano tajiri na nambari ya chini, soma hivi karibuni kuhusu hili.
Mazoezi yanaonyesha kuwa stack hutumiwa mara nyingi katika kazi zinazohusiana na usambazaji na utofauti wa data, kwa mfano, wakati wa kujenga mifumo ya darasa ya MDM (Usimamizi Mkuu wa Data) au DWH (Ghala la Data). Shida kama hizo zipo katika tasnia yoyote.
Kwa upande wa programu mahususi za sekta, teknolojia za Data Zilizounganishwa kwa sasa ni maarufu zaidi katika tasnia zifuatazo.
teknolojia za matibabu (ambapo umaarufu wao unaonekana kuwa unahusiana na utata wa kikoa);
uzalishaji na uendeshaji wa bidhaa ngumu (uhandisi mkubwa wa mitambo, uzalishaji wa mafuta na gesi; mara nyingi tunazungumza juu ya kiwango ISO 15926);
sasa
Hapa, pia, sababu ni ugumu wa eneo la somo, wakati, kwa mfano, katika hatua ya juu ya mto, ikiwa tunazungumzia kuhusu sekta ya mafuta na gesi, uhasibu rahisi unahitaji baadhi ya kazi za CAD.
Mnamo 2008, hafla ya ufungaji wa mwakilishi, iliyoandaliwa na Chevron, ilifanyika mkutano.
ISO 15926, mwishowe, ilionekana kuwa nzito kidogo kwa tasnia ya mafuta na gesi (na labda ilipata matumizi makubwa zaidi katika uhandisi wa mitambo). Ni Statoil (Equinor) pekee ndiyo iliyonasa juu yake; huko Norway, kwa ujumla mfumo wa ikolojia. Wengine wanajaribu kufanya mambo yao wenyewe. Kwa mfano, kulingana na uvumi, Wizara ya Nishati ya ndani inakusudia kuunda "mfano wa dhana ya ontolojia ya tata ya mafuta na nishati," sawa, inaonekana, iliyoundwa kwa tasnia ya nishati ya umeme.
mashirika ya kifedha (hata XBRL inaweza kuchukuliwa kuwa aina ya mseto wa SDMX na ontolojia ya RDF Data Cube);
sasa
Mwanzoni mwa mwaka, LinkedIn ilimtuma mwandishi kwa barua taka na nafasi za karibu kutoka kwa wakubwa wote wa tasnia ya kifedha, ambao anawajua kutoka kwa safu ya Televisheni "Force Majeure": Goldman Sachs, JPMorgan Chase na/au Morgan Stanley, Wells Fargo, SWIFT/Visa/Mastercard, Bank of America, Citigroup, Fed, Deutsche Bank... Huenda kila mtu alikuwa akitafuta mtu ambaye angeweza kumtuma Mkutano wa Grafu ya Maarifa. Wachache walifanikiwa kupata: mashirika ya kifedha yalichukua kila kitu asubuhi ya siku ya kwanza.
Kwenye HeadHunter, ni Sberbank pekee iliyopata kitu cha kufurahisha; ilikuwa ni kuhusu "Hifadhi ya EAV yenye muundo wa data kama RDF."
Pengine, tofauti katika kiwango cha upendo kwa teknolojia sambamba ya taasisi za fedha za ndani na za Magharibi ni kutokana na hali ya kimataifa ya shughuli za mwisho. Inavyoonekana, ujumuishaji katika mipaka ya serikali unahitaji suluhisho tofauti za shirika na kiufundi.
mifumo ya majibu ya maswali na maombi ya kibiashara (IBM Watson, Apple Siri, Google Knowledge Graph);
sasa
Kwa njia, muundaji wa Siri, Thomas Gruber, ndiye mwandishi wa ufafanuzi wa ontolojia (kwa maana ya IT) kama "uainishaji wa dhana." Kwa maoni yangu, kupanga upya maneno katika ufafanuzi huu haibadilishi maana yake, ambayo labda inaonyesha kwamba haipo.
uchapishaji wa data iliyopangwa (kwa uhalali mkubwa zaidi hii inaweza kuhusishwa na Data Huria Iliyounganishwa).
sasa
Mashabiki wakubwa wa Data Iliyounganishwa ni ile inayoitwa GLAM: Matunzio, Maktaba, Kumbukumbu, na Makumbusho. Inatosha kusema kwamba Maktaba ya Congress inakuza uingizwaji wa MARC21 BIBFRAMEAmbayo hutoa msingi wa mustakabali wa maelezo ya biblia na, bila shaka, kulingana na RDF.
Wikidata mara nyingi hutajwa kama mfano wa mradi uliofanikiwa katika uwanja wa Data Huria Iliyounganishwa - aina ya toleo linalosomeka na mashine la Wikipedia, maudhui ambayo, tofauti na DBPedia, hayatoleshwi kwa kuagiza kutoka kwa masanduku ya habari ya makala, lakini ni. imeundwa zaidi au kidogo kwa mikono (na baadaye inakuwa chanzo cha habari kwa visanduku sawa vya habari).
Tunapendekeza pia uangalie orodha watumiaji wa hifadhi ya Stardog RDF kwenye tovuti ya Stardog katika sehemu ya "Wateja".
Kuwa hivyo iwezekanavyo, katika Gartner Mzunguko wa Hype kwa Teknolojia Zinazoibuka 2016 "Taxonomia ya Biashara na Usimamizi wa Ontolojia" imewekwa katikati ya mteremko kwenye bonde la kukatishwa tamaa kwa matarajio ya kufikia "uwanda wa tija" mapema zaidi ya miaka 10.
Kuunganisha Data ya Biashara
Utabiri, utabiri, utabiri...
Kutokana na maslahi ya kihistoria, nimeorodhesha chini ya utabiri wa Gartner kwa miaka mbalimbali kuhusu teknolojia zinazotuvutia.
Mwaka
Π’Π΅Ρ Π½ΠΎΠ»ΠΎΠ³ΠΈΡ
Ripoti
Nafasi
Miaka kwa Plateau
2001
Mtandao wa Semantic
Teknolojia zinazoibuka
Kichochezi cha Ubunifu
5-10
2006
Wavuti ya Semantiki ya Biashara
Teknolojia zinazoibuka
Kilele cha Matarajio ya Kuongezeka
5-10
2012
Mtandao wa Semantic
Big Data
Kilele cha Matarajio ya Kuongezeka
> 10
2015
Data Iliyounganishwa
Uchanganuzi wa Kina na Sayansi ya Data
Njia ya Kukatishwa tamaa
5-10
2016
Usimamizi wa Ontolojia ya Biashara
Teknolojia zinazoibuka
Njia ya Kukatishwa tamaa
> 10
2018
Grafu za Maarifa
Teknolojia zinazoibuka
Kichochezi cha Ubunifu
5-10
Walakini, tayari ndani "Mzunguko wa Hype..." 2018 mwelekeo mwingine wa juu umeonekana - Grafu za Maarifa. Kuzaliwa upya fulani kulifanyika: DBMS za grafu, ambayo umakini wa watumiaji na juhudi za watengenezaji zilibadilika, chini ya ushawishi wa maombi ya wa zamani na tabia za mwisho, zilianza kuchukua mtaro na nafasi. ya washindani wao waliotangulia.
Takriban kila grafu ya DBMS sasa inajitangaza kuwa jukwaa linalofaa kwa ajili ya kujenga "grafu ya maarifa" ya shirika ("data iliyounganishwa" wakati mwingine hubadilishwa na "data iliyounganishwa"), lakini ni jinsi gani madai kama hayo yana haki?
Hifadhidata za grafu bado hazina maana; data katika grafu DBMS bado ni silo sawa ya data. Vitambulishi vya kamba badala ya URIs hufanya kazi ya kuunganisha DBMS za grafu mbili bado kuwa kazi ya ujumuishaji, huku kuunganisha maduka mawili ya RDF mara nyingi huja kwa kuunganisha kwa urahisi grafu mbili za RDF. Kipengele kingine cha usawaziko ni kutobadilika tena kwa mfano wa grafu ya LPG, ambayo inafanya kuwa vigumu kudhibiti metadata kwa kutumia jukwaa sawa.
Hatimaye, DBMS za grafu hazina injini za uelekezaji au injini za sheria. Matokeo ya injini kama hizo yanaweza kutolewa tena kwa maswali magumu, lakini hii inawezekana hata katika SQL.
Walakini, mifumo inayoongoza ya uhifadhi wa RDF haina shida kuunga mkono mfano wa LPG. Mbinu thabiti zaidi inachukuliwa kuwa ile iliyopendekezwa kwa wakati mmoja katika Blazegraph: mfano wa RDF*, unaochanganya RDF na LPG.