Wéb Semantik sareng Data Numbu. Koréksi sareng tambihan

Abdi hoyong nampilkeun ka umum sempalan buku anu nembe diterbitkeun ieu:

Modeling ontologis perusahaan: métode sareng téknologi [Téks]: monograf / [S. V. Gorshkov, S. S. Kralin, O. I. Mushtak jeung sajabana; redaktur eksekutif S.V. Gorshkov]. - Ekaterinburg: Ural Universitas Publishing House, 2019. - 234 p.: gering., méja; 20 cm - Pangarang. dituduhkeun dina tit deui. Jeung. - Bibliografi dina tungtung ch. - ISBN 978-5-7996-2580-1: 200 éksemplar.

Tujuan ngeposkeun sempalan ieu dina Habré aya opat:

  • Ieu saperti teu mirip nu saha bakal bisa nahan buku ieu dina leungeun maranéhna lamun anjeunna lain klien of a terhormat SergeIndex; Ieu pasti moal diobral.
  • Koréksi parantos dilakukeun pikeun téks (henteu disorot di handap) sareng parantos dilakukeun tambihan anu henteu cocog pisan sareng format monograf anu dicitak: catetan topikal (handapeun spoiler) sareng hyperlink.
  • Abdi hoyong ngumpulkeun patarosan sareng koméntar, pikeun nganggap hal éta nalika ngalebetkeun téks ieu dina bentuk anu dirévisi dina publikasi sanés.
  • Seueur Semantic Web and Linked Data panganut masih yakin yén bunderan maranéhanana jadi sempit, utamana kusabab masarakat umum teu acan leres dipedar kumaha hébat éta jadi adherent tina Semantic Web na numbu Data. Panulis sempalan, sanajan anjeunna milik bunderan ieu, teu boga pamadegan ieu, tapi, kumaha oge, ngemutan dirina obligated nyieun usaha sejen.

Ku kituna,

Wéb Semantik

Évolusi Internét bisa digambarkeun saperti kieu (atawa ngobrol ngeunaan bagéan na nu kabentuk dina urutan dituduhkeun di handap):

  1. Dokumén dina Internét. Téknologi konci - Gopher, FTP, jsb.
    Internét nyaéta jaringan global pikeun tukeur sumber daya lokal.
  2. Dokumén Internét. Téknologi konci nyaéta HTML sareng HTTP.
    Sifat sumber daya anu kakeunaan ngémutan karakteristik média transmisina.
  3. data internét. Téknologi konci - REST sareng SOAP API, XHR, jsb.
    Jaman aplikasi Internet, teu ngan jalma jadi konsumen sumberdaya.
  4. data internét. Téknologi konci nyaéta téknologi Data Patalina.
    Tahap kaopat ieu, diprediksi ku Berners-Lee, panyipta téknologi inti kadua sareng diréktur W3C, disebut Semantic Web; Téknologi Data Patalina dirancang pikeun ngajantenkeun data dina wéb sanés ngan ukur tiasa dibaca ku mesin, tapi ogé "bisa kaharti ku mesin".

Tina anu di handap ieu, pamaca bakal ngartos korespondensi antara konsép konci tahap kadua sareng kaopat:

  • URL analog sareng URI,
  • analog tina HTML nyaéta RDF,
  • Hyperlinks HTML sarua jeung kajadian URI dina dokumén RDF.

The Semantic Web leuwih ti hiji visi sistemik ngeunaan masa depan Internet ti trend spontan atawa lobbied husus, sanajan bisa nyandak ieu dimungkinkeun kana rekening. Contona, hiji ciri penting naon disebut Web 2.0 dianggap "eusi-generate pamaké". Khususna, rekomendasi W3C disebat pikeun tumut kana akun "Web Anotasi Ontologi"sareng usaha sapertos padet.

Naha Semantic Web Dead?

Lamun nolak ekspektasi unrealistic, kaayaan jeung web semantik kira sarua jeung komunisme salila jaman sosialisme dimekarkeun (jeung naha kasatiaan kana behests kondisional Ilyich urang dititénan, hayu dulur mutuskeun sorangan). mesin pencari rada suksés maksakeun situs wéb nganggo RDFa sareng JSON-LD sareng nyalira nganggo téknologi anu aya hubunganana sareng anu dijelaskeun di handap ieu (Google Knowledge Graph, Bing Knowledge Graph).

Sacara umum, panulis henteu tiasa nyarios naon anu nyegah panyebaran anu langkung ageung, tapi anjeunna tiasa nyarios dumasar kana pangalaman pribadi. Aya masalah anu bisa direngsekeun "out of the box" dina kaayaan SW karasa, sanajan maranehna teu pisan nyebar. Hasilna, jalma anu disanghareupan ku pancén-pancén ieu teu boga cara maksa ngalawan jalma-jalma anu sanggup méré solusi, sedengkeun panyadiaan solusi anu mandiri anu terakhir bertentangan sareng modél bisnisna. Ku kituna urang neruskeun parse HTML jeung lem babarengan rupa API, hiji shittier sejen.

Sanajan kitu, téknologi Data numbu geus sumebar saluareun Web mainstream; Buku, kanyataanna, dedicated ka aplikasi ieu. Ayeuna, komunitas Linked Data ngaharepkeun téknologi ieu janten langkung nyebar berkat rékaman Gartner (atanapi proklamasi, sakumaha anu anjeun pikahoyong) tina tren sapertos Gambar Pangetahuan и Kain Data. Abdi hoyong yakin yén éta moal janten "sapédah" palaksanaan konsep ieu bakal suksés, tapi nu patali jeung standar W3C dibahas dihandap.

Data numbu

Berners-Lee diartikeun Linked Data salaku web semantik "dipigawe leres": sakumpulan pendekatan sareng téknologi anu ngamungkinkeun pikeun ngahontal tujuan pamungkas na. Prinsip dasar tina Linked Data Berners-Lee disorot nyaéta.

Prinsip 1. Ngagunakeun URI pikeun ngaranan éntitas.

URIs mangrupakeun identifiers éntitas global sabalikna identifiers string lokal pikeun éntri. Satuluyna, prinsip ieu pangalusna dikedalkeun dina slogan Google Knowledge Graph "hal, teu string".

Prinsip 2. Ngagunakeun URIs dina skéma HTTP ambéh maranéhanana bisa de-referenced.

Ku ngarujuk kana URI, anjeun kedah tiasa nyandak tanda anu aya di tukangeun éta (analogi sareng nami operator "jelas di dieu).*"dina C); leuwih tepat, pikeun meunangkeun sababaraha ngagambarkeun ieu signified - gumantung kana nilai tina lulugu HTTP Accept:. Panginten, kalayan munculna jaman AR / VR, éta bakal tiasa kéngingkeun sumber daya sorangan, tapi pikeun ayeuna, paling dipikaresep, éta bakal janten dokumen RDF, anu mangrupikeun hasil tina ngalaksanakeun pamundut SPARQL. DESCRIBE.

Prinsip 3. Pamakéan standar W3C - utamana RDF (S) jeung SPARQL - utamana lamun dereferencing URIs.

Ieu individu "lapisan" tumpukan téhnologi Data numbu, ogé katelah Kue Lapisan Web Semantis, bakal dijelaskeun di handap.

Prinsip 4. Pamakéan rujukan ka URI séjén nalika ngajéntrékeun éntitas.

RDF ngidinan Anjeun pikeun ngawatesan diri ka déskripsi verbal sumberdaya dina basa alam, sarta prinsip kaopat nyaéta panggero teu ngalakukeun ieu. Upami prinsip anu munggaran dititénan sacara universal, janten mungkin nalika ngajéntrékeun sumber daya pikeun ngarujuk ka batur, kalebet anu "asing", naha éta data disebut dikaitkeun. Kanyataanna, éta ampir dilawan ngagunakeun URIs ngaranna dina kosakata RDFS.

RDF

RDF (Resource Description Framework) nyaéta formalisme pikeun ngajelaskeun éntitas anu aya hubunganana.

Pernyataan tipe "subjék-predikat-objék", disebut triplets, dijieun ngeunaan éntitas jeung hubungan maranéhanana. Dina kasus pangbasajanna, subjek, predikat, jeung obyék téh sadayana URIs. URI anu sami tiasa dina posisi anu béda dina triplet anu béda: janten subjek, predikat, sareng objék; Ku kituna, triplets ngabentuk hiji jenis grafik disebut RDF grafik.

Subjék jeung objék bisa jadi teu ngan URIs, tapi ogé disebut titik kosong, jeung objék ogé bisa literals. Literal mangrupikeun conto jinis primitif anu diwangun ku répréséntasi senar sareng indikasi jinis.

Conto tulisan literal (dina sintaksis Turtle, langkung seueur ngeunaan éta di handap): "5.0"^^xsd:float и "five"^^xsd:string. Literal jeung tipe rdf:langString bisa ogé dilengkepan tag basa; dina Turtle ditulis kieu: "five"@en и "пять"@ru.

Titik kosong mangrupakeun sumberdaya "anonim" tanpa identifiers global, ngeunaan nu pernyataan bisa kitu, dijieun; jenis variabel eksistensial.

Janten (ieu, kanyataanna, sadayana titik RDF):

  • Subjek mangrupikeun URI atanapi titik kosong,
  • predikat mangrupa URI,
  • obyék nyaéta URI, titik kosong, atanapi literal.

Naha predikat henteu tiasa janten titik kosong?

Alesan probable nyaéta kahayang pikeun informal ngartos tur narjamahkeun triplet kana basa logika predikat urutan kahiji. s p o kawas hal kawas Wéb Semantik sareng Data Numbu. Koréksi sareng tambihandimana Wéb Semantik sareng Data Numbu. Koréksi sareng tambihan - predikat, Wéb Semantik sareng Data Numbu. Koréksi sareng tambihan и Wéb Semantik sareng Data Numbu. Koréksi sareng tambihan - konstanta. Sidik pamahaman ieu aya dina dokumén "LBase: Semantik pikeun Basa tina Wéb Semantik", anu statusna catetan grup kerja W3C. Kalayan pamahaman ieu, triplet s p []dimana [] - titik kosong, bakal ditarjamahkeun salaku Wéb Semantik sareng Data Numbu. Koréksi sareng tambihandimana Wéb Semantik sareng Data Numbu. Koréksi sareng tambihan - variabel, tapi kumaha lajeng narjamahkeun s [] o? Dokumén sareng status Rekomendasi W3C "RDF 1.1 Semantik” nawiskeun metode tarjamahan anu sanés, tapi tetep henteu nganggap kamungkinan prédikat janten titik kosong.

Sanajan kitu, Manu Sporni diwenangkeun.

RDF mangrupikeun modél abstrak. RDF tiasa ditulis (serialized) dina sababaraha sintaksis: RDF/XML, penyu (paling dibaca manusa), JSON-LD, HDT (binér).

RDF sarua bisa serialized kana RDF / XML ku cara béda, ku kituna, misalna, teu aya rasa sangkan méré konfirmasi XML hasilna ngagunakeun XSD atawa coba nimba data maké XPath. Kitu ogé, JSON-LD sigana moal nyugemakeun kahayang pamekar Javascript rata-rata pikeun damel sareng RDF nganggo titik Javascript sareng notasi kuadrat-kurung (sanaos JSON-LD pindah ka arah éta ku nawiskeun mékanisme rangkay).

Seuseueurna sintaksis nawiskeun cara pikeun pondokkeun URI anu panjang. Contona, hiji iklan @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> dina Turtle lajeng bakal ngidinan Anjeun pikeun nulis gantina <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> adil rdf:type.

RDFS

RDFS (RDF Schema) - kosakata modeling dasar, ngawanohkeun konsép harta jeung kelas jeung sipat saperti rdf:type, rdfs:subClassOf, rdfs:domain и rdfs:range. Ngagunakeun kamus RDFS, contona, ekspresi valid di handap ieu bisa ditulis:

rdf:type         rdf:type         rdf:Property .
rdf:Property     rdf:type         rdfs:Class .
rdfs:Class       rdfs:subClassOf  rdfs:Resource .
rdfs:subClassOf  rdfs:domain      rdfs:Class .
rdfs:domain      rdfs:domain      rdf:Property .
rdfs:domain      rdfs:range       rdfs:Class .
rdfs:label       rdfs:range       rdfs:Literal .

RDFS mangrupa déskripsi jeung modeling kosakata, tapi lain basa konstrain (sanajan spésifikasi resmi jeung daun kamungkinan pamakéan sapertos). Kecap "Skéma" teu kudu dipikaharti dina harti anu sarua sakumaha dina babasan "Skema XML". Salaku conto, :author rdfs:range foaf:Person hartina éta rdf:type sakabéh nilai sipat :author - foaf:Person, tapi lain hartosna yén ieu kudu ngomong sateuacanna.

SPARQL

SPARQL (SPARQL Protocol and RDF Query Language) - basa pikeun query data RDF. Dina kasus basajan, query SPARQL nyaéta sakumpulan conto anu cocog sareng triplets tina grafik anu ditaroskeun. Pola bisa ngandung variabel dina subyek, predikat, jeung posisi objék.

Paménta bakal ngabalikeun nilai-nilai variabel anu, nalika disubstitusi kana conto, tiasa nyababkeun subgraf tina grafik RDF anu ditaroskeun (subset tina triplets na). Variabel tina ngaran anu sarua dina sampel béda triplets kudu boga nilai sarua.

Contona, dibere set luhur tujuh axioms RDFS, query handap bakal balik rdfs:domain и rdfs:range salaku nilai ?s и ?p masing-masing:

SELECT * WHERE {
 ?s ?p rdfs:Class .
 ?p ?p rdf:Property .
}

Perhatos yén SPARQL mangrupikeun déklaratif sareng sanés basa pikeun ngajelaskeun traversal grafik (tapi, sababaraha repositori RDF nawiskeun cara pikeun nyaluyukeun rencana palaksanaan pamundut). Ku alatan éta, sababaraha masalah grafik standar, contona, manggihan jalur shortest, teu bisa direngsekeun dina SPARQL, kaasup ngagunakeun jalur harta (tapi, deui, repositories RDF individu nawiskeun ekstensi husus pikeun ngajawab masalah ieu).

SPARQL henteu ngabagi anggapan kabuka dunya sareng nuturkeun pendekatan "negasi salaku gagal", dimana mungkin desain sapertos FILTER NOT EXISTS {…}. Distribusi data dipertimbangkeun ngagunakeun mékanisme queries federasi.

Titik aksés SPARQL - panyimpen RDF anu tiasa ngolah patarosan SPARQL - teu aya analog langsung tina tahap kadua (tingali awal paragraf ieu). Éta tiasa disaruakeun sareng pangkalan data, dumasar kana eusi halaman HTML anu didamel, tapi tiasa diaksés ka luar. Titik aksés SPARQL leuwih analog jeung titik aksés API ti tahap katilu, tapi mibanda dua béda utama. Kahiji, kasebut nyaéta dimungkinkeun pikeun ngagabungkeun sababaraha "atom" queries kana hiji (anu dianggap ciri konci GraphQL), sarta Bréh, hiji API ieu sagemblengna timer documenting (anu HATEOAS diusahakeun ngahontal).

Polémik

RDF mangrupikeun cara pikeun nyebarkeun data dina wéb, janten panyimpenan RDF kedah dianggap salaku DBMS dokumén. Leres, saprak RDF mangrupikeun grafik sareng sanés tangkal, aranjeunna ogé tétéla dumasar kana grafik. Ieu endah nu eta digawé kaluar pisan. Saha anu nyangka bakal aya jalma pinter anu bakal nerapkeun titik kosong. Codd di dieu teu hasil.

Aya ogé cara anu kirang lengkep pikeun ngatur aksés ka data RDF, contona, Fragmen Data numbu (LDF) jeung Platform Data numbu (LDP).

bueuk

bueuk (Web Ontology Language) - formalisme pikeun ngagambarkeun pangaweruh, versi sintaksis logika déskripsi Wéb Semantik sareng Data Numbu. Koréksi sareng tambihan (Di mana-mana di handap langkung leres nyarios OWL 2, versi munggaran OWL dumasar kana Wéb Semantik sareng Data Numbu. Koréksi sareng tambihan).

Konsep logika deskriptif dina OWL pakait jeung kelas, kalungguhan pakait jeung sipat, individu nahan ngaran maranéhanana saméméhna. Aksioma disebut oge aksioma.

Contona, dina disebut Sintaksis Manchester pikeun notasi OWL hiji aksioma geus dipikawanoh ku urang Wéb Semantik sareng Data Numbu. Koréksi sareng tambihan bakal ditulis saperti kieu:

Class: Human
Class: Parent
   EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent

Aya sintaksis séjén pikeun nyerat OWL, sapertos sintaksis fungsional, dipaké dina spésifikasi resmi, jeung OWL/XML. Salaku tambahan, OWL tiasa séri kana sintaksis RDF abstrak sarta salajengna - dina salah sahiji sintaksis husus.

OWL gaduh hubungan ganda sareng RDF. Di hiji sisi, éta tiasa dianggap salaku jinis kamus anu ngalegaan RDFS. Di sisi anu sanés, éta mangrupikeun formalisme anu langkung kuat dimana RDF ngan ukur format serialisasi. Henteu sadayana konstruksi OWL dasar tiasa ditulis nganggo triplet RDF tunggal.

Gumantung kana sawaréh tina constructs OWL diwenangkeun dipaké, aranjeunna nyarios disebut propil OWL. Anu standar sareng paling kasohor nyaéta OWL EL, OWL RL sareng OWL QL. Pilihan profil mangaruhan pajeulitna komputasi masalah has. Hiji set lengkep OWL constructs pakait jeung Wéb Semantik sareng Data Numbu. Koréksi sareng tambihan, disebutna OWL DL. Kadang-kadang aranjeunna ogé ngobrol ngeunaan OWL Full, dimana konstruksi OWL diidinan dianggo kalayan kabébasan pinuh anu aya dina RDF, tanpa larangan semantik sareng komputasi. Wéb Semantik sareng Data Numbu. Koréksi sareng tambihan. Salaku conto, hiji hal tiasa janten kelas sareng harta. OWL Full teu tiasa diputuskeun.

Prinsip konci pikeun ngalampirkeun konsékuansi di OWL nyaéta nyoko kana asumsi dunya kabuka. O.W.A.) jeung panolakan tina anggapan ngaran unik (asumsi ngaran unik, Hiji). Di handap ieu urang bakal ningali dimana prinsip ieu tiasa ngakibatkeun sareng ngenalkeun sababaraha konstruksi OWL.

Hayu ontologi ngandung fragmen di handap ieu (dina sintaksis Manchester):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human
   Facts: hasChild Alice, hasChild Bob, hasChild Carol

Naha éta bakal nuturkeun naon anu parantos nyarios yén John gaduh seueur murangkalih? Nolak UNA bakal maksa mesin inferensi pikeun ngajawab patarosan ieu dina négatip, sabab Alice sareng Bob tiasa janten jalma anu sami. Pikeun lumangsungna ieu, anjeun kedah nambihan aksioma ieu:

DifferentIndividuals: Alice, Bob, Carol, John

Hayu ayeuna sempalan ontologi boga formulir di handap ieu (John dinyatakeun boga loba anak, tapi anjeunna ngan boga dua anak):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human, manyChildren
   Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John

Bakal ontologi ieu inconsistent (anu bisa diinterpretasi salaku bukti data teu valid)? Narima OWA bakal ngabalukarkeun mesin inferensi ngabales dina négatip: "tempat" sejenna (dina ontologi sejen) eta bisa ogé disebutkeun yen Carol oge anak Kang Iwan.

Pikeun ngaluarkeun kamungkinan ieu, hayu urang tambahkeun fakta anyar ngeunaan John:

Individual: John
   Facts: hasChild Alice, hasChild Bob, not hasChild Carol

Pikeun ngaluarkeun penampilan barudak sejen, hayu urang nyebutkeun yén sakabéh nilai tina harta "gaduh anak" - jalma, nu urang boga ngan opat:

ObjectProperty: hasChild
   Domain: Human
   Сharacteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }

Ayeuna ontologi bakal jadi kontradiktif, nu mesin inferensi moal gagal ngalaporkeun. Kalayan aksioma anu terakhir anu urang gaduh, dina rasa, "tutup" dunya, sareng perhatikeun kumaha kamungkinan John janten anakna nyalira.

Ngahubungkeun Data Perusahaan

The Linked Data set tina pendekatan jeung téhnologi asalna dimaksudkeun pikeun medarkeun data dina Wéb. Pamakéanna dina lingkungan perusahaan internal nyanghareupan sababaraha kasusah.

Contona, dina lingkungan perusahaan katutup, kakuatan deduktif OWL dumasar kana nyoko OWA jeung tampikan UNA, kaputusan alatan sipat kabuka sarta disebarkeun tina Wéb, teuing lemah. Sareng di dieu solusi di handap ieu mungkin.

  • Endowing OWL kalawan semantik, implying abandonment of OWA jeung nyoko UNA, palaksanaan mesin kaluaran pakait. - Sapanjang jalan ieu bade gudang Stardog RDF.
  • Ninggalkeun kamampuan deduktif OWL pikeun milih mesin aturan. - Stardog ngarojong SWRL; Nawaran Jena jeung GraphDB diaku basa aturan
  • Panolakan tina kamampuhan deduktif of OWL, pamakéan hiji atawa sawaréh séjén deukeut RDFS pikeun modeling. - Tempo langkung seueur ngeunaan ieu di handap.

Masalah sanésna nyaéta fokus anu langkung ageung pikeun dunya perusahaan dina masalah kualitas data sareng kurangna alat validasi data dina tumpukan Data Numbu. Kaluaran di dieu nyaéta kieu.

  • Sakali deui, dianggo pikeun validasi konstruksi OWL kalayan semantik dunya katutup sareng nami unik upami aya mesin inferensi anu pas.
  • pamakean SHACL, distandarisasi saatos daptar lapisan Kue Lapisan Web Semantik parantos dibenerkeun (najan kitu, éta ogé tiasa dianggo salaku mesin aturan), atanapi ShEx.
  • Ngartos yen sagalana geus pamustunganana dipigawé kalawan queries SPARQL, nyieun mékanisme validasi data basajan sorangan ngagunakeun aranjeunna.

Sanajan kitu, sanajan hiji tampikan lengkep kamampuhan deduktif sarta parabot validasi ninggalkeun numbu Data tumpukan kaluar kompetisi dina tugas anu sarupa dina bentang ka buka jeung web disebarkeun - dina tugas integrasi data.

Kumaha upami sistem inpormasi perusahaan biasa?

Ieu mungkin, tapi anjeun kudu, tangtosna, jadi sadar persis naon masalah anu kudu direngsekeun ku téknologi pakait. Kuring bakal ngajelaskeun dieu réaksi has pamilon ngembangkeun pikeun nembongkeun naon tumpukan téhnologi ieu Sigana mah ti sudut pandang IT konvensional. Ngingetkeun kuring saeutik tina pasemon ngeunaan gajah:

  • analis bisnis: RDF mangrupa hal kawas model logis disimpen langsung.
  • Analis Sistem: RDF téh kawas EAV, ngan ku kebat indéks jeung basa query merenah.
  • pamekar: sumur, ieu sadayana dina sumanget konsep modél euyeub tur kode low, éta maca nembe ngeunaan ieu.
  • Ménéjer proyék: enya sarua ambruk tumpukan!

Prakték nunjukkeun yén tumpukan paling sering dianggo dina tugas anu aya hubunganana sareng distribusi sareng heterogenitas data, contona, nalika ngawangun sistem kelas MDM (Manajemén Data Master) atanapi DWH (Gudang Data). Masalah sapertos kitu aya dina industri naon waé.

Dina hal aplikasi khusus industri, téknologi Data Patalina ayeuna paling populer di industri di handap ieu.

  • téknologi biomedis (dimana popularitasna sigana aya hubunganana sareng kompleksitas domain);

ayeuna

"Titik Didih" nembé ngayakeun konperénsi anu diayakeun ku asosiasi "Basis Pengetahuan Médis Nasional"Ngagabungkeun ontologies. Ti téori pikeun aplikasi praktis".

  • produksi sareng operasi produk kompléks (rékayasa mékanis ageung, produksi minyak sareng gas; paling sering urang nyarioskeun standar ISO 15926);

ayeuna

Di dieu, teuing, alesanana nyaéta pajeulitna wewengkon subjek, nalika, contona, dina tahap hulu, lamun urang ngobrol ngeunaan industri minyak jeung gas, akuntansi basajan merlukeun sababaraha fungsi CAD.

Dina 2008, lumangsung acara instalasi wawakil, diayakeun ku Chevron éta konperénsi.

ISO 15926, tungtungna, sigana rada beurat pikeun industri minyak sareng gas (sareng mendakan aplikasi anu langkung ageung dina rékayasa mékanis). Ngan Statoil (Equinor) anu ngait kana éta; di Norwégia, sadayana ékosistem. Batur nyoba ngalakukeun hal sorangan. Salaku conto, numutkeun rumor, Kamentrian Énergi domestik badé nyiptakeun "modél ontologis konseptual tina kompleks bahan bakar sareng énergi," mirip, katingalina, dijieun pikeun industri kakuatan listrik.

  • organisasi finansial (malah XBRL bisa dianggap jenis hibrid SDMX jeung RDF Data Cube ontologi);

ayeuna

Dina awal taun, LinkedIn aktip spammed panulis kalayan lowongan ti ampir kabéh raksasa industri finansial, saha anjeunna terang ti serial TV "Force Majeure": Goldman Sachs, JPMorgan Chase jeung / atawa Morgan Stanley, Wells Fargo, SWIFT/Visa/Mastercard, Bank of America, Citigroup, Fed, Deutsche Bank... Panginten sadayana milarian batur anu tiasa dikirim Konférénsi Grafik Pangaweruh. Sababaraha junun manggihan: organisasi finansial nyandak sagalana isuk poé kahiji.

Dina HeadHunter, ngan Sberbank anu mendakan anu pikaresepeun; éta ngeunaan "panyimpenan EAV kalayan modél data sapertos RDF."

Panginten, bédana darajat cinta pikeun téknologi anu saluyu sareng lembaga keuangan domestik sareng Kulon disababkeun ku sifat transnasional kagiatan anu terakhir. Tétéla, integrasi sakuliah wates nagara merlukeun qualitatively béda solusi organisasi jeung teknis.

  • sistem patarosan-jawaban sareng aplikasi komérsial (IBM Watson, Apple Siri, Google Knowledge Graph);

ayeuna

Ku jalan kitu, panyipta Siri, Thomas Gruber, mangrupikeun panulis definisi ontologi (dina rasa IT) salaku "spesifikasi konseptualisasi." Dina pamanggih kuring, nyusun ulang kecap dina harti ieu teu ngarobah harti na, nu meureun nunjukkeun yén teu aya.

  • publikasi data terstruktur (kalawan leresan gede ieu bisa attributed ka numbu Buka Data).

ayeuna

Fans badag tina Linked Data anu disebut GLAM: Galeri, Perpustakaan, Arsip, jeung Museum. Cukup disebutkeun yen Perpustakaan Kongrés ngamajukeun gaganti pikeun MARC21 BIBFRAMEyen nyadiakeun dasar pikeun masa depan pedaran bibliografi jeung, tangtu, dumasar kana RDF.

Wikidata sering dicutat sabagé conto proyék suksés dina widang Linked Open Data - sajenis versi Wikipedia anu bisa dibaca ku mesin, anu eusina, kontras jeung DBPedia, henteu dihasilkeun ku impor tina kotak info artikel, tapi mangrupa dijieun leuwih atawa kurang sacara manual (jeung saterusna jadi sumber informasi pikeun infoboxes sarua).

Kami ogé nyarankeun yén anjeun pariksa deui daptar pamaké gudang Stardog RDF dina ramatloka Stardog dina bagian "Palanggan".

Janten kitu, di Gartner Hype Cycle pikeun Emerging Technologies 2016 "Taksonomi Perusahaan sareng Manajemén Ontologi" ditempatkeun di tengah-tengah turunan kana lebak kuciwa kalayan prospek ngahontal "dataran produktivitas" henteu langkung awal ti 10 taun.

Nyambungkeun Data Perusahaan

Ramalan, ramalan, ramalan ...

Kusabab minat sajarah, kuring parantos ngatabulasi di handap ramalan Gartner pikeun sababaraha taun ngeunaan téknologi anu dipikaresep ku urang.

taun teknologi Laporan posisi Taun ka dataran
2001 Wéb Semantik munculna Panyiaran Inovasi pemicu 5-10
2006 Web Semantik Perusahaan munculna Panyiaran Puncak ekspektasi Inflated 5-10
2012 Wéb Semantik Data badag Puncak ekspektasi Inflated > 10
2015 Data numbu Advanced Analytics sarta Élmu Data Trough of Disillusionment 5-10
2016 Manajemén Ontology perusahaan munculna Panyiaran Trough of Disillusionment > 10
2018 Gambar Pangetahuan munculna Panyiaran Inovasi pemicu 5-10

Sanajan kitu, geus di "Siklus Hype ..." 2018 trend luhur sejen geus mucunghul - Knowledge Graphs. A reinkarnasi tangtu lumangsung: grafik DBMSs, nu perhatian pamaké sarta usaha pamekar tétéla switched, dina pangaruh requests urut jeung kabiasaan dimungkinkeun, mimiti nyandak kana contours na positioning. tina pesaing miheulaan maranéhanana.

Ampir unggal grafik DBMS ayeuna nyatakeun sorangan platform cocog pikeun ngawangun "grafik pangaweruh" perusahaan ("data numbu" kadang diganti ku "data disambungkeun"), tapi kumaha diyakinkeun klaim misalna?

Basis data grafik masih asemantis; data dina grafik DBMS masih silo data anu sami. String identifiers tinimbang URI ngajadikeun tugas ngahijikeun dua grafik DBMS masih mangrupa tugas integrasi, bari ngahijikeun dua toko RDF mindeng turun ka saukur merging dua grafik RDF. Aspék séjén tina asemantisitas nyaéta non-reflexivity tina model grafik elpiji, nu ngajadikeun hésé pikeun ngatur metadata ngagunakeun platform sarua.

Tungtungna, DBMS grafik teu boga mesin inferensi atawa mesin aturan. Hasil mesin misalna bisa dihasilkeun ku complicating queries, tapi ieu mungkin malah dina SQL.

Tapi, sistem panyimpen RDF ngarah teu aya kasusah pikeun ngadukung modél LPG. Pendekatan anu paling padet dianggap anu diusulkeun sakaligus dina Blazegraph: modél RDF*, ngagabungkeun RDF sareng LPG.

deui

Anjeun tiasa maca langkung seueur ngeunaan dukungan neundeun RDF pikeun modél LPG dina tulisan sateuacana ngeunaan Habré: "Naon anu lumangsung dina panyimpenan RDF ayeuna". Abdi ngarepkeun hiji dinten tulisan anu misah bakal ditulis ngeunaan Grafik Pangaweruh sareng Data Fabric. Bagian ahir, sakumaha gampang kahartos, ditulis buru-buru, sanaos genep bulan saatosna, sadayana henteu langkung jelas sareng konsép ieu.

pustaka

  1. Halpin, H., Monnin, A. (eds.) (2014). Téknik Filsafat: Nuju hiji Filsafat Wéb
  2. Allemang, D., Hendler, J. (2011) Semantic Web for the Working Ontologist (2nd ed.)
  3. Staab, S., Studer, R. (eds.) (2009) Buku Panduan on Ontologies (2nd ed.)
  4. Kai, D. (ed.). (2011) Linking Data Perusahaan
  5. Keet, M. (2018) Hiji Perkenalan kana Téknik Ontologi

sumber: www.habr.com

Tambahkeun komentar