Web Semantik lan Data sing Disambung. Koreksi lan tambahan

Aku arep menehi menyang umum fragmen saka buku sing bubar diterbitake iki:

Pemodelan ontologis perusahaan: metode lan teknologi [Teks]: monograf / [S. V. Gorshkov, S. S. Kralin, O. I. Mushtak lan liya-liyane; editor eksekutif S.V. Gorshkov]. - Ekaterinburg: Ural University Publishing House, 2019. - 234 p.: gerah., Tabel; 20 cm - Pengarang. dituduhake ing tit mburi. karo. - Bibliografi ing pungkasan ch. — ISBN 978-5-7996-2580-1: 200 eksemplar.

Tujuan ngirim fragmen iki ing Habré ana papat:

  • Iku ora kamungkinan sing sapa bakal bisa nyekel buku iki ing tangane yen ora klien saka ajeni SergeIndex; Iku mesthi ora didol.
  • Koreksi wis digawe kanggo teks (ora disorot ing ngisor iki) lan tambahan wis digawe sing ora cocog banget karo format monograph dicithak: cathetan topikal (ing spoiler) lan hyperlinks.
  • Aku pengin ngumpulake pitakonan lan komentar, supaya digatekake nalika nyakup teks iki ing wangun sing wis direvisi ing publikasi liyane.
  • Akeh penganut Semantic Web lan Linked Data sing isih percaya yen bunderan kasebut sempit, utamane amarga masyarakat umum durung dijlentrehake kanthi bener kepiye carane dadi penganut Semantic Web lan Linked Data. Penulis fragmen, sanajan dheweke kalebu ing bunder iki, ora duwe pendapat iki, nanging, nanging, dheweke nganggep awake dhewe kudu nyoba liyane.

Supaya

Web Semantik

Évolusi Internet bisa diwakili kaya ing ngisor iki (utawa ngomong babagan segmen sing dibentuk miturut urutan sing dituduhake ing ngisor iki):

  1. Dokumen ing Internet. Teknologi utama - Gopher, FTP, lsp.
    Internet minangka jaringan global kanggo ijol-ijolan sumber daya lokal.
  2. dokumen Internet. Teknologi utama yaiku HTML lan HTTP.
    Sifat sumber daya sing kapapar nganggep karakteristik media transmisi kasebut.
  3. data internet. Teknologi utama - REST lan SOAP API, XHR, lsp.
    Jaman aplikasi Internet, ora mung wong dadi konsumen sumber daya.
  4. data internet. Teknologi utama yaiku teknologi Linked Data.
    Tahap kaping papat iki, diprediksi dening Berners-Lee, panyipta teknologi inti kapindho lan direktur W3C, diarani Web Semantik; Teknologi Data Link dirancang kanggo nggawe data ing web ora mung bisa diwaca mesin, nanging uga "bisa dingerteni mesin."

Saka ing ngisor iki, sing maca bakal ngerti korespondensi antarane konsep kunci ing tahap kapindho lan kaping papat:

  • URL padha karo URI,
  • analog saka HTML yaiku RDF,
  • Hyperlink HTML padha karo kedadeyan URI ing dokumen RDF.

Web Semantik luwih minangka visi sistemik babagan masa depan Internet tinimbang tren spontan utawa lobi tartamtu, sanajan bisa uga dianggep. Contone, karakteristik penting saka apa sing diarani Web 2.0 dianggep minangka "konten sing digawe pangguna." Utamane, rekomendasi W3C dijaluk kanggo nggatekake "Ontologi Anotasi Web"lan prasetya kayata Solid.

Apa Web Semantik Mati?

Yen sampeyan nolak pangarepan unrealistic, kahanan karo web semantik kira-kira padha karo komunisme ing jaman sosialisme sing dikembangake (lan apa kasetyan marang panjaluk kondisional Ilyich diamati, supaya saben wong mutusake dhewe). Mesin telusur cukup sukses meksa situs web nggunakake RDFa lan JSON-LD lan awake dhewe nggunakake teknologi sing ana gandhengane karo sing diterangake ing ngisor iki (Grafik Pengetahuan Google, Grafik Pengetahuan Bing).

Ing istilah umum, penulis ora bisa ngomong apa sing nyegah panyebaran luwih gedhe, nanging bisa ngomong adhedhasar pengalaman pribadi. Ana masalah sing bisa ditanggulangi "metu saka kothak" ing kahanan SW nyerang, sanajan padha ora banget nyebar. Akibaté, wong-wong sing ngadhepi tugas-tugas kasebut ora duwe cara meksa marang wong-wong sing bisa menehi solusi, dene panyedhiya solusi independen saka solusi kasebut bertentangan karo model bisnis. Dadi, kita terus ngurai HTML lan nglebokake macem-macem API, siji liyane shittier.

Nanging, teknologi Linked Data wis nyebar ngluwihi Web mainstream; Buku kasebut, nyatane, darmabakti kanggo aplikasi kasebut. Saiki, komunitas Linked Data ngarepake teknologi kasebut dadi luwih nyebar amarga rekaman Gartner (utawa proklamasi, kaya sing dikarepake) tren kayata Gambar Kawruh и Kain Data. Aku kaya pracaya yen ora bakal dadi "sepeda" implementasine saka konsep iki bakal sukses, nanging sing ana hubungane karo standar W3C rembugan ing ngisor iki.

Data sing digandhengake

Berners-Lee nemtokake Linked Data minangka web semantik "dirampungake kanthi bener": sakumpulan pendekatan lan teknologi sing ngidini kanggo nggayuh tujuan utama. Prinsip dhasar Linked Data Berners-Lee disorot ing ngisor iki.

Prinsip 1. Nggunakake URI kanggo jeneng entitas.

URI minangka pengenal entitas global tinimbang pengenal string lokal kanggo entri. Salajengipun, prinsip iki paling apik ditulis ing slogan Google Knowledge Graph "barang, ora strings".

Prinsip 2. Nggunakake URI ing skema HTTP supaya bisa de-referensi.

Kanthi ngrujuk menyang URI, mesthine bisa diwenehi tandha ing mburi penanda kasebut (analogi karo jeneng operator "jelas ing kene).*"ing C); luwih tepat, kanggo njaluk sawetara perwakilan iki signified - gumantung ing Nilai saka header HTTP Accept:. Mbok menawa, kanthi tekane jaman AR / VR, bisa entuk sumber daya kasebut dhewe, nanging saiki, paling kamungkinan, bakal dadi dokumen RDF, sing minangka asil nglakokake pitakon SPARQL. DESCRIBE.

Prinsip 3. Panggunaan standar W3C - utamané RDF(S) lan SPARQL - utamané nalika dereferencing URI.

Iki "lapisan" individu saka tumpukan teknologi Data Link, uga dikenal minangka Kue Lapisan Web Semantik, bakal diterangake ing ngisor iki.

Prinsip 4. Panganggone referensi kanggo URI liyane nalika njlentrehake entitas.

RDF ngijini sampeyan kanggo matesi dhewe kanggo gambaran lisan saka sumber ing basa alam, lan asas papat nelpon ora kanggo nindakake iki. Yen prinsip pisanan diamati sacara universal, bisa uga nalika njlentrehake sumber daya kanggo ngrujuk marang wong liya, kalebu sing "manca", mula data kasebut diarani disambung. Nyatane, meh ora bisa dihindari nggunakake URI sing dijenengi ing kosakata RDFS.

RDF

RDF (Resource Description Framework) minangka formalisme kanggo njlentrehake entitas sing saling gegandhengan.

Pranyatan jinis "subjek-predikat-obyek", disebut triplets, digawe babagan entitas lan hubungane. Ing kasus sing paling gampang, subyek, predikat, lan obyek kabeh URI. URI sing padha bisa ana ing posisi sing beda ing triplet sing beda: dadi subyek, predikat, lan obyek; Dadi, triplet mbentuk jinis grafik sing diarani grafik RDF.

Subjek lan obyek bisa uga ora mung URI, nanging uga disebut node kosong, lan obyek uga bisa harfiah. Literal minangka conto jinis primitif sing dumadi saka representasi string lan indikasi jinis.

Conto nulis literal (ing sintaksis Turtle, luwih akeh babagan ing ngisor iki): "5.0"^^xsd:float и "five"^^xsd:string. Literal kanthi jinis rdf:langString bisa uga dilengkapi tag basa; ing Turtle ditulis kaya mangkene: "five"@en и "пять"@ru.

Node kosong minangka sumber daya "anonim" tanpa pengenal global, babagan pernyataan sing bisa ditindakake; jinis variabel eksistensial.

Dadi (iki, nyatane, kabeh titik RDF):

  • subyek yaiku URI utawa simpul kosong,
  • predikat yaiku URI,
  • obyek iku URI, simpul kosong, utawa literal.

Napa predikat ora bisa dadi simpul kosong?

Alesan sing bisa ditindakake yaiku kepinginan kanggo ngerti lan nerjemahake triplet menyang basa logika predikat urutan pertama. s p o kaya soko Web Semantik lan Data sing Disambung. Koreksi lan tambahanngendi Web Semantik lan Data sing Disambung. Koreksi lan tambahan - predikat, Web Semantik lan Data sing Disambung. Koreksi lan tambahan и Web Semantik lan Data sing Disambung. Koreksi lan tambahan - konstanta. Jejak pemahaman iki ana ing dokumen "LBase: Semantik kanggo Basa saka Web Semantik", sing nduweni status cathetan klompok kerja W3C. Kanthi pangerten iki, triplet s p []ngendi [] - simpul kosong, bakal dijarwakake minangka Web Semantik lan Data sing Disambung. Koreksi lan tambahanngendi Web Semantik lan Data sing Disambung. Koreksi lan tambahan - variabel, nanging carane banjur nerjemahake s [] o? Dokumen kanthi status Rekomendasi W3C "RDF 1.1 Semantik” nawakake cara terjemahan liyane, nanging isih ora nganggep kemungkinan predikat minangka simpul kosong.

Nanging, Manu Sporni diijini.

RDF minangka model abstrak. RDF bisa ditulis (serialized) ing macem-macem sintaksis: RDF/XML, Turtle (paling bisa diwaca manungsa), JSON-LD, HDT (biner).

RDF padha bisa serialized menyang RDF / XML ing macem-macem cara, dadi, contone, iku ndadekake pangertèn kanggo validasi XML asil nggunakake XSD utawa nyoba kanggo extract data nggunakake XPath. Mangkono uga, JSON-LD ora bisa nyukupi kepinginan pangembang Javascript rata-rata kanggo nggarap RDF nggunakake notasi titik lan kuadrat Javascript (sanajan JSON-LD pindhah menyang arah kasebut kanthi menehi mekanisme framing).

Umume sintaksis nawakake cara kanggo nyepetake URI sing dawa. Contone, iklan @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> ing Turtle bakal ngidini sampeyan nulis tinimbang <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> mung rdf:type.

RDFS

RDFS (RDF Schema) - kosakata pemodelan dhasar, ngenalake konsep properti lan kelas lan properti kayata rdf:type, rdfs:subClassOf, rdfs:domain и rdfs:range. Nggunakake kamus RDFS, contone, ekspresi sing bener ing ngisor iki bisa ditulis:

rdf:type         rdf:type         rdf:Property .
rdf:Property     rdf:type         rdfs:Class .
rdfs:Class       rdfs:subClassOf  rdfs:Resource .
rdfs:subClassOf  rdfs:domain      rdfs:Class .
rdfs:domain      rdfs:domain      rdf:Property .
rdfs:domain      rdfs:range       rdfs:Class .
rdfs:label       rdfs:range       rdfs:Literal .

RDFS minangka deskripsi lan modeling kosakata, nanging dudu basa kendala (sanajan spesifikasi resmi lan godhong kemungkinan panggunaan kasebut). Tembung "Skema" ora kudu dimangerteni ing pangertèn sing padha karo ekspresi "Skema XML". Tuladhane, :author rdfs:range foaf:Person tegese rdf:type kabeh nilai properti :author - foaf:Person, nanging ora ateges sing iki kudu ngandika ing advance.

SPARQL

SPARQL (SPARQL Protocol and RDF Query Language) - basa kanggo nliti data RDF. Ing kasus sing prasaja, pitakon SPARQL minangka sakumpulan conto sing cocog karo triplet grafik sing ditakoni. Pola bisa ngemot variabel ing subyek, predikat, lan posisi obyek.

Pitakonan bakal ngasilake nilai variabel sing, nalika diganti dadi conto, bisa nyebabake subgraf saka grafik RDF sing ditakoni (subset saka triplet). Variabel kanthi jeneng sing padha ing conto triplet sing beda kudu nduweni nilai sing padha.

Contone, diwenehi set ndhuwur pitu aksioma RDFS, pitakonan ing ngisor iki bakal bali rdfs:domain и rdfs:range minangka nilai ?s и ?p mungguh:

SELECT * WHERE {
 ?s ?p rdfs:Class .
 ?p ?p rdf:Property .
}

Wigati dicathet yen SPARQL minangka deklaratif lan dudu basa kanggo njlentrehake traversal grafik (Nanging, sawetara repositori RDF nawakake cara kanggo nyetel rencana eksekusi query). Mulane, sawetara masalah grafik standar, contone, nemokake dalan paling cendhak, ora bisa ditanggulangi ing SPARQL, kalebu nggunakake dalan properti (nanging, maneh, repositori RDF individu nawakake ekstensi khusus kanggo ngatasi masalah kasebut).

SPARQL ora nuduhake anggepan keterbukaan ing jagad iki lan ngetutake pendekatan "negasi minangka kegagalan", sing bisa desain kayata FILTER NOT EXISTS {…}. Distribusi data dianggep nggunakake mekanisme pitakon federasi.

Titik akses SPARQL - panyimpenan RDF sing bisa ngolah pitakon SPARQL - ora ana analog langsung saka tahap kapindho (ndeleng wiwitan paragraf iki). Bisa diumpamakake kaya database, adhedhasar isi kaca HTML sing digawe, nanging bisa diakses saka njaba. Titik akses SPARQL luwih mirip karo titik akses API saka tahap katelu, nanging kanthi rong prabédan utama. Kaping pisanan, bisa digabungake sawetara pitakon "atom" dadi siji (sing dianggep minangka ciri utama GraphQL), lan nomer loro, API kasebut wis rampung dokumentasi dhewe (sing diupayakake HATEOAS).

Komentar polemik

RDF minangka cara kanggo nerbitake data ing web, mula panyimpenan RDF kudu dianggep minangka DBMS dokumen. Bener, amarga RDF minangka grafik lan dudu wit, mula uga adhedhasar grafik. Iku apik tenan sing bisa metu ing kabeh. Sapa sing ngira bakal ana wong pinter sing bakal ngetrapake simpul kosong. Codd kene ora bisa metu.

Ana uga cara sing kurang lengkap kanggo ngatur akses menyang data RDF, contone, Fragmen Data sing Disambung (LDF) lan Platform Data sing Disambung (LDP).

OWL

OWL (Basa Ontologi Web) - formalisme kanggo makili kawruh, versi sintaksis saka logika deskripsi Web Semantik lan Data sing Disambung. Koreksi lan tambahan (ing endi wae ing ngisor iki luwih bener kanggo ngomong OWL 2, versi pisanan OWL adhedhasar Web Semantik lan Data sing Disambung. Koreksi lan tambahan).

Konsep logika deskriptif ing OWL cocog karo kelas, peran cocog karo properti, individu tetep jeneng sadurunge. Aksioma uga disebut aksioma.

Contone, ing supaya disebut- Sintaksis Manchester kanggo notasi OWL aksioma wis dikenal kanggo kita Web Semantik lan Data sing Disambung. Koreksi lan tambahan bakal ditulis kaya mangkene:

Class: Human
Class: Parent
   EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent

Ana sintaksis liyane kanggo nulis OWL, kayata sintaksis fungsional, digunakake ing specification resmi, lan OWL/XML. Kajaba iku, OWL bisa serialized kanggo abstrak sintaks RDF lan luwih - ing sembarang sintaksis tartamtu.

OWL duwe hubungan dual karo RDF. Ing tangan siji, bisa dianggep minangka jinis kamus sing ngluwihi RDFS. Ing sisih liya, iki minangka formalisme sing luwih kuat sing RDF mung minangka format serialisasi. Ora kabeh konstruksi OWL dhasar bisa ditulis nganggo triplet RDF siji.

Gumantung ing subset saka konstruksi OWL sing diijini digunakake, padha ngomong babagan sing diarani profil OWL. Sing standar lan paling misuwur yaiku OWL EL, OWL RL lan OWL QL. Pilihan saka profil mengaruhi kerumitan komputasi masalah khas. A pesawat lengkap OWL mbangun cocog kanggo Web Semantik lan Data sing Disambung. Koreksi lan tambahan, diarani OWL DL. Kadhangkala dheweke uga ngomong babagan OWL Full, ing ngendi konstruksi OWL diidini digunakake kanthi kebebasan lengkap sing ana ing RDF, tanpa watesan semantik lan komputasi. Web Semantik lan Data sing Disambung. Koreksi lan tambahan. Contone, soko bisa dadi kelas lan properti. OWL Full ora bisa ditemtokake.

Prinsip utama kanggo ngetrapake konsekuensi ing OWL yaiku adopsi asumsi jagad terbuka. O.W.A.) lan nolak anggepan jeneng unik (asumsi jeneng unik, ONE). Ing ngisor iki kita bakal weruh ing ngendi prinsip kasebut bisa mimpin lan ngenalake sawetara konstruksi OWL.

Ayo ontologi ngemot fragmen ing ngisor iki (ing sintaksis Manchester):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human
   Facts: hasChild Alice, hasChild Bob, hasChild Carol

Apa bakal diterusake saka apa sing dikandhakake yen John duwe anak akeh? Nolak UNA bakal meksa mesin inferensi kanggo njawab pitakonan iki kanthi negatif, amarga Alice lan Bob bisa uga dadi wong sing padha. Kanggo kedadeyan ing ngisor iki, sampeyan kudu nambah aksioma ing ngisor iki:

DifferentIndividuals: Alice, Bob, Carol, John

Ayo saiki fragmen ontologi duwe wujud ing ngisor iki (John diumumake duwe anak akeh, nanging mung duwe anak loro):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human, manyChildren
   Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John

Apa ontologi iki ora konsisten (sing bisa diinterpretasikake minangka bukti data sing ora bener)? Nampa OWA bakal nyebabake mesin inferensi nanggapi kanthi negatif: "ing endi wae" liya (ing ontologi liyane) bisa uga diarani yen Carol uga anak John.

Kanggo ngilangi kemungkinan iki, ayo nambah fakta anyar babagan John:

Individual: John
   Facts: hasChild Alice, hasChild Bob, not hasChild Carol

Kanggo ngilangi penampilan bocah liyane, ayo ngomong yen kabeh nilai saka properti "duwe anak" yaiku wong, sing mung ana papat:

ObjectProperty: hasChild
   Domain: Human
   Сharacteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }

Saiki ontologi bakal dadi kontradiktif, sing mesin inferensi ora bakal gagal dilaporake. Kanthi pungkasan saka aksioma sing kita duwe, ing pangertèn, "nutup" donya, lan sok dong mirsani carane kamungkinan John dadi anak dhewe tilar.

Nyambungake Data Perusahaan

Seted Data Linked pendekatan lan teknologi asline dimaksudake kanggo nerbitake data ing Web. Panggunaan ing lingkungan perusahaan internal ngadhepi sawetara kesulitan.

Contone, ing lingkungan perusahaan tertutup, kekuwatan deduktif OWL adhedhasar adopsi OWA lan penolakan UNA, keputusan amarga sifat Web sing mbukak lan disebarake, banget banget. Lan ing kene solusi ing ngisor iki bisa ditindakake.

  • Endowing OWL karo semantik, implying nilar OWA lan Adoption saka UNA, implementasine saka mesin output sing cocog. - Ing dalan iki wis arep panyimpenan Stardog RDF.
  • Ninggalake kemampuan deduktif OWL kanggo milih mesin aturan. - Stardog ndhukung SWRL; Jena lan GraphDB nawakake duwe basa aturan
  • Nolak kemampuan deduktif OWL, nggunakake siji utawa subset liyane sing cedhak karo RDFS kanggo modeling. - Waca liyane babagan iki ing ngisor iki.

Masalah liyane yaiku penekanan sing luwih gedhe sing bisa ditindakake ing masalah kualitas data ing jagad perusahaan lan kekurangan alat validasi data ing tumpukan Data Link. Output ing kene kaya ing ngisor iki.

  • Maneh, gunakake kanggo validasi konstruksi OWL kanthi semantik donya tertutup lan jeneng unik yen mesin inferensi sing cocog kasedhiya.
  • Gunakake SHACL, standar sawise dhaptar Semantic Web Layer Cake lapisan wis didandani (Nanging, bisa uga digunakake minangka mesin aturan), utawa ShEx.
  • Ngerteni manawa kabeh wis rampung karo pitakon SPARQL, nggawe mekanisme validasi data sing gampang digunakake.

Nanging, sanajan penolakan lengkap saka kemampuan deduktif lan alat validasi ninggalake tumpukan Data Link metu saka kompetisi ing tugas sing padha ing lanskap menyang web sing mbukak lan disebarake - ing tugas integrasi data.

Kepiye babagan sistem informasi perusahaan biasa?

Iki bisa uga, nanging sampeyan kudu ngerti persis apa masalah sing bakal ditindakake dening teknologi sing cocog. Aku bakal njlèntrèhaké kene reaksi khas peserta pembangunan kanggo nuduhake apa tumpukan teknologi iki katon saka sudut pandang IT conventional. Aku ngelingake sethithik babagan pasemon gajah:

  • Analyst bisnis: RDF kaya model logis disimpen langsung.
  • Analis Sistem: RDF kaya EAV, mung kanthi akeh indeks lan basa pitakon sing trep.
  • Pangembang: uga, iki kabeh ing semangat konsep model sugih lan kode kurang, lagi maca bubar babagan iki.
  • Manajer Proyek: ya padha wae ambruk tumpukan!

Praktek nuduhake yen tumpukan paling asring digunakake ing tugas sing ana gandhengane karo distribusi lan heterogenitas data, contone, nalika mbangun sistem kelas MDM (Master Data Management) utawa DWH (Data Warehouse). Masalah kasebut ana ing industri apa wae.

Ing babagan aplikasi khusus industri, teknologi Linked Data saiki paling populer ing industri ing ngisor iki.

  • teknologi biomedis (ing endi popularitas katon ana hubungane karo kerumitan domain);

saiki

"Titik Didih" bubar dadi tuan rumah konferensi sing diatur dening asosiasi "Basis Pengetahuan Medis Nasional"Nggabungake ontologi. Saka teori kanggo aplikasi praktis".

  • produksi lan operasi produk kompleks (teknik mesin gedhe, produksi minyak lan gas; paling asring kita ngomong babagan standar ISO 15926);

saiki

Ing kene uga, alasane yaiku kerumitan area subyek, nalika, contone, ing tahap hulu, yen kita ngomong babagan industri minyak lan gas, akuntansi prasaja mbutuhake sawetara fungsi CAD.

Ing 2008, ana acara instalasi wakil, diatur dening Chevron konperensi kasebut.

ISO 15926, ing pungkasan, katon rada abot kanggo industri minyak lan gas (lan nemokake aplikasi sing luwih gedhe ing teknik mesin). Mung Statoil (Equinor) dadi kecanthol kanthi lengkap; ing Norwegia, kabeh ekosistem. Liyane nyoba kanggo nindakake dhewe. Contone, miturut desas-desus, Kamentrian Energi domestik arep nggawe "model ontologis konseptual saka bahan bakar lan kompleks energi," sing padha, ketoke, kanggo digawe kanggo industri tenaga listrik.

  • organisasi finansial (malah XBRL bisa dianggep minangka jenis hibrida SDMX lan ontologi RDF Data Cube);

saiki

Ing awal taun, LinkedIn aktif spammed penulis karo lowongan saka meh kabeh raksasa industri financial, kang ngerti saka seri TV "Force Majeure": Goldman Sachs, JPMorgan Chase lan / utawa Morgan Stanley, Wells Fargo, SWIFT/Visa/Mastercard, Bank of America, Citigroup, Fed, Deutsche Bank... Mbokmenawa kabeh wong nggoleki wong sing bisa dikirim Konferensi Grafik Kawruh. Cukup sawetara sing bisa ditemokake: organisasi finansial njupuk kabeh esuk dina pisanan.

Ing HeadHunter, mung Sberbank sing nemokake sing menarik; yaiku babagan "panyimpenan EAV kanthi model data kaya RDF."

Mbokmenawa, bedane tingkat katresnan kanggo teknologi sing cocog karo institusi keuangan domestik lan Barat amarga sifat transnasional saka aktivitas sing terakhir. Ketoke, integrasi ing wates negara mbutuhake solusi organisasi lan teknis sing beda-beda sacara kualitatif.

  • sistem pitakonan-jawaban kanthi aplikasi komersial (IBM Watson, Apple Siri, Google Knowledge Graph);

saiki

Miturut cara, pencipta Siri, Thomas Gruber, minangka penulis definisi ontologi (ing pangertèn IT) minangka "spesifikasi konseptualisasi." Miturut pamanggih kula, tembung-tembung ing andharan menika boten ngewahi tegesipun, mbokmanawi nedahaken bilih boten wonten.

  • publikasi data terstruktur (karo sabdhoning luwih iki bisa lantaran kanggo Linked Open Data).

saiki

Penggemar gedhe saka Linked Data yaiku sing diarani GLAM: Galeri, Perpustakaan, Arsip, lan Museum. Cukup kanggo ngomong sing Library of Congress mromosiaken panggantos kanggo MARC21 BIBFRAME, sing nyedhiyakake dhasar kanggo masa depan deskripsi bibliografi lan, mesthi, adhedhasar RDF.

Wikidata asring dikutip minangka conto proyek sukses ing bidang Linked Open Data - jinis versi Wikipedia sing bisa diwaca mesin, sing isine, beda karo DBPedia, ora digawe kanthi ngimpor saka kothak info artikel, nanging digawe luwih utawa kurang kanthi manual (lan banjur dadi sumber informasi kanggo infoboxes padha).

Disaranake uga mriksa metu dhaftar pangguna panyimpenan Stardog RDF ing situs web Stardog ing bagean "Pelanggan".

Dadi, ing Gartner Hype Cycle for Emerging Technologies 2016 "Taksonomi Perusahaan lan Manajemen Ontologi" diselehake ing tengah-tengah mudhun menyang lembah kuciwane kanthi prospek tekan "tataran produktivitas" ora luwih awal tinimbang 10 taun.

Nyambungake Data Perusahaan

Prakiraan, ramalan, ramalan ...

Saka kapentingan sajarah, aku wis tabulated ngisor ramalan Gartner kanggo macem-macem taun ing teknologi sing kapentingan kita.

Taun teknologi Laporan Posisi Taun menyang dataran tinggi
2001 Web Semantik Berkembang Teknologi Pemicu Inovasi 5-10
2006 Web Semantik Perusahaan Berkembang Teknologi Puncak Pangarep-arep Ngembang 5-10
2012 Web Semantik Big Data Puncak Pangarep-arep Ngembang > 10
2015 Data sing digandhengake Analitis Lanjut lan Ilmu Data Lelungan saka Dislusi 5-10
2016 Manajemen Ontologi Perusahaan Berkembang Teknologi Lelungan saka Dislusi > 10
2018 Gambar Kawruh Berkembang Teknologi Pemicu Inovasi 5-10

Nanging, wis ing "Siklus Hype ..." 2018 gaya munggah liyane wis muncul - Kawruh Graphs. Reinkarnasi tartamtu dumadi: grafik DBMS, sing narik kawigaten para pangguna lan upaya pangembang, miturut pengaruh panjaluk mantan lan kabiasaan sing terakhir, wiwit njupuk kontur lan posisi. saka saingan sadurungé.

Meh saben grafik DBMS saiki nyatakake dhewe minangka platform sing cocok kanggo mbangun "grafik pengetahuan" perusahaan ("data sing disambungake" kadhangkala diganti karo "data sing disambungake"), nanging kepiye klaim kasebut bisa dibenerake?

Basis data grafik isih asemantik; data ing DBMS grafik isih silo data sing padha. Pengenal string tinimbang URI nggawe tugas nggabungake rong DBMS grafik isih dadi tugas integrasi, nalika nggabungake rong toko RDF asring mung nggabungake rong grafik RDF. Aspek liyane saka asemantisitas yaiku non-refleksivitas model grafik LPG, sing ndadekake angel ngatur metadata nggunakake platform sing padha.

Pungkasan, DBMS grafik ora duwe mesin inferensi utawa mesin aturan. Asil saka mesin kuwi bisa maleh dening complicating pitakonan, nanging iki bisa malah ing SQL.

Nanging, sistem panyimpenan RDF sing unggul ora ana kangelan ndhukung model LPG. Pendekatan sing paling padhet yaiku sing diusulake bebarengan ing Blazegraph: model RDF*, nggabungake RDF lan LPG.

Waca liyane

Sampeyan bisa maca liyane babagan dhukungan panyimpenan RDF kanggo model LPG ing artikel sadurunge babagan Habré: "Apa sing kedadeyan karo panyimpenan RDF saiki". Muga-muga ing sawijining dina ana artikel sing kapisah bakal ditulis babagan Grafik Pengetahuan lan Kain Data. Bagian pungkasan, kaya sing gampang dingerteni, ditulis kanthi cepet, nanging sanajan nem wulan mengko, kabeh konsep kasebut ora luwih jelas.

Sastra

  1. Halpin, H., Monnin, A. (eds.) (2014). Teknik Filsafat: Menuju Filsafat Web
  2. Allemang, D., Hendler, J. (2011) Semantic Web for the Working Ontologist (2nd ed.)
  3. Staab, S., Studer, R. (eds.) (2009) Handbook ontologies (2nd ed.)
  4. Kayu, D. (ed.). (2011) Nyambung Data Perusahaan
  5. Keet, M. (2018) An Introduction to Ontology Engineering

Source: www.habr.com

Add a comment