Semantik Veb və Əlaqəli Məlumat. Düzəlişlər və əlavələr

Bu yaxınlarda çap olunmuş kitabdan bir fraqmenti ictimaiyyətə təqdim etmək istəyirəm:

Müəssisənin ontoloji modelləşdirilməsi: metodlar və texnologiyalar [Mətn]: monoqrafiya / [S. V. Qorşkov, S. S. Kralin, O. İ. Muştak və başqaları; məsul redaktor S.V. Qorşkov]. - Ekaterinburq: Ural Universitetinin nəşriyyatı, 2019. - 234 s.: ill., cədvəl; 20 sm.- Müəllif. arxa başlıqda göstərilmişdir. ilə. - Biblioqrafiya ch sonunda. — ISBN 978-5-7996-2580-1: 200 nüsxə.

Bu fraqmentin Habré-də yerləşdirilməsinin məqsədi dörddür:

  • Hörmətli birinin müştərisi olmasa, çətin ki, kimsə bu kitabı əlində tuta bilsin SergeIndex; Mütləq satışda deyil.
  • Mətndə düzəlişlər edilib (onlar aşağıda qeyd olunmayıb) və çap olunmuş monoqrafiyanın formatına o qədər də uyğun gəlməyən əlavələr edilib: aktual qeydlər (spoilerlər altında) və hiperlinklər.
  • İsteyirem suallar və şərhlər toplayın, bu mətni hər hansı digər nəşrlərə yenidən işlənmiş formada daxil edərkən onları nəzərə almaq üçün.
  • Bir çox Semantik Veb və Əlaqəli Məlumat tərəfdarları hələ də onların dairələrinin bu qədər dar olduğuna inanırlar, əsasən də geniş ictimaiyyət Semantik Veb və Əlaqəli Məlumatın tərəfdarı olmağın nə qədər böyük olduğunu hələ düzgün izah etmədiyinə görə. Fraqmentin müəllifi bu çevrəyə mənsub olsa da, bu fikirdə deyil, lakin buna baxmayaraq, özünü növbəti cəhdə borclu hesab edir.

Belə ki,

Semantik Veb

İnternetin təkamülünü aşağıdakı kimi təqdim etmək olar (yaxud onun aşağıda göstərilən ardıcıllıqla formalaşmış seqmentləri haqqında danışaq):

  1. İnternetdə sənədlər. Əsas texnologiyalar - Gopher, FTP və s.
    İnternet yerli resursların mübadiləsi üçün qlobal şəbəkədir.
  2. İnternet sənədləri. Əsas texnologiyalar HTML və HTTP-dir.
    Açıqlanan resursların xarakteri onların ötürücü mühitinin xüsusiyyətlərini nəzərə alır.
  3. İnternet məlumatları. Əsas texnologiyalar - REST və SOAP API, XHR və s.
    İnternet tətbiqləri dövrü, təkcə insanlar resursların istehlakçısına çevrilmir.
  4. İnternet məlumatları. Əsas texnologiyalar Linked Data texnologiyalarıdır.
    İkinci əsas texnologiyaların yaradıcısı və W3C-nin direktoru Berners-Li tərəfindən proqnozlaşdırılan bu dördüncü mərhələ Semantik Veb adlanır; Əlaqəli Məlumat texnologiyaları internetdəki məlumatları təkcə maşın tərəfindən oxuna bilən deyil, həm də “maşın tərəfindən başa düşülən” etmək üçün nəzərdə tutulmuşdur.

Bundan sonra oxucu ikinci və dördüncü mərhələlərin əsas anlayışları arasındakı uyğunluğu başa düşəcək:

  • URL-lər URI-lərə bənzəyir,
  • HTML-nin analoqu RDF,
  • HTML hiperlinkləri RDF sənədlərindəki URI hadisələrinə bənzəyir.

Semantik İnternet spesifik kortəbii və ya lobbiləşdirilmiş tendensiyadan daha çox İnternetin gələcəyinə dair sistemli bir baxışdır, baxmayaraq ki, bu sonuncuları nəzərə ala bilər. Məsələn, Web 2.0 adlanan şeyin mühüm xüsusiyyəti “istifadəçi tərəfindən yaradılan məzmun” hesab olunur. Xüsusilə, W3C tövsiyəsi bunu nəzərə almağa çağırılır "Veb Annotasiya Ontologiyası"və belə bir öhdəlik Bərk.

Semantik Veb Öldü?

Əgər imtina etsəniz qeyri-real gözləntilər, semantik şəbəkə ilə vəziyyət təxminən inkişaf etmiş sosializm dövründə kommunizmlə eynidir (və İliçin şərti vəsiyyətlərinə sədaqət müşahidə olunub-olunmaması, hər kəs özü üçün qərar versin). Axtarış motorları olduqca uğurla vebsaytları RDFa və JSON-LD-dən istifadə etməyə məcbur edir və özləri aşağıda təsvir edilənlərlə əlaqəli texnologiyalardan istifadə edirlər (Google Knowledge Graph, Bing Knowledge Graph).

Ümumiyyətlə, müəllif daha çox yayılmağa nəyin mane olduğunu deyə bilməz, ancaq şəxsi təcrübə əsasında danışa bilər. SW hücumu şəraitində "qutudan kənar" həll edilə bilən problemlər var, baxmayaraq ki, onlar çox geniş yayılmır. Nəticə etibarı ilə, bu vəzifələrlə üzləşənlər həll yolu təqdim edə bilənlərə qarşı heç bir məcburetmə vasitələrinə malik deyillər, sonuncunun müstəqil həll təmin etməsi isə onların biznes modellərinə ziddir. Beləliklə, biz HTML-i təhlil etməyə və bir-birimizdən daha pis olan müxtəlif API-ləri birləşdirməyə davam edirik.

Bununla belə, Linked Data texnologiyaları əsas İnternetdən kənara çıxdı; Kitab əslində bu tətbiqlərə həsr olunub. Hal-hazırda Linked Data icması Gartner-in qeydi (və ya istədiyiniz kimi elanı) sayəsində bu texnologiyaların daha da geniş yayılacağını gözləyir. Bilik Qrafikləri и Data Fabric. İnanmaq istərdim ki, bu konsepsiyaların “velosiped” tətbiqləri deyil, aşağıda müzakirə olunan W3C standartları ilə bağlı olanlar uğurlu olacaqdır.

Əlaqədar Data

Berners-Lee Əlaqəli Məlumatı semantik internet kimi “düzgün görüldü” təyin etdi: ona son məqsədlərinə çatmağa imkan verən yanaşmalar və texnologiyalar toplusu. Əlaqəli verilənlərin əsas prinsipləri Berners-Li vurğulanan növbəti.

Prinsip 1. Müəssisələri adlandırmaq üçün URI-lərdən istifadə.

URI-lər girişlər üçün yerli sətir identifikatorlarından fərqli olaraq qlobal qurum identifikatorlarıdır. Sonradan bu prinsip ən yaxşı şəkildə Google Knowledge Graph şüarında ifadə olundu.şeylər, simlər deyil.

Prinsip 2. URI-lərin HTTP sxemində istifadə edilməsi, belə ki, onlara istinad edilsin.

URI-yə istinad etməklə həmin işarənin arxasındakı işarəni əldə etmək mümkün olmalıdır (burada operatorun adı ilə bənzətmə aydındır).*"C-də); daha dəqiq desək, HTTP başlığının dəyərindən asılı olaraq, bu işarənin bəzi təsvirini əldə etmək Accept:. Ola bilsin ki, AR/VR dövrünün gəlişi ilə resursun özünü əldə etmək mümkün olacaq, lakin hələlik çox güman ki, bu, SPARQL sorğusunun icrasının nəticəsi olan RDF sənədi olacaq. DESCRIBE.

Prinsip 3. W3C standartlarından - ilk növbədə RDF(S) və SPARQL-dən istifadə, xüsusən də URI-lərə istinadı ləğv edərkən.

Əlaqəli Məlumat texnologiyası yığınının bu fərdi "qatları" kimi də tanınır Semantik Web Layer Tortu, aşağıda təsvir olunacaq.

Prinsip 4. Müəssisələri təsvir edərkən digər URI-lərə istinadların istifadəsi.

RDF, özünüzü təbii dildə resursun şifahi təsviri ilə məhdudlaşdırmağa imkan verir və dördüncü prinsip bunu etməməyə çağırır. Birinci prinsipə ümumən riayət olunarsa, resursu təsvir edərkən başqalarına, o cümlədən “xarici”lərə istinad etmək mümkün olur, buna görə də məlumatlar əlaqələndirilmiş adlanır. Əslində, RDFS lüğətində adı olan URI-lərdən istifadə etmək demək olar ki, qaçılmazdır.

RDF

RDF (Resurs Təsviri Çərçivəsi) bir-biri ilə əlaqəli obyektləri təsvir etmək üçün formalizmdir.

Üçlüklər adlanan “subyekt-predikat-obyekt” tipli ifadələr varlıqlar və onların əlaqələri haqqında verilir. Ən sadə halda, subyekt, predikat və obyekt hamısı URI-lərdir. Eyni URI müxtəlif üçlüklərdə müxtəlif mövqelərdə ola bilər: subyekt, predikat və obyekt olun; Beləliklə, üçlüklər RDF qrafiki adlanan bir növ qrafik meydana gətirirlər.

Mövzular və obyektlər yalnız URI-lər deyil, həm də sözdə ola bilər boş qovşaqlar, və obyektlər də ola bilər hərfi. Literallar sətir təsvirindən və tip göstəricisindən ibarət primitiv tiplərin nümunələridir.

Hərflərin yazılmasına dair nümunələr (Tısbağa sintaksisində, bu barədə aşağıda ətraflı): "5.0"^^xsd:float и "five"^^xsd:string. Tipi olan hərflər rdf:langString dil etiketi ilə də təchiz oluna bilər; Tısbağada belə yazılır: "five"@en и "пять"@ru.

Boş qovşaqlar qlobal identifikatorları olmayan “anonim” resurslardır, lakin onlar haqqında açıqlamalar verilə bilər; ekzistensial dəyişənlər növü.

Beləliklə (bu, əslində RDF-nin bütün nöqtəsidir):

  • mövzu URI və ya boş qovşaqdır,
  • predikat URI-dir,
  • obyekt URI, boş qovşaq və ya hərfidir.

Niyə predikatlar boş qovşaqlar ola bilməz?

Ehtimal olunan səbəb, üçlüyü qeyri-rəsmi şəkildə başa düşmək və birinci dərəcəli predikat məntiqinin dilinə tərcümə etmək istəyidir. s p o kimi bir şey kimi Semantik Veb və Əlaqəli Məlumat. Düzəlişlər və əlavələrHara Semantik Veb və Əlaqəli Məlumat. Düzəlişlər və əlavələr - predikat, Semantik Veb və Əlaqəli Məlumat. Düzəlişlər və əlavələr и Semantik Veb və Əlaqəli Məlumat. Düzəlişlər və əlavələr - sabitlər. Bu anlayışın izləri sənəddə var”LBase: Semantik Veb Dilləri üçün Semantika", W3C işçi qrupunun qeydi statusuna malikdir. Bu anlayışla üçüz s p []Hara [] - boş node, kimi tərcümə olunacaq Semantik Veb və Əlaqəli Məlumat. Düzəlişlər və əlavələrHara Semantik Veb və Əlaqəli Məlumat. Düzəlişlər və əlavələr - dəyişən, lakin sonra necə tərcümə etmək s [] o? W3C Tövsiyə statuslu sənəd "RDF 1.1 Semantika” başqa tərcümə metodu təklif edir, lakin hələ də predikatların boş qovşaqlar olma ehtimalını nəzərə almır.

Ancaq Manu Sporni icazə verilir.

RDF mücərrəd bir modeldir. RDF müxtəlif sintaksislərdə yazıla (seriyalaşdırıla bilər): RDF/XML, Tısbağa (insanın oxuya biləcəyi ən çox şey), JSON-LD, HDT (ikili).

Eyni RDF müxtəlif yollarla RDF/XML-ə seriyalaşdırıla bilər, buna görə də, məsələn, XSD istifadə edərək əldə edilən XML-i təsdiqləmək və ya XPath istifadə edərək məlumat çıxarmağa çalışmağın mənası yoxdur. Eyni şəkildə, JSON-LD çətin ki, orta Javascript tərtibatçısının Javascript-in nöqtə və kvadrat mötərizə qeydindən istifadə edərək RDF ilə işləmək istəyini təmin etsin (baxmayaraq ki, JSON-LD mexanizm təklif edərək bu istiqamətdə hərəkət edir. çərçivələmə).

Əksər sintaksislər uzun URI-ləri qısaltmaq yollarını təklif edir. Məsələn, bir reklam @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> Tısbağada sonra əvəzinə yazmağa icazə verəcək <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> yalnız rdf:type.

RDFS

RDFS (RDF Schema) - əsas modelləşdirmə lüğəti, mülkiyyət və sinif anlayışlarını və kimi xassələri təqdim edir. rdf:type, rdfs:subClassOf, rdfs:domain и rdfs:range. RDFS lüğətindən istifadə edərək, məsələn, aşağıdakı etibarlı ifadələr yazıla bilər:

rdf:type         rdf:type         rdf:Property .
rdf:Property     rdf:type         rdfs:Class .
rdfs:Class       rdfs:subClassOf  rdfs:Resource .
rdfs:subClassOf  rdfs:domain      rdfs:Class .
rdfs:domain      rdfs:domain      rdf:Property .
rdfs:domain      rdfs:range       rdfs:Class .
rdfs:label       rdfs:range       rdfs:Literal .

RDFS təsvir və modelləşdirmə lüğətidir, lakin məhdudlaşdırıcı dil deyil (rəsmi spesifikasiya və yarpaqlar belə istifadənin mümkünlüyü). "Sxema" sözü "XML Schema" ifadəsindəki kimi başa düşülməməlidir. Misal üçün, :author rdfs:range foaf:Person bunun mənası rdf:type bütün əmlak dəyərləri :author - foaf:Person, lakin o demək deyil ki, bunu əvvəlcədən söyləmək lazımdır.

SPARQL

SPARQL (SPARQL Protokolu və RDF Sorğu Dili) - RDF məlumatlarını sorğulamaq üçün dil. Sadə halda, SPARQL sorğusu sorğu edilən qrafikin üçlülərinin uyğunlaşdırıldığı nümunələr toplusudur. Nümunələr mövzu, predikat və obyekt mövqelərində dəyişənləri ehtiva edə bilər.

Sorğu elə dəyişən dəyərləri qaytaracaq ki, onlar nümunələrə əvəz edildikdə sorğu edilən RDF qrafikinin alt qrafası (üçlülərinin alt dəsti) ilə nəticələnə bilər. Üçlüklərin müxtəlif nümunələrində eyni adlı dəyişənlər eyni qiymətə malik olmalıdır.

Məsələn, yuxarıdakı yeddi RDFS aksiom dəstini nəzərə alsaq, aşağıdakı sorğu qayıdacaq rdfs:domain и rdfs:range dəyərlər kimi ?s и ?p müvafiq olaraq:

SELECT * WHERE {
 ?s ?p rdfs:Class .
 ?p ?p rdf:Property .
}

Qeyd etmək lazımdır ki, SPARQL deklarativdir və qrafik keçidini təsvir etmək üçün dil deyil (lakin bəzi RDF depoları sorğunun icra planını tənzimləmək yollarını təklif edir). Buna görə də, bəzi standart qrafik problemləri, məsələn, ən qısa yolu tapmaq, SPARQL-də həll edilə bilməz. əmlak yolları (lakin, yenə fərdi RDF depoları bu problemləri həll etmək üçün xüsusi genişlənmələr təklif edir).

SPARQL dünyanın açıqlığı prezumpsiyasını bölüşmür və “inkar etmə uğursuzluq kimi” yanaşmasına əməl edir. mümkündür kimi dizaynlar FILTER NOT EXISTS {…}. Mexanizmdən istifadə etməklə məlumatların paylanması nəzərə alınır federativ sorğular.

SPARQL giriş nöqtəsinin - SPARQL sorğularını emal edə bilən RDF yaddaşının ikinci mərhələdən birbaşa analoqları yoxdur (bu paraqrafın əvvəlinə baxın). O, HTML səhifələrinin yaradıldığı, lakin xaricdən əlçatan olan məzmununa əsaslanan verilənlər bazasına bənzədilə bilər. SPARQL giriş nöqtəsi üçüncü mərhələdən API giriş nöqtəsinə daha çox bənzəyir, lakin iki əsas fərqlə. Birincisi, bir neçə “atom” sorğunu birinə birləşdirmək mümkündür (bu, GraphQL-in əsas xüsusiyyəti hesab olunur), ikincisi, belə bir API tamamilə özünü sənədləşdirir (HATEOAS-ın buna nail olmağa çalışdığı budur).

Polemik qeyd

RDF internetdə məlumatları dərc etmək üsuludur, ona görə də RDF yaddaşı DBMS sənədi hesab edilməlidir. Doğrudur, RDF ağac deyil, qrafik olduğundan, onlar da qrafik əsaslı olduğu ortaya çıxdı. Bunun ümumiyyətlə nəticə verməsi təəccüblüdür. Boş qovşaqları həyata keçirəcək ağıllı insanların olacağını kim düşünərdi. Codd buradadır alınmadı.

RDF məlumatlarına girişi təşkil etmək üçün daha az tam xüsusiyyətli yollar da var, məsələn, Əlaqədar məlumat fraqmentləri (LDF) və Əlaqəli Məlumat Platforması (LDP).

OWL

OWL (Web Ontology Language) - biliyi təmsil etmək üçün formalizm, təsvir məntiqinin sintaktik versiyası Semantik Veb və Əlaqəli Məlumat. Düzəlişlər və əlavələr (aşağıda hər yerdə OWL 2 demək daha düzgündür, OWL-in ilk versiyası buna əsaslanırdı Semantik Veb və Əlaqəli Məlumat. Düzəlişlər və əlavələr).

OWL-də təsviri məntiq anlayışları siniflərə, rollar xassələrə uyğundur, fərdlər əvvəlki adlarını saxlayırlar. Aksiomalara aksiomlar da deyilir.

Məsələn, sözdə Mançester sintaksisi OWL notasiyası üçün artıq bizə məlum olan aksiomadır Semantik Veb və Əlaqəli Məlumat. Düzəlişlər və əlavələr belə yazılacaq:

Class: Human
Class: Parent
   EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent

OWL yazmaq üçün başqa sintaksislər var, məsələn funksional sintaksis, rəsmi spesifikasiyada istifadə olunur və OWL/XML. Bundan əlavə, OWL seriallaşdırıla bilər mücərrəd RDF sintaksisinə və daha sonra - xüsusi sintaksislərdən hər hansı birində.

OWL-in RDF ilə ikili əlaqəsi var. Bir tərəfdən, RDFS-ni genişləndirən bir növ lüğət kimi qəbul edilə bilər. Digər tərəfdən, RDF sadəcə seriallaşdırma formatı olduğu daha güclü formalizmdir. Bütün elementar OWL konstruksiyaları tək RDF üçlüyü ilə yazıla bilməz.

OWL konstruksiyalarının hansı alt dəstinin istifadəsinə icazə verildiyindən asılı olaraq, onlar sözdə danışırlar OWL profilləri. Standartlaşdırılmış və ən məşhurları OWL EL, OWL RL və OWL QL-dir. Profil seçimi tipik problemlərin hesablama mürəkkəbliyinə təsir göstərir. Uyğun olan OWL konstruksiyalarının tam dəsti Semantik Veb və Əlaqəli Məlumat. Düzəlişlər və əlavələr, OWL DL adlanır. Bəzən OWL Full haqqında da danışırlar, burada OWL konstruksiyalarının RDF-yə xas olan tam sərbəstliklə, semantik və hesablama məhdudiyyətləri olmadan istifadəsinə icazə verilir. Semantik Veb və Əlaqəli Məlumat. Düzəlişlər və əlavələr. Məsələn, bir şey həm sinif, həm də mülk ola bilər. OWL Full qərarsızdır.

OWL-də nəticələrin əlavə edilməsi üçün əsas prinsiplər açıq dünya fərziyyəsinin qəbul edilməsidir. O.W.A.) və unikal adların prezumpsiyasının rədd edilməsi (unikal ad fərziyyəsi, ONE). Aşağıda bu prinsiplərin hara gətirib çıxara biləcəyini və bəzi OWL konstruksiyalarını təqdim edəcəyini görəcəyik.

Ontologiya aşağıdakı fraqmenti ehtiva etsin (Mançester sintaksisində):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human
   Facts: hasChild Alice, hasChild Bob, hasChild Carol

Yəhyanın çoxlu uşağı olduğu deyilənlərdən belə nəticə çıxacaqmı? UNA-nın rədd edilməsi nəticə motorunu bu suala mənfi cavab verməyə məcbur edəcək, çünki Alice və Bob eyni adam ola bilər. Aşağıdakıların baş verməsi üçün aşağıdakı aksiomanı əlavə etmək lazımdır:

DifferentIndividuals: Alice, Bob, Carol, John

İndi ontoloji fraqment aşağıdakı formaya sahib olsun (Conun çoxlu uşağı olduğu elan edilir, lakin onun yalnız iki uşağı var):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human, manyChildren
   Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John

Bu ontologiya uyğunsuz olacaqmı (bu, etibarsız məlumatların sübutu kimi şərh edilə bilər)? OWA-nı qəbul etmək, nəticə çıxarma mühərrikinin mənfi cavab verməsinə səbəb olacaq: başqa bir yerdə (başqa bir ontologiyada) demək olar ki, Carol da Conun uşağıdır.

Bunun ehtimalını istisna etmək üçün Con haqqında yeni bir fakt əlavə edək:

Individual: John
   Facts: hasChild Alice, hasChild Bob, not hasChild Carol

Digər uşaqların görünüşünü istisna etmək üçün deyək ki, "uşaq sahibi olmaq" əmlakının bütün dəyərləri yalnız dördümüz olan insanlardır:

ObjectProperty: hasChild
   Domain: Human
   Сharacteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }

İndi ontologiya ziddiyyətə çevriləcək, nəticə çıxarma mühərriki bunu bildirməkdən yayınmayacaq. Sonuncu aksioma ilə dünyanı müəyyən mənada “bağladıq” və Conun öz övladı olma ehtimalının necə istisna edildiyinə diqqət yetirək.

Müəssisə məlumatlarının əlaqələndirilməsi

Bağlantılı Məlumatlar dəsti ilkin olaraq İnternetdə məlumatların dərc edilməsi üçün nəzərdə tutulmuşdu. Onların daxili korporativ mühitdə istifadəsi bir sıra çətinliklərlə üzləşir.

Məsələn, qapalı korporativ mühitdə OWA-nın qəbulu və UNA-nın rədd edilməsinə əsaslanan OWL-in deduktiv gücü, İnternetin açıq və paylanmış təbiəti səbəbindən qərarlar çox zəifdir. Və burada aşağıdakı həllər mümkündür.

  • OWL-ni semantika ilə bəxş etmək, OWA-nın tərk edilməsini və UNA-nın qəbulunu, müvafiq çıxış mühərrikinin həyata keçirilməsini nəzərdə tutur. - Bu yolda gedər Stardog RDF yaddaşı.
  • OWL-in deduktiv imkanlarından imtina edərək qayda mühərriklərinin xeyrinə. — Stardog dəstəkləyir SWRL; Jena və GraphDB təklifi sahibi dillərdə Qaydalar
  • OWL-in deduktiv imkanlarından imtina, modelləşdirmə üçün RDFS-ə yaxın bu və ya digər alt dəstədən istifadə. - Aşağıda bu barədə daha çox məlumat əldə edin.

Digər bir məsələ, korporativ dünyanın məlumatların keyfiyyəti problemlərinə daha çox diqqət yetirməsi və Əlaqəli Məlumat yığınında məlumatların yoxlanılması vasitələrinin olmamasıdır. Buradakı çıxışlar aşağıdakı kimidir.

  • Yenə də, müvafiq nəticə çıxarma mühərriki mövcud olduqda, qapalı dünya semantikası və unikal adları olan OWL konstruksiyalarının təsdiqi üçün istifadə edin.
  • Istifadə SHACL, Semantik Web Layer Cake təbəqələrinin siyahısı düzəldildikdən sonra standartlaşdırılıb (lakin o, qaydalar mühərriki kimi də istifadə edilə bilər) və ya ShEx.
  • Hər şeyin son nəticədə SPARQL sorğuları ilə edildiyini başa düşmək, onlardan istifadə edərək öz sadə məlumat yoxlama mexanizminizi yaratmaq.

Bununla belə, hətta deduktiv imkanların və doğrulama vasitələrinin tamamilə rədd edilməsi, Əlaqəli Məlumat yığınını açıq və paylanmış internetə landşaft baxımından oxşar olan tapşırıqlarda - verilənlərin inteqrasiyası tapşırıqlarında rəqabətdən kənarda qoyur.

Müəssisənin müntəzəm məlumat sistemi haqqında nə demək olar?

Bu mümkündür, lakin siz, əlbəttə ki, müvafiq texnologiyaların hansı problemləri həll etməli olduğunu dəqiq bilməlisiniz. Mən burada bu texnologiya yığınının adi İT nöqteyi-nəzərindən necə göründüyünü göstərmək üçün inkişaf iştirakçılarının tipik reaksiyasını təsvir edəcəyəm. Mənə bir az fil məsəlini xatırladır:

  • Biznes analitiki: RDF birbaşa saxlanılan məntiqi model kimi bir şeydir.
  • Sistem analitiki: RDF kimidir EAV, yalnız bir dəstə indeks və rahat sorğu dili ilə.
  • Developer: yaxşı, bunların hamısı zəngin model və aşağı kod anlayışlarının ruhundadır, oxuyurdu bu yaxınlarda.
  • Layihə meneceri: bəli eynidir yığının dağılması!

Təcrübə göstərir ki, yığın ən çox məlumatların paylanması və heterojenliyi ilə əlaqəli vəzifələrdə, məsələn, MDM (Master Data Management) və ya DWH (Data Warehouse) sinif sistemlərini qurarkən istifadə olunur. Belə problemlər istənilən sənayedə mövcuddur.

Sənayeyə aid tətbiqlər baxımından, Linked Data texnologiyaları hazırda aşağıdakı sənaye sahələrində ən populyardır.

  • biotibbi texnologiyalar (onların populyarlığının domenin mürəkkəbliyi ilə əlaqəli olduğu görünür);

cari

Bu günlərdə “Qaynama nöqtəsi”ndə “Milli Tibbi Bilik Bazası” assosiasiyasının təşkilatçılığı ilə konfrans keçirilib.Ontologiyaların birləşməsi. Nəzəriyyədən praktik tətbiqə qədər.

  • mürəkkəb məhsulların istehsalı və istismarı (böyük maşınqayırma, neft və qaz hasilatı; ən çox standartdan danışırıq ISO 15926);

cari

Burada da səbəb mövzu sahəsinin mürəkkəbliyidir, məsələn, neft-qaz sənayesindən danışsaq, sadə uçot bəzi CAD funksiyalarını tələb edir.

2008-ci ildə Chevron tərəfindən təşkil edilən nümayəndəlik quraşdırma tədbiri baş tutdu konfrans.

ISO 15926, nəticədə, neft və qaz sənayesi üçün bir qədər ağır göründü (və bəlkə də maşınqayırmada daha çox tətbiq tapdı). Yalnız Statoil (Equinor) ona tamamilə bağlandı; Norveçdə bütövlükdə ekosistem. Digərləri öz işlərini görməyə çalışırlar. Məsələn, şayiələrə görə, yerli Energetika Nazirliyi "yanacaq-energetika kompleksinin konseptual ontoloji modeli" yaratmaq niyyətindədir. elektrik enerjisi sənayesi üçün yaradılmışdır.

  • maliyyə təşkilatları (hətta XBRL SDMX və RDF Data Cube ontologiyasının bir növ hibrid hesab edilə bilər);

cari

İlin əvvəlində LinkedIn müəllifə "Fors-major" serialından tanıdığı maliyyə sənayesinin demək olar ki, bütün nəhənglərinin vakansiyaları ilə aktiv şəkildə spam göndərdi: Goldman Sachs, JPMorgan Chase və/və ya Morgan Stanley, Wells Fargo, SWIFT/Visa/Mastercard, Bank of America, Citigroup, Fed, Deutsche Bank... Yəqin ki, hər kəs göndərə biləcəyi birini axtarırdı. Bilik Qrafik Konfransı. Çox az adam tapmağı bacardı: maliyyə təşkilatları hər şeyi aldı ilk günün səhəri.

HeadHunter-də yalnız Sberbank maraqlı bir şeylə qarşılaşdı; söhbət "RDF kimi məlumat modeli ilə EAV saxlama" haqqında idi.

Yəqin ki, yerli və Qərb maliyyə institutlarının müvafiq texnologiyalarına sevgi dərəcəsindəki fərq sonuncunun fəaliyyətinin transmilli xarakteri ilə bağlıdır. Göründüyü kimi, dövlət sərhədlərini aşan inteqrasiya keyfiyyətcə fərqli təşkilati və texniki həllər tələb edir.

  • kommersiya tətbiqləri ilə sual-cavab sistemləri (IBM Watson, Apple Siri, Google Knowledge Graph);

cari

Yeri gəlmişkən, Siri-nin yaradıcısı Tomas Qruber ontologiyanın (İT mənasında) “konseptuallaşdırma spesifikasiyası” kimi tərifinin müəllifidir. Məncə, bu tərifdəki sözlərin yenidən düzülməsi onun mənasını dəyişmir ki, bu da bəlkə də orada olmadığını göstərir.

  • strukturlaşdırılmış məlumatların nəşri (daha çox əsaslandırma ilə bunu Əlaqəli Açıq Məlumata aid etmək olar).

cari

Əlaqəli Məlumatın böyük pərəstişkarları GLAM adlananlardır: Qalereyalar, Kitabxanalar, Arxivlər və Muzeylər. Konqres Kitabxanasının MARC21-in dəyişdirilməsini təşviq etdiyini söyləmək kifayətdir BİBFRAMEHansı biblioqrafik təsvirin gələcəyi üçün zəmin yaradır və əlbəttə ki, RDF əsasında.

Wikidata tez-tez Əlaqəli Açıq Məlumatlar sahəsində uğurlu layihənin nümunəsi kimi qeyd olunur - Vikipediyanın bir növ maşın tərəfindən oxuna bilən versiyası, məzmunu DBPedia-dan fərqli olaraq məqalə infoboxes idxalı ilə yaradılmır, lakin az və ya çox əl ilə yaradılmışdır (və sonradan eyni infoboxes üçün məlumat mənbəyinə çevrilir).

Onu da yoxlamağı tövsiyə edirik siyahı Stardog veb-saytında "Müştərilər" bölməsində Stardog RDF yaddaşının istifadəçiləri.

Nə olursa olsun, Gartner-də 2016-cı ildə Emerging Technologies üçün Hype Cycle "Müəssisələrin Taksonomiyası və Ontologiyasının İdarə Edilməsi" 10 ildən tez olmayan "məhsuldarlıq yaylasına" çatmaq perspektivi ilə məyusluq vadisinə enişin ortasında yerləşdirilir.

Müəssisə məlumatlarının əlaqələndirilməsi

Proqnozlar, proqnozlar, proqnozlar...

Tarixi maraqdan ötrü, Gartner-in bizi maraqlandıran texnologiyalarla bağlı müxtəlif illər üzrə proqnozlarını aşağıda cədvəlləşdirdim.

Il Технология Bildir Mövqe Yaylaya qədər illər
2001 Semantik Veb İnkişaf edən Texnologiyalar İnnovasiya Tətikçisi 5-10
2006 Korporativ Semantik Veb İnkişaf edən Texnologiyalar Şişirilmiş gözləntilərin zirvəsi 5-10
2012 Semantik Veb Big Data Şişirilmiş gözləntilərin zirvəsi > 10
2015 Əlaqədar Data Qabaqcıl Analitika və Məlumat Elmi Məyusluq çökəkliyi 5-10
2016 Müəssisə Ontoloji İdarəetmə İnkişaf edən Texnologiyalar Məyusluq çökəkliyi > 10
2018 Bilik Qrafikləri İnkişaf edən Texnologiyalar İnnovasiya Tətikçisi 5-10

Bununla belə, artıq "Hype Cycle..." 2018 daha bir yüksəliş tendensiyası meydana çıxdı - Knowledge Graphs. Müəyyən bir reenkarnasiya baş verdi: istifadəçilərin diqqətinin və tərtibatçıların səylərinin dəyişdirildiyi DBMS-lərin qrafiki, birincilərin istəkləri və ikincilərin vərdişlərinin təsiri altında konturları və yerləşdirməni almağa başladı. sələflərinin rəqiblərindən.

Demək olar ki, hər bir qrafik DBMS indi özünü korporativ “bilik qrafiki” yaratmaq üçün uyğun platforma elan edir (“əlaqəli məlumatlar” bəzən “əlaqəli məlumatlar” ilə əvəz olunur), lakin bu cür iddialar nə dərəcədə əsaslıdır?

Qrafik verilənlər bazaları hələ də asemantikdir; qrafik DBMS-dəki məlumatlar hələ də eyni məlumat silosudur. URI-lər əvəzinə simli identifikatorlar iki qrafik DBMS-nin inteqrasiyası vəzifəsini hələ də inteqrasiya tapşırığı edir, iki RDF mağazasını inteqrasiya etmək çox vaxt sadəcə iki RDF qrafikini birləşdirməyə gəlir. Asemantikliyin başqa bir cəhəti LPG qrafik modelinin əks olunmamasıdır ki, bu da eyni platformadan istifadə edərək metaməlumatların idarə olunmasını çətinləşdirir.

Nəhayət, qrafik DBMS-lərində nəticə çıxarma mühərrikləri və ya qayda mühərrikləri yoxdur. Belə mühərriklərin nəticələrini mürəkkəbləşdirən sorğular vasitəsilə çıxarmaq olar, lakin bu, hətta SQL-də də mümkündür.

Bununla belə, aparıcı RDF saxlama sistemləri LPG modelini dəstəkləməkdə çətinlik çəkmir. Ən möhkəm yanaşma Blazegraph-da eyni vaxtda təklif olunan yanaşma hesab olunur: RDF və LPG-ni birləşdirən RDF* modeli.

daha

LPG modeli üçün RDF saxlama dəstəyi haqqında daha çox Habré-dəki əvvəlki məqalədə oxuya bilərsiniz: "İndi RDF yaddaşı ilə nə baş verir". Ümid edirəm bir gün Knowledge Graphs və Data Fabric haqqında ayrıca məqalə yazılacaq. Son bölmə, başa düşmək asan olduğu kimi, tələsik yazılmışdır, lakin altı aydan sonra da bu anlayışlarla hər şey daha aydın deyil.

Ədəbiyyat

  1. Halpin, H., Monnin, A. (red.) (2014). Fəlsəfə Mühəndisliyi: İnternetin Fəlsəfəsinə Doğru
  2. Allemang, D., Hendler, J. (2011) İşləyən Ontoloq üçün Semantik Veb (2-ci nəşr)
  3. Staab, S., Studer, R. (eds.) (2009) Ontologiyalar üzrə kitabça (2-ci nəşr)
  4. Vud, D. (red.). (2011) Enterprise Data Linking
  5. Keet, M. (2018) Ontologiya Mühəndisliyinə Giriş

Mənbə: www.habr.com

Добавить комментарий