Семантичка мрежа и поврзани податоци. Исправки и дополнувања

Би сакал да и претставам на јавноста фрагмент од оваа неодамна објавена книга:

Онтолошко моделирање на претпријатие: методи и технологии [Текст]: монографија / [С. В. Горшков, С. С. Кралин, О. И. Муштак и други; извршен уредник С.В. Горшков]. - Екатеринбург: Издавачка куќа на Универзитетот Урал, 2019. - 234 стр.: ил., табела; 20 см - Автор. означено на задната цицка. Со. - Библиографија на крајот од гл. — ISBN 978-5-7996-2580-1: 200 примероци.

Целта на објавување на овој фрагмент на Хабре е четирикратна:

  • Малку е веројатно дека некој ќе може да ја држи оваа книга во свои раце ако не е клиент на почитуван СергеИндекс; Дефинитивно не е на продажба.
  • Направени се корекции на текстот (не се истакнати подолу) и направени се дополнувања кои не се многу компатибилни со форматот на печатена монографија: тематски белешки (под спојлери) и хиперврски.
  • сакам да собирајте прашања и коментари, со цел да се земат предвид при вклучување на овој текст во ревидирана форма во која било друга публикација.
  • Многу приврзаници на семантички веб и поврзани податоци сè уште веруваат дека нивниот круг е толку тесен, главно затоа што на пошироката јавност сè уште не и е соодветно објаснето колку е одлично да се биде приврзаник на семантичката мрежа и поврзаните податоци. Авторот на фрагментот, иако припаѓа на овој круг, не го држи ова мислење, но, сепак, се смета себеси задолжен да направи уште еден обид.

Значи,

Семантичка мрежа

Еволуцијата на Интернетот може да се претстави на следниов начин (или да зборуваме за неговите сегменти кои биле формирани по редоследот наведен подолу):

  1. Документи на Интернет. Клучни технологии - Gopher, FTP, итн.
    Интернетот е глобална мрежа за размена на локални ресурси.
  2. Интернет документи. Клучните технологии се HTML и HTTP.
    Природата на изложените ресурси ги зема предвид карактеристиките на нивниот преносен медиум.
  3. Интернет податоци. Клучни технологии - REST и SOAP API, XHR, итн.
    Во ерата на интернет апликациите, не само луѓето стануваат потрошувачи на ресурси.
  4. Интернет податоци. Клучните технологии се технологии за поврзани податоци.
    Оваа четврта фаза, предвидена од Бернерс-Ли, креаторот на вторите основни технологии и директор на W3C, се нарекува Семантичка мрежа; Технологиите за поврзани податоци се дизајнирани да ги направат податоците на веб не само машински читливи, туку и „машински разбирливи“.

Од она што следува, читателот ќе ја разбере кореспонденцијата помеѓу клучните концепти на втората и четвртата фаза:

  • URL-адресите се аналогни на URI,
  • аналогот на HTML е RDF,
  • HTML хиперврските се слични на URI појавите во RDF документите.

Семантичката мрежа е повеќе системска визија за иднината на Интернетот отколку специфичен спонтан или лобиран тренд, иако може да ги земе предвид овие вториве. На пример, важна карактеристика на она што се нарекува Web 2.0 се смета за „содржина генерирана од корисници“. Конкретно, препораката на W3C е повикана да ја земе предвид „Онтологија на веб прибелешки„и таков потфат како Солидна.

Дали семантичката мрежа е мртва?

Ако одбиете нереални очекувања, ситуацијата со семантичката мрежа е приближно иста како и со комунизмот за време на развиениот социјализам (а дали се почитува лојалноста кон условните наредби на Илич, секој нека одлучи сам за себе). Пребарувачите доста успешно принудете ги веб-локациите да користат RDFa и JSON-LD и самите да користат технологии поврзани со оние опишани подолу (Графикон на знаење на Google, График на знаење на Бинг).

Општо земено, авторот не може да каже што го спречува поголемото ширење, но може да зборува врз основа на лично искуство. Има проблеми кои би можеле да се решат „надвор од кутијата“ во услови на офанзивата на СВ, иако тие не се многу распространети. Како резултат на тоа, оние кои се соочени со овие задачи немаат средства за принуда против оние кои се способни да дадат решение, додека независното обезбедување решение од вторите е во спротивност со нивните деловни модели. Така, ние продолжуваме да го анализираме HTML и да лепиме различни API-а, едни со други посрамни.

Сепак, технологиите за поврзани податоци се проширија надвор од мејнстрим веб-от; Книгата, всушност, е посветена на овие апликации. Во моментов, заедницата за поврзани податоци очекува овие технологии да станат уште пораспространети благодарение на снимањето (или прогласувањето, како сакате) од Гартнер на трендовите како што се Графикони на знаење и Ткаенина за податоци. Би сакал да верувам дека нема да бидат успешни имплементациите на „велосипед“ на овие концепти, туку оние поврзани со стандардите на W3C за кои се дискутира подолу.

Поврзани податоци

Бернерс-Ли ги дефинираше Поврзаните податоци како семантичка мрежа „направено правилно“: збир на пристапи и технологии што им овозможуваат да ги постигне своите крајни цели. Основни принципи на поврзани податоци Бернерс-Ли истакнати следното.

Принцип 1. Користење на URI за именување ентитети.

URI се глобални идентификатори на ентитети за разлика од локалните идентификатори на низа за записи. Последователно, овој принцип беше најдобро изразен во слоганот Google Knowledge Graph „работи, а не жици".

Принцип 2. Користење URI во HTTP шемата за да може да се дереференцираат.

Со повикување на URI, треба да биде можно да се добие означеното зад тој означувач (аналогијата со името на операторот " е јасна овде).*"во C); поточно, за да се добие одредена претстава за ова означено - во зависност од вредноста на HTTP заглавието Accept:. Можеби, со доаѓањето на ерата AR/VR, ќе биде можно да се добие самиот ресурс, но засега, најверојатно, тоа ќе биде документ RDF, кој е резултат на извршување на барањето SPARQL DESCRIBE.

Принцип 3. Употреба на W3C стандарди - првенствено RDF(S) и SPARQL - особено при дереференцирање на URI-и.

Овие поединечни „слоеви“ од стекот на технологијата за поврзани податоци, познати и како Торта со семантички веб слој, ќе биде опишано подолу.

Принцип 4. Употреба на референци до други URI при опишување ентитети.

RDF ви овозможува да се ограничите на вербален опис на ресурс на природен јазик, а четвртиот принцип повикува да не го правите тоа. Ако првиот принцип е универзално почитуван, станува возможно кога се опишува ресурс да се повикуваат на други, вклучително и „странски“, поради што податоците се нарекуваат поврзани. Всушност, речиси е неизбежно да се користат URI именувани во речникот RDFS.

RDF

RDF (Рамка за опис на ресурси) е формализам за опишување меѓусебно поврзани ентитети.

Изјавите од типот „субјект-прирок-објект“, наречени тројки, се даваат за ентитетите и нивните односи. Во наједноставниот случај, субјектот, прирокот и објектот се сите URI. Истиот URI може да биде на различни позиции во различни тројки: да биде субјект, прирок и објект; Така, тројките формираат еден вид график наречен RDF график.

Предмети и објекти можат да бидат не само URI, туку и т.н празни јазли, а предметите исто така можат да бидат буквални. Литералите се примери на примитивни типови кои се состојат од претстава на низа и индикација за тип.

Примери за пишување буквални зборови (во синтаксата на Turtle, повеќе за тоа подолу): "5.0"^^xsd:float и "five"^^xsd:string. Буквални со тип rdf:langString може да биде опремена и со јазична ознака; во Turtle е напишано вака: "five"@en и "пять"@ru.

Празните јазли се „анонимни“ ресурси без глобални идентификатори, за кои, сепак, може да се дадат изјави; вид на егзистенцијални променливи.

Значи (ова е, всушност, целата поента на RDF):

  • субјектот е URI или празен јазол,
  • предикатот е URI,
  • објектот е URI, празен јазол или буквално.

Зошто предикатите не можат да бидат празни јазли?

Веројатната причина е желбата за неформално разбирање и преведување на тројката на јазикот на предикатна логика од прв ред s p o како нешто слично Семантичка мрежа и поврзани податоци. Исправки и дополнувањакаде Семантичка мрежа и поврзани податоци. Исправки и дополнувања - предикат, Семантичка мрежа и поврзани податоци. Исправки и дополнувања и Семантичка мрежа и поврзани податоци. Исправки и дополнувања - константи. Трагите од ова разбирање се во документот “LBase: Семантика за јазиците на семантичката мрежа“, која има статус на белешка од работна група на W3C. Со ова разбирање, тројката s p []каде [] - празен јазол, ќе се преведе како Семантичка мрежа и поврзани податоци. Исправки и дополнувањакаде Семантичка мрежа и поврзани податоци. Исправки и дополнувања - променлива, но како тогаш да се преведе s [] o? Документ со статус на препорака на W3C "RDF 1.1 Семантика” нуди друг метод на преведување, но сепак не ја разгледува можноста предикатите да бидат празни јазли.

Сепак, Ману Спорни дозволено.

RDF е апстрактен модел. RDF може да се напише (сериски) во различни синтакси: RDF/XML, Желка (најчитливо за луѓето), ЈСОН-ЛД, HDT (бинарно).

Истиот RDF може да се серијализира во RDF/XML на различни начини, така што, на пример, нема смисла да се потврди добиениот XML користејќи XSD или да се обиде да извлече податоци користејќи XPath. Исто така, JSON-LD веројатно нема да ја задоволи желбата на просечниот Javascript развивач да работи со RDF користејќи ја ознаката со точка и квадратна заграда на Javascript (иако JSON-LD се движи во таа насока нудејќи механизам врамување).

Повеќето синтаксии нудат начини за скратување на долгите URI. На пример, реклама @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> во Turtle тогаш ќе ви овозможи да пишувате наместо тоа <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> само rdf:type.

RDFS

RDFS (RDF Schema) - основен вокабулар за моделирање, ги воведува концептите на сопственост и класа и својства како што се rdf:type, rdfs:subClassOf, rdfs:domain и rdfs:range. Користејќи го речникот RDFS, на пример, може да се напишат следните валидни изрази:

rdf:type         rdf:type         rdf:Property .
rdf:Property     rdf:type         rdfs:Class .
rdfs:Class       rdfs:subClassOf  rdfs:Resource .
rdfs:subClassOf  rdfs:domain      rdfs:Class .
rdfs:domain      rdfs:domain      rdf:Property .
rdfs:domain      rdfs:range       rdfs:Class .
rdfs:label       rdfs:range       rdfs:Literal .

RDFS е речник за опис и моделирање, но не е јазик за ограничување (иако официјалната спецификација и лисја можност за таква употреба). Зборот „Шема“ не треба да се разбере во иста смисла како во изразот „Шема XML“. На пример, :author rdfs:range foaf:Person значи дека rdf:type сите вредности на имотот :author - foaf:Person, но не значи дека тоа треба да се каже однапред.

SPARQL

SPARQL (SPARQL Protocol и RDF Query Language) - јазик за барање RDF податоци. Во едноставен случај, барањето SPARQL е збир на примероци со кои се совпаѓаат тројки од графикот што се бара. Шаблоните може да содржат променливи во позиции на субјект, прирок и објект.

Барањето ќе врати такви променливи вредности што, кога ќе се заменат во примероците, може да резултираат со подграф од прашаниот RDF графикон (подмножество од неговите тројки). Променливите со исто име во различни примероци на тројки мора да имаат исти вредности.

На пример, со оглед на горната група од седум RDFS аксиоми, ќе се врати следното барање rdfs:domain и rdfs:range како вредности ?s и ?p соодветно:

SELECT * WHERE {
 ?s ?p rdfs:Class .
 ?p ?p rdf:Property .
}

Вреди да се напомене дека SPARQL е декларативен и не е јазик за опишување на преминување на графикони (сепак, некои складишта на RDF нудат начини за прилагодување на планот за извршување на барањето). Затоа, некои стандардни проблеми со графикот, на пример, наоѓање на најкратката патека, не можат да се решат во SPARQL, вклучително и користење на имотни патеки (но, повторно, поединечните складишта на RDF нудат специјални екстензии за решавање на овие проблеми).

SPARQL не ја дели претпоставката за отвореност на светот и го следи пристапот „негирање како неуспех“, во кој можно дизајни како што се FILTER NOT EXISTS {…}. Дистрибуцијата на податоците се зема предвид со користење на механизмот федерирани прашања.

Пристапната точка SPARQL - RDF складирање способно да обработува SPARQL барања - нема директни аналози од втората фаза (видете го почетокот на овој пасус). Може да се спореди со база на податоци, врз основа на чија содржина се генерирани HTML-страници, но достапни однадвор. Пристапната точка SPARQL е поаналогна на пристапната точка API од третата фаза, но со две главни разлики. Прво, можно е да се комбинираат неколку „атомски“ прашања во едно (што се смета за клучна карактеристика на GraphQL), и второ, таквото API е целосно самодокументирано (што е она што HATEOAS се обиде да го постигне).

Полемичка забелешка

RDF е начин за објавување податоци на веб, така што складирањето на RDF треба да се смета за DBMS на документи. Точно, бидејќи RDF е график, а не дрво, тие исто така се покажаа дека се базирани на графикони. Неверојатно е што воопшто успеа. Кој би помислил дека ќе има паметни луѓе кои ќе имплементираат празни јазли. Код е тука не успеа.

Исто така, постојат помалку целосно опремени начини за организирање пристап до RDF податоци, на пример, Поврзани фрагменти на податоци (LDF) и Платформа за поврзани податоци (ЛДП).

OWL

OWL (Web Ontology Language) - формализам за претставување на знаењето, синтаксичка верзија на логиката на описот Семантичка мрежа и поврзани податоци. Исправки и дополнувања (секаде подолу е поправилно да се каже OWL 2, првата верзија на OWL се базираше на Семантичка мрежа и поврзани податоци. Исправки и дополнувања).

Концептите на описни логики во OWL одговараат на класи, улогите одговараат на својствата, поединците го задржуваат своето претходно име. Аксиомите се нарекуваат и аксиоми.

На пример, во т.н Синтакса на Манчестер за OWL нотација веќе ни е позната аксиома Семантичка мрежа и поврзани податоци. Исправки и дополнувања ќе биде напишано вака:

Class: Human
Class: Parent
   EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent

Постојат и други синтакси за пишување OWL, како на пр функционална синтакса, што се користи во официјалната спецификација и OWL/XML. Дополнително, OWL може да се серијализира за апстрактна RDF синтакса и понатаму - во која било од специфичните синтакса.

OWL има двојна врска со RDF. Од една страна, може да се смета како еден вид речник што го проширува RDFS. Од друга страна, тоа е помоќен формализам за кој RDF е само формат за серијализација. Не сите елементарни OWL конструкции можат да се напишат со користење на една RDF тројка.

Во зависност од тоа кое подмножество на OWL конструкции е дозволено да се користи, тие зборуваат за т.н OWL профили. Стандардизираните и најпознатите се OWL EL, OWL RL и OWL QL. Изборот на профилот влијае на пресметковната сложеност на типичните проблеми. Комплетен сет на OWL конструкции што одговараат на Семантичка мрежа и поврзани податоци. Исправки и дополнувања, наречен OWL DL. Понекогаш тие исто така зборуваат за OWL Full, во кои на конструкциите на OWL им е дозволено да се користат со целосна слобода својствена за RDF, без семантички и пресметковни ограничувања Семантичка мрежа и поврзани податоци. Исправки и дополнувања. На пример, нешто може да биде и класа и својство. OWL Full е нерешлив.

Клучните принципи за прикачување на последиците во OWL се усвојувањето на претпоставката за отворен свет. ОВА) и отфрлање на претпоставката за единствени имиња (претпоставка за единствено име, ЕДЕН). Подолу ќе видиме каде можат да доведат овие принципи и ќе воведеме некои OWL конструкции.

Нека онтологијата го содржи следниов фрагмент (во синтаксата Манчестер):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human
   Facts: hasChild Alice, hasChild Bob, hasChild Carol

Дали од кажаното ќе следи дека Џон има многу деца? Одбивањето на UNA ќе го принуди моторот за заклучување да одговори на ова прашање негативно, бидејќи Алис и Боб можеби се иста личност. За да се случи следново, потребно е да се додаде следнава аксиома:

DifferentIndividuals: Alice, Bob, Carol, John

Нека сега онтолошкиот фрагмент го има следниов облик (за Џон е прогласен за многу деца, но тој има само две деца):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human, manyChildren
   Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John

Дали оваа онтологија ќе биде неконзистентна (што може да се толкува како доказ за невалидни податоци)? Прифаќањето на OWA ќе предизвика моторот за заклучување да одговори негативно: „некаде“ на друго место (во друга онтологија) може добро да се каже дека Керол е исто така дете на Џон.

За да ја исклучиме можноста за ова, да додадеме нов факт за Џон:

Individual: John
   Facts: hasChild Alice, hasChild Bob, not hasChild Carol

За да се исклучи појавата на други деца, да речеме дека сите вредности на имотот „има дете“ се луѓе, од кои имаме само четири:

ObjectProperty: hasChild
   Domain: Human
   Сharacteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }

Сега онтологијата ќе стане контрадикторна, што моторот за заклучување нема да пропушти да го пријави. Со последната од аксиомите, во извесна смисла, го „затворивме“ светот и забележуваме како е исклучена можноста Јован да биде негово дете.

Поврзување на податоците на претпријатието

Збирот на пристапи и технологии поврзани со податоци првично беше наменет за објавување податоци на Интернет. Нивната употреба во внатрешно корпоративно опкружување се соочува со голем број тешкотии.

На пример, во затворено корпоративно опкружување, дедуктивната моќ на OWL заснована на усвојување на OWA и отфрлање на UNA, одлуки поради отворената и дистрибуирана природа на Интернет, е премногу слаба. И тука се можни следните решенија.

  • Давање на OWL со семантика, што подразбира напуштање на OWA и усвојување на UNA, имплементација на соодветниот излезен мотор. - По овој пат оди Stardog RDF складирање.
  • Напуштање на дедуктивните способности на OWL во корист на моторите со правила. - Стардог поддржува SWRL; Понуда на Jena и GraphDB свој јазици правила
  • Одбивање на дедуктивните способности на OWL, употреба на едно или друго подмножество блиску до RDFS за моделирање. - Погледнете повеќе за ова подолу.

Друг проблем е поголемиот фокус што корпоративниот свет може да го има на проблемите со квалитетот на податоците и недостатокот на алатки за валидација на податоците во стекот Поврзани податоци. Излезите овде се како што следува.

  • Повторно, користете за валидација на OWL конструкции со семантика од затворен свет и единствени имиња доколку е достапен соодветен мотор за заклучоци.
  • Користете ШАКЛ, стандардизиран откако ќе се поправат слоевите на семантички веб-слоеви на торта (сепак, може да се користи и како мотор со правила), или SheEx.
  • Разбирање дека сè на крајот се прави со SPARQL барања, создавајќи свој едноставен механизам за валидација на податоци користејќи ги.

Сепак, дури и целосното отфрлање на дедуктивните способности и алатките за валидација ги остава поврзаните податоци надвор од конкуренција во задачите што се слични по пејзаж на отворената и дистрибуирана мрежа - во задачите за интеграција на податоци.

Што е со редовниот информациски систем на претпријатието?

Ова е можно, но, се разбира, треба да знаете кои точно проблеми ќе треба да ги решат соодветните технологии. Овде ќе опишам типична реакција на учесниците во развојот за да покажам како изгледа овој технолошки оџак од гледна точка на конвенционалната ИТ. Ме потсетува малку на параболата за слонот:

  • Бизнис аналитичар: RDF е нешто како директно складиран логички модел.
  • Системски аналитичар: RDF е како ЕАВ, само со еден куп индекси и удобен јазик за пребарување.
  • Инвеститорот: Па, сето ова е во духот на концептите на богат модел и низок код, читаше неодамна за ова.
  • Менаџер на проект: да исто е уривање на оџакот!

Практиката покажува дека стекот најчесто се користи во задачи поврзани со дистрибуција и хетерогеност на податоците, на пример, кога се градат системи за класа MDM (Master Data Management) или DWH (Data Warehouse). Вакви проблеми постојат во секоја индустрија.

Во однос на апликациите специфични за индустријата, технологиите за поврзани податоци моментално се најпопуларни во следните индустрии.

  • биомедицински технологии (каде што нивната популарност се чини дека е поврзана со сложеноста на доменот);

струја

„Точка на вриење“ неодамна беше домаќин на конференција организирана од здружението „Национална медицинска база на знаење“Комбинирање на онтологии. Од теорија до практична примена".

  • производство и работа на сложени производи (големо машинско инженерство, производство на нафта и гас; најчесто станува збор за стандардни ISO 15926);

струја

И овде, причината е сложеноста на предметната област, кога, на пример, во фазата нагоре, ако зборуваме за индустријата за нафта и гас, едноставното сметководство бара некои CAD функции.

Во 2008 година се одржа репрезентативен настан за инсталација, организиран од Шеврон конференцијата.

ISO 15926, на крајот, се чинеше малку тежок за индустријата за нафта и гас (и најде можеби поголема примена во механичкото инженерство). Само Statoil (Equinor) целосно се закачи на него, во Норвешка, целина екосистем. Други се обидуваат да си го направат своето. На пример, според гласините, домашното Министерство за енергетика има намера да создаде „концептуален онтолошки модел на комплексот гориво и енергија“, сличен, очигледно, на создадена за електроенергетската индустрија.

  • финансиски организации (дури и XBRL може да се смета за еден вид хибрид на SDMX и онтологијата RDF Data Cube);

струја

На почетокот на годината, LinkedIn активно го спамираше авторот со слободни работни места од речиси сите гиганти на финансиската индустрија, кои ги познава од ТВ сериите „Виша сила“: Голдман Сакс, Џеј-Пи Морган Чејс и/или Морган Стенли, Велс Фарго, SWIFT/Visa/Mastercard, Bank of America, Citigroup, Fed, Deutsche Bank... Веројатно сите бараа некого на кого би можеле да му испратат Конференција за графикони на знаење. Доста успеаја да најдат: финансиските организации презедоа сè утро на првиот ден.

На HeadHunter, само Сбербанк наиде на нешто интересно; се работи за „складирање EAV со модел на податоци сличен на RDF“.

Веројатно, разликата во степенот на љубов кон соодветните технологии на домашните и западните финансиски институции се должи на транснационалната природа на активностите на вторите. Очигледно, интеграцијата преку државните граници бара квалитативно различни организациски и технички решенија.

  • системи за прашања-одговори со комерцијални апликации (IBM Watson, Apple Siri, Google Knowledge Graph);

струја

Патем, креаторот на Siri, Томас Грубер, е автор на самата дефиниција на онтологијата (во ИТ смисла) како „спецификација за концептуализација“. Според мене, преуредувањето на зборовите во оваа дефиниција не го менува неговото значење, што можеби укажува дека го нема.

  • објавување на структурирани податоци (со поголемо оправдување ова може да се припише на Поврзани отворени податоци).

струја

Големи обожаватели на Поврзани податоци се таканаречените GLAM: галерии, библиотеки, архиви и музеи. Доволно е да се каже дека Библиотеката на Конгресот промовира замена за MARC21 BIBRAMEКои обезбедува основа за иднината на библиографскиот опис и, се разбира, врз основа на RDF.

Википодатоците често се наведуваат како пример за успешен проект во областа на Поврзани отворени податоци - еден вид машински читлива верзија на Википедија, чија содржина, за разлика од DBPedia, не се генерира со увоз од инфокутии за статии, туку е создаден повеќе или помалку рачно (и последователно станува извор на информации за истите инфокутии).

Ви препорачуваме и да го проверите листа корисници на складиштето на Stardog RDF на веб-страницата на Stardog во делот „Клиенти“.

Како и да е, во Гартнер Hype Cycle for Emerging Technologies 2016 „Enterprise Taxonomy and Ontology Management“ е поставен на средината на спуштањето во долината на разочарувањето со изгледи да се достигне „плато на продуктивноста“ не порано од 10 години.

Поврзување на податоците на претпријатието

Прогнози, прогнози, прогнози...

Од историски интерес, табеларно ги наведов подолу предвидувањата на Гартнер за различни години за технологиите што нè интересираат.

Година Технология Извештај Позиција Години до плато
2001 Семантичка мрежа Новите технологии Активирање на иновации 5-10
2006 Корпоративна семантичка мрежа Новите технологии Врв на надуени очекувања 5-10
2012 Семантичка мрежа Биг податоци Врв на надуени очекувања > 10
2015 Поврзани податоци Напредна аналитика и наука за податоци Коритото на разочарување 5-10
2016 Управување со онтологијата на претпријатијата Новите технологии Коритото на разочарување > 10
2018 Графикони на знаење Новите технологии Активирање на иновации 5-10

Сепак, веќе во „Хајп циклус...“ 2018 година се појави уште еден нагорен тренд - Графикони на знаење. Се случи одредена реинкарнација: графиконите DBMS, на кои се покажа дека е префрлено вниманието на корисниците и напорите на програмерите, под влијание на барањата на првите и навиките на вторите, почнаа да ги заземаат контурите и позиционирањето. на нивните претходници конкуренти.

Речиси секој графикон DBMS сега се декларира како соодветна платформа за градење на корпоративен „график на знаење“ („поврзаните податоци“ понекогаш се заменуваат со „поврзани податоци“), но колку се оправдани таквите тврдења?

Базите на податоци со графикони сè уште се асемантични; податоците во графиконот DBMS сè уште се истиот силос на податоци. Идентификаторите на стринг наместо URI ја прават задачата за интегрирање на два графички DBMS сè уште задача за интеграција, додека интегрирањето на две RDF складишта често се сведува на едноставно спојување на два RDF графика. Друг аспект на асемантичноста е нерефлексивноста на моделот на графиконот LPG, што го отежнува управувањето со метаподатоците со користење на истата платформа.

Конечно, графичките DBMS немаат мотори за заклучување или мотори со правила. Резултатите од таквите мотори може да се репродуцираат со комплицирање на прашања, но тоа е можно дури и во SQL.

Сепак, водечките системи за складирање RDF немаат потешкотии да го поддржат моделот LPG. Најцврстиот пристап се смета за оној предложен во Блазеграф: моделот RDF*, кој комбинира RDF и LPG.

Повеќе

Можете да прочитате повеќе за поддршката за складирање RDF за моделот LPG во претходната статија на Habré: „Што се случува со складирањето RDF сега“. Се надевам дека еден ден ќе биде напишана посебна статија за графиконите на знаење и податочната ткаенина. Последниот дел, како што е лесно да се разбере, беше напишан набрзина, но, дури и шест месеци подоцна, сè не е многу појасно со овие концепти.

Литература

  1. Halpin, H., Monnin, A. (eds.) (2014). Филозофско инженерство: кон филозофија на веб
  2. Алеманг, Д., Хендлер, Ј. (2011) Семантичка мрежа за работниот онтолог (второ издание)
  3. Staab, S., Studer, R. (eds.) (2009) Прирачник за онтологии (второ издание)
  4. Wood, D. (уред.). (2011) Поврзување на податоци за претпријатијата
  5. Keet, M. (2018) Вовед во онтолошкото инженерство

Извор: www.habr.com

Додадете коментар