Семантичка мрежа и повезани подаци. Исправке и допуне

Желео бих да представим јавности део ове недавно објављене књиге:

Онтолошко моделирање предузећа: методе и технологије [Текст]: монографија / [С. В. Горшков, С. С. Кралин, О. И. Мусхтак и други; извршни уредник С.В. Горшков]. - Јекатеринбург: Издавачка кућа Уралског универзитета, 2019. - 234 стр.: илустр., табела; 20 цм - Аутор. назначено на задњој сиси. Витх. — Библиографија на крају гл. — ИСБН 978-5-7996-2580-1: 200 примерака.

Сврха постављања овог фрагмента на Хабре је четворострука:

  • Мало је вероватно да ће неко моћи да држи ову књигу у рукама ако није клијент уваженог СергеИндек; Дефинитивно није у продаји.
  • Извршене су исправке у тексту (нису истакнуте у наставку) и допуне које нису баш компатибилне са форматом штампане монографије: актуелне напомене (испод спојлера) и хиперлинкови.
  • Желим да прикупља питања и коментаре, како бисмо их узели у обзир приликом укључивања овог текста у ревидираном облику у било које друге публикације.
  • Многи присталице семантичког веба и повезаних података и даље верују да је њихов круг тако узак, углавном зато што широј јавности још није на прави начин објашњено колико је сјајно бити присталица семантичког веба и повезаних података. Аутор фрагмента, иако припада овом кругу, не заступа овакво мишљење, али се, ипак, сматра обавезним да учини још један покушај.

Дакле,

Семантички веб

Еволуција Интернета се може представити на следећи начин (или говорити о његовим сегментима који су формирани у доле наведеном редоследу):

  1. Документи на Интернету. Кључне технологије - Гопхер, ФТП, итд.
    Интернет је глобална мрежа за размену локалних ресурса.
  2. Интернет документи. Кључне технологије су ХТМЛ и ХТТП.
    Природа изложених ресурса узима у обзир карактеристике њиховог преносног медија.
  3. Интернет подаци. Кључне технологије - РЕСТ и СОАП АПИ, КСХР итд.
    У ери интернет апликација не само да људи постају потрошачи ресурса.
  4. Интернет подаци. Кључне технологије су технологије повезаних података.
    Ова четврта фаза, коју је предвидео Бернерс-Ли, творац технологије другог језгра и директор В3Ц, назива се семантичком вебом; Технологије повезаних података су дизајниране да учине податке на вебу не само машински читљивим, већ и „машински разумљивим“.

Из онога што следи, читалац ће разумети кореспонденцију између кључних концепата друге и четврте фазе:

  • УРЛ адресе су аналогне УРИ-овима,
  • аналог ХТМЛ-а је РДФ,
  • ХТМЛ хипервезе су сличне УРИ појављивању у РДФ документима.

Семантичка мрежа је више системска визија будућности Интернета него специфични спонтани или лобирани тренд, иако ово последње може узети у обзир. На пример, сматра се да је важна карактеристика онога што се назива Веб 2.0 „садржај који генеришу корисници“. Конкретно, препорука В3Ц је позвана да то узме у обзир „Онтологија веб анотација„и такав подухват као Солидан.

Да ли је семантички веб мртав?

Ако одбијете нереална очекивања, ситуација са семантичком мрежом је приближно иста као и са комунизмом у време развијеног социјализма (а да ли се поштује лојалност Иличевим условним зељама, свако нека одлучи сам). Претраживачи прилично успешан присиљавају веб-сајтове да користе РДФа и ЈСОН-ЛД и сами користе технологије које се односе на оне које су описане у наставку (Гоогле Граф знања, Бинг Графикон знања).

Уопштено говорећи, аутор не може да каже шта спречава ширење, али може да говори на основу личног искуства. Постоје проблеми који би се могли решити „из кутије“ у условима ЈЗ офанзиве, иако нису много распрострањени. Као резултат тога, они који су суочени са овим задацима немају средства принуде према онима који су у стању да дају решење, док је њихово самостално пружање решења у супротности са њиховим пословним моделима. Тако да настављамо да анализирамо ХТМЛ и спајамо разне АПИ-је, једни друге усраније.

Међутим, технологије повезаних података прошириле су се изван главног тока Веба; Књига је, заправо, посвећена овим применама. Тренутно, заједница повезаних података очекује да ће ове технологије постати још раширеније захваљујући Гартнер-овом снимању (или проглашењу, како желите) трендова као што су Графикони знања и Дата Фабриц. Желео бих да верујем да неће бити успешне имплементације ових концепата на „бициклима“, већ оне које се односе на стандарде В3Ц о којима се говори у наставку.

Повезани подаци

Бернерс-Лее је дефинисао повезане податке као семантички веб „урађен како треба“: скуп приступа и технологија који му омогућавају да постигне своје крајње циљеве. Основни принципи повезаних података Бернерс-Лее истакнуто Следећи.

Принцип 1. Коришћење УРИ-ја за именовање ентитета.

УРИ су глобални идентификатори ентитета за разлику од локалних идентификатора стрингова за уносе. Након тога, овај принцип је најбоље изражен у слогану Гоогле Кновледге Грапх „ствари, а не жице'.

Принцип 2. Коришћење УРИ-ја у ХТТП шеми тако да се могу дереференцирати.

Позивањем на УРИ, требало би да буде могуће добити означено иза тог означитеља (аналогија са именом оператора је овде јасна).*" у Ц); тачније, да добијемо неку репрезентацију овог означеног - у зависности од вредности ХТТП заглавља Accept:. Можда ће са доласком АР/ВР ере бити могуће добити сам ресурс, али за сада ће највероватније то бити РДФ документ, који је резултат извршавања СПАРКЛ упита DESCRIBE.

Принцип 3. Коришћење В3Ц стандарда – првенствено РДФ(С) и СПАРКЛ – посебно када се дереференцирају УРИ-ји.

Ови појединачни „слојеви“ стека технологије повезаних података, такође познати као Семантички веб слој, биће описано у наставку.

Принцип 4. Употреба референци на друге УРИ-је при описивању ентитета.

РДФ вам омогућава да се ограничите на вербални опис ресурса на природном језику, а четврти принцип позива да то не радите. Ако се први принцип универзално поштује, постаје могуће приликом описивања извора упућивати на друге, укључујући и „стране“, због чега се подаци називају повезаним. У ствари, скоро је неизбежно користити УРИ-је именоване у РДФС речнику.

РДФ

РДФ (Ресоурце Десцриптион Фрамеворк) је формализам за описивање међусобно повезаних ентитета.

О ентитетима и њиховим односима дају се изјаве типа „субјект-предикат-објекат“, које се називају тројке. У најједноставнијем случају, субјект, предикат и објекат су сви УРИ. Исти УРИ може бити на различитим позицијама у различитим триплетима: бити субјект, предикат и објекат; Дакле, тројке формирају неку врсту графа који се зове РДФ граф.

Субјекти и објекти могу бити не само УРИ, већ и тзв празни чворови, а објекти такође могу бити литерали. Литерали су примери примитивних типова који се састоје од стринг репрезентације и индикације типа.

Примери писања литерала (у Туртле синтакси, више о томе у наставку): "5.0"^^xsd:float и "five"^^xsd:string. Литерали са типом rdf:langString такође може бити опремљен језичком ознаком; у Туртле је написано овако: "five"@en и "пять"@ru.

Празни чворови су „анонимни“ ресурси без глобалних идентификатора, о којима се, међутим, могу дати изјаве; врста егзистенцијалних варијабли.

Дакле (ово је, у ствари, цела поента РДФ-а):

  • предмет је УРИ или празан чвор,
  • предикат је УРИ,
  • објекат је УРИ, празан чвор или литерал.

Зашто предикати не могу бити празни чворови?

Вероватан разлог је жеља да се неформално разуме и преведе триплет на језик предикатске логике првог реда. s p o као нешто слично Семантичка мрежа и повезани подаци. Исправке и допунеГде Семантичка мрежа и повезани подаци. Исправке и допуне - предикат, Семантичка мрежа и повезани подаци. Исправке и допуне и Семантичка мрежа и повезани подаци. Исправке и допуне - константе. Трагови овог схватања налазе се у документу „ЛБасе: Семантика за језике семантичког веба“, који има статус белешке радне групе В3Ц. Са овим схватањем, тројка s p []Где [] - празан чвор, биће преведен као Семантичка мрежа и повезани подаци. Исправке и допунеГде Семантичка мрежа и повезани подаци. Исправке и допуне - променљива, али како онда превести s [] o? Документ са статусом В3Ц препоруке "РДФ 1.1 Семантика” нуди другу методу превођења, али и даље не разматра могућност да предикати буду празни чворови.

Међутим, Ману Спорни дозвољен.

РДФ је апстрактни модел. РДФ се може написати (серијски) у различитим синтаксама: РДФ/КСМЛ, Корњача (људски најчитљивији), ЈСОН-ЛД, ХДТ (бинарни).

Исти РДФ се може серијаловати у РДФ/КСМЛ на различите начине, тако да, на пример, нема смисла валидирати резултујући КСМЛ користећи КССД или покушавати да издвојите податке користећи КСПатх. Слично томе, мало је вероватно да ће ЈСОН-ЛД задовољити жељу просечног Јавасцрипт програмера да ради са РДФ-ом користећи Јавасцрипт нотацију тачкама и угластим заградама (иако се ЈСОН-ЛД креће у том правцу нудећи механизам кадрирање).

Већина синтаксе нуди начине за скраћивање дугих УРИ-ја. На пример, оглас @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> у Туртле ће вам тада омогућити да пишете уместо тога <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> само rdf:type.

РДФС

РДФС (РДФ шема) – основни речник моделирања, уводи концепте својства и класе и својства као нпр. rdf:type, rdfs:subClassOf, rdfs:domain и rdfs:range. Користећи РДФС речник, на пример, могу се написати следећи важећи изрази:

rdf:type         rdf:type         rdf:Property .
rdf:Property     rdf:type         rdfs:Class .
rdfs:Class       rdfs:subClassOf  rdfs:Resource .
rdfs:subClassOf  rdfs:domain      rdfs:Class .
rdfs:domain      rdfs:domain      rdf:Property .
rdfs:domain      rdfs:range       rdfs:Class .
rdfs:label       rdfs:range       rdfs:Literal .

РДФС је речник описа и моделирања, али није језик ограничења (иако званична спецификација и оставља могућност такве употребе). Реч „Шема“ не треба разумети у истом смислу као у изразу „КСМЛ шема“. На пример, :author rdfs:range foaf:Person значи да rdf:type све вредности имовине :author - foaf:Person, али не значи да то треба унапред рећи.

СПАРКЛ

СПАРКЛ (СПАРКЛ Протоцол и РДФ Куери Лангуаге) – језик за упите РДФ података. У једноставном случају, СПАРКЛ упит је скуп узорака са којима се упарују триплети графа који се испитује. Обрасци могу садржати променљиве на позицији субјекта, предиката и објекта.

Упит ће вратити такве променљиве вредности које, када се замене у узорке, могу да доведу до подграфа упитаног РДФ графа (подскуп његових тројки). Променљиве истог имена у различитим узорцима тројки морају имати исте вредности.

На пример, с обзиром на горњи скуп од седам РДФС аксиома, следећи упит ће се вратити rdfs:domain и rdfs:range као вредности ?s и ?p редом:

SELECT * WHERE {
 ?s ?p rdfs:Class .
 ?p ?p rdf:Property .
}

Вреди напоменути да је СПАРКЛ декларативни и није језик за описивање обиласка графова (међутим, нека РДФ спремишта нуде начине за прилагођавање плана извршења упита). Због тога се неки стандардни проблеми са графом, на пример, проналажење најкраће путање, не могу решити у СПАРКЛ-у, укључујући коришћење путеви имовине (али, опет, појединачна РДФ спремишта нуде посебна проширења за решавање ових проблема).

СПАРКЛ не дели претпоставку отворености света и следи приступ „негација као неуспех“, у коме могуће дизајни као што су FILTER NOT EXISTS {…}. Дистрибуција података се узима у обзир коришћењем механизма федерални упити.

СПАРКЛ приступна тачка – РДФ складиште способно за обраду СПАРКЛ упита – нема директних аналога из друге фазе (погледајте почетак овог пасуса). Може се упоредити са базом података, на основу чијег садржаја су генерисане ХТМЛ странице, али доступна споља. СПАРКЛ приступна тачка је аналогнија АПИ приступној тачки из треће фазе, али са две главне разлике. Прво, могуће је комбиновати неколико „атомских“ упита у један (што се сматра кључном карактеристиком ГрапхКЛ-а), а друго, такав АПИ је потпуно самодокументован (што је ХАТЕОАС покушао да постигне).

Полемичка примедба

РДФ је начин објављивања података на вебу, тако да РДФ складиште треба сматрати ДБМС документом. Истина, пошто је РДФ граф а не дрво, испоставило се да су и они засновани на графу. Невероватно је да је то уопште успело. Ко би рекао да ће бити паметних људи који ће имплементирати празне чворове. Цодд је овде није успело.

Постоје и мање потпуни начини за организовање приступа РДФ подацима, на пример, Повезани фрагменти података (ЛДФ) и Повезана платформа података (ЛДП).

ОВЛ

ОВЛ (Веб Онтологи Лангуаге) - формализам за представљање знања, синтаксичка верзија логике описа Семантичка мрежа и повезани подаци. Исправке и допуне (свуда испод је исправније рећи ОВЛ 2, прва верзија ОВЛ-а је заснована на Семантичка мрежа и повезани подаци. Исправке и допуне).

Концепти дескриптивне логике у ОВЛ одговарају класама, улоге одговарају својствима, појединци задржавају своје претходно име. Аксиоми се такође називају аксиоми.

На пример, у тзв Манчестерска синтакса за ОВЛ нотацију нам већ познат аксиом Семантичка мрежа и повезани подаци. Исправке и допуне биће написано овако:

Class: Human
Class: Parent
   EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent

Постоје и друге синтаксе за писање ОВЛ-а, као нпр функционална синтакса, који се користи у званичној спецификацији, и ОВЛ/КСМЛ. Додатно, ОВЛ се може серијализирати да апстрактно РДФ синтаксу и даље – у било којој од специфичних синтакса.

ОВЛ има двоструки однос са РДФ-ом. С једне стране, може се сматрати неком врстом речника који проширује РДФС. С друге стране, то је моћнији формализам за који је РДФ само формат серијализације. Не могу се све елементарне ОВЛ конструкције написати користећи један РДФ триплет.

У зависности од тога који подскуп ОВЛ конструкција је дозвољено користити, они говоре о тзв ОВЛ профилес. Стандардизоване и најпознатије су ОВЛ ЕЛ, ОВЛ РЛ и ОВЛ КЛ. Избор профила утиче на рачунску сложеност типичних проблема. Комплетан скуп ОВЛ конструкција који одговарају Семантичка мрежа и повезани подаци. Исправке и допуне, под називом ОВЛ ДЛ. Понекад се говори и о ОВЛ Фулл, у коме је дозвољено коришћење ОВЛ конструкција са пуном слободом својственом РДФ-у, без семантичких и рачунских ограничења Семантичка мрежа и повезани подаци. Исправке и допуне. На пример, нешто може бити и класа и својство. ОВЛ Фулл је неодлучиво.

Кључни принципи за приписивање последица у ОВЛ су усвајање претпоставке отвореног света. ОВА) и одбацивање претпоставке јединствених имена (претпоставка јединственог имена, ОНЕ). У наставку ћемо видети где ови принципи могу да доведу и увести неке ОВЛ конструкције.

Нека онтологија садржи следећи фрагмент (у синтакси из Манчестера):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human
   Facts: hasChild Alice, hasChild Bob, hasChild Carol

Да ли ће из реченог следити да Јован има много деце? Одбијање УНА ће приморати механизам закључивања да негативно одговори на ово питање, пошто Алис и Боб могу бити иста особа. Да би се десило следеће, мораћете да додате следећи аксиом:

DifferentIndividuals: Alice, Bob, Carol, John

Нека сада фрагмент онтологије има следећи облик (Џон је проглашен за много деце, али има само двоје деце):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human, manyChildren
   Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John

Да ли ће ова онтологија бити недоследна (што се може протумачити као доказ неважећих података)? Прихватање ОВА ће довести до тога да механизам закључивања одговори негативно: „негде другде” (у другој онтологији) може се рећи да је Керол такође Џоново дете.

Да бисмо искључили могућност овога, додајмо нову чињеницу о Џону:

Individual: John
   Facts: hasChild Alice, hasChild Bob, not hasChild Carol

Да бисмо искључили појаву друге деце, рецимо да су све вредности имовине „имати дете“ људи, којих имамо само четири:

ObjectProperty: hasChild
   Domain: Human
   Сharacteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }

Сада ће онтологија постати контрадикторна, што механизам закључивања неће пропустити да пријави. Последњим од аксиома смо, у извесном смислу, „затворили” свет и приметимо како је искључена могућност да Јован буде његово дете.

Повезивање података предузећа

Скуп приступа и технологија повезаних података првобитно је био намењен објављивању података на вебу. Њихова употреба у интерном корпоративном окружењу суочава се са бројним потешкоћама.

На пример, у затвореном корпоративном окружењу, дедуктивна моћ ОВЛ-а заснована на усвајању ОВА и одбијању УНА, одлука због отворене и дистрибуиране природе Веба, је преслаба. И овде су могућа следећа решења.

  • Обдаривање ОВЛ семантиком, што подразумева напуштање ОВА и усвајање УНА, имплементацију одговарајућег излазног мотора. - На овој стази иде Стардог РДФ складиште.
  • Напуштање ОВЛ-ових дедуктивних способности у корист механизама за правила. — Звездани пас подржава СВРЛ; Јена и ГрапхДБ понуда сопствени језика Правила
  • Одбијање дедуктивних могућности ОВЛ-а, коришћење једног или другог подскупа блиског РДФС-у за моделирање. - Видите више о овоме у наставку.

Други проблем је већи фокус који корпоративни свет може имати на проблеме квалитета података и недостатак алата за валидацију података у стеку повезаних података. Излази овде су следећи.

  • Опет, користите за валидацију ОВЛ конструкција са затвореним светским семантиком и јединственим именима ако је доступан одговарајући механизам закључивања.
  • Коришћење СХАЦЛ, стандардизован након што је листа слојева колача семантичког веба поправљена (међутим, може се користити и као механизам за правила), или СхЕк.
  • Разумевање да се све на крају ради са СПАРКЛ упитима, креирајући сопствени једноставан механизам за валидацију података користећи их.

Међутим, чак и потпуно одбацивање дедуктивних могућности и алата за валидацију оставља скуп повезаних података ван конкуренције у задацима који су у пејзажу слични отвореном и дистрибуираном вебу - у задацима интеграције података.

Шта је са редовним информационим системом предузећа?

Ово је могуће, али морате, наравно, бити свесни тачно које проблеме ће одговарајуће технологије морати да реше. Овде ћу описати типичну реакцију учесника у развоју да покажу како ова технолошка група изгледа са становишта конвенционалног ИТ-а. Мало ме подсећа на параболу о слону:

  • Пословни аналитичар: РДФ је нешто попут директно ускладиштеног логичког модела.
  • Системи аналитичар: РДФ је као ЕАВ, само са гомилом индекса и погодним језиком за упите.
  • Програмер: па, ово је све у духу концепата богатог модела и ниског кода, Је читао недавно о овоме.
  • Вођа пројекта: да исто је срушивши стог!

Пракса показује да се стек најчешће користи у задацима који се односе на дистрибуцију и хетерогеност података, на пример, при изградњи система класа МДМ (Мастер Дата Манагемент) или ДВХ (Дата Варехоусе). Такви проблеми постоје у било којој индустрији.

Што се тиче апликација специфичних за индустрију, технологије повезаних података су тренутно најпопуларније у следећим индустријама.

  • биомедицинске технологије (где се чини да је њихова популарност повезана са сложеношћу домена);

Тренутни

„Тачка кључања“ је недавно била домаћин конференције коју је организовало удружење „Национална база медицинског знања“Комбиновање онтологија. Од теорије до практичне примене'.

  • производња и експлоатација сложених производа (велико машинство, производња нафте и гаса; најчешће је реч о стандардним ИСО КСНУМКС);

Тренутни

И овде је разлог сложеност предметне области, када, на пример, у узводној фази, ако говоримо о индустрији нафте и гаса, једноставно рачуноводство захтева неке ЦАД функције.

2008. године одржана је репрезентативна инсталација коју је организовао Цхеврон конференција.

ИСО 15926 је, на крају, деловао мало тежак за индустрију нафте и гаса (и нашао је можда већу примену у машинству). Само се Статоил (Екуинор) у потпуности навукао на њега; у Норвешкој, цео екосистем. Други покушавају да ураде своје. На пример, према гласинама, домаће Министарство енергетике намерава да направи „концептуални онтолошки модел комплекса горива и енергије“, сличан, очигледно, створена за електропривреду.

  • финансијске организације (чак се и КСБРЛ може сматрати неком врстом хибрида СДМКС и РДФ Дата Цубе онтологије);

Тренутни

ЛинкедИн је почетком године аутору активно слао слободна радна места из готово свих гиганата финансијске индустрије, које познаје из ТВ серије „Виша сила“: Голдман Сакс, ЈПМорган Цхасе и/или Морган Станлеи, Веллс Фарго, СВИФТ/Виса/Мастерцард, Банк оф Америца, Цитигроуп, Фед, Деутсцхе Банк... Вероватно су сви тражили некога коме могу послати Конференција о графу знања. Неколицина је успела да пронађе: финансијске организације су узеле све ујутро првог дана.

На ХеадХунтер-у је само Сбербанка наишла на нешто занимљиво; радило се о „ЕАВ складишту са моделом података сличним РДФ-у“.

Вероватно је разлика у степену љубави према одговарајућим технологијама домаћих и западних финансијских институција последица транснационалне природе активности ових последњих. Очигледно, интеграција преко државних граница захтева квалитативно другачија организациона и техничка решења.

  • системи питања-одговори са комерцијалним апликацијама (ИБМ Ватсон, Аппле Сири, Гоогле Кновледге Грапх);

Тренутни

Иначе, творац Сири-а, Томас Грубер, аутор је саме дефиниције онтологије (у ИТ смислу) као „спецификације концептуализације“. По мом мишљењу, преуређивање речи у овој дефиницији не мења њено значење, што можда указује да га нема.

  • објављивање структурираних података (са већим оправдањем то се може приписати повезаним отвореним подацима).

Тренутни

Велики љубитељи повезаних података су такозвани ГЛАМ: галерије, библиотеке, архиви и музеји. Довољно је рећи да Конгресна библиотека промовише замену за МАРЦ21 БИБФРАМЕКоји пружа основу за будућност библиографског описа и, наравно, на основу РДФ-а.

Викидата се често наводи као пример успешног пројекта у области повезаних отворених података – својеврсне машински читљиве верзије Википедије, чији садржај, за разлику од ДБПедиа, није генерисан увозом из инфокутија чланака, већ се креиран мање-више ручно (и накнадно постаје извор информација за исте инфокутије).

Такође вам препоручујемо да то проверите списак корисници Стардог РДФ складишта на веб локацији Стардог у одељку „Купци“.

Било како било, у Гартнеру Хипе Цицле фор Емергинг Тецхнологиес 2016 „Управљање таксономијом и онтологијом предузећа“ је постављено усред спуштања у долину разочарања са перспективом да достигне „плато продуктивности“ не раније него за 10 година.

Повезивање података предузећа

Прогнозе, прогнозе, прогнозе...

Из историјског интереса, испод сам приказао Гартнерове прогнозе за различите године о технологијама које нас занимају.

Година Технология Извештај Положај Године до платоа
2001 Семантички веб Emerging Technologies Инноватион Триггер 5-10
2006 Корпоративни семантички веб Emerging Technologies Врхунац надуваних очекивања 5-10
2012 Семантички веб Биг података Врхунац надуваних очекивања > КСНУМКС
2015 Повезани подаци Напредна аналитика и наука о подацима Корито разочарања 5-10
2016 Управљање онтологијом предузећа Emerging Technologies Корито разочарања > КСНУМКС
2018 Графикони знања Emerging Technologies Инноватион Триггер 5-10

Међутим, већ у „Хајпе циклус...“ 2018 појавио се још један узлазни тренд – Графови знања. Дошло је до извесне реинкарнације: графички ДБМС, на које се испоставило да су преусмерени пажња корисника и напори програмера, под утицајем захтева првих и навика других, почели су да попримају контуре и позиционирање. од својих претходника конкурената.

Скоро сваки графички ДБМС сада себе проглашава одговарајућом платформом за прављење корпоративног „графа знања“ („повезани подаци“ се понекад замењују „повезаним подацима“), али колико су такве тврдње оправдане?

Графичке базе података су и даље асемантичне; подаци у графичком ДБМС-у су и даље исти силос података. Идентификатори низа уместо УРИ-ја чине задатак интеграције два ДБМС графа и даље интеграцијским задатком, док се интеграција два РДФ складишта често своди на једноставно спајање два РДФ графа. Други аспект асемантичности је нерефлексивност модела ЛПГ графа, што отежава управљање метаподацима користећи исту платформу.

Коначно, графички ДБМС-ови немају механизме за закључивање или механизме правила. Резултати таквих машина могу се репродуковати компликованим упитима, али то је могуће чак и у СКЛ-у.

Међутим, водећи РДФ системи за складиштење немају потешкоћа да подрже ТНГ модел. Најчвршћим приступом се сматра онај који је својевремено предложен у Блазеграпху: РДФ* модел, који комбинује РДФ и ТНГ.

више

Можете прочитати више о РДФ подршци за складиштење за ЛПГ модел у претходном чланку на Хабре: „Шта се сада дешава са РДФ складиштем“. Надам се да ће једног дана бити написан посебан чланак о графовима знања и ткању података. Последњи део, као што је лако разумети, написан је на брзину, међутим, ни шест месеци касније, са овим концептима није све много јасније.

Литература

  1. Халпин, Х., Моннин, А. (ур.) (2014). Филозофски инжењеринг: ка филозофији веба
  2. Аллеманг, Д., Хендлер, Ј. (2011) Семантички веб за радног онтолога (2. изд.)
  3. Стааб, С., Студер, Р. (ур.) (2009) Приручник о онтологијама (2. изд.)
  4. Воод, Д. (ур.). (2011) Повезивање података предузећа
  5. Кеет, М. (2018) Увод у онтолошко инжењерство

Извор: ввв.хабр.цом

Додај коментар