Шта се сада дешава са РДФ складиштем?

Семантичка мрежа и повезани подаци су попут свемира: тамо нема живота. Да идем тамо на мање-више дуг временски период... Не знам шта су ти рекли као детету на „Желим да постанем астронаут“. Али можете посматрати шта се дешава док сте на Земљи; Много је лакше постати астроном аматер или чак професионалац.

Чланак ће се фокусирати на недавне, не старије од неколико месеци, трендове из света РДФ складиштења. Метафора у првом пасусу инспирисана је рекламном сликом епске величине испод реза.


Епска слика

Шта се сада дешава са РДФ складиштем?

И. ГрапхКЛ за РДФ приступ

Они кажуда ГрапхКЛ има за циљ да постане универзални језик за приступ бази података. Шта је са могућношћу приступа РДФ-у користећи ГрапхКЛ?

Изван оквира ову прилику пружају:

Ако спремиште не пружа такву могућност, може се имплементирати независно писањем одговарајућег „ресолвера“. То су урадили, на пример, у француском пројекту ДатаТоурисме. Или више не можете ништа писати, већ само узети ХиперГрапхКЛ.

Са становишта ортодоксног присталица семантичког веба и повезаних података, све је ово, наравно, тужно, јер изгледа дизајнирано за интеграције изграђене око следећег силоса података, а не одговарајућих платформи (РДФ продавнице, наравно) .

Утисци из поређења ГрапхКЛ-а са СПАРКЛ-ом су двоструки.

  • С једне стране, ГрапхКЛ изгледа као далеки рођак СПАРКЛ-а: решава проблеме поновног узорковања и вишеструкости упита који су типични за РЕСТ – без којих, вероватно, не би било могуће размотрити језик упита, барем за веб;
  • С друге стране, крута шема ГрапхКЛ-а је разочаравајућа. Сходно томе, његова „интроспективност“ изгледа веома ограничена у поређењу са пуном рефлексивношћу РДФ-а. И нема аналога путања својстава, тако да није ни јасно зашто је то „Графикон-“.

ИИ. Адаптери за МонгоДБ

Тренд комплементаран претходном.

  • Сада у Стардог-у можда - посебно, све на истом ГрапхКЛ - конфигурисати мапирање МонгоДБ података у виртуелне РДФ графове;
  • Онтотект ГрапхДБ је недавно Он омогућава уметните фрагменте у СПАРКЛ на МонгоДБ упиту.

Ако говоримо шире о адаптерима за ЈСОН изворе, који омогућавају мање-више „у ходу“ да представљају ЈСОН похрањен у овим изворима као РДФ, можемо се присјетити прилично дугогодишњег СПАРКЛ Генерате, који се може подесити, на пример, Апацхе Јена.

Сумирајући прва два тренда, можемо рећи да РДФ складишта показују пуну спремност за интеграцију и рад у условима „полиглотске истрајности“. Познато је, међутим, да је ово друго одавно изашло из моде, и да га замењује долази мулти-модел. Шта је са мулти-моделирањем у свету РДФ складиштења?

Укратко, никако. Желео бих да посветим посебан чланак теми вишемоделних ДБМС-ова, али за сада се може приметити да тренутно не постоје мултимоделни ДБМС „базирани” на моделу графа (РДФ се може сматрати његовом врстом) . Нека мала мулти-моделирања - подршка за РДФ складиштење за алтернативни модел ЛПГ графа - биће разматрана у одељак В.

ИИИ. ОЛТП вс. ОЛАП

Међутим, исти Гартнер пишетај мултимодел је сине куа нон услов првенствено за операционе сале ДБМС. Ово је разумљиво: у ситуацији „мултиваријантног складиштења“ главни проблеми настају са трансакционим.

Али где се налазе РДФ складишта на ОЛТП-ОЛАП скали? Одговорио бих овако: ни тамо ни овамо. Да бисмо назначили чему су намењени, потребна је нека трећа скраћеница. Као опцију бих предложио ОЛИП — Интернетска интелектуална обрада.

Међутим, ипак:

  • механизми интеграције са МонгоДБ имплементираним у ГрапхДБ нису најмање важни намењен да заобиђе проблеме са перформансама писања;
  • Звездани пас иде још даље и потпуно преписује мотор, опет са циљем побољшања перформанси снимања.

Сада ми дозволите да представим новог играча тржишту. Од креатора ИБМ Нетезза и Амазон Редсхифт - АнзоГрапх™. На почетку чланка постављена је слика из рекламе за производ заснован на њој. АнзоГрапх се позиционира као ГОЛАП решење. Како вам се свиђа СПАРКЛ са функцијама прозора? —

SELECT ?month (COUNT(?event) OVER (PARTITION BY ?month) AS ?events) WHERE {  …  }

ИВ. РоцксДБ

Већ више постојала је веза на најаву Стардог 7 Бета, у којој је речено да ће Стардог користити РоцксДБ као основни систем за складиштење - складиште кључ-вредност, Фацебоок форк Гоогле-овог ЛевелДБ-а. Зашто је вредно говорити о одређеном тренду?

Прво, судећи по Чланак на Википедији, не само да се РДФ складишта „трансплантирају“ у РоцксДБ. Постоје пројекти који користе РоцксДБ као механизам за складиштење у АрангоДБ, МонгоДБ, МиСКЛ и МариаДБ, Цассандра.

Друго, пројекти (то јест, не производи) на релевантне теме креирају се на РоцксДБ-у.

На пример, еБаи користи РоцксДБ у платформа за ваш „граф знања“. Узгред, смешно је читати: језик упита је почео као домаћи формат, али је у скорије време постао много више као СПАРКЛ. Као у шали: без обзира колико графикон знања направимо, ипак завршимо са РДФ-ом.

Још један пример - онај који се појавио пре неколико месеци Услуга упита историје Википодатака. Пре његовог увођења, историјским информацијама Википодатака се морало приступити преко МВАПИ на стандардни Медиавики АПИ. Сада је много тога могуће са чистим СПАРКЛ-ом. „Испод хаубе“ се налази и РоцксДБ. Иначе, ВДХКС је, чини се, направила особа која је увезла Фреебасе у Гоогле Кновледге Грапх.

В. Подршка за ТНГ

Дозволите ми да вас подсетим на главну разлику између ЛПГ графикона и РДФ графикона.

У ЛПГ-у, скаларна својства могу бити додељена инстанцама ивица, док се у РДФ-у могу доделити само „типовима“ ивица (али не само скаларним својствима, већ и обичним везама). Ово ограничење РДФ-а у поређењу са ТНГ-ом савладати једну или другу технику моделирања. Ограничења ТНГ-а у поређењу са РДФ-ом је теже превазићи, али ТНГ графикони више личе на слике из Харари уџбеника него РДФ графике, због чега их људи желе.

Очигледно, задатак „подршке за ТНГ“ се дели на два дела:

  1. уношење измена у модел РДФ које омогућавају симулацију ТНГ структура у њему;
  2. уношење промена у РДФ језик упита које омогућавају приступ подацима у овом модификованом моделу, или имплементација могућности да се упити за овај модел у популарним ЛПГ језицима упита.

В.1. Модел података

Овде постоји неколико могућих приступа.

В.1.1. Синглетон Проперти

Вероватно је најбуквалнији приступ хармонизацији РДФ-а и ТНГ-а синглетон проперти:

  • Уместо, на пример, предиката :isMarriedTo користе се предикати :isMarriedTo1, :isMarriedTo2 и тако даље.
  • Ови предикати тада постају субјекти нових тројки: :isMarriedTo1 :since "2013-09-13"^^xsd:date итд
  • Веза ових инстанци предиката са заједничким предикатом успоставља се тројкама облика :isMarriedTo1 rdf:singletonPropertyOf :isMarriedTo.
  • Очигледно rdf:singletonPropertyOf rdfs:subPropertyOf rdf:type, али размисли о томе зашто не би требало само да пишеш :isMarriedTo1 rdf:type :isMarriedTo.

Проблем „подршке за ТНГ“ је овде решен на нивоу РДФС. Таква одлука захтева укључивање у одговарајуће стандарт. Неке промене могу бити потребне за РДФ продавнице које подржавају причвршћивање последица, али за сада, Синглетон Проперти се може сматрати само још једном техником моделирања.

В.1.2. Реифицатион Доне Ригхт

Мање наивни приступи произилазе из схватања да су инстанце својства у потпуности инстанцибилне тројкама. Моћи ћемо да кажемо нешто о тројкама, моћи ћемо да причамо о имовинским инстанцама.

Најснажнији од ових приступа је РДФ*, звани РДР, рођен у дубинама Блејзграфа. То је од самог почетка изабран за себе и АнзоГрапх. Солидност приступа одређује чињеница да се у његовим оквирима нуде се одговарајуће промене у РДФ Семантицс. Поента је, међутим, крајње једноставна. У Туртле серијализацији РДФ-а сада можете написати нешто овако:

<<:bob :isMarriedTo :alice>> :since "2013-09-13"^^xsd:date .

В.1.3. Други приступи

Не можете се замарати формалном семантиком, већ једноставно претпоставити да тројке имају одређене идентификаторе, који су, наравно, УРИ-ји, и креирајте нове тројке са овим УРИ-јима. Остаје само да се омогући приступ овим УРИ-овима у СПАРКЛ-у. Тако stiže Звездани пас.

У Аллегрограпх отишао на средњи начин. Познато је да су триплет идентификатори у Аллегрограпх ту је, али при имплементацији троструких атрибута не стрше. Међутим, још увек је веома далеко од формалне семантике. Важно је напоменути да триплет атрибути нису УРИ, а вредности ових атрибута такође могу бити само литерали. Присталице ЛПГ-а добијају управо оно што желе. У специјално измишљеном НККС формату, пример сличан оном изнад за РДФ* изгледа овако:

:bob :marriedTo :alice {"since" : "2013-09-13"}

В.2. Језици упита

Пошто сте на овај или онај начин подржали ТНГ на нивоу модела, потребно је да омогућите постављање упита о подацима у таквом моделу.

  • Блазеграпх за РДФ* упите подржава СПАРКЛ* и Гремлин. СПАРКЛ* упит изгледа овако:

 SELECT * { <<:bob :isMarriedTo ?wife>> :since ?since }

  • Анзограф такође подржава СПАРКЛ* и подржаће Ципхер, језик упита у Нео4ј.
  • Звездани пас подржава своје експанзија СПАРКЛ анд опет Гремлин. Можете добити триплет УРИ и „мета-информације“ у СПАРКЛ користећи нешто овако:

SELECT * {
    BIND (stardog:identifier(:bob, :isMarriedTo, ?wife) AS ?id)
    ?id :since ?since
}

  • Аллегрограпх такође подржава своје експанзија СПАРКЛ:

 SELECT * { ("since" ?since)  franz:attributesNameValue  ( :bob :marriedTo ?wife ) }

Иначе, ГрапхДБ је својевремено подржавао Тинкерпоп/Гремлин без подршке за ЛПГ, али је то престало у верзији 8.0 или 8.1.

ВИ. Пооштравање лиценци

Није било недавних додатака на пресеку скупова „триплесторе по избору“ и „триплесторе отвореног кода“. Нове РДФ продавнице отвореног кода су далеко од тога да буду добар избор за свакодневну употребу, а нове троструке продавнице које бих желео да користим (као АнзоГрапх) су затвореног кода. Умјесто тога, можемо говорити о смањењу...

Наравно, отворени код није био угашен у прошлости, али се нека складишта отвореног кода полако више не виде као вредна избора. Виртуосо, који има издање отвореног кода, се, по мом мишљењу, дави у баговима. Блазеграпх је купио АВС и чинио је основу Амазон Нептуна; сада је нејасно да ли ће бити још најмање једно издање. Остаје само Јена...

Ако отворени код није много важан, али само желите да га испробате, онда је све мање ружичасто него раније. На пример:

  • Звездани пас прекида дистрибуирати бесплатну верзију (међутим, пробни период обичне верзије се удвостручио);
  • в ГрапхДБ Цлоуд, где сте раније могли да изаберете бесплатни основни план, регистрације нових корисника су обустављене.

Генерално, за просечног информатичара простор постаје све недоступнији, његов развој постаје део посла корпорација.

Извор: ввв.хабр.цом

Додај коментар