セマンティック Web ずリンクされたデヌタ。 修正ず远加

最近出版されたこの本の䞀郚を䞀般に玹介したいず思いたす。

䌁業の存圚論的モデリング: 方法ずテクノロゞヌ [テキスト]: モノグラフ / [S. V. ゎルシコフ、S. S. クラリン、O. I. ムシュタクなど。 ゚グれクティブ゚ディタヌ S.V. ゎルシコフ]。 - ゚カテリンブルク: りラル倧孊出版瀟、2019。 - 234 ペヌゞ: 病気、衚。 20cm - 著者。 裏胞に蚘茉。 ず。 — 参考文献chの最埌に— ISBN 978-5-7996-2580-1: 200 郚。

この断片をハブレに投皿する目的は XNUMX ぀ありたす。

  • 尊敬する人物の顧客でない限り、この本を手に取るこずができる人はいないだろう。 SergeIndex; 確かに非売品ですね。
  • 本文には修正が加えられ (以䞋では匷調衚瀺されおいたせん)、たた、印刷されたモノグラフの圢匏ずあたり互換性のない远加が行われおいたす: トピックノヌト (スポむラヌの䞋) およびハむパヌリンク。
  • したい 質問やコメントを集める、このテキストを他の出版物に改蚂された圢匏で含めるずきにそれらを考慮するためです。
  • セマンティック Web ずリンクト デヌタの支持者の倚くは、自分たちの茪が非垞に狭いず今でも信じおいたす。その䞻な理由は、セマンティック Web ずリンクト デヌタの支持者であるこずがどれほど玠晎らしいこずであるかが䞀般の人々にただ適切に説明されおいないからです。 この断片の著者は、このサヌクルに属しおいたすが、この意芋を持っおいたせんが、それでも、別の詊みをする矩務があるず考えおいたす。

このように、

セマンティックWeb

むンタヌネットの進化は次のように衚すこずができたす (たたは、以䞋に瀺す順序で圢成されたむンタヌネットのセグメントに぀いお話したす)。

  1. むンタヌネット䞊の文曞。 䞻芁なテクノロゞヌ - Gopher、FTP など
    むンタヌネットは、ロヌカル リ゜ヌスを亀換するためのグロヌバル ネットワヌクです。
  2. むンタヌネット文曞。 䞻芁なテクノロゞヌは HTML ず HTTP です。
    公開されるリ゜ヌスの性質には、䌝送媒䜓の特性が考慮されたす。
  3. むンタヌネットデヌタ。 䞻芁なテクノロゞヌ - REST および SOAP API、XHR など
    むンタヌネット アプリケヌションの時代、リ゜ヌスの消費者になるのは人々だけではありたせん。
  4. むンタヌネットデヌタ。 䞻芁なテクノロゞヌは Linked Data テクノロゞヌです。
    この第 3 段階は、第 XNUMX のコア テクノロゞの䜜成者であり WXNUMXC のディレクタヌであるバヌナヌズ リヌによっお予枬されおおり、セマンティック Web ず呌ばれおいたす。 Linked Data テクノロゞヌは、Web 䞊のデヌタを機械が読み取り可胜にするだけでなく、「機械が理解できる」ように蚭蚈されおいたす。

以䞋の内容から、読者は第 XNUMX 段階ず第 XNUMX 段階の重芁な抂念間の察応関係を理解するでしょう。

  • URL は URI に䌌おいたす。
  • HTML の類䌌物は RDF です。
  • HTML ハむパヌリンクは、RDF ドキュメント内の URI の出珟に䌌おいたす。

セマンティック Web は、特定の自発的たたはロビヌ掻動による傟向よりも、むンタヌネットの将来に察する䜓系的なビゞョンですが、埌者を考慮に入れるこずもできたす。 たずえば、Web 2.0 ず呌ばれるものの重芁な特城は、「ナヌザヌ生成コンテンツ」であるず考えられおいたす。 特に、W3C 勧告を考慮するこずが求められおいたす。Web アノテヌション オントロゞヌ「そしおそのような取り組み コヌルテン.

セマンティックりェブは死んだのか?

拒吊した堎合 非珟実的な期埅、セマンティックりェブの状況は、瀟䌚䞻矩が発展した時代の共産䞻矩の状況ずほが同じですそしお、むリむチの条件付き呜什ぞの忠誠が守られるかどうかは、誰もが自分で決めおください。 サヌチ゚ンゞン かなり成功した Web サむトに RDFa ず JSON-LD の䜿甚を匷制し、Web サむト自䜓が以䞋に説明するテクノロゞに関連するテクノロゞ (Google Knowledge Graph、Bing Knowledge Graph) を䜿甚したす。

䞀般論ずしお、著者は䜕がさらなる蔓延を劚げおいるのかを蚀うこずはできたせんが、個人的な経隓に基づいお話すこずはできたす。 それほど広範囲には及ばないものの、南西郚の攻撃状況には「すぐに」解決できる問題がありたす。 結果ずしお、これらの課題に盎面しおいる人々は、解決策を提䟛できる人々に察しお匷制する手段を持たない䞀方で、埌者が独自に解決策を提䟛するこずは圌らのビゞネスモデルに矛盟したす。 そのため、私たちは HTML の解析を続け、さたざたな API を぀なぎ合わせたす。

しかし、Linked Data テクノロゞヌは䞻流の Web を超えお広がりたした。 実際、この本はこれらのアプリケヌションに特化しおいたす。 珟圚、Linked Data コミュニティは、ガヌトナヌによる次のようなトレンドの蚘録 (たたは宣蚀) のおかげで、これらのテクノロゞヌがさらに普及するず期埅しおいたす。 ナレッゞグラフ О デヌタ ファブリック。 私は、これらの抂念の「自転車」実装が成功するのではなく、以䞋で説明する W3C 暙準に関連した実装が成功するず信じたいず思いたす。

リンクされたデヌタ

Berners-Lee は、Linked Data を「正しく行われた」セマンティック Web、぀たり最終目暙の達成を可胜にする䞀連のアプロヌチずテクノロゞであるず定矩したした。 Linked Data の基本原則 バヌナヌズ・リヌ 遞び出された 次の。

原則1。 URI を䜿甚しお゚ンティティに名前を付ける。

URI は、゚ントリのロヌカル文字列識別子ではなく、グロヌバル ゚ンティティ識別子です。 その埌、この原則は Google Knowledge Graph のスロヌガン「文字列ではなく物'。

原則2。 HTTP スキヌムで URI を䜿甚しお、逆参照できるようにしたす。

URI を参照するこずにより、その蚘号衚珟の背埌にある蚘号内容を取埗できるはずです (挔算子 " の名前ずの類掚はここで明らかです)。*「C); より正確には、HTTP ヘッダヌの倀に応じお、これを意味する衚珟を取埗したす。 Accept:。 おそらく、AR/VR 時代の到来により、リ゜ヌス自䜓を取埗できるようになるでしょうが、今のずころ、おそらく、それは SPARQL ク゚リの実行結果である RDF ドキュメントになるでしょう。 DESCRIBE.

原則3。 特に URI を参照解陀する堎合は、W3C 暙準 (䞻に RDF(S) ず SPARQL) を䜿甚したす。

Linked Data テクノロゞヌ スタックのこれらの個々の「レむダヌ」は、別名「レむダヌ」ずも呌ばれたす。 セマンティック Web レむダヌ ケヌキに぀いおは埌述する。

原則4。 ゚ンティティを蚘述する際の他の URI ぞの参照の䜿甚。

RDF を䜿甚するず、リ゜ヌスを自然蚀語で口頭で説明するこずに制限できたすが、XNUMX 番目の原則ではこれを行わないように求められおいたす。 最初の原則が普遍的に守られおいる堎合、リ゜ヌスを蚘述するずきに、「倖郚」リ゜ヌスを含む他のリ゜ヌスを参照するこずが可胜になりたす。これが、デヌタがリンクされおいるず呌ばれる理由です。 実際、RDFS ボキャブラリで指定された URI を䜿甚するこずはほが避けられたせん。

RDF

RDF (リ゜ヌス蚘述フレヌムワヌク) は、盞互に関連する゚ンティティを蚘述するための圢匏䞻矩です。

トリプレットず呌ばれる「䞻語-述語-目的語」タむプのステヌトメントは、゚ンティティずその関係に぀いお䜜成されたす。 最も単玔なケヌスでは、䞻語、述語、目的語はすべお URI です。 同じ URI が、異なるトリプレットの異なる䜍眮に存圚する可胜性がありたす。぀たり、䞻語、述語、目的語になりたす。 したがっお、トリプレットは RDF グラフず呌ばれる䞀皮のグラフを圢成したす。

サブゞェクトずオブゞェクトは URI だけでなく、いわゆる 空のノヌド、オブゞェクトも可胜です リテラル。 リテラルは、文字列衚珟ず型指瀺で構成されるプリミティブ型のむンスタンスです。

リテラルの蚘述䟋 (Turtle 構文の堎合、詳现は以䞋で説明したす): "5.0"^^xsd:float О "five"^^xsd:string。 型付きリテラル rdf:langString 蚀語タグを装備するこずもできたす。Turtle では次のように蚘述されたす。 "five"@en О "пять"@ru.

空のノヌドはグロヌバル識別子のない「匿名」リ゜ヌスですが、それに぀いおはステヌトメントを䜜成できたす。 存圚倉数の䞀皮。

したがっお (実際、これが RDF の芁点です):

  • subject は URI たたは空のノヌドです。
  • 述語は URI であり、
  • object は、URI、空のノヌド、たたはリテラルです。

述語を空のノヌドにできないのはなぜですか?

考えられる理由は、トリプレットを非公匏に理解し、䞀次述語論理の蚀語に翻蚳したいずいう欲求です。 s p o みたいな セマンティック Web ずリンクされたデヌタ。 修正ず远加どこ セマンティック Web ずリンクされたデヌタ。 修正ず远加 - 述語、 セマンティック Web ずリンクされたデヌタ。 修正ず远加 О セマンティック Web ずリンクされたデヌタ。 修正ず远加 - 定数。 この理解の痕跡は文曞の䞭にありたす。LBase: セマンティック Web の蚀語のセマンティクス」、これは W3C ワヌキング グルヌプのメモのステヌタスを持っおいたす。 このように理解するず、トリプレットは、 s p []どこ [] - 空のノヌドは次のように倉換されたす。 セマンティック Web ずリンクされたデヌタ。 修正ず远加どこ セマンティック Web ずリンクされたデヌタ。 修正ず远加 - 倉数ですが、どのように翻蚳するか s [] o? W3C 勧告ステヌタスを含む文曞」RDF 1.1 セマンティクス」は別の倉換方法を提䟛したすが、述語が空のノヌドである可胜性はただ考慮されおいたせん。

しかし、マヌ・スポルニ 蚱可された.

RDF は抜象モデルです。 RDF はさたざたな構文で蚘述する (シリアル化する) こずができたす。 RDF/XML, カメ (人間が刀読できる範囲で最も可読性が高い)、 JSON-LD, HDT バむナリ。

同じ RDF をさたざたな方法で RDF/XML にシリアル化できるため、たずえば、XSD を䜿甚しお結果の XML を怜蚌したり、XPath を䜿甚しおデヌタを抜出しようずしたりするこずは意味がありたせん。 同様に、JSON-LD は、JavaScript のドットず角括匧の衚蚘法を䜿甚しお RDF を操䜜したいずいう平均的な Javascript 開発者の欲求を満たす可胜性は䜎いです (ただし、JSON-LD は、メカニズムを提䟛するこずでその方向に進んでいたす) フレヌミング).

ほずんどの構文には、長い URI を短瞮する方法が甚意されおいたす。 たずえば、広告 @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> Turtle では、代わりに次のように曞くこずができたす。 <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> ちょうど rdf:type.

RDFS

RDFS (RDF スキヌマ) - 基本的なモデリング語圙。プロパティ、クラス、および次のようなプロパティの抂念を導入したす。 rdf:type, rdfs:subClassOf, rdfs:domain О rdfs:range。 たずえば、RDFS ディクショナリを䜿甚するず、次の有効な匏を䜜成できたす。

rdf:type         rdf:type         rdf:Property .
rdf:Property     rdf:type         rdfs:Class .
rdfs:Class       rdfs:subClassOf  rdfs:Resource .
rdfs:subClassOf  rdfs:domain      rdfs:Class .
rdfs:domain      rdfs:domain      rdf:Property .
rdfs:domain      rdfs:range       rdfs:Class .
rdfs:label       rdfs:range       rdfs:Literal .

RDFS は蚘述ずモデリングの語圙ですが、制玄蚀語ではありたせん (ただし、公匏の仕様ず 葉っぱ そのような䜿甚の可胜性がありたす。 「スキヌマ」ずいう蚀葉は、「XML スキヌマ」ずいう衚珟ず同じ意味で理解すべきではありたせん。 䟋えば、 :author rdfs:range foaf:Person ずいう意味です rdf:type すべおのプロパティ倀 :author - foaf:Person, しかし、これは事前に蚀うべきだずいう意味ではありたせん。

SPARQL

SPARQL (SPARQL プロトコルおよび RDF ク゚リ蚀語) - RDF デヌタをク゚リするための蚀語。 単玔なケヌスでは、SPARQL ク゚リは、ク゚リ察象のグラフのトリプレットが照合されるサンプルのセットです。 パタヌンには、䞻語、述語、および目的語の䜍眮に倉数を含めるこずができたす。

ク゚リは、サンプルに代入するず、ク゚リされた RDF グラフのサブグラフ (そのトリプレットのサブセット) が埗られるような倉数倀を返したす。 トリプレットの異なるサンプル内の同じ名前の倉数は、同じ倀を持぀必芁がありたす。

たずえば、䞊蚘の XNUMX ぀の RDFS 公理のセットを考慮するず、次のク゚リは次の倀を返したす。 rdfs:domain О rdfs:range 䟡倀芳ずしお ?s О ?p したがっお

SELECT * WHERE {
 ?s ?p rdfs:Class .
 ?p ?p rdf:Property .
}

SPARQL は宣蚀型であり、グラフ トラバヌサルを蚘述するための蚀語ではないこずに泚意しおください (ただし、䞀郚の RDF リポゞトリではク゚リ実行プランを調敎する方法が提䟛されおいたす)。 したがっお、最短パスの怜玢などの䞀郚の暙準グラフ問題は、SPARQL では解決できたせん。 プロパティパス (ただし、繰り返しになりたすが、個々の RDF リポゞトリは、これらの問題を解決するための特別な拡匵機胜を提䟛しおいたす)。

SPARQL は䞖界のオヌプン性の前提を共有せず、「倱敗ずしおの吊定」アプロヌチに埓いたす。 可胜 などのデザむン FILTER NOT EXISTS {
}。 デヌタ分散を考慮した仕組み フェデレヌションク゚リ.

SPARQL アクセス ポむント (SPARQL ク゚リを凊理できる RDF ストレヌゞ) には、第 XNUMX 段階から盎接類䌌するものはありたせん (この段萜の冒頭を参照)。 これは、HTML ペヌゞが生成された内容に基づいおデヌタベヌスにたずえるこずができたすが、倖郚からアクセスできたす。 SPARQL アクセス ポむントは、第 XNUMX 段階の API アクセス ポむントに䌌おいたすが、䞻に XNUMX ぀の違いがありたす。 第䞀に、耇数の「アトミック」ク゚リを XNUMX ぀に結合するこずが可胜であり (これが GraphQL の重芁な特性ず考えられおいたす)、第二に、そのような API は完党に自己文曞化されおいたす (これが HATEOAS が達成しようずしたこずです)。

論争的な発蚀

RDF は Web 䞊でデヌタを公開する方法であるため、RDF ストレヌゞはドキュメント DBMS ず芋なす必芁がありたす。 確かに、RDF はツリヌではなくグラフであるため、グラフベヌスであるこずも刀明したした。 それがたったくうたくいったのは驚くべきこずです。 空のノヌドを実装する賢い人がいるずは誰が想像したでしょうか。 コッドがここにいたす うたくいかなかった.

RDF デヌタぞのアクセスを敎理するための、あたり機胜が充実しおいない方法もありたす。次に䟋を瀺したす。 リンクされたデヌタフラグメント (LDF)ず リンクドデヌタプラットフォヌム 自民党。

OWL

OWL (Web オントロゞヌ蚀語) - 知識を衚珟するための圢匏䞻矩、蚘述ロゞックの構文バヌゞョン セマンティック Web ずリンクされたデヌタ。 修正ず远加 (以䞋では、OWL 2ず蚀う方が正確です。OWLの最初のバヌゞョンは、OWL XNUMXに基づいおいたした。 セマンティック Web ずリンクされたデヌタ。 修正ず远加).

OWLの蚘述ロゞックの抂念はクラスに察応し、ロヌルはプロパティに察応し、個人は以前の名前を保持したす。 公理は公理ずも呌ばれたす。

たずえば、いわゆる マンチェスタヌ構文 OWL衚蚘の堎合、すでに知られおいる公理 セマンティック Web ずリンクされたデヌタ。 修正ず远加 次のように曞かれたす:

Class: Human
Class: Parent
   EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent

OWLを蚘述するための構文は他にもありたす。 関数構文、公匏仕様で䜿甚されおおり、 OWL/XML。 さらに、OWL はシリアル化できたす。 RDF構文を抜象化する さらに、特定の構文のいずれかで。

OWLはRDFず二重の関係にありたす。 䞀方で、RDFS を拡匵した䞀皮の蟞曞ず考えるこずもできたす。 䞀方、RDF は単なるシリアル化圢匏であるため、RDF はより匷力な圢匏䞻矩です。 すべおの基本的な OWL 構造が単䞀の RDF トリプレットを䜿甚しお蚘述できるわけではありたせん。

OWL構造䜓のどのサブセットの䜿甚が蚱可されおいるかに応じお、それらはいわゆる OWLプロファむル。 暙準化されおおり最も有名なのはOWL EL、OWL RL、OWL QLです。 プロファむルの遞択は、䞀般的な問題の蚈算の耇雑さに圱響したす。 以䞋に察応するOWLコンストラクトの完党なセット セマンティック Web ずリンクされたデヌタ。 修正ず远加、OWL DLず呌ばれたす。 堎合によっおは、意味論的および蚈算䞊の制限なしに、RDF に固有の完党な自由で OWL 構造を䜿甚できる OWL Full に぀いおも話したす。 セマンティック Web ずリンクされたデヌタ。 修正ず远加。 たずえば、䜕かはクラスずプロパティの䞡方になる可胜性がありたす。 OWL Fullは未定。

OWLで結果を付加するための重芁な原則は、オヌプンワヌルドの仮定を採甚するこずです。 OWAおよび䞀意の名前の掚定の拒吊䞀意の名前の仮定、 ONE。 以䞋では、これらの原則がどこに぀ながるかを芋お、いく぀かのOWL構造を玹介したす。

オントロゞヌに次のフラグメント (マンチェスタヌ構文) が含たれるようにしたす。

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human
   Facts: hasChild Alice, hasChild Bob, hasChild Carol

ゞョンにはたくさんの子䟛がいるず蚀われおいるこずから、そうなるのでしょうか UNA を拒吊するず、アリスずボブは同䞀人物である可胜性が高いため、掚論゚ンゞンはこの質問に吊定的に答えるこずになりたす。 以䞋のこずを行うには、次の公理を远加する必芁がありたす。

DifferentIndividuals: Alice, Bob, Carol, John

ここで、オントロゞヌのフラグメントが次の圢匏を持぀ずしたす (ゞョンには倚くの子䟛がいるず宣蚀されおいたすが、子䟛は XNUMX 人しかいたせん)。

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human, manyChildren
   Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John

このオントロゞヌは矛盟したすか (無効なデヌタの蚌拠ずしお解釈される可胜性がありたす)? OWA を受け入れるず、掚論゚ンゞンは吊定的な応答をしたす。぀たり、別の「どこか」 (別のオントロゞヌ内) では、キャロルもゞョンの子䟛であるず蚀えるかもしれたせん。

この可胜性を排陀するために、ゞョンに関する新しい事実を远加したしょう。

Individual: John
   Facts: hasChild Alice, hasChild Bob, not hasChild Carol

他の子䟛の出珟を陀倖するために、「子䟛がいる」ずいうプロパティのすべおの倀が人々であり、そのうちの XNUMX ぀だけがあるずしたす。

ObjectProperty: hasChild
   Domain: Human
   Сharacteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }

オントロゞヌは矛盟するようになり、掚論゚ンゞンは必ずそれを報告したす。 最埌の公理により、ある意味で䞖界が「閉じられた」こずになり、ゞョンが自分の子䟛である可胜性がどのように排陀されおいるかに泚目したす。

䌁業デヌタのリンク

Linked Data の䞀連のアプロヌチずテクノロゞヌは、もずもず Web 䞊でデヌタを公開するこずを目的ずしおいたした。 䌁業内郚環境でこれらを䜿甚するには、倚くの困難に盎面したす。

たずえば、閉鎖的な䌁業環境では、OWA の採甚ず UNA の拒吊に基づく OWL の挔繹力 (Web のオヌプンで分散された性質による決定) は匱すぎたす。 そしおここで、次のような解決策が考えられたす。

  • OWLにセマンティクスを䞎え、OWAの攟棄ずUNAの採甚、察応する出力゚ンゞンの実装を意味したす。 - この道に沿っお です スタヌドッグ RDF ストレヌゞ。
  • OWLの挔繹機胜を攟棄し、ルヌル゚ンゞンを優先したす。 — スタヌドッグのサポヌト スワヌル; Jena ず GraphDB のオファヌ 自分の 蚀語 ルヌル
  • OWLの挔繹的機胜の拒吊、モデリングのためのRDFSに近いXNUMX぀たたは別のサブセットの䜿甚。 - これに぀いおは以䞋を参照しおください。

もう XNUMX ぀の問題は、䌁業がデヌタ品質の問題ず Linked Data スタック内のデヌタ怜蚌ツヌルの欠劂に倧きな焊点を圓おおいる可胜性があるこずです。 ここでの出力は次のずおりです。

  • この堎合も、適切な掚論゚ンゞンが利甚可胜な堎合は、閉じた䞖界のセマンティクスず䞀意の名前を持぀ OWL 構造の怜蚌に䜿甚したす。
  • 䜿甚 シャクル、Semantic Web Layer Cake レむダヌのリストが修正された埌に暙準化されたした (ただし、ルヌル ゚ンゞンずしおも䜿甚できたす)、たたは シュ゚クス.
  • 最終的にはすべおが SPARQL ク゚リで行われるこずを理解し、それらを䜿甚しお独自の単玔なデヌタ怜蚌メカニズムを䜜成したす。

しかし、たずえ挔繹機胜や怜蚌ツヌルを完党に拒吊したずしおも、リンクト デヌタ スタックは、オヌプンで分散された Web ず状況が䌌おいるタスク、぀たりデヌタ統合タスクにおいお競争力を倱いたす。

通垞の䌁業情報システムではどうでしょうか?

これは可胜ですが、察応するテクノロゞがどのような問題を解決する必芁があるかを正確に認識しおおく必芁がありたす。 ここでは、この技術スタックが埓来の IT の芳点からどのように芋えるかを瀺すために、開発参加者の兞型的な反応を説明したす。 象のたずえ話を少し思い出したす。

  • ビゞネスアナリスト: RDF は、盎接保存された論理モデルのようなものです。
  • システムアナリスト: RDF は次のようなものです EAV倧量のむンデックスず䟿利なク゚リ蚀語を備えおいるだけです。
  • 開発者: そうですね、これはすべおリッチ モデルずロヌ コヌドの抂念の粟神に基づいおいたす。 読む 最近これに぀いお。
  • プロゞェクトリヌダヌはい、同じです スタックを折りたたむ!

実践によるず、スタックは、MDM (マスタヌ デヌタ管理) や DWH (デヌタ りェアハりス) クラス システムを構築する堎合など、デヌタの分散ず異質性に関連するタスクで最もよく䜿甚されたす。 このような問題はどの業界にも存圚したす。

業界固有のアプリケヌションに関しお蚀えば、Linked Data テクノロゞヌは珟圚、次の業界で最も人気がありたす。

  • 生物医孊技術 (その人気は分野の耇雑さに関係しおいるず思われる);

珟圚

「Boiling Point」は最近、「National Medical Knowledge Base」協䌚が䞻催するカンファレンスを䞻催したした。オントロゞヌの結合。 理論から実践ぞ'。

  • 耇雑な補品の生産ず運営 (倧芏暡な機械工孊、石油ずガスの生産。ほずんどの堎合、暙準的な補品に぀いお話したす) ISO 15926);

珟圚

ここでも、その理由は察象分野の耇雑さです。たずえば、石油・ガス産業に぀いお蚀えば、䞊流段階では、単玔な䌚蚈凊理にいく぀かの CAD 機胜が必芁になりたす。

2008 幎には、シェブロンが䞻催する代衚的なむンスタレヌション むベントが開催されたした。 䌚議.

ISO 15926 は結局のずころ、石油・ガス業界にずっおは少々負担が倧きいように思えたした (そしおおそらく機械工孊においおより倧きな応甚が芋出されおいたす)。 完党に倢䞭になったのは Statoil (Equinor) だけで、ノルりェヌでは党䜓が 生態系。 他の人は自分のこずをやろうずしおいたす。 たずえば、噂によるず、囜内゚ネルギヌ省は、明らかに次のような「燃料・゚ネルギヌ耇合䜓の抂念的存圚論的モデル」を䜜成する぀もりだずいう。 電力業界のために䜜られた.

  • 金融機関 (XBRL でさえ、SDMX ず RDF デヌタ キュヌブ オントロゞヌの䞀皮のハむブリッドず考えるこずができたす)。

珟圚

今幎の初めに、LinkedIn は、テレビ シリヌズ「䞍可抗力」で著者が知っおいる金融業界のほがすべおの巚人からの求人情報を積極的にスパム送信したした。ゎヌルドマン サックス、JP モルガン チェヌスおよび/たたはモルガン スタンレヌ、りェルズ ファヌゎ、 SWIFT/Visa/Mastercard、Bank of America、Citigroup、FRB、Deutsche Bank...おそらく誰もが送金できる盞手を探しおいたでしょう。 ナレッゞグラフカンファレンス。 かなりの数の人が、金融機関がすべおを奪ったこずを発芋したした。 初日の朝.

HeadHunter では、Sberbank だけが興味深いものを芋぀けたした。それは、「RDF のようなデヌタ モデルを備えた EAV ストレヌゞ」に関するものでした。

おそらく、囜内の金融機関ず欧米の金融機関の察応技術に察する愛情の床合いの違いは、埌者の掻動の囜境を越えた性質によるものず思われたす。 明らかに、州境を越えた統合には、質的に異なる組織的および技術的゜リュヌションが必芁です。

  • 商甚アプリケヌションを䜿甚した質問応答システム (IBM Watson、Apple Siri、Google Knowledge Graph)。

珟圚

ちなみに、Siri の䜜成者であるトヌマス グルヌバヌは、「抂念化仕様」ずしおの (IT の意味での) オントロゞヌの定矩そのものの著者です。 私の意芋では、この定矩の単語を䞊べ替えおも意味は倉わりたせんが、これはおそらくその定矩が存圚しないこずを瀺しおいるず思いたす。

  • 構造化デヌタの公開 (より正圓な理由ずしお、これは Linked Open Data に起因するず考えられたす)。

珟圚

Linked Data の倧ファンは、ギャラリヌ、図曞通、アヌカむブ、博物通などのいわゆる GLAM です。 米囜議䌚図曞通が MARC21 の代替を掚進しおいるず蚀えば十分でしょう。 れッケンフレヌムどちら 曞誌蚘述の将来のための基盀を提䟛する そしおもちろん RDF に基づいおいたす。

りィキデヌタは、Linked Open Data の分野で成功したプロゞェクトの䟋ずしおよく匕甚されたす。りィキデヌタは、りィキペディアの䞀皮の機械可読バヌゞョンであり、DBPedia ずは察照的に、そのコンテンツは蚘事むンフォボックスからのむンポヌトによっお生成されたせん。倚かれ少なかれ手動で䜜成されたす (その埌、同じむンフォボックスの情報源になりたす)。

こちらもぜひチェックしおみるこずをお勧めしたす リスト Stardog Web サむトの「顧客」セクションにある Stardog RDF ストレヌゞのナヌザヌ。

それはずもかく、Gartner では 2016 幎の新興テクノロゞヌのハむプ サむクル 「゚ンタヌプラむズ分類ずオントロゞヌ管理」は、早ければ 10 幎以内に「生産性のプラトヌ」に達するず予想され、倱望の谷ぞの䞋り坂の真っ只䞭に眮かれおいたす。

゚ンタヌプラむズデヌタの接続

予報、予報、予報 。

歎史的関心から、私たちが興味を持っおいるテクノロゞヌに関するさたざたな幎における Gartner の予枬を以䞋に衚にしたした。

幎 ТехМПлПгОя レポヌト 䜍眮 停滞期たでの幎数
2001 セマンティックWeb 新技術 むノベヌショントリガヌ 5-10
2006 䌁業セマンティック Web 新技術 むンフレ期埅のピヌク 5-10
2012 セマンティックWeb ビッグデヌタ むンフレ期埅のピヌク > 10
2015 リンクされたデヌタ 高床な分析ずデヌタサむ゚ンス 幻滅のくが地 5-10
2016 ゚ンタヌプラむズオントロゞヌ管理 新技術 幻滅のくが地 > 10
2018 ナレッゞグラフ 新技術 むノベヌショントリガヌ 5-10

ただし、すでに 「ハむプサむクル...」2018 別の䞊昇傟向が珟れたした - ナレッゞグラフ。 ある茪廻が起こった。ナヌザヌの泚意ず開発者の努力がグラフDBMSに切り替わり、前者の芁求ず埌者の習慣の圱響を受けお、その茪郭ず䜍眮付けが決たり始めた。以前の競合他瀟の。

珟圚、ほがすべおのグラフ DBMS は、䌁業の「ナレッゞ グラフ」 (「リンクされたデヌタ」は「接続されたデヌタ」に眮き換えられるこずもありたす) を構築するのに適したプラットフォヌムであるず宣蚀しおいたすが、そのような䞻匵はどの皋床正圓化されるのでしょうか?

グラフ デヌタベヌスは䟝然ずしおセマンティックであり、グラフ DBMS 内のデヌタは䟝然ずしお同じデヌタ サむロです。 URI の代わりに文字列識別子を䜿甚するず、XNUMX ぀のグラフ DBMS を統合するタスクが䟝然ずしお統合タスクになりたすが、XNUMX ぀の RDF ストアの統合は、倚くの堎合、単玔に XNUMX ぀の RDF グラフをマヌゞするこずになりたす。 アセマンシティのもう XNUMX ぀の偎面は、LPG グラフ モデルの非再垰性であり、これにより、同じプラットフォヌムを䜿甚しおメタデヌタを管理するこずが困難になりたす。

最埌に、グラフ DBMS には掚論゚ンゞンやルヌル ゚ンゞンがありたせん。 このような゚ンゞンの結果はク゚リを耇雑にするこずで再珟できたすが、これは SQL でも可胜です。

ただし、䞻芁な RDF ストレヌゞ システムは、LPG モデルを問題なくサポヌトしおいたす。 最も確実なアプロヌチは、Blazegraph で䞀床提案されたアプロヌチであるず考えられおいたす。それは、RDF ず LPG を組み合わせた RDF* モデルです。

もっず

LPG モデルの RDF ストレヌゞ サポヌトの詳现に぀いおは、Habré に関する以前の蚘事を参照しおください。 「RDFストレヌゞで今䜕が起こっおいるのか」。 い぀かナレッゞ グラフずデヌタ ファブリックに぀いお別の蚘事が曞けるこずを願っおいたす。 最埌のセクションは、わかりやすいように、急いで曞かれたものですが、XNUMX か月経っおも、これらの抂念に぀いおすべおがそれほど明確になっおいるわけではありたせん。

文孊

  1. Halpin, H.、Monnin, A. (ç·š) (2014)。 哲孊工孊: りェブの哲孊に向けお
  2. Allemang, D.、Hendler, J. (2011) 働く存圚論者のためのセマンティック Web (第 2 版)
  3. Staab, S.、Studer, R. (ç·š) (2009) オントロゞヌに関するハンドブック (第 2 版)
  4. りッド、D. (ç·š)。 (2011) 䌁業デヌタのリンク
  5. Keet, M. (2018) オントロゞヌ ゚ンゞニアリングの抂芁

出所 habr.com

コメントを远加したす