Anlamsal Web ve Bağlantılı Veriler. Düzeltmeler ve eklemeler

Yakın zamanda basılan bu kitaptan bir bölümü kamuoyuna sunmak istiyorum:

Bir işletmenin ontolojik modellenmesi: yöntemler ve teknolojiler [Metin]: monografi / [S. V. Gorshkov, S.S. Kralin, O.I. Mushtak ve diğerleri; yönetici editör S.V. Gorshkov]. - Ekaterinburg: Ural Üniversitesi Yayınevi, 2019. - 234 s.: hasta, tablo; 20 cm - Yazar. arka baştankarada belirtilmiştir. İle. — Kaynakça bölümün sonunda. — ISBN 978-5-7996-2580-1: 200 kopya.

Bu parçayı Habré'de yayınlamanın amacı dört yönlüdür:

  • Saygın bir firmanın müşterisi olmayan birinin bu kitabı elinde tutması pek mümkün değildir. SergeIndex; Kesinlikle satışta değil.
  • Metinde düzeltmeler yapıldı (aşağıda vurgulanmadı) ve basılı monografinin formatıyla pek uyumlu olmayan eklemeler yapıldı: güncel notlar (spoiler altında) ve köprüler.
  • İstiyorum soruları ve yorumları toplayınBu metni gözden geçirilmiş biçimde başka yayınlara dahil ederken bunları dikkate almak için.
  • Semantik Web ve Bağlantılı Veri taraftarlarının çoğu, hâlâ çevrelerinin çok dar olduğuna inanıyor; bunun temel nedeni, Semantik Web ve Bağlantılı Veri taraftarı olmanın ne kadar harika olduğu genel kamuoyuna henüz tam olarak açıklanmamış olmasıdır. Parçanın yazarı, bu çevreye ait olmasına rağmen bu görüşe sahip değil, ancak yine de kendisini başka bir girişimde bulunmak zorunda görüyor.

Bu durumda,

Anlamsal ağ

İnternetin evrimi şu şekilde temsil edilebilir (veya aşağıda belirtilen sıraya göre oluşturulan bölümleri hakkında konuşabiliriz):

  1. İnternetteki belgeler. Anahtar teknolojiler - Gopher, FTP, vb.
    İnternet, yerel kaynakların değişimine yönelik küresel bir ağdır.
  2. İnternet belgeleri. Anahtar teknolojiler HTML ve HTTP'dir.
    Açığa çıkan kaynakların doğası, iletim ortamının özelliklerini dikkate alır.
  3. İnternet verileri. Anahtar teknolojiler - REST ve SOAP API, XHR vb.
    İnternet uygulamalarının çağında sadece insanlar kaynakların tüketicisi haline gelmiyor.
  4. İnternet verileri. Anahtar teknolojiler Bağlantılı Veri teknolojileridir.
    İkinci temel teknolojilerin yaratıcısı ve W3C'nin yöneticisi Berners-Lee'nin öngördüğü bu dördüncü aşamaya Anlamsal Web adı veriliyor; Bağlantılı Veri teknolojileri, web üzerindeki verileri yalnızca makine tarafından okunabilir değil, aynı zamanda "makineler tarafından anlaşılabilir" hale getirmek için tasarlanmıştır.

Okuyucu, bundan sonra ikinci ve dördüncü aşamaların anahtar kavramları arasındaki uyumu anlayacaktır:

  • URL'ler URI'lere benzer,
  • HTML'nin analogu RDF'dir,
  • HTML köprüleri, RDF belgelerindeki URI oluşumlarına benzer.

Semantik Web, spontane ya da lobi faaliyeti sonucu ortaya çıkan belirli bir eğilimden ziyade, İnternet'in geleceğine dair sistemik bir vizyondur; ancak bu ikincisini de hesaba katabilir. Örneğin Web 2.0 olarak adlandırılan şeyin önemli bir özelliğinin "kullanıcı tarafından oluşturulan içerik" olduğu düşünülmektedir. Özellikle W3C tavsiyesinin dikkate alınması isteniyor "Web Ek Açıklama Ontolojisi"ve böyle bir girişim İçi Dolu.

Anlamsal Web Öldü mü?

Eğer reddedersen gerçekçi olmayan beklentilerAnlamsal ağdaki durum, gelişmiş sosyalizm zamanlarındaki komünizmle hemen hemen aynıdır (ve Ilyich'in koşullu emirlerine sadakatin uyulup uyulmadığı, herkesin kendisi karar vermesine izin verin). Arama motorları gayet başarılı web sitelerini RDFa ve JSON-LD kullanmaya zorlar ve kendileri aşağıda açıklananlarla ilgili teknolojileri kullanır (Google Bilgi Grafiği, Bing Bilgi Grafiği).

Genel anlamda yazar, daha fazla yayılmayı neyin engellediğini söyleyemez ancak kişisel deneyimlerine dayanarak konuşabilir. Çok yaygın olmasa da, SW saldırısı koşullarında "alışılmışın dışında" çözülebilecek sorunlar var. Sonuç olarak bu görevlerle karşı karşıya kalanların, çözüm üretebilecek olanlara karşı herhangi bir baskı aracı bulunmazken, çözüm üretebilenlerin bağımsız olarak çözüm sunması iş modelleriyle çelişmektedir. Bu yüzden HTML'yi ayrıştırmaya ve birbirinden daha berbat olan çeşitli API'leri birbirine yapıştırmaya devam ediyoruz.

Ancak Bağlantılı Veri teknolojileri ana akım Web'in ötesine yayıldı; Aslında kitap bu uygulamalara adanmıştır. Şu anda Bağlantılı Veri topluluğu, Gartner'ın aşağıdaki gibi trendleri kaydetmesi (veya dilediğiniz gibi duyurması) sayesinde bu teknolojilerin daha da yaygınlaşmasını bekliyor: Bilgi Grafikleri и Veri Dokusu. Başarılı olacak olanın bu kavramların “bisiklet” uygulamaları değil, aşağıda tartışılan W3C standartlarıyla ilgili uygulamalar olacağına inanmak isterim.

Bağlantılı Veriler

Berners-Lee Bağlantılı Veriyi "doğru yapılan" anlamsal web olarak tanımladı: nihai hedeflerine ulaşmasını sağlayan bir dizi yaklaşım ve teknoloji. Bağlantılı Verilerin temel ilkeleri Berners-Lee seçildi aşağıdaki.

İlke 1. Varlıkları adlandırmak için URI'leri kullanma.

URI'ler, girişlere yönelik yerel dize tanımlayıcılarının aksine, genel varlık tanımlayıcılarıdır. Daha sonra bu ilke en iyi şekilde Google Bilgi Grafiği sloganında ifade edildi "dizeler değil, şeyler'.

İlke 2. Referansların kaldırılabilmesi için HTTP şemasında URI'lerin kullanılması.

Bir URI'ye atıfta bulunarak, o gösterenin arkasındaki gösterileni elde etmek mümkün olmalıdır (burada "operatörünün adı ile benzetme açıktır).*" C'de); daha doğrusu, HTTP başlığının değerine bağlı olarak bu gösterilenin bir temsilini elde etmek için Accept:. Belki AR/VR çağının gelişiyle kaynağın kendisini elde etmek mümkün olacak, ancak şimdilik büyük olasılıkla bu, bir SPARQL sorgusunun yürütülmesinin sonucu olan bir RDF belgesi olacaktır. DESCRIBE.

İlke 3. Özellikle URI'lerin referansı kaldırılırken W3C standartlarının (öncelikle RDF(S) ve SPARQL) kullanılması.

Bağlantılı Veri teknolojisi yığınının bu bireysel "katmanları" olarak da bilinir. Anlamsal Web Katmanı Pastası, aşağıda açıklanacaktır.

İlke 4. Varlıkları tanımlarken diğer URI'lere referansların kullanılması.

RDF, kendinizi bir kaynağın doğal dilde sözlü açıklamasıyla sınırlandırmanıza olanak tanır ve dördüncü ilke, bunu yapmamaya çağırır. İlk ilkeye evrensel olarak uyulursa, bir kaynağı tanımlarken "yabancı" olanlar da dahil olmak üzere başkalarına atıfta bulunmak mümkün hale gelir, bu nedenle verilere bağlantılı denir. Aslında RDFS sözlüğünde adı geçen URI'leri kullanmak neredeyse kaçınılmazdır.

RDF

RDF (Kaynak Açıklama Çerçevesi), birbiriyle ilişkili varlıkları açıklamaya yönelik bir formalizmdir.

Varlıklar ve onların ilişkileri hakkında üçlü olarak adlandırılan “özne-yüklem-nesne” türünden açıklamalar yapılır. En basit durumda özne, yüklem ve nesnenin tümü URI'dir. Aynı URI, farklı üçlülerde farklı konumlarda olabilir: özne, yüklem ve nesne olabilir; Böylece üçlüler RDF grafiği adı verilen bir tür grafik oluşturur.

Konular ve nesneler yalnızca URI'ler değil aynı zamanda sözde URI'ler de olabilir. boş düğümlerve nesneler de olabilir değişmezler. Değişmez değerler, bir dize temsili ve bir tür göstergesinden oluşan ilkel türlerin örnekleridir.

Hazır bilgi yazma örnekleri (Kaplumbağa sözdiziminde, bunun hakkında daha fazla bilgi aşağıdadır): "5.0"^^xsd:float и "five"^^xsd:string. Türü olan değişmez değerler rdf:langString bir dil etiketi ile de donatılabilir; Turtle'da şu şekilde yazılır: "five"@en и "пять"@ru.

Boş düğümler, küresel tanımlayıcıları olmayan "anonim" kaynaklardır; ancak bununla ilgili açıklamalar yapılabilir; bir çeşit varoluşsal değişken.

Yani (aslında RDF'nin asıl amacı budur):

  • konu bir URI veya boş bir düğüm ise,
  • yüklem bir URI'dir,
  • nesne bir URI, boş bir düğüm veya değişmez değerdir.

Yüklemler neden boş düğümler olamaz?

Bunun olası nedeni, üçlüyü gayri resmi olarak anlama ve birinci dereceden yüklem mantığı diline çevirme arzusudur. s p o şöyle bir şey gibi Anlamsal Web ve Bağlantılı Veriler. Düzeltmeler ve eklemelerNerede Anlamsal Web ve Bağlantılı Veriler. Düzeltmeler ve eklemeler - yüklem, Anlamsal Web ve Bağlantılı Veriler. Düzeltmeler ve eklemeler и Anlamsal Web ve Bağlantılı Veriler. Düzeltmeler ve eklemeler - sabitler. Bu anlayışın izleri belgede mevcut”LBase: Anlamsal Web Dilleri için Anlambilim", W3C çalışma grubu notu statüsündedir. Bu anlayışla üçlü s p []Nerede [] - boş düğüm şu şekilde çevrilecek: Anlamsal Web ve Bağlantılı Veriler. Düzeltmeler ve eklemelerNerede Anlamsal Web ve Bağlantılı Veriler. Düzeltmeler ve eklemeler - değişken, ancak o zaman nasıl tercüme edilir s [] o? W3C Öneri durumuna sahip belge "RDF 1.1 Semantik” başka bir çeviri yöntemi sunuyor ancak yine de yüklemlerin boş düğümler olma olasılığını dikkate almıyor.

Ancak Manu Sporni izin.

RDF soyut bir modeldir. RDF çeşitli sözdizimlerinde yazılabilir (serileştirilebilir): RDF / XML, Kaplumbağa (insanların çoğu tarafından okunabilir), JSON-LD, HDT (ikili).

Aynı RDF, RDF/XML'e farklı şekillerde serileştirilebilir; bu nedenle, örneğin, ortaya çıkan XML'i XSD kullanarak doğrulamanın veya XPath kullanarak veri çıkarmaya çalışmanın bir anlamı yoktur. Benzer şekilde, JSON-LD'nin ortalama bir Javascript geliştiricisinin Javascript'in nokta ve köşeli parantez gösterimini kullanarak RDF ile çalışma isteğini karşılaması pek mümkün değildir (her ne kadar JSON-LD bir mekanizma sunarak bu yönde hareket etse de) çerçeveleme).

Çoğu sözdizimi, uzun URI'leri kısaltmanın yollarını sunar. Örneğin, bir reklam @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> Turtle'da bunun yerine yazmanıza izin verilecek <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> sadece rdf:type.

RDFS

RDFS (RDF Şeması) - temel bir modelleme sözlüğü, özellik ve sınıf kavramlarını ve aşağıdaki gibi özellikleri tanıtır rdf:type, rdfs:subClassOf, rdfs:domain и rdfs:range. Örneğin RDFS sözlüğünü kullanarak aşağıdaki geçerli ifadeler yazılabilir:

rdf:type         rdf:type         rdf:Property .
rdf:Property     rdf:type         rdfs:Class .
rdfs:Class       rdfs:subClassOf  rdfs:Resource .
rdfs:subClassOf  rdfs:domain      rdfs:Class .
rdfs:domain      rdfs:domain      rdf:Property .
rdfs:domain      rdfs:range       rdfs:Class .
rdfs:label       rdfs:range       rdfs:Literal .

RDFS bir açıklama ve modelleme sözlüğüdür ancak bir kısıtlama dili değildir (her ne kadar resmi belirtim ve yapraklar böyle bir kullanım olasılığı). "Şema" kelimesi "XML Şeması" ifadesiyle aynı anlamda anlaşılmamalıdır. Örneğin, :author rdfs:range foaf:Person anlamına gelir rdf:type tüm özellik değerleri :author - foaf:Person, ancak bunun önceden söylenmesi gerektiği anlamına gelmez.

SPARQL

SPARQL (SPARQL Protokolü ve RDF Sorgu Dili) - RDF verilerini sorgulamak için kullanılan bir dil. Basit bir durumda, bir SPARQL sorgusu, sorgulanan grafiğin üçlülerinin eşleştirildiği bir örnek kümesidir. Desenler konu, yüklem ve nesne konumlarında değişkenler içerebilir.

Sorgu, örneklere değiştirildiğinde sorgulanan RDF grafiğinin bir alt grafiğine (üçlülerinin bir alt kümesi) yol açabilecek değişken değerleri döndürecektir. Farklı üçlü örneklerdeki aynı isimli değişkenler aynı değerlere sahip olmalıdır.

Örneğin, yukarıdaki yedi RDFS aksiyomu kümesi göz önüne alındığında, aşağıdaki sorgu şunu döndürecektir: rdfs:domain и rdfs:range değerler olarak ?s и ?p sırasıyla:

SELECT * WHERE {
 ?s ?p rdfs:Class .
 ?p ?p rdf:Property .
}

SPARQL'in bildirimsel olduğunu ve grafik geçişini açıklayan bir dil olmadığını belirtmekte fayda var (ancak bazı RDF depoları, sorgu yürütme planını ayarlamanın yollarını sunar). Bu nedenle, en kısa yolu bulma gibi bazı standart grafik problemleri SPARQL'de çözülemez. mülk yolları (ancak yine bireysel RDF depoları bu sorunları çözmek için özel uzantılar sunar).

SPARQL dünyanın açıklığı varsayımını paylaşmaz ve “başarısızlık olarak olumsuzlama” yaklaşımını takip eder. mümkün gibi tasarımlar FILTER NOT EXISTS {…}. Mekanizma kullanılarak veri dağıtımı dikkate alınır birleştirilmiş sorgular.

SPARQL sorgularını işleyebilen bir RDF depolama alanı olan SPARQL erişim noktasının, ikinci aşamadan doğrudan analogları yoktur (bu paragrafın başına bakın). HTML sayfalarının oluşturulduğu içeriklere dayalı ancak dışarıdan erişilebilen bir veritabanına benzetilebilir. SPARQL erişim noktası, üçüncü aşamadaki API erişim noktasına daha benzer ancak iki ana farkı vardır. Birincisi, birkaç "atomik" sorguyu tek bir sorguda birleştirmek mümkündür (bu, GraphQL'in temel özelliği olarak kabul edilir) ve ikinci olarak, böyle bir API tamamen kendi kendini belgelemektedir (HATEOAS'ın başarmaya çalıştığı şey budur).

polemik açıklama

RDF, verileri web'de yayınlamanın bir yoludur, bu nedenle RDF depolaması, bir belge DBMS'si olarak düşünülmelidir. Doğru, RDF bir ağaç değil de bir grafik olduğundan, bunların da grafik tabanlı olduğu ortaya çıktı. Her şeyin yolunda gitmesi şaşırtıcı. Boş düğümleri uygulayacak akıllı insanların olacağını kim düşünebilirdi? Codd burada çalışmadı.

RDF verilerine erişimi organize etmenin daha az özellikli yolları da vardır; örneğin: Bağlantılı Veri Parçaları (LDF) ve Bağlantılı Veri Platformu (LDP).

BAYKUŞ

BAYKUŞ (Web Ontoloji Dili) - bilgiyi temsil etmeye yönelik bir biçimcilik, açıklama mantığının sözdizimsel bir versiyonu Anlamsal Web ve Bağlantılı Veriler. Düzeltmeler ve eklemeler (Aşağıdaki her yerde OWL 2 demek daha doğrudur, OWL'nin ilk sürümü Anlamsal Web ve Bağlantılı Veriler. Düzeltmeler ve eklemeler).

OWL'deki tanımlayıcı mantık kavramları sınıflara, roller özelliklere karşılık gelir, bireyler önceki adlarını korur. Aksiyomlara aksiyomlar da denir.

Örneğin, sözde Manchester sözdizimi OWL notasyonu için zaten bildiğimiz bir aksiyom Anlamsal Web ve Bağlantılı Veriler. Düzeltmeler ve eklemeler şu şekilde yazılacaktır:

Class: Human
Class: Parent
   EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent

OWL yazmak için başka sözdizimleri de vardır, örneğin işlevsel sözdizimi, resmi spesifikasyonda kullanılan ve BAYKUŞ/XML. Ek olarak OWL serileştirilebilir RDF sözdizimini soyutlamak için ve ayrıca - belirli sözdizimlerinden herhangi birinde.

OWL'nin RDF ile ikili bir ilişkisi vardır. Bir yandan RDFS'yi genişleten bir tür sözlük olarak da düşünülebilir. Öte yandan, RDF'nin yalnızca bir serileştirme formatı olduğu daha güçlü bir biçimciliktir. Tüm temel OWL yapıları tek bir RDF üçlüsü kullanılarak yazılamaz.

OWL yapılarının hangi alt kümesinin kullanılmasına izin verildiğine bağlı olarak, sözde OWL profilleri. Standartlaştırılmış ve en ünlüsü OWL EL, OWL RL ve OWL QL'dir. Profil seçimi tipik problemlerin hesaplama karmaşıklığını etkiler. Aşağıdakilere karşılık gelen eksiksiz bir OWL yapıları seti Anlamsal Web ve Bağlantılı Veriler. Düzeltmeler ve eklemeler, OWL DL olarak adlandırıldı. Bazen OWL yapılarının RDF'nin doğasında bulunan tam özgürlükle, anlamsal ve hesaplama kısıtlamaları olmadan kullanılmasına izin verilen OWL Full'den de bahsediyorlar. Anlamsal Web ve Bağlantılı Veriler. Düzeltmeler ve eklemeler. Örneğin bir şey hem sınıf hem de özellik olabilir. OWL Full karar verilemez.

OWL'de sonuçların eklenmesine ilişkin temel ilkeler, açık dünya varsayımının benimsenmesidir. OWA) ve benzersiz ad varsayımının reddedilmesi (benzersiz ad varsayımı, A). Aşağıda bu ilkelerin nereye varabileceğini göreceğiz ve bazı OWL yapılarını tanıtacağız.

Ontolojinin aşağıdaki parçayı içermesine izin verin (Manchester sözdiziminde):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human
   Facts: hasChild Alice, hasChild Bob, hasChild Carol

Söylenenlerden John'un çok çocuğu olduğu sonucu çıkacak mı? UNA'nın reddedilmesi çıkarım motorunu bu soruyu olumsuz yanıtlamaya zorlayacaktır çünkü Alice ve Bob aynı kişi olabilir. Aşağıdakilerin gerçekleşmesi için aşağıdaki aksiyomun eklenmesi gerekir:

DifferentIndividuals: Alice, Bob, Carol, John

Şimdi ontoloji parçasının aşağıdaki forma sahip olmasına izin verin (John'un birçok çocuğu olduğu açıklandı, ancak yalnızca iki çocuğu var):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human, manyChildren
   Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John

Bu ontoloji tutarsız mı olacak (geçersiz verinin kanıtı olarak yorumlanabilir)? OWA'yı kabul etmek, çıkarım motorunun olumsuz yanıt vermesine neden olacaktır: başka bir "bir yerde" (başka bir ontolojide), Carol'ın da John'un çocuğu olduğu söylenebilir.

Bunun olasılığını dışlamak için John hakkında yeni bir gerçeği ekleyelim:

Individual: John
   Facts: hasChild Alice, hasChild Bob, not hasChild Carol

Diğer çocukların görünümünü dışlamak için, "çocuk sahibi olma" özelliğinin tüm değerlerinin, elimizde sadece dört tane bulunan insanlar olduğunu varsayalım:

ObjectProperty: hasChild
   Domain: Human
   Сharacteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }

Artık ontoloji çelişkili hale gelecektir ve çıkarım motoru bunu rapor etmekte başarısız olmayacaktır. Son aksiyomla bir anlamda dünyayı “kapatmış” oluyoruz ve John'un kendi çocuğu olma olasılığının nasıl dışlandığını görüyoruz.

Kurumsal Verileri Bağlama

Bağlantılı Veri yaklaşımları ve teknolojileri seti, başlangıçta verilerin Web'de yayınlanması için tasarlanmıştı. İç kurumsal ortamda bunların kullanımı bir takım zorluklarla karşı karşıyadır.

Örneğin, kapalı bir kurumsal ortamda, OWA'nın benimsenmesine ve UNA'nın reddedilmesine dayanan OWL'nin tümdengelim gücü, Web'in açık ve dağıtılmış yapısı nedeniyle alınan kararlar çok zayıftır. Ve burada aşağıdaki çözümler mümkündür.

  • OWL'ye anlambilim kazandırmak, OWA'nın terk edilmesini ve UNA'nın benimsenmesini, ilgili çıkış motorunun uygulanmasını ima eder. - Bu yol boyunca olduğu Stardog RDF depolama.
  • OWL'nin tümdengelim yeteneklerini kural motorları lehine terk etmek. — Stardog destekler SWRL; Jena ve GraphDB teklifi kendi diller tüzük
  • OWL'nin tümdengelim yeteneklerinin reddedilmesi, modelleme için RDFS'ye yakın bir veya daha fazla alt kümenin kullanılması. - Aşağıda bununla ilgili daha fazla bilgi bulabilirsiniz.

Diğer bir sorun ise kurumsal dünyanın veri kalitesi sorunlarına daha fazla odaklanması ve Bağlantılı Veri yığınında veri doğrulama araçlarının bulunmamasıdır. Buradaki çıktılar aşağıdaki gibidir.

  • Yine, uygun bir çıkarım motoru mevcutsa, kapalı dünya semantiğine ve benzersiz adlara sahip OWL yapılarının doğrulanması için kullanın.
  • kullanımı ŞACLAnlamsal Web Katmanı Pastası katmanlarının listesi düzeltildikten sonra standartlaştırılır (ancak kural motoru olarak da kullanılabilir) veya ShEx.
  • Her şeyin sonuçta SPARQL sorgularıyla yapıldığını anlamak ve bunları kullanarak kendi basit veri doğrulama mekanizmanızı oluşturmak.

Bununla birlikte, tümdengelim yeteneklerinin ve doğrulama araçlarının tamamen reddedilmesi bile, Bağlantılı Veri yığınını, veri entegrasyonu görevlerinde açık ve dağıtılmış web'e benzer görevlerde rekabetin dışında bırakır.

Düzenli bir kurumsal bilgi sistemine ne dersiniz?

Bu mümkündür, ancak elbette ilgili teknolojilerin tam olarak hangi sorunları çözmesi gerektiğinin farkında olmalısınız. Burada, bu teknoloji yığınının geleneksel BT açısından neye benzediğini göstermek için geliştirme katılımcılarının tipik tepkisini anlatacağım. Bana biraz fil benzetmesini hatırlattı:

  • İş analisti: RDF doğrudan depolanan mantıksal modele benzer.
  • Sistem analizcisi: RDF gibidir EAV, yalnızca bir grup dizin ve kullanışlı bir sorgu dili ile.
  • Geliştirici: peki, bunların hepsi zengin model ve düşük kod kavramlarının ruhuna uygun, okuduğum yakın zamanda bu konuda.
  • Proje yöneticisi: evet aynı yığının çökmesi!

Uygulama, yığının en çok verilerin dağıtımı ve heterojenliği ile ilgili görevlerde, örneğin MDM (Ana Veri Yönetimi) veya DWH (Veri Ambarı) sınıfı sistemleri oluştururken kullanıldığını göstermektedir. Bu tür sorunlar her sektörde var.

Sektöre özel uygulamalar açısından Bağlantılı Veri teknolojileri şu anda aşağıdaki sektörlerde en popülerdir.

  • biyomedikal teknolojiler (popülaritelerinin alanın karmaşıklığıyla ilişkili olduğu görülüyor);

akım

“Kaynama Noktası” geçtiğimiz günlerde “Ulusal Tıp Bilgi Bankası” derneğinin düzenlediği bir konferansa ev sahipliği yaptı”Ontolojilerin birleştirilmesi. Teoriden pratik uygulamaya'.

  • karmaşık ürünlerin üretimi ve işletilmesi (büyük makine mühendisliği, petrol ve gaz üretimi; çoğunlukla standartlardan bahsediyoruz) ISO 15926);

akım

Burada da neden, konu alanının karmaşıklığıdır; örneğin yukarı akış aşamasında, petrol ve gaz endüstrisi hakkında konuşursak, basit muhasebe bazı CAD işlevlerini gerektirir.

2008 yılında Chevron tarafından düzenlenen temsili bir kurulum etkinliği gerçekleşti konferans.

Sonuçta ISO 15926, petrol ve gaz endüstrisi için biraz ağır göründü (ve belki de makine mühendisliğinde daha fazla uygulama alanı buldu). Yalnızca Statoil (Equinor) buna tamamen bağımlı hale geldi; Norveç'te ise bütünüyle ekosistem. Diğerleri ise kendi işlerini yapmaya çalışıyor. Örneğin, söylentilere göre, yerel Enerji Bakanlığı, görünüşe göre buna benzer bir "yakıt ve enerji kompleksinin kavramsal ontolojik modelini" oluşturmayı planlıyor. elektrik enerjisi endüstrisi için yaratıldı.

  • finansal kuruluşlar (XBRL bile SDMX ile RDF Data Cube ontolojisinin bir tür melezi olarak düşünülebilir);

akım

Yılın başında LinkedIn, yazara "Mücbir Sebepler" dizisinden tanıdığı finans sektörünün neredeyse tüm devlerinden boş pozisyonlar göndererek aktif olarak spam gönderdi: Goldman Sachs, JPMorgan Chase ve/veya Morgan Stanley, Wells Fargo, SWIFT/Visa/Mastercard, Bank of America, Citigroup, Fed, Deutsche Bank... Muhtemelen herkes gönderebileceği birini arıyordu Bilgi Grafiği Konferansı. Birçoğu bulmayı başardı: finansal kuruluşlar her şeyi aldı ilk günün sabahı.

HeadHunter'da yalnızca Sberbank ilginç bir şeye rastladı; "RDF benzeri veri modeline sahip EAV depolaması" ile ilgiliydi.

Muhtemelen, yerli ve Batılı finans kurumlarının ilgili teknolojilerine olan sevgi derecesindeki farklılık, ikincisinin faaliyetlerinin ulusötesi niteliğinden kaynaklanmaktadır. Görünen o ki, eyalet sınırları ötesindeki entegrasyon niteliksel olarak farklı organizasyonel ve teknik çözümler gerektiriyor.

  • ticari uygulamalara sahip soru-cevap sistemleri (IBM Watson, Apple Siri, Google Knowledge Graph);

akım

Bu arada, Siri'nin yaratıcısı Thomas Gruber, ontolojinin (BT anlamında) bir "kavramsallaştırma spesifikasyonu" olarak tanımının yazarıdır. Bana göre bu tanımdaki kelimelerin yeniden düzenlenmesi anlamını değiştirmiyor, bu belki de orada olmadığını gösteriyor.

  • yapılandırılmış verilerin yayınlanması (daha büyük bir gerekçeyle bu, Bağlantılı Açık Veriye atfedilebilir).

akım

Bağlantılı Verilerin büyük hayranları GLAM olarak adlandırılan Galeriler, Kütüphaneler, Arşivler ve Müzelerdir. Kongre Kütüphanesi'nin MARC21'in yerine yenisini desteklediğini söylemek yeterli. ÇERÇEVEHangi bibliyografik açıklamanın geleceği için bir temel sağlar ve tabii ki RDF'ye dayalı.

Wikidata sıklıkla Bağlantılı Açık Veri (Wikipedia'nın makine tarafından okunabilen bir tür versiyonu) alanındaki başarılı bir projenin örneği olarak gösterilmektedir; içeriği DBPedia'nın aksine, makale bilgi kutularından içe aktarılarak oluşturulmamaktadır, ancak az çok manuel olarak oluşturulur (ve daha sonra aynı bilgi kutuları için bir bilgi kaynağı haline gelir).

Ayrıca göz atmanızı öneririz liste Stardog web sitesindeki “Müşteriler” bölümünde Stardog RDF depolama alanı kullanıcıları.

Öyle de olsa Gartner'da Gelişen Teknolojiler için Hype Döngüsü 2016 "Kurumsal Taksonomi ve Ontoloji Yönetimi", en erken 10 yıl içinde "üretkenlik platosuna" ulaşma beklentisiyle hayal kırıklığı vadisine doğru bir düşüşün ortasında yer alıyor.

Kurumsal Verileri Bağlama

Tahminler, tahminler, tahminler...

Tarihsel ilgiden dolayı, bizi ilgilendiren teknolojilere ilişkin Gartner'ın çeşitli yıllara ait tahminlerini aşağıda tablo halinde sundum.

Yıl Teknoloji Rapor Pozisyon Platoya kalan yıllar
2001 Anlamsal ağ Gelişen Teknolojiler İnovasyon Tetikleyici 5-10
2006 Kurumsal Semantik Web Gelişen Teknolojiler Şişirilmiş Beklentilerin Zirvesi 5-10
2012 Anlamsal ağ büyük Veri Şişirilmiş Beklentilerin Zirvesi > 10
2015 Bağlantılı Veriler İleri Analitik ve Veri Bilimi Hayal kırıklığı yalak 5-10
2016 Kurumsal Ontoloji Yönetimi Gelişen Teknolojiler Hayal kırıklığı yalak > 10
2018 Bilgi Grafikleri Gelişen Teknolojiler İnovasyon Tetikleyici 5-10

Ancak zaten içinde "Heyecan Döngüsü..." 2018 başka bir yükseliş eğilimi ortaya çıktı: Bilgi Grafikleri. Belirli bir reenkarnasyon gerçekleşti: Kullanıcıların dikkatinin ve geliştiricilerin çabalarının, birincisinin isteklerinin ve ikincisinin alışkanlıklarının etkisi altında değiştirildiği ortaya çıkan grafik DBMS'ler, konturları ve konumlandırmayı üstlenmeye başladı. önceki rakiplerinin

Hemen hemen her grafik DBMS artık kendisini kurumsal bir "bilgi grafiği" oluşturmak için uygun bir platform olarak ilan ediyor ("bağlantılı veriler" bazen "bağlantılı veriler" ile değiştiriliyor), ancak bu tür iddialar ne kadar haklı?

Grafik veritabanları hala anlamsaldır; grafik DBMS'deki veriler hala aynı veri silosudur. URI'ler yerine dize tanımlayıcıları, iki grafik DBMS'yi entegre etme görevini hâlâ bir entegrasyon görevi haline getirirken, iki RDF deposunu entegre etmek genellikle iki RDF grafiğini birleştirmeye indirgenir. Anlamsallığın bir başka yönü de LPG grafik modelinin yansımamasıdır, bu da aynı platformu kullanarak meta verileri yönetmeyi zorlaştırır.

Son olarak, grafik DBMS'lerin çıkarım motorları veya kural motorları yoktur. Bu tür motorların sonuçları sorguları karmaşıklaştırarak yeniden üretilebilir, ancak bu SQL'de bile mümkündür.

Ancak önde gelen RDF depolama sistemleri LPG modelini desteklemekte hiçbir zorluk çekmiyor. En sağlam yaklaşımın Blazegraph'ta aynı anda önerilen yaklaşım olduğu düşünülmektedir: RDF ve LPG'yi birleştiren RDF* modeli.

Daha fazla

Habré'deki önceki makalede LPG modeli için RDF depolama desteği hakkında daha fazla bilgi edinebilirsiniz: "Şu anda RDF depolamada neler oluyor?". Umarım bir gün Bilgi Grafikleri ve Veri Dokusu hakkında ayrı bir yazı yazılır. Son bölüm, anlaşılması kolay olduğu gibi aceleyle yazılmış, ancak altı ay sonra bile bu kavramlarla ilgili her şey pek net değil.

Edebiyat

  1. Halpin, H., Monnin, A. (ed.) (2014). Felsefi Mühendislik: Web Felsefesine Doğru
  2. Allemang, D., Hendler, J. (2011) Çalışan Ontolog için Anlamsal Web (2. baskı)
  3. Staab, S., Studer, R. (eds.) (2009) Handbook on Ontolojiler (2. baskı)
  4. Wood, D. (ed.). (2011) Kurumsal Verileri Bağlama
  5. Keet, M. (2018) Ontoloji Mühendisliğine Giriş

Kaynak: habr.com

Yorum ekle