Semantic Web ug Linked Data. Pagtul-id ug pagdugang

Gusto nakong ipresentar sa pagtagad sa publiko ang usa ka tipik niining bag-o lang gimantala nga libro:

Ontological modeling sa negosyo: mga pamaagi ug teknolohiya [Text]: monograph / [S. V. Gorshkov, S. S. Kralin, O. I. Mushtak, ug uban pa; executive editor S. V. Gorshkov]. - Yekaterinburg: Publishing House sa Ural University, 2019. - 234 p.: sakit., tab.; 20 cm - Awt. nalista sa likod sa tit. Uban sa. — Bibliograpo. sa katapusan sa ch. - ISBN 978-5-7996-2580-1: 200 ka kopya.

Ang katuyoan sa pagbutang niini nga tipik sa Habré upat ka pilo:

  • Dili tingali nga adunay makagunit niini nga libro sa ilang mga kamot kung dili siya kliyente sa usa ka respetado SergeIndex; Siguradong dili kini ibaligya.
  • Gihimo ang mga pagtul-id sa teksto (wala kini gipasiugda sa ubos) ug gihimo ang mga pagdugang nga dili kaayo tugma sa pormat sa giimprinta nga monograpo: topical notes (ubos sa mga spoiler) ug mga hyperlink.
  • Gusto nako pagkolekta og mga pangutana ug komentonga tagdon kini kung kini nga teksto gilakip sa usa ka rebisadong porma sa bisan unsang ubang mga edisyon.
  • Daghang Semantic Web ug Linked Data adherents sa gihapon mibati nga ang ilang sirkulo mao ang pig-ot kaayo, nag-una tungod kay ang kinatibuk-ang publiko wala pa sa husto nga pagpatin-aw unsa ka dako nga kini mao ang usa ka adherents sa Semantic Web ug Linked Data. Ang tagsulat sa tipik, bisan tuod siya nahisakop niini nga sirkulo, wala magsunod sa ingon nga opinyon, apan, bisan pa niana, nag-isip sa iyang kaugalingon nga obligado sa paghimo sa laing pagsulay.

Ug busa,

Semantiko nga Web

Ang ebolusyon sa Internet mahimong irepresentar ingon sa mosunod (o hisguti ang bahin sa mga bahin niini nga naporma sa mosunod nga han-ay):

  1. Mga dokumento sa Internet. Panguna nga mga teknolohiya - Gopher, FTP, ug uban pa.
    Ang Internet usa ka global nga network alang sa pagbinayloay sa mga lokal nga kapanguhaan.
  2. Mga Dokumento sa Internet. Ang mga yawe nga teknolohiya mao ang HTML ug HTTP.
    Ang kinaiyahan sa nahayag nga mga kahinguhaan nagkonsiderar sa mga kinaiya sa medium alang sa ilang pagpasa.
  3. Data sa internet. Ang mga yawe nga teknolohiya mao ang REST ug SOAP API, XHR, ug uban pa.
    Ang panahon sa mga aplikasyon sa Internet, dili lamang ang mga tawo ang mahimong mga konsumedor sa mga kapanguhaan.
  4. data sa internet. Ang panguna nga mga teknolohiya mao ang mga teknolohiya sa Linked Data.
    Kining ikaupat nga yugto, nga gitagna ni Berners-Lee, tiglalang sa yawe nga mga teknolohiya sa ikaduha ug direktor sa W3C, gitawag nga Semantic Web; Gidisenyo ang mga teknolohiya sa Linked Data aron mahimo ang datos sa web nga dili lamang mabasa sa makina, apan usab "masabtan sa makina".

Gikan sa mosunod, mahimong tin-aw sa magbabasa nga ang mahinungdanong mga konsepto sa ikaduha ug ikaupat nga mga hugna katumbas:

  • Ang mga analogue sa URL mao ang mga URI,
  • Ang HTML susama sa RDF,
  • Ang mga hyperlink sa HTML susama sa mga entry sa URI sa mga dokumento sa RDF.

Ang Semantic Web labaw pa sa usa ka sistematikong panan-awon sa kaugmaon sa Internet kay sa usa ka espesipikong spontaneous o lobbied trend, bisan tuod kini makahimo sa pagkonsiderar niini nga mga ulahi usab. Pananglitan, ang usa ka importante nga bahin sa gitawag nga Web 2.0 giisip nga "kontent nga hinimo sa tiggamit". Gitawag kini nga tagdon kini, labi na, ang rekomendasyon sa W3C "Web Annotation Ontology"ug ang ingon nga buluhaton sama sa Solid.

Patay ba ang Semantic Web?

Kung mubalibad ka dili realistiko nga mga pagdahom, ang sitwasyon sa semantic web halos parehas sa komunismo sa mga adlaw sa naugmad nga sosyalismo (ug tuguti ang matag usa nga magdesisyon alang sa iyang kaugalingon kung ang pagkamaunongon sa kondisyon nga mga lagda sa Ilyich gisunod). Mga search engine medyo malampuson pugson ang mga website sa paggamit sa RDFa ug JSON-LD ug sa ilang kaugalingon naggamit sa mga teknolohiya nga may kalabutan niadtong gihulagway sa ubos (Google Knowledge Graph, Bing Knowledge Graph).

Sa kinatibuk-an nga termino, ang tagsulat dili makasulti kung unsa ang nagpugong sa mas dako nga pagsabwag, apan makasulti base sa personal nga kasinatian. Adunay mga buluhaton nga masulbad "gikan sa kahon" sa mga kondisyon sa opensiba sa SW, bisan kung dili kaayo dako. Ingon usa ka sangputanan, kadtong adunay kini nga mga buluhaton wala’y paagi sa pagpamugos batok sa mga makahimo sa paghatag usa ka solusyon, ug ang naulahi mismo nga naghatag solusyon sa naulahi sukwahi sa ilang mga modelo sa negosyo. Mao nga nagpadayon kami sa pag-parse sa HTML ug pagpapilit sa lainlaing mga API, usa ka shittier pagkahuman sa lain.

Bisan pa, ang mga teknolohiya sa Linked Data mikaylap lapas sa mass web; Ang libro, sa tinuud, gipahinungod sa ilang mga aplikasyon. Sa pagkakaron, ang Linked Data nga komunidad naglaum nga kini nga mga teknolohiya mahimong mas kaylap sa Gartner nga pag-ayo (o pagproklamar, bisan asa nimo gusto) nga mga uso sama sa Mga Kahibalo sa Kaalam и Data Tela. Gusto ko nga motuo nga dili "bisikleta" nga pagpatuman niini nga mga konsepto ang magmalampuson, apan ang mga may kalabutan sa mga sumbanan sa W3C nga gihisgutan sa ubos.

Nalambigit nga Data

Gihubit ni Berners-Lee ang Linked Data ingon nga ang Semantic Web nga nahimo nga husto: usa ka hugpong sa mga pamaagi ug mga teknolohiya aron makab-ot ang katapusan nga mga katuyoan. Sukaranan nga mga Prinsipyo sa Linked Data Berners-Lee gipili nagsunod.

Prinsipyo 1. Paggamit sa mga URI sa pagngalan sa mga entidad.

Ang mga URI kay mga global entity identifier sukwahi sa local string identifiers sa mga entry. Pagkahuman, kini nga prinsipyo nakit-an ang labing kaayo nga ekspresyon sa Google Knowledge Graph slogan nga "mga butang, dili mga kuwerdas".

Prinsipyo 2. Paggamit sa mga URI sa HTTP scheme aron sila mahimong dereferencing.

Pinaagi sa paghisgot sa usa ka URI, kinahanglan nga posible nga makuha ang signifier sa likod sa kana nga signifier (ang analohiya sa ngalan sa operator "*»sa C); mas tukma, aron makakuha og representasyon niini nga gipasabot - depende sa bili sa HTTP header Accept:. Tingali, sa pag-abut sa panahon sa AR / VR, posible nga makuha ang kapanguhaan mismo, apan sa pagkakaron, lagmit, kini usa ka dokumento sa RDF nga resulta sa usa ka pangutana sa SPARQL. DESCRIBE.

Prinsipyo 3. Paggamit sa mga sukdanan sa W3C - panguna nga RDF(S) ug SPARQL - labi na kung gi-dereferencing ang mga URI.

Kini nga indibidwal nga "mga layer" sa Linked Data technology stack, nailhan usab nga Semantic Web Layer Cake, ihulagway sa ubos.

Prinsipyo 4. Paggamit sa mga pakisayran sa ubang mga URI kung naghulagway sa mga entidad.

Gitugotan ka sa RDF nga limitahan ang imong kaugalingon sa usa ka verbal nga paghulagway sa usa ka kapanguhaan sa natural nga sinultian, ug ang ikaupat nga prinsipyo nagtawag nga dili kini buhaton. Uban sa unibersal nga pag-obserbar sa unang prinsipyo, mahimong posible nga maghisgot sa uban, lakip ang mga "langyaw", kung naghulagway sa usa ka kapanguhaan, mao nga ang datos gitawag nga nalambigit. Sa tinuud, hapit dili kalikayan ang paggamit sa mga URI nga ginganlan sa diksyonaryo sa RDFS.

Ang RDF

Ang RDF (Resource Description Framework) - usa ka pormalismo alang sa paghulagway sa mga interrelated nga entidad.

Mahitungod sa mga entidad ug sa ilang mga relasyon, ang mga pahayag sa porma nga "subject-predicate-object" gihimo, gitawag nga triplets. Sa pinakasimple nga kaso, ang subject, predicate, ug object pareho nga URI. Ang parehas nga URI mahimong naa sa lainlaing mga triplet sa lainlaing mga posisyon: mahimong usa ka hilisgutan, usa ka predicate, ug usa ka butang; ang triplets sa ingon nahimong usa ka matang sa graph nga gitawag ug RDF graph.

Ang mga hilisgutan ug mga butang mahimong dili lamang mga URI, apan gitawag usab walay sulod nga mga node, ug ang mga butang mahimo usab mga literal. Ang mga literal mao ang mga pananglitan sa mga primitive nga tipo, nga naglangkob sa usa ka representasyon sa hilo ug usa ka espesipikasyon sa tipo.

Mga pananglitan sa pagsulat sa mga literal (sa Turtle syntax, labaw pa sa ubos): "5.0"^^xsd:float и "five"^^xsd:string. Mga literal nga may tipo rdf:langString mahimo usab nga mahatagan sa usa ka tag sa pinulongan, sa Turtle kini gisulat sama niini: "five"@en и "пять"@ru.

Ang mga walay sulod nga node kay "anonymous" nga mga kapanguhaan nga walay global identifiers, nga, bisan pa niana, mahimong ipahayag; matang sa existential variables.

Mao nga (kini, sa tinuud, mao ang tibuuk nga esensya sa RDF):

  • ang hilisgutan usa ka URI o usa ka walay sulod nga node,
  • ang predicate kay URI,
  • Ang butang usa ka URI, usa ka walay sulod nga node, o usa ka literal.

Ngano nga ang mga predicate mahimong walay sulod nga mga node?

Ang lagmit nga rason mao ang tinguha sa dili pormal nga pagsabot ug paghubad sa triplet ngadto sa pinulongan sa first-order predicate logic. s p o sama sa usa ka butang Semantic Web ug Linked Data. Pagtul-id ug pagdugangdiin Semantic Web ug Linked Data. Pagtul-id ug pagdugang - predicate, Semantic Web ug Linked Data. Pagtul-id ug pagdugang и Semantic Web ug Linked Data. Pagtul-id ug pagdugang - makanunayon. Adunay mga timailhan sa ingon nga pagsabut sa dokumento "LBase: Semantics alang sa mga Pinulongan sa Semantic Web”, nga adunay status sa usa ka W3C working group note. Uban niini nga pagsabut, ang triplet s p []diin [] - usa ka walay sulod nga node, hubaron nga Semantic Web ug Linked Data. Pagtul-id ug pagdugangdiin Semantic Web ug Linked Data. Pagtul-id ug pagdugang - variable, apan unsaon paghubad s [] o? Ang dokumento sa rekomendasyon sa W3C "RDF 1.1 Semantics” nagsugyot ug laing paagi sa paghubad, apan wala gihapon tagda ang posibilidad sa mga predicate kay walay sulod nga mga node.

Apan, Manu Sporny gitugotan.

Ang RDF usa ka abstract nga modelo. Ang RDF mahimong isulat (serialized) sa lainlaing mga syntax: RDF/XML, bao (kadaghanan mabasa sa tawo) JSON-LD, HDT (binary).

Ang parehas nga RDF mahimong ma-serialize sa RDF/XML sa lainlaing mga paagi, busa wala’y kahulogan, pananglitan, ang pag-validate sa resulta nga XML sa XSD o pagsulay sa pagkuha sa datos gamit ang XPath. Sa susama, ang JSON-LD dili tingali makatagbaw sa tinguha sa kasagaran nga developer sa Javascript nga magtrabaho uban sa RDF gamit ang Javascript dot ug square bracket notation (bisan tuod ang JSON-LD naglihok sa maong direksyon pinaagi sa pagtanyag og mekanismo. pag-frame).

Kadaghanan sa mga syntax nagtanyag mga paagi sa pagpamubo sa taas nga mga URI. Pananglitan, ad @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> sa Turtle unya motugot kaninyo sa pagsulat sa baylo <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> makatarunganon rdf:type.

RDFS

RDFS (RDF Schema) - batakang modelo sa bokabularyo, nagpaila sa mga konsepto sa kabtangan ug klase, ug mga kabtangan sama sa rdf:type, rdfs:subClassOf, rdfs:domain и rdfs:range. Gamit ang diksyonaryo sa RDFS, pananglitan, ang mosunod nga balido nga mga ekspresyon mahimong isulat:

rdf:type         rdf:type         rdf:Property .
rdf:Property     rdf:type         rdfs:Class .
rdfs:Class       rdfs:subClassOf  rdfs:Resource .
rdfs:subClassOf  rdfs:domain      rdfs:Class .
rdfs:domain      rdfs:domain      rdf:Property .
rdfs:domain      rdfs:range       rdfs:Class .
rdfs:label       rdfs:range       rdfs:Literal .

Ang RDFS usa ka deskripsyon ug modelo nga bokabularyo, apan dili usa ka pagpugong nga pinulongan (bisan pa ang opisyal nga detalye ug dahon ang posibilidad sa maong paggamit). Ang pulong nga "Schema" kinahanglan dili sabton sa parehas nga diwa sama sa ekspresyon nga "XML Schema". Pananglitan, :author rdfs:range foaf:Person nagpasabut nga rdf:type tanan nga mga kantidad sa kabtangan :author - foaf:Person, apan wala magpasabot nga kini kinahanglang isulti daan.

SPARQL

SPARQL (SPARQL Protocol ug RDF Query Language) usa ka pangutana nga lengguwahe para sa datos sa RDF. Sa usa ka yano nga kaso, ang usa ka pangutana sa SPARQL usa ka hugpong sa mga sample diin ang mga triplet sa gipangutana nga graph gipares. Ang mga variable mahimong ibutang sa mga posisyon sa mga subject, predicates, ug mga butang sa mga pattern.

Ibalik sa pangutana ang ingon nga mga variable nga kantidad nga, kung ilisan sa mga sample, mahimong moresulta sa usa ka subgraph sa RDF graph nga gipangutana (usa ka subset sa mga triplets niini). Ang mga variable nga parehas nga ngalan sa lainlaing mga sample sa triplet kinahanglan adunay parehas nga kantidad.

Pananglitan, sa ibabaw nga set sa pito ka RDFS axioms, ang mosunod nga pangutana mobalik rdfs:domain и rdfs:range isip mga mithi ?s и ?p sa tinuud:

SELECT * WHERE {
 ?s ?p rdfs:Class .
 ?p ?p rdf:Property .
}

Angay nga hinumdoman nga ang SPARQL usa ka deklaratibo ug dili usa ka graph traversal nga lengguwahe (bisan pa, pipila ka mga repositoryo sa RDF nagtanyag mga paagi aron ma-adjust ang plano sa pagpatuman sa pangutana). Busa, ang pipila ka standard nga mga problema sa graph, sama sa pagpangita sa pinakamubo nga dalan, dili masulbad sa SPARQL, lakip ang paggamit sa mekanismo mga agianan sa kabtangan (apan, pag-usab, ang indibidwal nga mga repositoryo sa RDF nagtanyag mga espesyal nga extension alang niini nga mga buluhaton).

Ang SPARQL wala mag-ambit sa pangagpas sa pagkabukas sa kalibutan ug nagsunod sa "negation as failure" nga pamaagi, diin posible mga istruktura sama sa FILTER NOT EXISTS {…}. Ang pag-apod-apod sa datos gikonsiderar gamit ang mekanismo federated nga mga pangutana.

Ang SPARQL access point, usa ka tindahan sa RDF nga makahimo sa pagproseso sa mga pangutana sa SPARQL, walay direktang mga analogue gikan sa ikaduhang yugto (tan-awa ang sinugdanan niini nga parapo). Mahimo kini nga ikatandi sa usa ka database, base sa sulod diin ang mga panid sa HTML nahimo, apan ma-access sa gawas. Ang SPARQL access point mas sama sa usa ka API access point gikan sa ikatulo nga yugto, apan adunay duha ka dagkong kalainan. Una, posible nga makombinar ang daghang "atomic" nga mga pangutana sa usa (nga gikonsiderar nga usa ka yawe nga kinaiya sa GraphQL), ug ikaduha, ang ingon nga API hingpit nga dokumentado sa kaugalingon (nga gisulayan nga makab-ot sa HATEOAS).

Polemic nga komento

Ang RDF usa ka paagi sa pagmantala sa datos sa web, busa ang mga repositoryo sa RDF kinahanglan isipon nga mga dokumento nga DBMS. Tinuod, tungod kay ang RDF usa ka graph, dili usa ka kahoy, nahimo silang graph sa parehas nga oras. Talagsaon nga kini nagtrabaho sa tanan. Kinsay magtuo nga adunay mga maalamon nga mga tawo nga nagpatuman sa mga blangko nga node. Ania si Codd wala molampos.

Adunay usab dili kaayo bug-os nga bahin nga mga paagi aron maorganisar ang pag-access sa datos sa RDF, pananglitan, Na-link nga mga Fragment sa Data (LDF) ug Nalambigit nga Data Platform (LDP).

OWL

OWL (Web Ontology Language) - usa ka pormalismo sa representasyon sa kahibalo, usa ka syntactic nga bersyon sa deskriptibong lohika Semantic Web ug Linked Data. Pagtul-id ug pagdugang (bisan asa sa ubos mas tukma nga isulti ang OWL 2, ang unang bersyon sa OWL gibase sa Semantic Web ug Linked Data. Pagtul-id ug pagdugang).

Ang mga konsepto sa mga lohika sa paghulagway sa OWL katumbas sa mga klase, mga tahas sa mga kabtangan, ang mga indibidwal nagpabilin sa ilang kanhing ngalan. Ang mga axiom gitawag usab nga mga axiom.

Pananglitan, sa gitawag nga Manchester syntax para sa OWL notation, ang axiom nga nahibal-an na nato Semantic Web ug Linked Data. Pagtul-id ug pagdugang isulat sama niini:

Class: Human
Class: Parent
   EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent

Adunay ubang mga syntax sa pagsulat sa OWL, sama sa functional syntax, gigamit sa opisyal nga detalye, ug OWL/XML. Usab, ang OWL mahimong serialized ngadto sa abstract RDF syntax ug sa umaabot - sa bisan unsang piho nga mga syntax.

Ang OWL duha ka pilo sa relasyon sa RDF. Sa usa ka bahin, kini mahimong tan-awon isip usa ka matang sa diksyonaryo nga nagpalapad sa RDFS. Sa laing bahin, kini usa ka mas gamhanan nga pormalismo diin ang RDF usa lamang ka serialization format. Dili tanang elementary OWL constructs pwede isulat gamit ang usa ka RDF triplet.

Depende kung unsang subset sa mga konstruksyon sa OWL ang gitugotan nga gamiton, ang usa naghisgot sa gitawag nga Mga profile sa OWL. Ang standardized ug labing nailhan mao ang OWL EL, OWL RL ug OWL QL. Ang pagpili sa profile makaapekto sa computational complexity sa tipikal nga mga problema. Usa ka kompleto nga hugpong sa mga disenyo sa OWL nga magkatugma Semantic Web ug Linked Data. Pagtul-id ug pagdugang, gitawag nga OWL DL. Usahay ang usa usab maghisgot sa OWL Full, diin ang OWL constructs gitugotan nga gamiton uban ang hingpit nga kagawasan nga anaa sa RDF, nga walay semantiko ug computational nga mga pagdili. Semantic Web ug Linked Data. Pagtul-id ug pagdugang. Pananglitan, ang usa ka butang mahimong usa ka klase ug usa ka kabtangan. Ang OWL Full dili masulbad.

Ang yawe nga mga prinsipyo sa paglakip sa mga sangputanan sa OWL mao ang pagdawat sa open world assumption (open world assumption, O.W.A.) ug ang pagsalikway sa talagsaon nga pangagpas sa ngalan, USA). Sa ubos atong makita kung unsa kini nga mga prinsipyo mahimong mosangpot ug ipaila ang pipila sa mga konstruksyon sa OWL.

Himoa nga ang ontology naglangkob sa mosunod nga tipik (sa Manchester syntax):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human
   Facts: hasChild Alice, hasChild Bob, hasChild Carol

Mosunod ba kini sa giingon nga daghang anak si Juan? Ang pagsalikway sa UNA makapugos sa inference engine sa pagtubag niini nga pangutana sa negatibo, tungod kay si Alice ug Bob mahimong parehas nga tawo. Aron mahitabo ang mosunod, kinahanglan natong idugang ang mosunod nga axiom:

DifferentIndividuals: Alice, Bob, Carol, John

Karon himoa nga ang ontology fragment adunay mosunod nga porma (si John gipahayag nga adunay daghang mga anak, apan siya adunay duha lamang ka mga anak):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human, manyChildren
   Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John

Kini ba nga ontolohiya mahimong dili managsama (nga mahimong hubaron nga ebidensya sa dili balido nga datos)? Ang pagdawat sa OWA makapahimo sa inference engine nga motubag sa negatibo: "sa laing dapit" (sa lain nga ontology) mahimong ikaingon nga si Carol anak usab ni John.

Aron mawagtang kini nga posibilidad, magdugang kita usa ka bag-ong kamatuoran bahin ni John:

Individual: John
   Facts: hasChild Alice, hasChild Bob, not hasChild Carol

Aron dili iapil ang dagway sa ubang mga bata, ingnon ta nga ang tanan nga mga kantidad sa kabtangan "adunay usa ka bata" mga tawo, diin kami adunay upat ra:

ObjectProperty: hasChild
   Domain: Human
   Сharacteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }

Karon ang ontology mahimong dili managsama, nga ang inference engine dili mapakyas sa pagtaho. Uban sa katapusan sa mga axioms, kita matang sa "sirado" sa kalibutan, ug makamatikod sa unsa nga paagi nga ang posibilidad nga si John mao ang iyang kaugalingong anak gisalikway.

Pag-link sa Data sa Enterprise

Usa ka hugpong sa mga pamaagi ug teknolohiya Ang Linked Data orihinal nga gituyo alang sa pagmantala sa datos sa web. Ang paggamit niini sa usa ka intracorporate nga palibot nag-atubang sa daghang mga kalisud.

Pananglitan, sa usa ka closed corporate environment, ang deductive power sa OWL base sa pagsagop sa OWA ug ang pagsalikway sa UNA, mga solusyon nga gimaneho sa bukas ug distributed nga kinaiyahan sa web, huyang kaayo. Ug dinhi ang mosunod nga mga output posible.

  • Ang paghatag sa OWL sa mga semantiko, nga nagpasabot sa pagsalikway sa OWA ug sa pagsagop sa UNA, ang pagpatuman sa katugbang nga inference engine. - subay niini nga dalan moadto Stardog RDF repository.
  • Gibiyaan ang deductive nga gahum sa OWL pabor sa mga makina sa pagmando. - Gisuportahan sa Stardog SWRL; Gitanyag ni Jena ug GraphDB kaugalingon mga sinultian mga lagda.
  • Ang pagsalikway sa mga deductive nga kapabilidad sa OWL, ang paggamit sa usa o lain nga subset duol sa RDFS alang sa pagmodelo. - Tan-awa ang dugang bahin niini sa ubos.

Ang usa pa nga problema mao ang labi ka hinungdanon nga atensyon nga mahimo sa kalibutan sa korporasyon sa mga isyu sa kalidad sa datos ug ang kakulang sa mga himan sa pag-validate sa datos sa Linked Data stack. Ang mga output mao ang mosunod.

  • Pag-usab, ang paggamit sa OWL nga mga konstruksyon nga adunay closed-world semantics ug pagkatalagsaon sa mga ngalan aron ma-validate kung adunay angay nga inference engine.
  • Paggamit SHACL, gi-estandard human naayo ang lista sa Semantic Web Layer Cake layers (bisan pa, mahimo usab kini gamiton isip rule engine), o ShEx.
  • Nahibal-an nga ang tanan sa katapusan nahimo pinaagi sa mga pangutana sa SPARQL, paghimo sa imong kaugalingon nga yano nga mekanismo sa pag-validate sa datos gamit kini.

Bisan pa, bisan ang usa ka kompleto nga pagsalikway sa mga deductive nga kapabilidad ug mga himan sa pag-validate nagbiya sa Linked Data stack gikan sa kompetisyon sa mga buluhaton nga parehas nga talan-awon sa bukas ug gipang-apod-apod nga web - sa mga buluhaton sa paghiusa sa datos.

Unsa ang mahitungod sa usa ka regular nga corporate information system?

Posible kini, apan kinahanglan, siyempre, mahibal-an kung unsa nga mga problema ang kinahanglan nga sulbaron sa angay nga mga teknolohiya. Akong ihulagway dinhi ang usa ka tipikal nga reaksyon sa mga partisipante sa pag-uswag aron ipakita kung unsa kini nga stack sa teknolohiya gikan sa punto sa pagtan-aw sa naandan nga IT. Nagpahinumdom kanako og gamay sa sambingay sa elepante:

  • Analista sa negosyo: RDF mao ang usa ka butang sama sa usa ka direkta nga gitipigan lohikal nga modelo.
  • Analista sa Sistema: Ang RDF sama sa EAV, nga adunay usa ka hugpong sa mga indeks ug usa ka kombenyente nga pangutana nga lengguwahe.
  • developer: maayo, kini tanan sa diwa sa adunahan nga modelo ug ubos nga mga konsepto sa code, nagbasa mahitungod niini bag-o lang.
  • Tagdumala sa Proyekto: oo nga pagkahugno sa stack!

Gipakita sa praktis nga ang stack kasagarang gigamit sa mga buluhaton nga may kalabutan sa pag-apod-apod ug heterogeneity sa datos, pananglitan, sa pagtukod og mga sistema sa MDM (Master Data Management) o DWH (Data Warehouse) nga klase. Ang ingon nga mga problema anaa sa bisan unsang industriya.

Sama sa alang sa mga aplikasyon nga espesipiko sa industriya, ang mga teknolohiya sa Linked Data sa pagkakaron labing popular sa mosunod nga mga industriya.

  • biomedical nga mga teknolohiya (diin ang ilang pagkapopular daw adunay kalabutan sa pagkakomplikado sa hilisgutan nga dapit);

topical

Sa "Boiling Point" sa miaging adlaw, usa ka komperensya nga gi-organisa sa asosasyon nga "National Medical Knowledge Base" ang gipahigayon "Paghiusa sa ontologies. Gikan sa teorya hangtod sa praktikal nga aplikasyon".

  • paghimo ug operasyon sa mga komplikadong produkto (dako nga engineering, produksiyon sa lana ug gas; kasagaran kini usa ka sumbanan ISO 15926);

topical

Dinhi, usab, ang hinungdan mao ang pagkakomplikado sa hilisgutan nga lugar, kung, pananglitan, sa upstream nga yugto, kung maghisgot kita bahin sa industriya sa lana ug gas, ang usa ka yano nga accounting kinahanglan adunay pipila nga mga gimbuhaton sa CAD.

Sa 2008, ang Chevron nag-host sa usa ka representante nga instalasyon ang komperensya.

Ang ISO 15926 sa kadugayan ingon og medyo bug-at sa industriya sa lana ug gas (ug nakit-an nga halos mas daghang gamit sa mechanical engineering). Si Statoil (Equinor) lang ang nalambigit kaniya sa hingpit, sa tibuok Norway ecosystem. Ang uban naningkamot sa pagbuhat sa ilang kaugalingong butang. Pananglitan, sumala sa mga hungihong, ang domestic Ministry of Energy nagtinguha sa paghimo sa usa ka "conceptual ontological nga modelo sa fuel ug energy complex", susama, dayag, sa gihimo alang sa industriya sa kuryente.

  • pinansyal nga mga institusyon (bisan ang XBRL makita nga hybrid sa SDMX ug RDF Data Cube ontology);

topical

Ang LinkedIn sa sinugdanan sa tuig aktibong nag-spam sa tagsulat sa mga bakante gikan sa halos tanang higante sa industriya sa pinansya, nga iyang nailhan gikan sa serye sa TV Suits: Goldman Sachs, JPMorgan Chase ug/o Morgan Stanley, Wells Fargo, SWIFT/Visa/ Mastercard, Bank of America, Citigroup, the Fed, Deutsche Bank… Ang tanan tingali nangita og tawo nga ipadala Komperensya sa Graph sa Kahibalo. Daghan ang nakahimo sa pagpangita: ang mga institusyong pinansyal nag-okupar sa tanan unang adlaw sa buntag.

Sa HeadHunter, usa ka butang nga makapaikag nga nakit-an lamang gikan sa Sberbank, kini mahitungod sa "EAV storage nga adunay usa ka modelo sa datos nga sama sa RDF."

Tingali, ang kalainan sa ang-ang sa gugma alang sa katugbang nga mga teknolohiya sa domestic ug Western pinansyal nga mga institusyon tungod sa transnational nga kinaiya sa mga kalihokan sa ulahi. Dayag nga, ang paghiusa sa mga utlanan sa estado nanginahanglan lahi nga kwalitatibo nga mga solusyon sa organisasyon ug teknikal.

  • pangutana-tubag nga mga sistema nga adunay komersyal nga mga aplikasyon (IBM Watson, Apple Siri, Google Knowledge Graph);

topical

Pinaagi sa dalan, ang tiglalang sa Siri, si Thomas Gruber, mao ang tagsulat sa mismong kahulugan sa ontology (sa IT nga diwa) isip usa ka "conceptualization specification". Sa akong opinyon, ang paghan-ay pag-usab sa mga pulong niini nga kahulugan wala mag-usab sa kahulogan niini, nga, tingali, nagpakita nga kini wala didto.

  • pagmantala sa structured data (uban sa maayong rason nga mahimo na kining ipasangil sa Linked Open Data).

topical

Daghang mga fans sa Linked Data mao ang gitawag nga GLAM: Mga Galeriya, Aklatan, Arkibo, ug Museyo. Igo lang isulti dinhi nga ilis sa MARC21, ang Library of Congress maoy nagpasiugda BIBFRAME, nga naghatag ug pundasyon alang sa kaugmaon sa bibliographic nga paghulagway ug siyempre base sa RDF.

Ang Wikidata kanunay nga gikutlo isip usa ka pananglitan sa usa ka malampuson nga proyekto sa natad sa Linked Open Data - usa ka matang sa mabasa sa makina nga bersyon sa Wikipedia, ang sulod niini, sukwahi sa DBPedia, wala mamugna pinaagi sa pag-import sa mga artikulo gikan sa mga infoboxes, apan gihimo nga mas daghan o dili kaayo mano-mano (ug pagkahuman nahimo nga tinubdan sa kasayuran alang sa parehas nga mga infoboxes).

Girekomenda usab alang sa pagrepaso listahan tiggamit sa Stardog RDF repository sa Stardog website sa "Customers" nga seksyon.

Bisan pa, sa Gartner "Hype Cycle alang sa Emerging Technologies" 2016 Ang "Enterprise Taxonomy and Ontology Management" gibutang sa tunga-tunga sa usa ka paglugsong ngadto sa walog sa kasagmuyo nga adunay paglaom nga makaabot sa usa ka "productivity plateau" nga dili mas sayo kaysa 10 ka tuig ang milabay.

Pagkonektar sa Data sa Enterprise

Mga panagna, panagna, panagna…

Tungod sa interes sa kasaysayan, akong gi-summarize ang mga panagna ni Gartner sa lainlaing mga tuig alang sa mga teknolohiya nga makapainteres kanamo sa lamesa sa ubos.

Год teknolohiya Pagreport Posisyon Mga tuig ngadto sa patag
2001 Semantiko nga Web Mga mitumaw nga Teknolohiya Inovation Trigger 5-10
2006 Corporate Semantic Web Mga mitumaw nga Teknolohiya Ang kinapungkayan sa gipaburot nga mga pagdahom 5-10
2012 Semantiko nga Web Big Data Ang kinapungkayan sa gipaburot nga mga pagdahom > 10
2015 Nalambigit nga Data Advanced Analytics ug Data Science Paagi sa Kapakyasan 5-10
2016 Pagdumala sa Enterprise Ontology Mga mitumaw nga Teknolohiya Paagi sa Kapakyasan > 10
2018 Mga Kahibalo sa Kaalam Mga mitumaw nga Teknolohiya Inovation Trigger 5-10

Hinuon, naa na sa "Hype Cycle..." 2018 laing uptrend ang mitungha - Knowledge Graphs. Usa ka piho nga reinkarnasyon ang nahitabo: graph DBMS, diin ang atensyon sa mga tiggamit ug mga pwersa sa mga developer nahimo nga gibalhin, ubos sa impluwensya sa mga hangyo sa una ug sa mga batasan sa ulahi, nagsugod sa pag-angkon sa mga contours ug positioning sa ang ilang mga kakompetensya nga gisundan.

Hapit matag graph DBMS karon nag-angkon nga usa ka angay nga plataporma alang sa pagtukod sa usa ka corporate "kahibalo graph" ("linked data" usahay gipulihan sa "connected data"), apan unsa ka makatarunganon ang maong mga pag-angkon?

Ang mga database sa graph kay asemantic gihapon, ang datos sa usa ka graph nga DBMS mao ra gihapon ang data silo. Ang mga string identifier imbes nga mga URI naghimo sa tahas sa pag-integrate sa duha ka graph nga DBMS sa parehas nga buluhaton sa pag-integrate, samtang ang pag-integrate sa duha ka RDF repository kasagaran usa lamang ka butang sa paghiusa sa duha ka RDF graphs. Ang laing aspeto sa asemanticity mao ang non-reflexivity sa LPG graph model, nga nagpalisud sa pagdumala sa metadata gamit ang parehas nga plataporma.

Sa kataposan, ang graph DBMSs walay inference engines o rule engines. Ang mga resulta sa maong mga makina mahimong kopyahon pinaagi sa komplikado nga mga pangutana, apan kini posible bisan sa SQL.

Bisan pa, ang nanguna nga mga repositoryo sa RDF wala’y problema sa pagsuporta sa modelo sa LPG. Ang labing lig-on mao ang pamaagi nga gisugyot sa usa ka higayon sa Blazegraph: ang RDF* nga modelo, nga naghiusa sa RDF ug LPG.

Basaha ang dugang pa

Mahimo nimong mabasa ang dugang bahin sa suporta sa modelo sa LPG pinaagi sa mga pagtipig sa RDF sa miaging artikulo sa Habré: "Unsa ang nahitabo sa mga repository sa RDF karon". Mahitungod sa Knowledge Graphs ug Data Fabric, nanghinaut ko nga usa ka adlaw ang usa ka lahi nga artikulo isulat. Ang katapusan nga seksyon, ingon nga dali sabton, gisulat nga nagdali, bisan pa, bisan unom ka bulan ang milabay, kini nga mga konsepto dili labi ka klaro.

Literatura

  1. Halpin, H., Monnin, A. (eds.) (2014). Philosophical Engineering: Ngadto sa Pilosopiya sa Web
  2. Allemang, D., Hendler, J. (2011) Semantic Web for the Working Ontologist (2nd ed.)
  3. Staab, S., Studer, R. (eds.) (2009) Handbook on Ontologies (2nd ed.)
  4. Wood, D. (ed.). (2011) Pag-link sa Data sa Enterprise
  5. Keet, M. (2018) Usa ka Pasiuna sa Ontology Engineering

Source: www.habr.com

Idugang sa usa ka comment