Իմաստային վեբ և կապակցված տվյալներ: Ուղղումներ և լրացումներ

Ուզում եմ հանրության ուշադրությանը ներկայացնել վերջերս լույս տեսած այս գրքից մի հատված.

Ձեռնարկության գոյաբանական մոդելավորում. մեթոդներ և տեխնոլոգիաներ [Տեքստ]. մենագրություն / [Ս. Վ. Գորշկով, Ս. Ս. Կրալին, Օ. Ի. Մուշտակ և այլք; գործադիր խմբագիր Ս.Վ.Գորշկով]. - Եկատերինբուրգ: Ուրալի համալսարանի հրատարակչություն, 2019 թ. - 234 էջ: հիվանդ, էջանիշ; 20 սմ - Auth. նշված է կրծքի հետևի մասում: Հետ. - Մատենագետ. գլխի վերջում։ - ISBN 978-5-7996-2580-1՝ 200 օրինակ։

Այս հատվածը Հաբրեի վրա դնելու նպատակը չորսն է.

  • Դժվար թե ինչ-որ մեկը կարողանա այս գիրքն իր ձեռքում պահել, եթե հարգվածի հաճախորդը չէ SergeIndex; հաստատ չի վաճառվում։
  • Տեքստում կատարվել են ուղղումներ (ներքևում դրանք ընդգծված չեն) և լրացումներ են կատարվել, որոնք այնքան էլ չեն համապատասխանում տպագիր մենագրության ձևաչափին՝ թեմատիկ նշումներ (սպոյլերների տակ) և հիպերհղումներ։
  • ես ուզում եմ հավաքել հարցեր և մեկնաբանություններդրանք հաշվի առնել, երբ այս տեքստը վերանայված ձևով ներառված է որևէ այլ հրատարակության մեջ:
  • Իմաստային վեբի և կապակցված տվյալների շատ հետևորդներ դեռևս կարծում են, որ իրենց շրջանակն այնքան նեղ է, հիմնականում այն ​​պատճառով, որ լայն հանրությանը դեռ պատշաճ կերպով չի բացատրվել, թե որքան լավ է լինել Իմաստային վեբի և կապակցված տվյալների հետևորդ: Հատվածի հեղինակը, թեև պատկանում է այս շրջանակին, չի հավատարիմ մնալ նման կարծիքին, բայց, այնուամենայնիվ, իրեն պարտավորված է համարում հերթական փորձն անել։

Այնպես որ,

Semantic Web- ը

Ինտերնետի էվոլյուցիան կարելի է ներկայացնել հետևյալ կերպ (կամ խոսել դրա հատվածների մասին, որոնք ձևավորվել են հետևյալ հաջորդականությամբ).

  1. Փաստաթղթեր ինտերնետում. Հիմնական տեխնոլոգիաներ - Gopher, FTP և այլն:
    Համացանցը գլոբալ ցանց է տեղական ռեսուրսների փոխանակման համար։
  2. Ինտերնետ փաստաթղթեր. Հիմնական տեխնոլոգիաներն են HTML և HTTP:
    Բացահայտված ռեսուրսների բնույթը հաշվի է առնում դրանց փոխանցման միջավայրի բնութագրերը:
  3. Ինտերնետային տվյալներ. Հիմնական տեխնոլոգիաներն են REST և SOAP API, XHR և այլն:
    Ինտերնետ հավելվածների դարաշրջան, ոչ միայն մարդիկ են դառնում ռեսուրսների սպառողներ։
  4. ինտերնետ տվյալներ. Հիմնական տեխնոլոգիաները Կապված տվյալների տեխնոլոգիաներն են:
    Այս չորրորդ փուլը, որը կանխատեսել է երկրորդի հիմնական տեխնոլոգիաների ստեղծող և W3C-ի տնօրեն Բերներս-Լին, կոչվում է Սեմալիստական ​​ցանց; Կապված տվյալների տեխնոլոգիաները նախագծված են համացանցում տվյալները ոչ միայն մեքենայական, այլև «մեքենայով հասկանալի» դարձնելու համար։

Հետևյալից ընթերցողին պարզ կդառնա, որ երկրորդ և չորրորդ փուլերի հիմնական հասկացությունները համապատասխանում են.

  • URL-ի անալոգները URI-ներն են,
  • HTML-ը նման է RDF-ին,
  • HTML հիպերհղումները նման են RDF փաստաթղթերի URI գրառումներին:

Semantic Web-ը ավելի շատ ինտերնետի ապագայի համակարգված տեսլական է, քան կոնկրետ ինքնաբուխ կամ լոբբիստական ​​միտում, թեև այն կարող է հաշվի առնել նաև վերջիններս: Օրինակ, «օգտատիրոջ կողմից ստեղծված բովանդակությունը» համարվում է Web 2.0 կոչվողի կարևոր հատկանիշ: Կոչ է արվում հաշվի առնել այն, մասնավորապես, W3C հանձնարարականը.Վեբ անոտացիայի գոյաբանություն«և այնպիսի ձեռնարկում, ինչպիսին է Պինդ.

Արդյո՞ք իմաստային ցանցը մեռած է:

Եթե ​​դուք հրաժարվեք անիրատեսական սպասումներ, իմաստային սարդոստայնի հետ կապված իրավիճակը մոտավորապես նույնն է, ինչ կոմունիզմի դեպքում՝ զարգացած սոցիալիզմի ժամանակներում (և թող յուրաքանչյուրն ինքը որոշի, թե արդյոք պահպանվում է հավատարմությունը Իլյիչի պայմանական պատվիրաններին)։ Որոնման համակարգեր բավականին հաջողակ ստիպել կայքերին օգտագործել RDFa և JSON-LD և իրենք օգտագործել ստորև նկարագրվածների հետ կապված տեխնոլոգիաներ (Google Knowledge Graph, Bing Knowledge Graph):

Ընդհանուր առմամբ, հեղինակը չի կարող ասել, թե ինչն է խանգարում ավելի մեծ տարածմանը, բայց կարող է խոսել անձնական փորձի հիման վրա։ Խնդիրներ կան, որոնք կլուծվեին «դուրս» ՀՕ-ի հարձակման պայմաններում, թեև ոչ շատ զանգվածային։ Որպես հետևանք՝ այս խնդիրներն ունեցողները չունեն հարկադրանքի միջոցներ նրանց նկատմամբ, ովքեր ի վիճակի են լուծում տալ, և վերջիններս իրենք՝ վերջիններիս կողմից լուծում տալը հակասում է իրենց բիզնես մոդելներին։ Այսպիսով, մենք շարունակում ենք վերլուծել HTML-ը և սոսնձել տարբեր API-ներ՝ մեկը մյուսի հետևից ավելի վատ:

Այնուամենայնիվ, Կապված տվյալների տեխնոլոգիաները տարածվել են զանգվածային ցանցից դուրս. Գիրքն, ըստ էության, նվիրված է նրանց կիրառություններին։ Ներկայումս Կապված տվյալների համայնքն ակնկալում է, որ այս տեխնոլոգիաները ավելի լայն տարածում կստանան Gartner-ի ֆիքսման (կամ հռչակելու, որը ցանկանում եք) միտումներով, ինչպիսիք են. Գիտելիքների գծապատկերներ и Տվյալների գործվածք. Ես կցանկանայի հավատալ, որ ոչ թե այս կոնցեպտների «հեծանիվների» իրականացումը հաջող կլինի, այլ ստորև քննարկված W3C ստանդարտներին:

Կապակցված տվյալներ

Բերներս-Լին սահմանեց Կապված տվյալները որպես ճիշտ արված իմաստային վեբ՝ իր վերջնական նպատակներին հասնելու մոտեցումների և տեխնոլոգիաների մի շարք: Կապակցված տվյալների հիմնական սկզբունքները Բերներ-Լի առանձնացրեց հետեւելով.

Սկզբունք 1. URI-ների օգտագործումը սուբյեկտներին անվանելու համար:

URI-ները գլոբալ միավորների նույնացուցիչներ են՝ ի տարբերություն գրառումների տեղական տողերի նույնացուցիչների: Հետագայում այս սկզբունքը գտավ իր լավագույն արտահայտությունը Google Knowledge Graph կարգախոսում «իրեր, ոչ թե լարեր.

Սկզբունք 2. URI-ների օգտագործումը HTTP սխեմայում, որպեսզի դրանք կարողանան վերաբերել:

Անդրադառնալով URI-ին, պետք է հնարավոր լինի ստանալ այդ նշանի հետևում գտնվող նշանակիչը (օպերատորի անվան անալոգիա «*» C-ում); ավելի ճիշտ՝ այս նշանակալի պատկերը ստանալու համար՝ կախված HTTP վերնագրի արժեքից Accept:. Հավանաբար, AR / VR դարաշրջանի գալուստով հնարավոր կլինի ստանալ ռեսուրսը ինքնին, բայց առայժմ, ամենայն հավանականությամբ, դա կլինի RDF փաստաթուղթ, որը SPARQL հարցման արդյունք է: DESCRIBE.

Սկզբունք 3. W3C ստանդարտների՝ հիմնականում RDF(S) և SPARQL-ի օգտագործումը, մասնավորապես, URI-ների վերաբերման ժամանակ:

Կապված տվյալների տեխնոլոգիայի կույտի այս անհատական ​​«շերտերը», որը նաև հայտնի է որպես Semantic Web Layer Cake, կներկայացվի ստորև։

Սկզբունք 4. Օգտագործելով այլ URI-ների հղումներ՝ սուբյեկտները նկարագրելիս:

RDF-ն թույլ է տալիս Ձեզ սահմանափակվել բնական լեզվով ռեսուրսի բանավոր նկարագրությամբ, և չորրորդ սկզբունքը կոչ է անում դա չանել: Առաջին սկզբունքի համընդհանուր պահպանման դեպքում ռեսուրսը նկարագրելիս հնարավոր է դառնում հղում կատարել ուրիշներին, այդ թվում՝ «օտարներին», ինչի պատճառով էլ տվյալները կոչվում են կապակցված։ Փաստորեն, գրեթե անխուսափելի է օգտագործել RDFS բառարանում նշված URI-ները:

RDF- ն

RDF- ն (Resource Description Framework) - փոխկապակցված սուբյեկտների նկարագրության ֆորմալիզմ:

Սուբյեկտների և նրանց փոխհարաբերությունների մասին արվում են «առարկա-նախադատ-օբյեկտ» ձևի հայտարարություններ, որոնք կոչվում են եռյակներ։ Ամենապարզ դեպքում, սուբյեկտը, պրեդիկատը և օբյեկտը երկուսն էլ URI-ներ են: Նույն URI-ն կարող է լինել տարբեր եռյակներում՝ տարբեր դիրքերում՝ լինել սուբյեկտ, պրեդիկատ և օբյեկտ; Այսպիսով, եռյակները ձևավորում են մի տեսակ գրաֆիկ, որը կոչվում է RDF գրաֆիկ:

Սուբյեկտներ և օբյեկտներ կարող են լինել ոչ միայն URI-ներ, այլ նաև այսպես կոչված դատարկ հանգույցներ, և առարկաները կարող են նաև լինել բառացի. Literals-ը պարզունակ տիպերի օրինակներ են, որոնք բաղկացած են լարային ներկայացումից և տիպի ճշգրտումից:

Բառացի գրելու օրինակներ (կրիայի շարահյուսությամբ, դրա մասին ավելին ստորև). "5.0"^^xsd:float и "five"^^xsd:string. Բառացիներ՝ տիպի հետ rdf:langString կարող է տրամադրվել նաև լեզվի պիտակ, Turtle-ում սա գրված է այսպես. "five"@en и "пять"@ru.

Դատարկ հանգույցները «անանուն» ռեսուրսներ են՝ առանց գլոբալ նույնացուցիչների, որոնք, այնուամենայնիվ, կարելի է պնդել. էկզիստենցիալ փոփոխականների տեսակ։

Այսպիսով (սա, ըստ էության, RDF-ի ողջ էությունն է).

  • թեման URI է կամ դատարկ հանգույց,
  • պրեդիկատը URI է,
  • օբյեկտը URI է, դատարկ հանգույց կամ բառացի:

Ինչու՞ պրեդիկատները չեն կարող դատարկ հանգույցներ լինել:

Հավանական պատճառը եռյակը ոչ պաշտոնապես հասկանալու և առաջին կարգի պրեդիկատային տրամաբանության լեզվով թարգմանելու ցանկությունն է: s p o նման բանի նման Իմաստային վեբ և կապակցված տվյալներ: Ուղղումներ և լրացումներՈրտեղ Իմաստային վեբ և կապակցված տվյալներ: Ուղղումներ և լրացումներ - պրեդիկատ, Իմաստային վեբ և կապակցված տվյալներ: Ուղղումներ և լրացումներ и Իմաստային վեբ և կապակցված տվյալներ: Ուղղումներ և լրացումներ - հաստատուններ. Փաստաթղթում նման ըմբռնման հետքեր կան».LBase: Իմաստաբանություն իմաստային վեբի լեզուների համար», որն ունի W3C աշխատանքային խմբի գրության կարգավիճակ։ Այս հասկացողությամբ եռյակը s p []Որտեղ [] - դատարկ հանգույց, կթարգմանվի որպես Իմաստային վեբ և կապակցված տվյալներ: Ուղղումներ և լրացումներՈրտեղ Իմաստային վեբ և կապակցված տվյալներ: Ուղղումներ և լրացումներ - փոփոխական, բայց ինչպես հետո թարգմանել s [] o? W3C հանձնարարական փաստաթուղթ»RDF 1.1 Իմաստաբանություն»-ն առաջարկում է թարգմանության մեկ այլ եղանակ, սակայն դեռևս չի դիտարկում պրեդիկատի դատարկ հանգույց լինելու հնարավորությունը։

Այնուամենայնիվ, Մանու Սփորնին թույլատրված է.

RDF-ն վերացական մոդել է։ RDF-ն կարող է գրվել (սերիականացված) տարբեր շարահյուսություններով. RDF/XML, Կրիա (Մարդկանց համար առավել ընթեռնելի) JSON-LD, HDT (երկուական):

Նույն RDF-ն կարող է սերիալացվել RDF/XML-ի մեջ տարբեր ձևերով, ուստի անիմաստ է, օրինակ, ստացված XML-ը XSD-ով վավերացնելը կամ XPath-ով տվյալներ հանել: Նմանապես, JSON-LD-ը դժվար թե բավարարի Javascript-ի միջին մշակողի ցանկությունը՝ աշխատելու RDF-ի հետ՝ օգտագործելով Javascript կետ և քառակուսի փակագծային նշում (չնայած JSON-LD-ը շարժվում է այդ ուղղությամբ՝ առաջարկելով մեխանիզմ: շրջանակելը).

Շատ շարահյուսություններ առաջարկում են երկար URI-ների կրճատման եղանակներ: Օրինակ, գովազդ @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> Turtle-ում այնուհետև թույլ կտա ձեզ գրել փոխարենը <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> ուղղակի rdf:type.

RDFS

RDFS (RDF Schema) - հիմնական մոդելավորման բառապաշար, ներկայացնում է սեփականության և դասի հասկացությունները և այնպիսի հատկություններ, ինչպիսիք են. rdf:type, rdfs:subClassOf, rdfs:domain и rdfs:range. Օգտագործելով RDFS բառարանը, օրինակ, կարելի է գրել հետևյալ վավեր արտահայտությունները.

rdf:type         rdf:type         rdf:Property .
rdf:Property     rdf:type         rdfs:Class .
rdfs:Class       rdfs:subClassOf  rdfs:Resource .
rdfs:subClassOf  rdfs:domain      rdfs:Class .
rdfs:domain      rdfs:domain      rdf:Property .
rdfs:domain      rdfs:range       rdfs:Class .
rdfs:label       rdfs:range       rdfs:Literal .

RDFS-ը նկարագրության և մոդելավորման բառապաշար է, բայց սահմանափակող լեզու չէ (չնայած պաշտոնական բնութագրերը և տերևները նման օգտագործման հնարավորությունը): «Schema» բառը չպետք է հասկանալ նույն իմաստով, ինչ «XML Schema» արտահայտության մեջ։ Օրինակ, :author rdfs:range foaf:Person նշանակում է, որ rdf:type գույքի բոլոր արժեքները :author - foaf:Person, բայց չի նշանակում, որ սա պետք է նախապես ասել։

SPARQL

SPARQL (SPARQL Protocol and RDF Query Language) հարցման լեզու է RDF տվյալների համար: Պարզ դեպքում SPARQL հարցումը նմուշների մի շարք է, որոնց հետ համընկնում են հարցվող գրաֆիկի եռյակները: Փոփոխականները կարող են տեղադրվել սուբյեկտների, պրեդիկատների և առարկաների դիրքերում նախշերով:

Հարցումը կվերադարձնի այնպիսի փոփոխական արժեքներ, որոնք, երբ փոխարինվում են նմուշների մեջ, կարող են հանգեցնել RDF գրաֆիկի ենթագրաֆի հարցմանը (նրա եռյակների ենթաբազմությունը): Եռյակների տարբեր նմուշներում նույն անունով փոփոխականները պետք է ունենան նույն արժեքները:

Օրինակ, վերը նշված յոթ RDFS աքսիոմների վրա կվերադառնա հետևյալ հարցումը rdfs:domain и rdfs:range որպես արժեքներ ?s и ?p համապատասխանաբար ՝

SELECT * WHERE {
 ?s ?p rdfs:Class .
 ?p ?p rdf:Property .
}

Հարկ է նշել, որ SPARQL-ը դեկլարատիվ է և գրաֆիկի անցման լեզու չէ (սակայն, որոշ RDF պահոցներ առաջարկում են հարցումների կատարման պլանը կարգավորելու եղանակներ): Հետևաբար, որոշ ստանդարտ գրաֆիկական խնդիրներ, ինչպիսիք են ամենակարճ ճանապարհը գտնելը, չեն կարող լուծվել SPARQL-ում, այդ թվում՝ օգտագործելով մեխանիզմը: սեփականության ուղիները (բայց, կրկին, առանձին RDF պահոցներն առաջարկում են հատուկ ընդարձակումներ այս առաջադրանքների համար):

SPARQL-ը չի կիսում աշխարհի բաց լինելու կանխավարկածը և հետևում է «ժխտումը որպես ձախողում» մոտեցմանը, որում. հնարավոր է կառույցներ, ինչպիսիք են FILTER NOT EXISTS {…}. Տվյալների բաշխումը հաշվի է առնվում մեխանիզմի կիրառմամբ դաշնային հարցումներ.

SPARQL մուտքի կետը՝ RDF խանութ, որը կարող է մշակել SPARQL հարցումները, երկրորդ փուլից ուղիղ անալոգներ չունի (տե՛ս այս պարբերության սկիզբը): Այն կարելի է համեմատել տվյալների բազայի հետ, որի բովանդակության հիման վրա ստեղծվել են HTML էջեր, սակայն հասանելի են արտաքինից: SPARQL մուտքի կետը ավելի շատ նման է API մուտքի կետի երրորդ փուլից, բայց երկու հիմնական տարբերություններով: Նախ, հնարավոր է միավորել մի քանի «ատոմային» հարցումներ մեկի մեջ (որը համարվում է GraphQL-ի հիմնական բնութագիրը), և երկրորդ՝ նման API-ն ամբողջությամբ փաստաթղթավորված է (ինչին փորձել է հասնել HATEOAS-ը):

Պոլեմիկ դիտողություն

RDF-ն համացանցում տվյալների հրապարակման միջոց է, ուստի RDF պահոցները պետք է համարվեն փաստաթղթերի DBMS: Ճիշտ է, քանի որ RDF-ն գրաֆիկ է, ոչ թե ծառ, պարզվեց, որ դրանք միաժամանակ գրաֆիկ են: Զարմանալի է, որ դա ընդհանրապես ստացվեց: Ո՞վ կմտածեր, որ կլինեն խելացի մարդիկ, ովքեր իրականացնում են դատարկ հանգույցներ: Ահա Քոդը չստացվեց.

Կան նաև RDF տվյալների հասանելիությունը կազմակերպելու ավելի քիչ լիարժեք եղանակներ, օրինակ. Կապված տվյալների հատվածներ (LDF) և Կապված տվյալների հարթակ (LDP):

OWL

OWL (Web Ontology Language) - գիտելիքների ներկայացման ֆորմալիզմ, նկարագրական տրամաբանության շարահյուսական տարբերակ Իմաստային վեբ և կապակցված տվյալներ: Ուղղումներ և լրացումներ (ներքևում ամենուր ավելի ճիշտ է ասել OWL 2, OWL-ի առաջին տարբերակը հիմնված էր. Իմաստային վեբ և կապակցված տվյալներ: Ուղղումներ և լրացումներ).

OWL-ում նկարագրության տրամաբանության հասկացությունները համապատասխանում են դասերին, դերերը՝ հատկություններին, անհատները պահպանում են իրենց նախկին անվանումը։ Աքսիոմները կոչվում են նաև աքսիոմներ։

Օրինակ, այսպես կոչված Մանչեսթերի շարահյուսություն OWL նշման համար՝ աքսիոմը, որը մենք արդեն գիտենք Իմաստային վեբ և կապակցված տվյալներ: Ուղղումներ և լրացումներ կգրվի այսպես.

Class: Human
Class: Parent
   EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent

OWL գրելու այլ շարահյուսություններ կան, օրինակ ֆունկցիոնալ շարահյուսություն, օգտագործվում է պաշտոնական բնութագրում, և OWL/XML. Նաև OWL-ը կարող է սերիականացվել վերացական RDF շարահյուսության մեջ իսկ ապագայում՝ կոնկրետ շարահյուսություններից որևէ մեկում։

OWL-ը RDF-ի նկատմամբ երկակի է: Մի կողմից, այն կարելի է դիտարկել որպես մի տեսակ բառարան, որը ընդլայնում է RDFS-ը: Մյուս կողմից, դա ավելի հզոր ֆորմալիզմ է, որի համար RDF-ն ընդամենը սերիալացման ձևաչափ է։ Ոչ բոլոր տարրական OWL կառուցվածքները կարող են գրվել մեկ RDF եռյակով:

Կախված նրանից, թե OWL կոնստրուկցիաների որ ենթաբազմություն է թույլատրվում օգտագործել, խոսվում է այսպես կոչված. OWL պրոֆիլներ. Ստանդարտացված և ամենահայտնիներն են OWL EL, OWL RL և OWL QL: Պրոֆիլի ընտրությունը ազդում է տիպիկ խնդիրների հաշվողական բարդության վրա: Համապատասխան OWL դիզայնի ամբողջական հավաքածու Իմաստային վեբ և կապակցված տվյալներ: Ուղղումներ և լրացումներ, կոչվում է OWL DL: Երբեմն խոսվում է նաև OWL Full-ի մասին, որտեղ OWL կոնստրուկցիաները թույլատրվում են օգտագործել RDF-ին բնորոշ լիակատար ազատությամբ՝ առանց իմաստային և հաշվողական սահմանափակումների։ Իմաստային վեբ և կապակցված տվյալներ: Ուղղումներ և լրացումներ. Օրինակ, ինչ-որ բան կարող է լինել և՛ դաս, և՛ սեփականություն: OWL Full-ը անլուծելի է:

OWL-ում հետևանքների կցման հիմնական սկզբունքներն են բաց աշխարհի ենթադրության ընդունումը (բաց աշխարհի ենթադրություն, ՕՎԱ) և եզակի անվան ենթադրության մերժումը, ՄԵԿ) Ստորև մենք կտեսնենք, թե ինչի կարող են հանգեցնել այս սկզբունքները և կներկայացնենք OWL-ի որոշ կառուցվածքներ:

Թող գոյաբանությունը պարունակի հետևյալ հատվածը (Մանչեսթերի շարահյուսությամբ).

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human
   Facts: hasChild Alice, hasChild Bob, hasChild Carol

Ասվածից կհետևի՞, որ Ջոնը շատ երեխաներ ունի։ UNA-ի մերժումը կստիպի եզրակացության շարժիչին բացասական պատասխան տալ այս հարցին, քանի որ Ալիսը և Բոբը շատ լավ կարող են լինել նույն մարդը: Որպեսզի տեղի ունենա հետևյալը, մենք պետք է ավելացնենք հետևյալ աքսիոմը.

DifferentIndividuals: Alice, Bob, Carol, John

Հիմա թող գոյաբանության հատվածը ունենա հետևյալ ձևը (Ջոնը հայտարարվում է, որ շատ երեխաներ ունի, բայց նա ունի ընդամենը երկու երեխա).

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human, manyChildren
   Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John

Արդյո՞ք այս գոյաբանությունը անհամապատասխան կլինի (որը կարող է մեկնաբանվել որպես անվավեր տվյալների ապացույց): OWA-ի ընդունումը կհանգեցնի եզրակացության շարժիչի բացասական պատասխանին. «որևէ տեղ» (այլ գոյաբանությամբ) կարելի է ասել, որ Քերոլը նույնպես Ջոնի երեխա է:

Այս հնարավորությունը վերացնելու համար եկեք ավելացնենք մի նոր փաստ Հովհաննեսի մասին.

Individual: John
   Facts: hasChild Alice, hasChild Bob, not hasChild Carol

Այլ երեխաների արտաքին տեսքը բացառելու համար ասենք, որ «երեխա ունենալ» գույքի բոլոր արժեքները մարդիկ են, որոնցից ունենք միայն չորսը.

ObjectProperty: hasChild
   Domain: Human
   Сharacteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }

Այժմ գոյաբանությունը կդառնա անհամապատասխան, ինչը եզրակացության շարժիչը չի զլանա հաղորդել: Վերջին աքսիոմներով մենք մի տեսակ «փակեցինք» աշխարհը և նկատեցինք, թե ինչպես է բացառվում այն ​​հավանականությունը, որ Ջոնն իր զավակն է։

Ձեռնարկությունների տվյալների միացում

Կապված տվյալների մի շարք մոտեցումներ և տեխնոլոգիաներ ի սկզբանե նախատեսված էր համացանցում տվյալների հրապարակման համար: Ներկորպորատիվ միջավայրում դրանք օգտագործելը մի շարք դժվարությունների է հանդիպում։

Օրինակ, փակ կորպորատիվ միջավայրում OWL-ի դեդուկտիվ ուժը, որը հիմնված է OWA-ի ընդունման և UNA-ի մերժման վրա, լուծումներ, որոնք պայմանավորված են ցանցի բաց և բաշխված բնույթով, չափազանց թույլ է: Եվ այստեղ հնարավոր են հետևյալ ելքերը.

  • OWL-ին իմաստաբանությամբ օժտել՝ ենթադրելով OWA-ի մերժում և UNA-ի ընդունում, համապատասխան եզրակացության շարժիչի ներդրում։ - այս ճանապարհով գնում Stardog RDF պահոց.
  • Հրաժարվելով OWL-ի դեդուկտիվ հզորությունից՝ հօգուտ կանոնների շարժիչների: - Stardog-ն աջակցում է SWRL; Jena-ն և GraphDB-ն առաջարկում են սեփական լեզուներ կանոնները։
  • OWL-ի դեդուկտիվ հնարավորությունների մերժում, մոդելավորման համար RDFS-ին մոտ գտնվող այս կամ այն ​​ենթաբազմության օգտագործումը։ - Այս մասին ավելին տես ստորև:

Մեկ այլ խնդիր է ավելի զգալի ուշադրությունը, որը կորպորատիվ աշխարհը կարող է հատկացնել տվյալների որակի խնդիրներին և տվյալների վավերացման գործիքների բացակայությունը Կապված տվյալների կույտում: Արդյունքները հետևյալն են.

  • Կրկին, օգտագործելով OWL կոնստրուկցիաները փակ աշխարհի իմաստաբանությամբ և անունների եզակիությամբ՝ հաստատելու համար, թե արդյոք կա համապատասխան եզրակացության շարժիչ:
  • Օգտագործում ՇԱԿԼ, ստանդարտացված Semantic Web Layer Cake շերտերի ցանկի ամրագրումից հետո (սակայն, այն կարող է օգտագործվել նաև որպես կանոնների շարժիչ), կամ ՇԷքս.
  • Հասկանալով, որ ամեն ինչ, ի վերջո, կատարվում է SPARQL հարցումների միջոցով՝ ստեղծելով ձեր սեփական պարզ տվյալների վավերացման մեխանիզմը՝ օգտագործելով դրանք:

Այնուամենայնիվ, նույնիսկ դեդուկտիվ հնարավորությունների և վավերացման գործիքների ամբողջական մերժումը Կապված տվյալներին դուրս է թողնում մրցակցությունից այնպիսի առաջադրանքներում, որոնք նման են բաց և բաշխված վեբին՝ տվյալների ինտեգրման առաջադրանքներում:

Ի՞նչ կասեք սովորական կորպորատիվ տեղեկատվական համակարգի մասին:

Սա հնարավոր է, բայց պետք է, իհարկե, տեղյակ լինել, թե կոնկրետ ինչ խնդիրներ պետք է լուծեն համապատասխան տեխնոլոգիաները։ Ես այստեղ նկարագրելու եմ զարգացման մասնակիցների տիպիկ ռեակցիան՝ ցույց տալու համար, թե ինչ տեսք ունի այս տեխնոլոգիական փաթեթը սովորական ՏՏ տեսանկյունից: Ինձ մի փոքր հիշեցնում է փղի առակը.

  • Բիզնեսի վերլուծաբանRDF-ն ուղղակիորեն պահվող տրամաբանական մոդելի նման մի բան է:
  • Համակարգի վերլուծաբանRDF-ն նման է EAV, միայն մի փունջ ինդեքսներով և հարցումների հարմար լեզվով։
  • ԵրեվակիչԴե, ամեն ինչ հարուստ մոդելի և ցածր կոդերի գաղափարների ոգով է, կարդում էր այդ մասին վերջերս:
  • Ծրագրի ղեկավար: Այո այդպես է փլուզելով կույտը!

Պրակտիկան ցույց է տալիս, որ կույտը առավել հաճախ օգտագործվում է տվյալների բաշխման և տարասեռության հետ կապված առաջադրանքներում, օրինակ, MDM (Master Data Management) կամ DWH (Data Warehouse) դասի համակարգեր կառուցելիս: Նման խնդիրներ կան ցանկացած ոլորտում։

Ինչ վերաբերում է ոլորտին հատուկ հավելվածներին, ապա Կապված տվյալների տեխնոլոգիաները ներկայումս առավել տարածված են հետևյալ ոլորտներում.

  • կենսաբժշկական տեխնոլոգիաներ (որտեղ դրանց ժողովրդականությունը կարծես թե կապված է թեմայի ոլորտի բարդության հետ);

արդիական

«Եռման կետում» օրերս տեղի ունեցավ «Ազգային բժշկական գիտելիքի բազա» ասոցիացիայի կողմից կազմակերպված համաժողովը.Գոյաբանությունների միավորում. Տեսությունից մինչև գործնական կիրառություն.

  • բարդ արտադրանքների արտադրություն և շահագործում (խոշոր ճարտարագիտություն, նավթի և գազի արդյունահանում. ամենից հաճախ դա ստանդարտ է ISO 15926);

արդիական

Այստեղ նույնպես պատճառը առարկայական ոլորտի բարդությունն է, երբ, օրինակ, վերին հոսանքի փուլում, եթե խոսենք նավթագազային արդյունաբերության մասին, պարզ հաշվառումը պետք է ունենա որոշակի CAD գործառույթներ։

2008 թվականին Chevron-ը հյուրընկալեց ներկայացուցչական ինստալացիա կոնֆերանս.

ISO 15926-ը, ի վերջո, մի փոքր ծանր թվաց նավթի և գազի արդյունաբերության համար (և գրեթե ավելի շատ կիրառություն գտավ մեքենաշինության մեջ): Միայն Statoil-ը (Էքվինորը) հիմնովին կապվեց նրա վրա, ամբողջ Նորվեգիայում էկոհամակարգ. Մյուսները փորձում են իրենց գործն անել: Օրինակ, ըստ լուրերի, ներքին էներգետիկայի նախարարությունը մտադիր է ստեղծել «վառելիքաէներգետիկ համալիրի հայեցակարգային գոյաբանական մոդել», որը, ըստ երեւույթին, նման է. ստեղծված էլեկտրաէներգիայի արդյունաբերության համար.

  • ֆինանսական հաստատություններ (նույնիսկ XBRL-ը կարելի է դիտել որպես SDMX և RDF Data Cube գոյաբանության հիբրիդ);

արդիական

LinkedIn-ը տարեսկզբին ակտիվորեն սպամում էր հեղինակի թափուր աշխատատեղերը ֆինանսական ոլորտի գրեթե բոլոր հսկաներից, որոնց նա ճանաչում է Suits հեռուստասերիալից՝ Goldman Sachs, JPMorgan Chase և/կամ Morgan Stanley, Wells Fargo, SWIFT/Visa/: Mastercard, Bank of America, Citigroup, Fed, Deutsche Bank… Բոլորը հավանաբար փնտրում էին ինչ-որ մեկին ուղարկելու համար: Գիտելիքի գրաֆիկի կոնֆերանս. Բավականին հաջողվել է գտնել. ֆինանսական հաստատությունները զբաղեցրել են ամեն ինչ առաջին օրվա առավոտ.

HeadHunter-ում հետաքրքիր բան հայտնվեց միայն Սբերբանկից, խոսքը վերաբերում էր «EAV պահեստավորմանը RDF-ի նման տվյալների մոդելով»:

Հավանաբար, հայրենական և արևմտյան ֆինանսական կառույցների համապատասխան տեխնոլոգիաների նկատմամբ սիրո աստիճանի տարբերությունը պայմանավորված է վերջիններիս գործունեության անդրազգային բնույթով։ Ըստ երևույթին, պետական ​​սահմաններից դուրս ինտեգրումը պահանջում է որակապես տարբեր կազմակերպչական և տեխնիկական լուծումներ։

  • հարցուպատասխան համակարգեր, որոնք ունեն առևտրային հավելվածներ (IBM Watson, Apple Siri, Google Knowledge Graph);

արդիական

Ի դեպ, Siri-ի ստեղծող Թոմաս Գրուբերը հենց գոյաբանության (ՏՏ իմաստով) սահմանման հեղինակն է՝ որպես «կոնցեպտուալացման հստակեցում»։ Իմ կարծիքով, այս սահմանման մեջ բառերի վերադասավորումը չի փոխում դրա իմաստը, ինչը, թերեւս, ցույց է տալիս, որ այն չկա։

  • կառուցվածքային տվյալների հրապարակում (հիմնավոր պատճառներով դա արդեն կարելի է վերագրել Կապված բաց տվյալներին):

արդիական

Կապված տվյալների մեծ երկրպագուներն են, այսպես կոչված, GLAM-ը՝ պատկերասրահներ, գրադարաններ, արխիվներ և թանգարաններ: Այստեղ բավական է ասել, որ MARC21-ին փոխարինելու համար Կոնգրեսի գրադարանը խթանում է BIBFRAMEՈրը հիմք է տալիս մատենագիտական ​​նկարագրության ապագայի համար և իհարկե հիմնված RDF-ի վրա:

Վիքիտվյալները հաճախ նշվում են որպես Կապակցված բաց տվյալների ոլորտում հաջողված նախագծի օրինակ՝ Վիքիպեդիայի մի տեսակ մեքենայաընթեռնելի տարբերակ, որի բովանդակությունը, ի տարբերություն DBPedia-ի, չի ստեղծվում տեղեկատվական արկղերից հոդվածներ ներմուծելով, այլ ստեղծվել է քիչ թե շատ ձեռքով (և հետագայում դառնում է նույն տեղեկատվական արկղերի տեղեկատվության աղբյուր):

Նաև առաջարկվում է վերանայման համար ցանկ Stardog RDF պահեստի օգտվողները Stardog կայքում «Հաճախորդներ» բաժնում:

Ինչքան էլ որ լինի, Gartner-ում «Hype Cycle for Emerging Technologies» 2016 թ «Ձեռնարկությունների տաքսոնոմիա և գոյաբանության կառավարում»-ը տեղավորվում է հիասթափության հովիտ իջնելիս՝ ոչ շուտ, քան 10 տարի հետո «արտադրողական սարահարթի» հասնելու հեռանկարով:

Ձեռնարկությունների տվյալների միացում

Կանխատեսումներ, կանխատեսումներ, կանխատեսումներ…

Պատմական հետաքրքրությունից ելնելով` ես ամփոփել եմ Gartner-ի տարբեր տարիների կանխատեսումները մեզ հետաքրքրող տեխնոլոգիաների վերաբերյալ ստորև բերված աղյուսակում:

Տարի Технология Զեկուցել Դիրք Տարիներ դեպի սարահարթ
2001 Semantic Web- ը Զարգացող տեխնոլոգիաներ Նորարարության ձգան 5-10
2006 Կորպորատիվ իմաստային վեբ Զարգացող տեխնոլոգիաներ Ուռճացված սպասումների գագաթնակետը 5-10
2012 Semantic Web- ը Մեծ Data Ուռճացված սպասումների գագաթնակետը > 10
2015 Կապակցված տվյալներ Ընդլայնված վերլուծություն և տվյալների գիտություն Հիասթափության տաշտ 5-10
2016 Ձեռնարկությունների գոյաբանության կառավարում Զարգացող տեխնոլոգիաներ Հիասթափության տաշտ > 10
2018 Գիտելիքների գծապատկերներ Զարգացող տեխնոլոգիաներ Նորարարության ձգան 5-10

Այնուամենայնիվ, արդեն ներս «Hype Cycle...» 2018 թ Հայտնվեց մեկ այլ աճի միտում՝ Գիտելիքի գրաֆիկները: Տեղի ունեցավ որոշակի ռեինկառնացիա՝ գրաֆիկական DBMS, որի վրա, պարզվեց, որ օգտատերերի ուշադրությունը և մշակողների ուժերը միացված են՝ առաջինների խնդրանքների և վերջինների սովորությունների ազդեցության տակ, սկսեցին ձեռք բերել ուրվագծեր և դիրքավորում։ նրանց մրցակից նախորդները:

Գրեթե յուրաքանչյուր գրաֆիկ DBMS-ն այժմ պնդում է, որ հարմար հարթակ է կորպորատիվ «գիտելիքների գրաֆիկ» ստեղծելու համար («կապված տվյալները» երբեմն փոխարինվում են «կապված տվյալներով»), բայց որքանո՞վ են արդարացված նման պնդումները:

Գրաֆիկական տվյալների բազաները դեռևս ասեմանտ են, գրաֆիկական DBMS-ի տվյալները դեռևս նույն տվյալների սիլոսն են: URI-ների փոխարեն տողերի նույնացուցիչները դարձնում են երկու գրաֆիկական DBMS-ների ինտեգրման առաջադրանքը դեռևս նույն ինտեգրման առաջադրանքը, մինչդեռ երկու RDF պահեստների ինտեգրումը հաճախ ընդամենը երկու RDF գրաֆիկների միաձուլման խնդիր է: Ասեմանտիզմի մեկ այլ ասպեկտը LPG գրաֆիկի մոդելի ոչ ռեֆլեկտիվությունն է, ինչը դժվարացնում է մետատվյալների կառավարումը նույն հարթակի միջոցով:

Վերջապես, գրաֆիկական DBMS-ները չունեն եզրակացության շարժիչներ կամ կանոնների շարժիչներ: Նման շարժիչների արդյունքները կարող են վերարտադրվել հարցումները բարդացնելով, բայց դա հնարավոր է նույնիսկ SQL-ում։

Այնուամենայնիվ, առաջատար RDF պահեստները խնդիր չունեն աջակցելու LPG մոդելին: Ամենակարևորը Blazegraph-ում ժամանակին առաջարկված մոտեցումն է՝ RDF* մոդելը, որը համատեղում է RDF և LPG:

ավելի շատ

Դուք կարող եք ավելին կարդալ RDF պահեստների կողմից LPG մոդելի աջակցության մասին Habré-ի նախորդ հոդվածում. «Ի՞նչ է կատարվում այժմ RDF պահեստների հետ». Գիտելիքների գրաֆիկների և տվյալների գործվածքի մասին, հուսով եմ, որ մի օր առանձին հոդված կգրվի: Վերջնական բաժինը, ինչպես հեշտ է հասկանալ, գրվել է հապճեպ, սակայն, նույնիսկ վեց ամիս անց, այս հասկացությունները շատ ավելի պարզ չեն:

Գրականություն

  1. Halpin, H., Monnin, A. (խմբ.) (2014): Փիլիսոփայական ճարտարագիտություն. դեպի համացանցի փիլիսոփայություն
  2. Ալեմանգ, Դ., Հենդլեր, Ջ.
  3. Staab, S., Studer, R. (eds.) (2009) Handbook ontologies (2nd ed.)
  4. Wood, D. (խմբ.): (2011) Ձեռնարկությունների տվյալների կապը
  5. Keet, M. (2018) Ներածություն գոյաբանական ճարտարագիտության մեջ

Source: www.habr.com

Добавить комментарий