Semantic ويب ۽ ڳنڍيل ڊيٽا. تصحيح ۽ اضافو

مان هن تازو ڇپيل ڪتاب جو هڪ ٽڪرو عوام آڏو پيش ڪرڻ چاهيان ٿو:

انٽرپرائز جي آنٽولوجي ماڊلنگ: طريقا ۽ ٽيڪنالاجيون [متن]: مونوگراف / [S. V. Gorshkov، S. S. Kralin، O. I. مشتاڪ ۽ ٻيا؛ ايگزيڪيوٽو ايڊيٽر S.V. Gorshkov]. - ايڪاترينبرگ: يورال يونيورسٽي پبلشنگ هائوس، 2019. - 234 ص: بيمار، ٽيبل؛ 20 سي ايم - ليکڪ. پوئين ٽائيٽل تي اشارو ڪيو ويو آهي. سان. - ببليوگرافي ch جي آخر ۾. ISBN 978-5-7996-2580-1: 200 ڪاپيون.

هبري تي هن ٽڪري کي پوسٽ ڪرڻ جو مقصد چار ڀيرا آهي:

  • اهو ممڪن نه آهي ته ڪو ماڻهو اهو ڪتاب هٿ ۾ کڻي سگهي، جيڪڏهن هو ڪنهن معزز جو گراهڪ نه هجي SergeIndex؛ اهو يقيني طور تي وڪرو تي ناهي.
  • متن ۾ تصحيحون ڪيون ويون آهن (اهي هيٺ نه ڏيکاريا ويا آهن) ۽ اضافا ڪيا ويا آهن جيڪي ڇپيل مونوگراف جي فارميٽ سان بلڪل هم آهنگ نه آهن: ٽاپيڪل نوٽس (اسپائلرز هيٺ) ۽ هائپر لنڪس.
  • مان چاهيان ٿو سوال ۽ رايا گڏ ڪريو, انهن کي حساب ۾ رکڻ لاءِ جڏهن هن متن کي ڪنهن ٻئي اشاعت ۾ نظرثاني ٿيل فارم ۾ شامل ڪيو وڃي.
  • ڪيتريون ئي Semantic ويب ۽ ڳنڍيل ڊيٽا جي پيروي ڪندڙ اڃا تائين يقين رکن ٿا ته انهن جو دائرو تمام تنگ آهي، خاص طور تي ڇاڪاڻ ته عام عوام اڃا تائين صحيح طور تي وضاحت نه ڪئي وئي آهي ته اهو ڪيترو عظيم آهي سيمينٽڪ ويب ۽ ڳنڍيل ڊيٽا جي پيروي ڪندڙ. حصو جو مصنف، جيتوڻيڪ هو هن دائري سان تعلق رکي ٿو، هن راء کي نه رکندو آهي، پر، ان جي باوجود، پاڻ کي هڪ ٻي ڪوشش ڪرڻ جو پابند سمجهي ٿو.

۽ ائين،

سامونڊي ويب

انٽرنيٽ جي ارتقاءَ کي هن ريت پيش ڪري سگهجي ٿو (يا ان جي حصن بابت ڳالهايو جيڪي هيٺ ڏنل ترتيب ۾ ٺاهيا ويا آهن):

  1. انٽرنيٽ تي دستاويز. اهم ٽيڪنالاجيون - گوفر، ايف ٽي پي، وغيره.
    انٽرنيٽ مقامي وسيلن جي مٽاسٽا لاءِ هڪ عالمي نيٽ ورڪ آهي.
  2. انٽرنيٽ دستاويز. اهم ٽيڪنالاجيون HTML ۽ HTTP آهن.
    ظاهر ڪيل وسيلن جي فطرت انهن جي ٽرانسميشن وچولي جي خاصيتن کي حساب ۾ رکي ٿي.
  3. انٽرنيٽ ڊيٽا. اهم ٽيڪنالاجيون - REST ۽ SOAP API، XHR، وغيره.
    انٽرنيٽ ايپليڪيشنن جو دور، نه رڳو ماڻهو وسيلن جا صارف بڻجي ويا آهن.
  4. انٽرنيٽ ڊيٽا. اهم ٽيڪنالاجيون ڳنڍيل ڊيٽا ٽيڪنالاجيون آهن.
    هي چوٿون مرحلو، جنهن جي اڳڪٿي ڪئي وئي برنرز-لي، ٻئي بنيادي ٽيڪنالاجي جو خالق ۽ W3C جو ڊائريڪٽر، سڏيو ويندو آهي Semantic Web؛ ڳنڍيل ڊيٽا ٽيڪنالاجيون ڊزائين ڪيون ويون آهن ويب تي ڊيٽا کي نه رڳو مشين لاءِ پڙهڻ لائق، پر ”مشين-سمجهڻ لائق“ پڻ.

ان کان پوءِ پڙهندڙ ٻئي ۽ چوٿين مرحلن جي اهم تصورن جي وچ ۾ رابطي کي سمجهي سگهندا:

  • URLs يو آر آءِ جي برابر آهن،
  • HTML جو اينالاگ RDF آهي،
  • HTML هائپر لنڪس RDF دستاويزن ۾ URI واقعن سان ملندڙ جلندڙ آهن.

سيمينٽڪ ويب انٽرنيٽ جي مستقبل جو هڪ سسٽماتي نظارو وڌيڪ آهي هڪ مخصوص خودڪشي يا لاب ٿيل رجحان جي ڀيٽ ۾، جيتوڻيڪ اهو انهن بعد ۾ حساب ۾ وٺي سگهي ٿو. مثال طور، هڪ اهم خصوصيت جنهن کي ويب 2.0 سڏيو وڃي ٿو سمجهي وڃي ٿو "صارف جي ٺاهيل مواد." خاص طور تي، W3C سفارش کي سڏيو وڃي ٿو ان کي حساب ۾ رکڻ لاء "ويب تشريح آنٽولوجي”۽ اهڙو معاهدو بيڪار.

ڇا سيمينٽڪ ويب مري ويو آهي؟

جيڪڏهن توهان انڪار ڪيو غير حقيقي اميدون, semantic web سان صورتحال لڳ ڀڳ ساڳي آهي جيئن ترقي يافته سوشلزم جي دور ۾ ڪميونزم سان (۽ ڇا Ilyich جي مشروط خواهشن جي وفاداري جو مشاهدو ڪيو وڃي، هر ڪنهن کي پاڻ لاء فيصلو ڪرڻ ڏيو). سرچ انجڻ ڪافي ڪاميابي سان ويب سائيٽن کي RDFa ۽ JSON-LD استعمال ڪرڻ تي مجبور ڪن ٿا ۽ پاڻ هيٺ ڏنل بيان ڪيل ٽيڪنالاجي سان لاڳاپيل ٽيڪنالاجيون استعمال ڪن ٿا (Google Knowledge Graph, Bing Knowledge Graph).

عام اصطلاحن ۾، ليکڪ اهو نه ٿو چئي سگهي ته ڇا وڏي پکيڙ کي روڪيو آهي، پر هو ذاتي تجربو جي بنياد تي ڳالهائي سگهي ٿو. اهڙا مسئلا آهن جيڪي "باڪس کان ٻاهر" SW جارحيت جي حالتن ۾ حل ٿي سگهن ٿيون، جيتوڻيڪ اهي تمام وسيع نه آهن. نتيجي طور، جن کي انهن ڪمن سان منهن ڏيڻو پوي ٿو، انهن جي خلاف جبر جو ڪو وسيلو نه آهي، جيڪي حل مهيا ڪرڻ جي قابل آهن، جڏهن ته بعد ۾ هڪ حل جي آزاد روزي انهن جي ڪاروباري ماڊل جي تضاد آهي. تنهن ڪري اسان HTML کي پارس ڪرڻ جاري رکون ٿا ۽ مختلف APIs کي گڏ ڪري رهيا آهيون، هڪ ٻئي سان گڏ.

بهرحال، ڳنڍيل ڊيٽا ٽيڪنالاجيون مکيه وهڪرو ويب کان ٻاهر پکڙيل آهن؛ ڪتاب، حقيقت ۾، انهن ايپليڪيشنن لاء وقف آهي. في الحال، لنڪ ٿيل ڊيٽا ڪميونٽي کي اميد آهي ته اهي ٽيڪنالاجيون اڃا به وڌيڪ وسيع ٿي وينديون گارٽنر جي رڪارڊنگ (يا اعلان، جيئن توهان چاهيو) رجحانات جهڙوڪ علم جو گرافس и ڊيٽا ڪپڙو. مان يقين ڪرڻ چاهيان ٿو ته اهو انهن تصورن جي "سائيڪل" تي عمل درآمد نه ٿيندو جيڪي ڪامياب ٿيندا، پر جيڪي هيٺ ڏنل بحث ڪيل W3C معيار سان لاڳاپيل آهن.

ڳنڍيل ڊيٽا

Berners-Lee وضاحت ڪئي ڳنڍيل ڊيٽا جي طور تي سيمينٽڪ ويب "ڊن صحيح": طريقن ۽ ٽيڪنالاجي جو هڪ سيٽ جيڪو ان کي پنهنجي حتمي مقصدن حاصل ڪرڻ جي اجازت ڏئي ٿو. ڳنڍيل ڊيٽا برنرز-لي جا بنيادي اصول نمايان ٿيل هيٺيون.

اصول 1. ادارن جو نالو ڏيڻ لاءِ URIs استعمال ڪريو.

URIs عالمي ادارن جي سڃاڻپ ڪندڙ آھن جيئن داخلائن لاءِ مقامي اسٽرنگ سڃاڻپ ڪندڙ جي مخالفت ڪن. ان کان پوء، هن اصول کي گوگل علم گراف جي نعري ۾ بهترين طور تي بيان ڪيو ويو آهي "شيون، تار نه».

اصول 2. ايڇ ٽي ٽي پي اسڪيم ۾ URIs استعمال ڪرڻ ته جيئن انهن کي رد ڪري سگهجي.

هڪ URI جي حوالي سان، اهو ممڪن هجڻ گهرجي ته ان نشاني جي پويان نشانيون حاصل ڪرڻ (آپريٽر جي نالي سان تشبيه "هتي واضح آهي).*"سي ۾)؛ وڌيڪ واضح طور تي، هن نشاني جي ڪجهه نمائندگي حاصل ڪرڻ لاء - HTTP هيڊر جي قيمت تي منحصر آهي Accept:. ٿي سگهي ٿو، AR/VR دور جي اچڻ سان، اهو ممڪن ٿيندو ته وسيلا پاڻ حاصل ڪرڻ، پر هن وقت، گهڻو ڪري، اهو هڪ RDF دستاويز هوندو، جيڪو SPARQL سوال تي عمل ڪرڻ جو نتيجو آهي. DESCRIBE.

اصول 3. W3C معيارن جو استعمال - بنيادي طور تي RDF(S) ۽ SPARQL - خاص طور تي جڏهن URIs جي حوالي سان.

اهي انفرادي "پرت" ڳنڍيل ڊيٽا ٽيڪنالاجي اسٽيڪ جي، پڻ سڃاتل آهن سيمينٽڪ ويب پرت ڪيڪ، هيٺ بيان ڪيو ويندو.

اصول 4. ادارن جي وضاحت ڪرڻ وقت ٻين URIs جي حوالي سان استعمال ڪريو.

RDF توهان کي اجازت ڏئي ٿو ته توهان پاڻ کي قدرتي ٻولي ۾ وسيلن جي زباني وضاحت تائين محدود ڪري، ۽ چوٿون اصول اهو نه ڪرڻ لاءِ سڏي ٿو. جيڪڏهن پهريون اصول عالمي طور تي مشاهدو ڪيو وڃي ٿو، اهو ممڪن آهي جڏهن هڪ وسيلن کي ٻين ڏانهن اشارو ڪرڻ لاء بيان ڪيو وڃي، جنهن ۾ "پرڏيهي" شامل آهن، انهي ڪري ڊيٽا کي ڳنڍيل سڏيو ويندو آهي. حقيقت ۾، اهو تقريبا ناگزير آهي استعمال ڪرڻ لاء URIs جو نالو RDFS لفظ ۾.

آر ڊي ايف

آر ڊي ايف (ريسورس ڊڪشنري فريم ورڪ) هڪ رسم الخط آهي جيڪو بيان ڪرڻ لاءِ هڪ ٻئي سان لاڳاپيل ادارن کي بيان ڪري ٿو.

"موضوع-پريڊيڪيٽ-آبجیکٹ" قسم جا بيان، جن کي ٽرپلٽس سڏيو ويندو آهي، ادارن ۽ انهن جي رشتن بابت ٺاهيو ويندو آهي. سادي صورت ۾، موضوع، پيشڪش، ۽ اعتراض سڀ URIs آهن. ساڳئي URI مختلف پوزيشن ۾ مختلف ٽنهي ۾ ٿي سگهي ٿو: هڪ موضوع، هڪ پيشڪش، ۽ هڪ اعتراض؛ اهڙيءَ طرح، ٽِپليٽ هڪ قسم جو گراف ٺاهيندا آهن جنهن کي RDF گراف سڏيو ويندو آهي.

مضمون ۽ شيون نه رڳو URIs ٿي سگھن ٿيون، پر پڻ نام نهاد خالي نوڊس، ۽ شيون به ٿي سگهن ٿيون لفظي. لٽريرل بنيادي قسم جا مثال آهن جن ۾ تار جي نمائندگي ۽ هڪ قسم جي اشاري شامل آهن.

لٽريچر لکڻ جا مثال (Turtle نحو ۾، ان بابت وڌيڪ هيٺ ڏنل): "5.0"^^xsd:float и "five"^^xsd:string. قسم سان لٽريچر rdf:langString ٻولي جي ٽيگ سان پڻ ليس ٿي سگھي ٿو؛ Turtle ۾ اھو ھن طرح لکيل آھي: "five"@en и "пять"@ru.

خالي نوڊس "گمنام" وسيلا آهن بغير عالمي سڃاڻپ ڪندڙ، جن جي باري ۾ بيان ڪري سگهجي ٿو، جيتوڻيڪ، ٿي سگهي ٿو؛ وجودي variables جو قسم.

تنهن ڪري (اهو آهي، حقيقت ۾، آر ڊي ايف جو سڄو نقطو):

  • موضوع هڪ URI يا هڪ خالي نوڊ آهي،
  • اڳڪٿي هڪ URI آهي،
  • اعتراض هڪ URI، هڪ خالي نوڊ، يا لفظي آهي.

اڳڪٿيون خالي نوڊس ڇو نٿا ٿي سگهن؟

امڪاني سبب اهو آهي ته غير رسمي طور تي سمجھڻ جي خواهش ۽ ترجمي کي پهرين آرڊر جي اڳڪٿي منطق جي ٻولي ۾. s p o ڪجهه وانگر وانگر Semantic ويب ۽ ڳنڍيل ڊيٽا. تصحيح ۽ اضافوڪٿي Semantic ويب ۽ ڳنڍيل ڊيٽا. تصحيح ۽ اضافو - اڳڪٿي ڪرڻ، Semantic ويب ۽ ڳنڍيل ڊيٽا. تصحيح ۽ اضافو и Semantic ويب ۽ ڳنڍيل ڊيٽا. تصحيح ۽ اضافو - مستقل. هن سمجھاڻي جا نشان دستاويز ۾ آهن "LBase: Semantics for Languages ​​of the Semantic Web"، جنهن کي W3C ڪم ڪندڙ گروپ نوٽ جي حيثيت حاصل آهي. اُن سمجھڻ سان، ٽِپَل s p []ڪٿي [] - خالي نوڊ، ترجمو ڪيو ويندو جيئن Semantic ويب ۽ ڳنڍيل ڊيٽا. تصحيح ۽ اضافوڪٿي Semantic ويب ۽ ڳنڍيل ڊيٽا. تصحيح ۽ اضافو - متغير، پر پوء ڪيئن ترجمو ڪجي s [] o؟ W3C سفارش واري حيثيت سان دستاويز "آر ڊي ايف 1.1 سيمينٽڪس” هڪ ٻيو ترجمي جو طريقو پيش ڪري ٿو، پر اڃا به امڪان تي غور نٿو ڪري ته اڳڪٿيون خالي نوڊس هجڻ جي.

بهرحال، منو اسپورني اجازت.

آر ڊي ايف هڪ خلاصو ماڊل آهي. RDF لکي سگھجي ٿو (سيريل ٿيل) مختلف نحو ۾: آر ڊي ايف / ايڪس ايم ايل, ڪمي (سڀ کان وڌيڪ پڙهيل ماڻهو) JSON-LD, ايڇ ٽي ٽي (بائنري).

ساڳئي RDF کي RDF/XML ۾ مختلف طريقن سان ترتيب ڏئي سگهجي ٿو، تنهن ڪري، مثال طور، XSD استعمال ڪندي نتيجو XML کي درست ڪرڻ يا XPath استعمال ڪندي ڊيٽا کي ڪڍڻ جي ڪوشش ڪرڻ جو ڪو احساس ناهي. اهڙي طرح، JSON-LD جاوا اسڪرپٽ ڊولپر جي اوسط جاوا اسڪرپٽ ڊولپر جي آر ڊي ايف سان ڪم ڪرڻ جي خواهش کي پورو ڪرڻ جو امڪان ناهي Javascript جي ڊٽ ۽ اسڪوائر-بريڪٽ نوٽشن (جيتوڻيڪ JSON-LD هڪ ميکانيزم پيش ڪندي انهي طرف هلي ٿو. ٺاھڻ).

اڪثر نحو ڊگھي URIs کي مختصر ڪرڻ جا طريقا پيش ڪن ٿا. مثال طور، هڪ اشتهار @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> Turtle ۾ پوءِ توھان کي ان جي بدران لکڻ جي اجازت ڏيندو <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> بس rdf:type.

آر ڊي ايف ايس

آر ڊي ايف ايس (RDF اسڪيما) - هڪ بنيادي ماڊلنگ لفظ، ملڪيت ۽ طبقي ۽ ملڪيت جي تصورات کي متعارف ڪرايو آهي جهڙوڪ rdf:type, rdfs:subClassOf, rdfs:domain и rdfs:range. RDFS ڊڪشنري استعمال ڪندي، مثال طور، ھيٺ ڏنل صحيح اظهار لکي سگھجي ٿو:

rdf:type         rdf:type         rdf:Property .
rdf:Property     rdf:type         rdfs:Class .
rdfs:Class       rdfs:subClassOf  rdfs:Resource .
rdfs:subClassOf  rdfs:domain      rdfs:Class .
rdfs:domain      rdfs:domain      rdf:Property .
rdfs:domain      rdfs:range       rdfs:Class .
rdfs:label       rdfs:range       rdfs:Literal .

آر ڊي ايف ايس هڪ وضاحت ۽ ماڊلنگ لفظ آهي، پر اها ڪا محدود ٻولي ناهي (جيتوڻيڪ سرڪاري وضاحت ۽ پنن اهڙي استعمال جو امڪان). لفظ "اسڪيما" کي ساڳئي معني ۾ نه سمجهڻ گهرجي جيئن "XML اسڪيما" جي اظهار ۾. مثال طور، :author rdfs:range foaf:Person مطلب ته rdf:type سڀ ملڪيت جا قدر :author - foaf:Person، پر مطلب اهو ناهي ته اهو اڳ ۾ ئي چيو وڃي.

SPARQL

SPARQL (SPARQL Protocol and RDF Query Language) - RDF ڊيٽا جي پڇا ڳاڇا لاءِ هڪ ٻولي. هڪ سادي صورت ۾، هڪ SPARQL سوال نمونن جو هڪ مجموعو آهي جنهن جي مقابلي ۾ سوال ڪيل گراف جا ٽي ڀيرا ملائي رهيا آهن. نمونن ۾ متغير شامل ٿي سگھن ٿا موضوع، پيشڪش، ۽ اعتراض جي پوزيشن ۾.

سوال اهڙيون متغير قيمتون موٽائي ڇڏيندو، جيڪي نموني ۾ تبديل ڪيا ويندا، نتيجو ٿي سگهي ٿو پڇيل RDF گراف جي ذيلي گراف (ان جي ٽن حصن جو هڪ ذيلي سيٽ). ٽريپلٽس جي مختلف نمونن ۾ ساڳئي نالي جي متغيرن کي ساڳيو قدر هجڻ گهرجي.

مثال طور، مٿي ڏنل ست RDFS محورين جو سيٽ، ھيٺ ڏنل سوال موٽندو rdfs:domain и rdfs:range قدر جي طور تي ?s и ?p ترتيب وار:

SELECT * WHERE {
 ?s ?p rdfs:Class .
 ?p ?p rdf:Property .
}

اها ڳالهه نوٽ ڪرڻ جي قابل آهي ته SPARQL بيان ڪندڙ آهي ۽ گراف ٽرورسل کي بيان ڪرڻ جي ٻولي ناهي (جڏهن ته، ڪجهه RDF ريپوزٽريز سوالن جي عمل جي منصوبي کي ترتيب ڏيڻ جا طريقا پيش ڪن ٿا). تنهن ڪري، ڪجهه معياري گراف مسئلا، مثال طور، مختصر ترين رستو ڳولڻ، SPARQL ۾ حل نه ٿو ڪري سگهجي، بشمول ملڪيت جا رستا (پر، ٻيهر، انفرادي RDF مخزن انهن مسئلن کي حل ڪرڻ لاءِ خاص توسيع پيش ڪن ٿا).

SPARQL دنيا جي آزاديءَ جي تصور کي حصيداري نٿو ڪري ۽ "ناڪامي جي طور تي نفي" واري طريقي جي پيروي ڪري ٿو، جنهن ۾ ممڪن ڊزائينز جهڙوڪ FILTER NOT EXISTS {…}. ڊيٽا جي ورڇ جي حساب ۾ ورتو وڃي ميڪانيزم استعمال ڪندي وفاق جا سوال.

SPARQL رسائي پوائنٽ - هڪ RDF اسٽوريج جيڪو SPARQL سوالن کي پروسيس ڪرڻ جي قابل آهي - ٻئي اسٽيج کان ڪو به سڌو اينالاگ نه آهي (هن پيراگراف جي شروعات ڏسو). اهو هڪ ڊيٽابيس سان مشابهت ڪري سگهجي ٿو، جنهن جي مواد جي بنياد تي HTML صفحا ٺاهيا ويا هئا، پر ٻاهران تائين رسائي لائق. SPARQL رسائي پوائنٽ ٽين اسٽيج کان API رسائي پوائنٽ کان وڌيڪ هڪجهڙائي آهي، پر ٻن مکيه اختلافن سان. پهرين، اهو ممڪن آهي ته ڪيترن ئي "ايٽمي" سوالن کي هڪ ۾ گڏ ڪرڻ (جيڪو GraphQL جي هڪ اهم خصوصيت سمجهي وڃي ٿو)، ۽ ٻيو، اهڙي API مڪمل طور تي خود دستاويزي آهي (جيڪو HATEOAS حاصل ڪرڻ جي ڪوشش ڪئي آهي).

سياسي تبصرو

RDF ويب تي ڊيٽا شايع ڪرڻ جو هڪ طريقو آهي، تنهنڪري RDF اسٽوريج کي هڪ دستاويز سمجهيو وڃي DBMS. سچ، جيئن ته آر ڊي ايف هڪ گراف آهي ۽ هڪ وڻ نه آهي، اهي پڻ گراف تي ٻڌل آهن. اها حيرت انگيز آهي ته اهو سڀ ڪجهه ڪم ڪيو. ڪير سوچي ها ته هوشيار ماڻهو هوندا جيڪي خالي نوڊس تي عمل ڪندا. ڪوڊ هتي آهي اهو ڪم نه ڪيو.

RDF ڊيٽا تائين رسائي کي منظم ڪرڻ لاءِ پڻ گهٽ مڪمل نمايان طريقا آهن، مثال طور، ڳنڍيل ڊيٽا جا ٽڪرا (LDF) ۽ ڳنڍيل ڊيٽا پليٽ فارم (LDP).

OWL

OWL (ويب آنٽولوجي ٻولي) - علم جي نمائندگي لاءِ هڪ رسم الخط، وضاحت جي منطق جو هڪ نحوي نسخو Semantic ويب ۽ ڳنڍيل ڊيٽا. تصحيح ۽ اضافو (هيٺيان هر جڳهه OWL 2 چوڻ وڌيڪ صحيح آهي، OWL جو پهريون نسخو ٻڌل هو Semantic ويب ۽ ڳنڍيل ڊيٽا. تصحيح ۽ اضافو).

OWL ۾ وضاحتي منطق جا تصور طبقن سان ملن ٿا، ڪردار ملڪيتن سان ملن ٿا، فرد پنهنجو پويون نالو برقرار رکن ٿا. Axioms کي Axioms به سڏيو ويندو آهي.

مثال طور، نالي ماتر ۾ مانچسٽر نحو OWL نوٽيفڪيشن لاءِ هڪ محور اسان کي اڳ ۾ ئي معلوم آهي Semantic ويب ۽ ڳنڍيل ڊيٽا. تصحيح ۽ اضافو هن طرح لکيو ويندو:

Class: Human
Class: Parent
   EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent

OWL لکڻ لاءِ ٻيا نحو آهن، جهڙوڪ فنڪشنل نحو، سرڪاري وضاحتن ۾ استعمال ٿيل، ۽ OWL/XML. اضافي طور تي، OWL سيريل ڪري سگهجي ٿو RDF نحو جو خلاصو ۽ اڳتي - ڪنهن به مخصوص نحو ۾.

OWL جو RDF سان ٻٽي تعلق آهي. هڪ پاسي، اهو سمجهي سگهجي ٿو هڪ قسم جي لغت جيڪا RDFS کي وڌائي ٿي. ٻئي طرف، اهو هڪ وڌيڪ طاقتور فارملزم آهي جنهن لاء آر ڊي ايف صرف هڪ سيريلائيشن فارميٽ آهي. نه سڀئي ابتدائي OWL تعميرات هڪ واحد RDF ٽرپلٽ استعمال ڪندي لکي سگهجن ٿيون.

ان تي منحصر آهي ته OWL تعميرات جي ذيلي سيٽ کي استعمال ڪرڻ جي اجازت ڏني وئي آهي، اهي نام نهاد جي باري ۾ ڳالهائيندا آهن OWL پروفائلز. معياري ۽ سڀ کان وڌيڪ مشهور آهن OWL EL، OWL RL ۽ OWL QL. پروفائل جو انتخاب عام مسئلن جي ڪمپيوٽري پيچيدگي کي متاثر ڪري ٿو. OWL تعميرات جو هڪ مڪمل سيٽ مطابق Semantic ويب ۽ ڳنڍيل ڊيٽا. تصحيح ۽ اضافوOWL DL سڏيو ويندو آهي. ڪڏهن ڪڏهن اهي OWL Full جي باري ۾ پڻ ڳالهائيندا آهن، جنهن ۾ OWL تعميرات کي استعمال ڪرڻ جي اجازت ڏني وئي آهي مڪمل آزادي سان RDF ۾ موروثي، بغير ڪنهن لفظي ۽ حسابي پابندين جي. Semantic ويب ۽ ڳنڍيل ڊيٽا. تصحيح ۽ اضافو. مثال طور، ڪا شيءِ ٻئي طبقي ۽ ملڪيت ٿي سگهي ٿي. OWL مڪمل ناقابل فيصلو آهي.

OWL ۾ نتيجن کي ڳنڍڻ جا اهم اصول کليل دنيا جي مفروضي کي اپنائڻ آهن. اوڪا) ۽ منفرد نالن جي تصور کي رد ڪرڻ (منفرد نالو فرض، ONE). هيٺ اسين ڏسنداسين ته اهي اصول ڪٿي رهن ٿا ۽ ڪجهه OWL تعميرات متعارف ڪرائي سگهن ٿا.

اچو ته آنٽولوجي هيٺ ڏنل ٽڪرا تي مشتمل هجي (مانچسٽر نحو ۾):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human
   Facts: hasChild Alice, hasChild Bob, hasChild Carol

ڇا اھو ان جي پٺيان آھي جيڪو چيو ويو آھي ته جان ڪيترائي ٻار آھن؟ UNA کي رد ڪرڻ انفرنس انجڻ کي مجبور ڪندو ته هن سوال جو جواب منفي ۾، ڇو ته ايلس ۽ باب شايد ساڳيا ماڻهو هوندا. ھيٺ ڏنل ٿيڻ لاء، توھان کي ھيٺ ڏنل محور شامل ڪرڻو پوندو:

DifferentIndividuals: Alice, Bob, Carol, John

اچو ته ھاڻي آنٽولوجي جي ٽڪڙي کي ھيٺين شڪل ڏيو (جان کي ڪيترائي ٻار آھن، پر کيس صرف ٻه ٻار آھن):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human, manyChildren
   Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John

ڇا هي آنٽولوجي متضاد هوندو (جنهن کي غلط ڊيٽا جي ثبوت طور تشريح ڪري سگهجي ٿو)؟ OWA کي قبول ڪرڻ سبب انفرنس انجڻ کي ناڪاري ۾ جواب ڏيڻو پوندو: ”ڪٿي“ ٻيو (ٻئي آنٽولوجي ۾) اهو چئبو ته ڪيرول به جان جو ٻار آهي.

ان جي امڪان کي رد ڪرڻ لاء، اچو ته جان بابت هڪ نئين حقيقت شامل ڪريو:

Individual: John
   Facts: hasChild Alice, hasChild Bob, not hasChild Carol

ٻين ٻارن جي ظاهر کي خارج ڪرڻ لاء، اچو ته چوندا آهن ته ملڪيت جا سڀئي قدر "ٻار هجڻ" ماڻهو آهن، جن مان اسان وٽ صرف چار آهن:

ObjectProperty: hasChild
   Domain: Human
   Сharacteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }

ھاڻي آنٽولوجي متضاد ٿي ويندي، جنھن کي انفرنس انجڻ رپورٽ ڪرڻ ۾ ناڪام ٿيندو. آخري محور سان اسان وٽ، هڪ لحاظ سان، دنيا کي ”بند“ ڪيو ويو آهي، ۽ ڏسو ته جان جي پنهنجي ٻار هجڻ جي امڪان کي ڪيئن خارج ڪيو ويو آهي.

انٽرپرائز ڊيٽا کي ڳنڍڻ

لنڪ ٿيل ڊيٽا سيٽ طريقن ۽ ٽيڪنالاجيز جو اصل مقصد هو ويب تي ڊيٽا شايع ڪرڻ لاءِ. اندروني ڪارپوريٽ ماحول ۾ انهن جو استعمال ڪيترن ئي مشڪلاتن کي منهن ڏئي ٿو.

مثال طور، هڪ بند ڪارپوريٽ ماحول ۾، OWL جي ڪٽائي واري طاقت جي بنياد تي OWA کي اپنائڻ ۽ UNA کي رد ڪرڻ، فيصلا ويب جي کليل ۽ ورهايل فطرت جي ڪري، تمام ڪمزور آهي. ۽ هتي هيٺيان حل ممڪن آهن.

  • OWL کي سيمينٽڪس سان ختم ڪرڻ، OWA کي ڇڏڻ ۽ UNA کي اپنائڻ جو مطلب، لاڳاپيل آئوٽ انجڻ جي عمل کي لاڳو ڪرڻ. - هن رستي ۾ وڃي رهيو آهي Stardog RDF اسٽوريج.
  • حڪمراني انجڻ جي حق ۾ OWL جي ڪٽائي صلاحيتن کي ڇڏي ڏيڻ. - اسٽارڊگ سپورٽ ڪري ٿو SWRL؛ جينا ۽ گراف ڊي بي پيش ڪن ٿا پنهنجو پاڻ ٻوليون ضابطا
  • OWL جي ڪٽائي صلاحيتن کان انڪار، ماڊلنگ لاءِ RDFS جي ويجهو هڪ يا ٻئي سبسٽ جو استعمال. - هن جي باري ۾ وڌيڪ هيٺ ڏسو.

هڪ ٻيو مسئلو اهو آهي ته وڏو ڌيان اهو آهي ته ڪارپوريٽ دنيا شايد ڊيٽا جي معيار جي مسئلن تي هجي ۽ لنڪ ٿيل ڊيٽا اسٽيڪ ۾ ڊيٽا جي تصديق واري اوزار جي کوٽ. هتي جا نتيجا هن ريت آهن.

  • ٻيهر، OWL تعميرات جي تصديق لاءِ استعمال ڪريو بند دنيا جي لفظن ۽ منفرد نالن سان جيڪڏهن مناسب انفرنس انجڻ موجود هجي.
  • استعمال ڪريو SHACL، معياري ويب پرت ڪيڪ پرت جي فهرست کان پوءِ مقرر ڪئي وئي آهي (جڏهن ته، اهو پڻ استعمال ڪري سگهجي ٿو ضابطن جي انجڻ جي طور تي)، يا شيڪس.
  • اهو سمجھڻ ته سڀ ڪجهه آخرڪار SPARQL سوالن سان ڪيو ويندو آهي، انهن کي استعمال ڪندي توهان جي پنهنجي سادي ڊيٽا جي تصديق واري ميڪانيزم ٺاهي.

جيتوڻيڪ، ڪٽائي صلاحيتن ۽ تصديق جي اوزارن جو مڪمل رد ڪرڻ سان ڳنڍيل ڊيٽا اسٽيڪ کي ڪمن ۾ مقابلي کان ٻاهر ڪري ٿو جيڪي منظر ۾ هڪجهڙا آهن کليل ۽ ورهايل ويب - ڊيٽا انٽيگريشن ڪمن ۾.

هڪ باقاعده انٽرپرائز انفارميشن سسٽم بابت ڇا؟

اهو ممڪن آهي، پر توهان کي، يقينا، ڄاڻڻ گهرجي ته انهن مسئلن سان لاڳاپيل ٽيڪنالاجيز کي حل ڪرڻو پوندو. مان هتي بيان ڪندس ترقياتي شرڪت ڪندڙن جو هڪ عام رد عمل اهو ڏيکارڻ لاءِ ته هي ٽيڪنالاجي اسٽيڪ ڪهڙي طرح نظر اچي ٿو روايتي IT جي نقطي نظر کان. مون کي هاٿي جي مثال جو ٿورو ياد ڏياريندو آهي:

  • ڪاروباري تجزيه نگار: آر ڊي ايف هڪ سڌي طرح محفوظ ٿيل منطقي نموني وانگر آهي.
  • سسٽم تجزيه نگار: RDF جهڙو آهي EAV، صرف انڊيڪس جي هڪ گروپ سان ۽ هڪ آسان سوال واري ٻولي سان.
  • ڊولپر: خير، اهو سڀ ڪجهه امير ماڊل ۽ گهٽ ڪوڊ جي تصور جي روح ۾ آهي، پڙهو هن بابت تازو.
  • پروجيڪٽ مئنيجر: ها اهو ساڳيو آهي اسٽيڪ کي ٽوڙڻ!

مشق ڏيکاري ٿو ته اسٽيڪ اڪثر ڪري ڊيٽا جي ورڇ ۽ ورهاڱي سان لاڳاپيل ڪمن ۾ استعمال ٿيندو آهي، مثال طور، جڏهن MDM (ماسٽر ڊيٽا مئنيجمينٽ) يا DWH (ڊيٽا گودام) ڪلاس سسٽم ٺاهي رهيا آهن. اهڙا مسئلا ڪنهن به صنعت ۾ موجود آهن.

صنعت جي مخصوص ايپليڪيشنن جي لحاظ کان، لنڪ ٿيل ڊيٽا ٽيڪنالاجيون هن وقت هيٺين صنعتن ۾ تمام گهڻو مشهور آهن.

  • حياتياتي ٽيڪنالاجيون (جتي انهن جي مقبوليت لڳي ٿي ڊومين جي پيچيدگي سان لاڳاپيل آهي)؛

موجوده

”بوائلنگ پوائنٽ“ تازو ئي ”نيشنل ميڊيڪل نالج بيس“ ايسوسيئيشن پاران منعقد ڪيل ڪانفرنس جي ميزباني ڪئي.آنٽولوجيز کي گڏ ڪرڻ. نظريي کان عملي درخواست تائين».

  • پيچيده شين جي پيداوار ۽ آپريشن (وڏي مشيني انجنيئرنگ، تيل ۽ گئس جي پيداوار؛ اڪثر ڪري اسين معياري بابت ڳالهائي رهيا آهيون. مذهبي پابنديون لاڳو 15926);

موجوده

هتي، پڻ، سبب آهي موضوع جي علائقي جي پيچيدگي، جڏهن، مثال طور، اپ اسٽريم اسٽيج تي، جيڪڏهن اسان تيل ۽ گئس جي صنعت جي باري ۾ ڳالهايون ٿا، سادو اڪائونٽنگ ڪجهه CAD افعال جي ضرورت آهي.

2008 ۾، هڪ نمائندي تنصيب واقعي، شيورون پاران منظم ڪيو ويو ڪانفرنس.

ISO 15926، آخر ۾، تيل ۽ گيس جي صنعت کي ٿورو ڳري لڳي (۽ شايد ميڪيڪل انجنيئرنگ ۾ وڏي ايپليڪيشن ملي). صرف Statoil (Equinor) ان تي چڱيءَ طرح جڪڙيل ٿي ويو؛ ناروي ۾، سڄو ماحولياتي نظام. ٻيا پنهنجو ڪم ڪرڻ جي ڪوشش ڪري رهيا آهن. مثال طور، افواهون جي مطابق، توانائي جي گهرو وزارت جو ارادو رکي ٿو "ٻار ۽ توانائي جي ڪمپليڪس جو تصوراتي آنٽولوجي ماڊل"، ساڳئي طرح، ظاهري طور تي، بجلي جي صنعت لاء ٺهيل.

  • مالي تنظيمون (جيتوڻيڪ XBRL کي سمجهي سگهجي ٿو هڪ قسم جو هائبرڊ SDMX ۽ RDF Data Cube آنٽولوجي)؛

موجوده

سال جي شروعات ۾، LinkedIn فعال طور تي ليکڪ کي اسپام ڪيو ته تقريبن مالي صنعت جي تقريبن سڀني وڏن کان خالي جايون، جن کي هو ٽي وي سيريز "فورس ميجر" مان ڄاڻي ٿو: گولڊمين ساڪس، جي پي مارگن چيس ۽ / يا مورگن اسٽنلي، ويلز فارگو، SWIFT/Visa/Mastercard, Bank of America, Citigroup, Fed, Deutsche Bank... غالباً هر ڪو ڪنهن کي ڳولي رهيو هو جنهن ڏانهن هو موڪلي سگهي. علم گراف ڪانفرنس. ڪافي ڪجھ ڳولڻ ۾ ڪامياب ٿي ويا: مالي تنظيمون سڀ ڪجھ ورتو پهرين ڏينهن جي صبح.

HeadHunter تي، صرف Sberbank ڪجهه دلچسپ ڏسڻ ۾ آيو؛ اهو "آر ڊي ايف جهڙو ڊيٽا ماڊل سان EAV اسٽوريج" بابت هو.

شايد، ملڪي ۽ مغربي مالياتي ادارن جي لاڳاپيل ٽيڪنالاجيز جي محبت جي درجي ۾ فرق، بعد جي سرگرمين جي بين الاقوامي نوعيت جي ڪري آهي. ظاهري طور تي، رياستي سرحدن جي وچ ۾ انضمام کي معيار جي لحاظ کان مختلف تنظيمي ۽ ٽيڪنيڪل حلن جي ضرورت آهي.

  • تجارتي ايپليڪيشنن سان سوالن جا جواب سسٽم (IBM واٽسسن، ايپل سري، گوگل نالج گراف)؛

موجوده

رستي جي ذريعي، سري جو خالق، ٿامس گربر، آنٽولوجي جي بلڪل تعريف جو مصنف آهي (IT معنيٰ ۾) ”تصور جي وضاحت“ جي طور تي. منهنجي خيال ۾، هن وصف ۾ لفظن کي ٻيهر ترتيب ڏيڻ سان ان جي معني ۾ تبديلي نه ايندي آهي، جيڪو شايد اهو ظاهر ڪري ٿو ته اهو نه آهي.

  • منظم ڪيل ڊيٽا جي اشاعت (وڌيڪ جواز سان هن کي ڳنڍيل اوپن ڊيٽا ڏانهن منسوب ڪري سگهجي ٿو).

موجوده

ڳنڍيل ڊيٽا جا وڏا مداح نام نهاد GLAM آهن: گيلريز، لائبريريون، آرڪائيوز، ۽ ميوزيم. اهو چوڻ ڪافي آهي ته ڪانگريس جي لائبريري MARC21 جي متبادل کي فروغ ڏئي رهي آهي بي بي فريمته بائيبلوگرافڪ وضاحت جي مستقبل لاءِ بنياد فراهم ڪري ٿي ۽، يقينا، RDF جي بنياد تي.

Wikidata اڪثر ڪري لنڪڊ اوپن ڊيٽا جي ميدان ۾ هڪ ڪامياب منصوبي جي مثال طور حوالو ڏنو ويندو آهي - وڪيپيڊيا جو هڪ قسم جو مشين-پڙهڻ وارو نسخو، جنهن جو مواد، DBPedia جي برعڪس، آرٽيڪل انفارميشن باڪس مان درآمد ڪرڻ سان پيدا نه ڪيو ويو آهي، پر اهو آهي. وڌيڪ يا گهٽ دستي طور تي ٺاهي وئي (۽ بعد ۾ ساڳئي معلومات باڪس لاء معلومات جو ذريعو بڻجي ٿو).

اسان پڻ صلاح ڏيو ٿا ته توهان ان کي چيڪ ڪريو فهرست Stardog RDF اسٽوريج جا استعمال ڪندڙ Stardog ويب سائيٽ تي "ڪسٽمر" سيڪشن ۾.

جيئن ٿي سگهي، گارٽنر ۾ Hype Cycle for Emerging Technologies 2016 "انٽرپرائز ٽيڪسونومي ۽ آنٽولوجي مئنيجمينٽ" هڪ نزول جي وچ ۾ مايوسي جي وادي ۾ رکيل آهي "پيداوار واري پليٽ" تائين پهچڻ جي امڪان سان 10 سالن کان اڳ نه.

انٽرپرائز ڊيٽا کي ڳنڍڻ

اڳڪٿيون، اڳڪٿيون، اڳڪٿيون...

تاريخي دلچسپي کان ٻاهر، مون هيٺ ڏنل جدول ڪيو آهي گارٽنر جي اڳڪٿيون مختلف سالن لاءِ ٽيڪنالاجيون جيڪي اسان سان دلچسپي رکن ٿيون.

سال ٽيڪنالاجي رپورٽ ڪريو جڳهه پليٽ فارم تائين سال
2001 سامونڊي ويب هنگامي ٽيڪنالاجيون جدت جو محرڪ 5-10
2006 ڪارپوريٽ Semantic ويب هنگامي ٽيڪنالاجيون Inflated اميدن جي چوٽي 5-10
2012 سامونڊي ويب وڏي ڊيٽا Inflated اميدن جي چوٽي > 10
2015 ڳنڍيل ڊيٽا ترقي يافته تجزياتي ۽ ڊيٽا سائنس مايوسيءَ جو خاتمو 5-10
2016 انٽرنيشنل آنٽولوجي مئنيجمينٽ هنگامي ٽيڪنالاجيون مايوسيءَ جو خاتمو > 10
2018 علم جو گرافس هنگامي ٽيڪنالاجيون جدت جو محرڪ 5-10

بهرحال، اڳ ۾ ئي "هائپ سائيڪل ..." 2018 هڪ ٻيو اڀرندڙ رجحان ظاهر ٿيو آهي - علم گرافس. هڪ خاص ٻيهر جنم ورتو: گراف ڊي بي ايم ايس، جنهن ڏانهن صارفين جي توجه ۽ ڊولپرز جي ڪوششن کي تبديل ڪيو ويو، اڳوڻي درخواستن ۽ بعد جي عادتن جي اثر هيٺ، شڪل ۽ پوزيشن تي عمل ڪرڻ شروع ڪيو. انهن جي اڳوڻن مقابلي ۾.

تقريبن هر گراف ڊي بي ايم ايس هاڻي پاڻ کي ڪارپوريٽ "علم گراف" جي تعمير لاء هڪ مناسب پليٽ فارم جو اعلان ڪري ٿو ("ڳنڍيل ڊيٽا" ڪڏهن ڪڏهن "ڳنڍيل ڊيٽا" سان تبديل ڪيو ويندو آهي)، پر اهڙي دعوي ڪيئن صحيح آهن؟

گراف ڊيٽابيس اڃا تائين غير معمولي آهن؛ گراف ڊي بي ايم ايس ۾ ڊيٽا اڃا تائين ساڳيو ڊيٽا سائلو آهي. URIs جي بدران اسٽرنگ سڃاڻپ ڪندڙ ٻن گراف DBMSs کي ضم ڪرڻ جو ڪم اڃا به هڪ انضمام جو ڪم ڪن ٿا، جڏهن ته ٻن RDF اسٽورن کي ضم ڪرڻ اڪثر ڪري هيٺ اچي ٿو صرف ٻن RDF گرافس کي ضم ڪرڻ لاءِ. اسمانيت جو هڪ ٻيو پاسو ايل پي جي گراف ماڊل جي غير اضطراب آهي، جيڪا ساڳئي پليٽ فارم استعمال ڪندي ميٽاداٽا کي منظم ڪرڻ ڏکيو بڻائي ٿي.

آخرڪار، گراف DBMSs وٽ انجڻ انجڻ يا قاعدي انجڻ نه آھن. اهڙين انجڻين جا نتيجا پيچيده سوالن ذريعي ٻيهر پيدا ڪري سگهجن ٿا، پر اهو SQL ۾ به ممڪن آهي.

بهرحال، معروف RDF اسٽوريج سسٽم کي LPG ماڊل جي حمايت ڪرڻ ۾ ڪا به ڏکيائي نه آهي. سڀ کان وڌيڪ مضبوط طريقو سمجهيو ويندو آهي هڪ تجويز ڪيل هڪ وقت تي Blazegraph ۾: RDF * ماڊل، RDF ۽ LPG کي گڏ ڪندي.

وڌيڪ

توھان وڌيڪ پڙھي سگھوٿا RDF اسٽوريج سپورٽ LPG ماڊل لاءِ اڳئين مضمون ۾ Habré: "هاڻي آر ڊي ايف اسٽوريج سان ڇا ٿي رهيو آهي". مون کي اميد آهي ته هڪ ڏينهن هڪ الڳ مضمون نالج گرافس ۽ ڊيٽا فيبرڪ بابت لکيو ويندو. آخري سيڪشن، جيئن سمجهڻ آسان آهي، جلدي ۾ لکيو ويو هو، تنهن هوندي به، ڇهن مهينن کان پوء، انهن تصورن سان هر شيء بلڪل واضح ناهي.

ادب

  1. هالپن، ايڇ، مونن، اي (ايڊز.) (2014). فلسفي انجنيئرنگ: ويب جي فلسفي ڏانهن
  2. اليمنگ، ڊي، هينڊلر، جي. (2011) ڪم ڪندڙ آنٽولوجسٽ لاءِ سيمينٽڪ ويب (2nd ايڊ.)
  3. اسٽاب، ايس.، اسٽوڊر، آر. (ايڊز.) (2009) آنٽولوجيز تي دستي ڪتاب (2nd ايڊ.)
  4. ووڊ، ڊي (ايڊ.). (2011) انٽرپرائز ڊيٽا کي ڳنڍڻ
  5. ڪيٽ، ايم (2018) آنٽولوجي انجنيئرنگ جو هڪ تعارف

جو ذريعو: www.habr.com

تبصرو شامل ڪريو