انٽرپرائز جي آنٽولوجي ماڊلنگ: طريقا ۽ ٽيڪنالاجيون [متن]: مونوگراف / [S. V. Gorshkov، S. S. Kralin، O. I. مشتاڪ ۽ ٻيا؛ ايگزيڪيوٽو ايڊيٽر S.V. Gorshkov]. - ايڪاترينبرگ: يورال يونيورسٽي پبلشنگ هائوس، 2019. - 234 ص: بيمار، ٽيبل؛ 20 سي ايم - ليکڪ. پوئين ٽائيٽل تي اشارو ڪيو ويو آهي. سان. - ببليوگرافي ch جي آخر ۾. ISBN 978-5-7996-2580-1: 200 ڪاپيون.
هبري تي هن ٽڪري کي پوسٽ ڪرڻ جو مقصد چار ڀيرا آهي:
اهو ممڪن نه آهي ته ڪو ماڻهو اهو ڪتاب هٿ ۾ کڻي سگهي، جيڪڏهن هو ڪنهن معزز جو گراهڪ نه هجي SergeIndex؛ اهو يقيني طور تي وڪرو تي ناهي.
متن ۾ تصحيحون ڪيون ويون آهن (اهي هيٺ نه ڏيکاريا ويا آهن) ۽ اضافا ڪيا ويا آهن جيڪي ڇپيل مونوگراف جي فارميٽ سان بلڪل هم آهنگ نه آهن: ٽاپيڪل نوٽس (اسپائلرز هيٺ) ۽ هائپر لنڪس.
مان چاهيان ٿو سوال ۽ رايا گڏ ڪريو, انهن کي حساب ۾ رکڻ لاءِ جڏهن هن متن کي ڪنهن ٻئي اشاعت ۾ نظرثاني ٿيل فارم ۾ شامل ڪيو وڃي.
ڪيتريون ئي Semantic ويب ۽ ڳنڍيل ڊيٽا جي پيروي ڪندڙ اڃا تائين يقين رکن ٿا ته انهن جو دائرو تمام تنگ آهي، خاص طور تي ڇاڪاڻ ته عام عوام اڃا تائين صحيح طور تي وضاحت نه ڪئي وئي آهي ته اهو ڪيترو عظيم آهي سيمينٽڪ ويب ۽ ڳنڍيل ڊيٽا جي پيروي ڪندڙ. حصو جو مصنف، جيتوڻيڪ هو هن دائري سان تعلق رکي ٿو، هن راء کي نه رکندو آهي، پر، ان جي باوجود، پاڻ کي هڪ ٻي ڪوشش ڪرڻ جو پابند سمجهي ٿو.
۽ ائين،
سامونڊي ويب
انٽرنيٽ جي ارتقاءَ کي هن ريت پيش ڪري سگهجي ٿو (يا ان جي حصن بابت ڳالهايو جيڪي هيٺ ڏنل ترتيب ۾ ٺاهيا ويا آهن):
انٽرنيٽ دستاويز. اهم ٽيڪنالاجيون HTML ۽ HTTP آهن.
ظاهر ڪيل وسيلن جي فطرت انهن جي ٽرانسميشن وچولي جي خاصيتن کي حساب ۾ رکي ٿي.
انٽرنيٽ ڊيٽا. اهم ٽيڪنالاجيون - REST ۽ SOAP API، XHR، وغيره.
انٽرنيٽ ايپليڪيشنن جو دور، نه رڳو ماڻهو وسيلن جا صارف بڻجي ويا آهن.
انٽرنيٽ ڊيٽا. اهم ٽيڪنالاجيون ڳنڍيل ڊيٽا ٽيڪنالاجيون آهن.
هي چوٿون مرحلو، جنهن جي اڳڪٿي ڪئي وئي برنرز-لي، ٻئي بنيادي ٽيڪنالاجي جو خالق ۽ W3C جو ڊائريڪٽر، سڏيو ويندو آهي Semantic Web؛ ڳنڍيل ڊيٽا ٽيڪنالاجيون ڊزائين ڪيون ويون آهن ويب تي ڊيٽا کي نه رڳو مشين لاءِ پڙهڻ لائق، پر ”مشين-سمجهڻ لائق“ پڻ.
ان کان پوءِ پڙهندڙ ٻئي ۽ چوٿين مرحلن جي اهم تصورن جي وچ ۾ رابطي کي سمجهي سگهندا:
URLs يو آر آءِ جي برابر آهن،
HTML جو اينالاگ RDF آهي،
HTML هائپر لنڪس RDF دستاويزن ۾ URI واقعن سان ملندڙ جلندڙ آهن.
سيمينٽڪ ويب انٽرنيٽ جي مستقبل جو هڪ سسٽماتي نظارو وڌيڪ آهي هڪ مخصوص خودڪشي يا لاب ٿيل رجحان جي ڀيٽ ۾، جيتوڻيڪ اهو انهن بعد ۾ حساب ۾ وٺي سگهي ٿو. مثال طور، هڪ اهم خصوصيت جنهن کي ويب 2.0 سڏيو وڃي ٿو سمجهي وڃي ٿو "صارف جي ٺاهيل مواد." خاص طور تي، W3C سفارش کي سڏيو وڃي ٿو ان کي حساب ۾ رکڻ لاء "ويب تشريح آنٽولوجي”۽ اهڙو معاهدو بيڪار.
ڇا سيمينٽڪ ويب مري ويو آهي؟
جيڪڏهن توهان انڪار ڪيو غير حقيقي اميدون, semantic web سان صورتحال لڳ ڀڳ ساڳي آهي جيئن ترقي يافته سوشلزم جي دور ۾ ڪميونزم سان (۽ ڇا Ilyich جي مشروط خواهشن جي وفاداري جو مشاهدو ڪيو وڃي، هر ڪنهن کي پاڻ لاء فيصلو ڪرڻ ڏيو). سرچ انجڻ ڪافي ڪاميابي سان ويب سائيٽن کي RDFa ۽ JSON-LD استعمال ڪرڻ تي مجبور ڪن ٿا ۽ پاڻ هيٺ ڏنل بيان ڪيل ٽيڪنالاجي سان لاڳاپيل ٽيڪنالاجيون استعمال ڪن ٿا (Google Knowledge Graph, Bing Knowledge Graph).
عام اصطلاحن ۾، ليکڪ اهو نه ٿو چئي سگهي ته ڇا وڏي پکيڙ کي روڪيو آهي، پر هو ذاتي تجربو جي بنياد تي ڳالهائي سگهي ٿو. اهڙا مسئلا آهن جيڪي "باڪس کان ٻاهر" SW جارحيت جي حالتن ۾ حل ٿي سگهن ٿيون، جيتوڻيڪ اهي تمام وسيع نه آهن. نتيجي طور، جن کي انهن ڪمن سان منهن ڏيڻو پوي ٿو، انهن جي خلاف جبر جو ڪو وسيلو نه آهي، جيڪي حل مهيا ڪرڻ جي قابل آهن، جڏهن ته بعد ۾ هڪ حل جي آزاد روزي انهن جي ڪاروباري ماڊل جي تضاد آهي. تنهن ڪري اسان HTML کي پارس ڪرڻ جاري رکون ٿا ۽ مختلف APIs کي گڏ ڪري رهيا آهيون، هڪ ٻئي سان گڏ.
بهرحال، ڳنڍيل ڊيٽا ٽيڪنالاجيون مکيه وهڪرو ويب کان ٻاهر پکڙيل آهن؛ ڪتاب، حقيقت ۾، انهن ايپليڪيشنن لاء وقف آهي. في الحال، لنڪ ٿيل ڊيٽا ڪميونٽي کي اميد آهي ته اهي ٽيڪنالاجيون اڃا به وڌيڪ وسيع ٿي وينديون گارٽنر جي رڪارڊنگ (يا اعلان، جيئن توهان چاهيو) رجحانات جهڙوڪ علم جو گرافس и ڊيٽا ڪپڙو. مان يقين ڪرڻ چاهيان ٿو ته اهو انهن تصورن جي "سائيڪل" تي عمل درآمد نه ٿيندو جيڪي ڪامياب ٿيندا، پر جيڪي هيٺ ڏنل بحث ڪيل W3C معيار سان لاڳاپيل آهن.
ڳنڍيل ڊيٽا
Berners-Lee وضاحت ڪئي ڳنڍيل ڊيٽا جي طور تي سيمينٽڪ ويب "ڊن صحيح": طريقن ۽ ٽيڪنالاجي جو هڪ سيٽ جيڪو ان کي پنهنجي حتمي مقصدن حاصل ڪرڻ جي اجازت ڏئي ٿو. ڳنڍيل ڊيٽا برنرز-لي جا بنيادي اصول نمايان ٿيل هيٺيون.
اصول 1. ادارن جو نالو ڏيڻ لاءِ URIs استعمال ڪريو.
URIs عالمي ادارن جي سڃاڻپ ڪندڙ آھن جيئن داخلائن لاءِ مقامي اسٽرنگ سڃاڻپ ڪندڙ جي مخالفت ڪن. ان کان پوء، هن اصول کي گوگل علم گراف جي نعري ۾ بهترين طور تي بيان ڪيو ويو آهي "شيون، تار نه».
اصول 2. ايڇ ٽي ٽي پي اسڪيم ۾ URIs استعمال ڪرڻ ته جيئن انهن کي رد ڪري سگهجي.
هڪ URI جي حوالي سان، اهو ممڪن هجڻ گهرجي ته ان نشاني جي پويان نشانيون حاصل ڪرڻ (آپريٽر جي نالي سان تشبيه "هتي واضح آهي).*"سي ۾)؛ وڌيڪ واضح طور تي، هن نشاني جي ڪجهه نمائندگي حاصل ڪرڻ لاء - HTTP هيڊر جي قيمت تي منحصر آهي Accept:. ٿي سگهي ٿو، AR/VR دور جي اچڻ سان، اهو ممڪن ٿيندو ته وسيلا پاڻ حاصل ڪرڻ، پر هن وقت، گهڻو ڪري، اهو هڪ RDF دستاويز هوندو، جيڪو SPARQL سوال تي عمل ڪرڻ جو نتيجو آهي. DESCRIBE.
اصول 3. W3C معيارن جو استعمال - بنيادي طور تي RDF(S) ۽ SPARQL - خاص طور تي جڏهن URIs جي حوالي سان.
اصول 4. ادارن جي وضاحت ڪرڻ وقت ٻين URIs جي حوالي سان استعمال ڪريو.
RDF توهان کي اجازت ڏئي ٿو ته توهان پاڻ کي قدرتي ٻولي ۾ وسيلن جي زباني وضاحت تائين محدود ڪري، ۽ چوٿون اصول اهو نه ڪرڻ لاءِ سڏي ٿو. جيڪڏهن پهريون اصول عالمي طور تي مشاهدو ڪيو وڃي ٿو، اهو ممڪن آهي جڏهن هڪ وسيلن کي ٻين ڏانهن اشارو ڪرڻ لاء بيان ڪيو وڃي، جنهن ۾ "پرڏيهي" شامل آهن، انهي ڪري ڊيٽا کي ڳنڍيل سڏيو ويندو آهي. حقيقت ۾، اهو تقريبا ناگزير آهي استعمال ڪرڻ لاء URIs جو نالو RDFS لفظ ۾.
آر ڊي ايف
آر ڊي ايف (ريسورس ڊڪشنري فريم ورڪ) هڪ رسم الخط آهي جيڪو بيان ڪرڻ لاءِ هڪ ٻئي سان لاڳاپيل ادارن کي بيان ڪري ٿو.
"موضوع-پريڊيڪيٽ-آبجیکٹ" قسم جا بيان، جن کي ٽرپلٽس سڏيو ويندو آهي، ادارن ۽ انهن جي رشتن بابت ٺاهيو ويندو آهي. سادي صورت ۾، موضوع، پيشڪش، ۽ اعتراض سڀ URIs آهن. ساڳئي URI مختلف پوزيشن ۾ مختلف ٽنهي ۾ ٿي سگهي ٿو: هڪ موضوع، هڪ پيشڪش، ۽ هڪ اعتراض؛ اهڙيءَ طرح، ٽِپليٽ هڪ قسم جو گراف ٺاهيندا آهن جنهن کي RDF گراف سڏيو ويندو آهي.
مضمون ۽ شيون نه رڳو URIs ٿي سگھن ٿيون، پر پڻ نام نهاد خالي نوڊس، ۽ شيون به ٿي سگهن ٿيون لفظي. لٽريرل بنيادي قسم جا مثال آهن جن ۾ تار جي نمائندگي ۽ هڪ قسم جي اشاري شامل آهن.
لٽريچر لکڻ جا مثال (Turtle نحو ۾، ان بابت وڌيڪ هيٺ ڏنل): "5.0"^^xsd:float и "five"^^xsd:string. قسم سان لٽريچر rdf:langString ٻولي جي ٽيگ سان پڻ ليس ٿي سگھي ٿو؛ Turtle ۾ اھو ھن طرح لکيل آھي: "five"@en и "пять"@ru.
خالي نوڊس "گمنام" وسيلا آهن بغير عالمي سڃاڻپ ڪندڙ، جن جي باري ۾ بيان ڪري سگهجي ٿو، جيتوڻيڪ، ٿي سگهي ٿو؛ وجودي variables جو قسم.
امڪاني سبب اهو آهي ته غير رسمي طور تي سمجھڻ جي خواهش ۽ ترجمي کي پهرين آرڊر جي اڳڪٿي منطق جي ٻولي ۾. s p o ڪجهه وانگر وانگر ڪٿي - اڳڪٿي ڪرڻ، и - مستقل. هن سمجھاڻي جا نشان دستاويز ۾ آهن "LBase: Semantics for Languages of the Semantic Web"، جنهن کي W3C ڪم ڪندڙ گروپ نوٽ جي حيثيت حاصل آهي. اُن سمجھڻ سان، ٽِپَل s p []ڪٿي [] - خالي نوڊ، ترجمو ڪيو ويندو جيئن ڪٿي - متغير، پر پوء ڪيئن ترجمو ڪجي s [] o؟ W3C سفارش واري حيثيت سان دستاويز "آر ڊي ايف 1.1 سيمينٽڪس” هڪ ٻيو ترجمي جو طريقو پيش ڪري ٿو، پر اڃا به امڪان تي غور نٿو ڪري ته اڳڪٿيون خالي نوڊس هجڻ جي.
ساڳئي RDF کي RDF/XML ۾ مختلف طريقن سان ترتيب ڏئي سگهجي ٿو، تنهن ڪري، مثال طور، XSD استعمال ڪندي نتيجو XML کي درست ڪرڻ يا XPath استعمال ڪندي ڊيٽا کي ڪڍڻ جي ڪوشش ڪرڻ جو ڪو احساس ناهي. اهڙي طرح، JSON-LD جاوا اسڪرپٽ ڊولپر جي اوسط جاوا اسڪرپٽ ڊولپر جي آر ڊي ايف سان ڪم ڪرڻ جي خواهش کي پورو ڪرڻ جو امڪان ناهي Javascript جي ڊٽ ۽ اسڪوائر-بريڪٽ نوٽشن (جيتوڻيڪ JSON-LD هڪ ميکانيزم پيش ڪندي انهي طرف هلي ٿو. ٺاھڻ).
اڪثر نحو ڊگھي URIs کي مختصر ڪرڻ جا طريقا پيش ڪن ٿا. مثال طور، هڪ اشتهار @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> Turtle ۾ پوءِ توھان کي ان جي بدران لکڻ جي اجازت ڏيندو <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> بس rdf:type.
آر ڊي ايف ايس
آر ڊي ايف ايس (RDF اسڪيما) - هڪ بنيادي ماڊلنگ لفظ، ملڪيت ۽ طبقي ۽ ملڪيت جي تصورات کي متعارف ڪرايو آهي جهڙوڪ rdf:type, rdfs:subClassOf, rdfs:domain и rdfs:range. RDFS ڊڪشنري استعمال ڪندي، مثال طور، ھيٺ ڏنل صحيح اظهار لکي سگھجي ٿو:
اها ڳالهه نوٽ ڪرڻ جي قابل آهي ته SPARQL بيان ڪندڙ آهي ۽ گراف ٽرورسل کي بيان ڪرڻ جي ٻولي ناهي (جڏهن ته، ڪجهه RDF ريپوزٽريز سوالن جي عمل جي منصوبي کي ترتيب ڏيڻ جا طريقا پيش ڪن ٿا). تنهن ڪري، ڪجهه معياري گراف مسئلا، مثال طور، مختصر ترين رستو ڳولڻ، SPARQL ۾ حل نه ٿو ڪري سگهجي، بشمول ملڪيت جا رستا (پر، ٻيهر، انفرادي RDF مخزن انهن مسئلن کي حل ڪرڻ لاءِ خاص توسيع پيش ڪن ٿا).
SPARQL دنيا جي آزاديءَ جي تصور کي حصيداري نٿو ڪري ۽ "ناڪامي جي طور تي نفي" واري طريقي جي پيروي ڪري ٿو، جنهن ۾ ممڪن ڊزائينز جهڙوڪ FILTER NOT EXISTS {…}. ڊيٽا جي ورڇ جي حساب ۾ ورتو وڃي ميڪانيزم استعمال ڪندي وفاق جا سوال.
SPARQL رسائي پوائنٽ - هڪ RDF اسٽوريج جيڪو SPARQL سوالن کي پروسيس ڪرڻ جي قابل آهي - ٻئي اسٽيج کان ڪو به سڌو اينالاگ نه آهي (هن پيراگراف جي شروعات ڏسو). اهو هڪ ڊيٽابيس سان مشابهت ڪري سگهجي ٿو، جنهن جي مواد جي بنياد تي HTML صفحا ٺاهيا ويا هئا، پر ٻاهران تائين رسائي لائق. SPARQL رسائي پوائنٽ ٽين اسٽيج کان API رسائي پوائنٽ کان وڌيڪ هڪجهڙائي آهي، پر ٻن مکيه اختلافن سان. پهرين، اهو ممڪن آهي ته ڪيترن ئي "ايٽمي" سوالن کي هڪ ۾ گڏ ڪرڻ (جيڪو GraphQL جي هڪ اهم خصوصيت سمجهي وڃي ٿو)، ۽ ٻيو، اهڙي API مڪمل طور تي خود دستاويزي آهي (جيڪو HATEOAS حاصل ڪرڻ جي ڪوشش ڪئي آهي).
سياسي تبصرو
RDF ويب تي ڊيٽا شايع ڪرڻ جو هڪ طريقو آهي، تنهنڪري RDF اسٽوريج کي هڪ دستاويز سمجهيو وڃي DBMS. سچ، جيئن ته آر ڊي ايف هڪ گراف آهي ۽ هڪ وڻ نه آهي، اهي پڻ گراف تي ٻڌل آهن. اها حيرت انگيز آهي ته اهو سڀ ڪجهه ڪم ڪيو. ڪير سوچي ها ته هوشيار ماڻهو هوندا جيڪي خالي نوڊس تي عمل ڪندا. ڪوڊ هتي آهي اهو ڪم نه ڪيو.
OWL (ويب آنٽولوجي ٻولي) - علم جي نمائندگي لاءِ هڪ رسم الخط، وضاحت جي منطق جو هڪ نحوي نسخو (هيٺيان هر جڳهه OWL 2 چوڻ وڌيڪ صحيح آهي، OWL جو پهريون نسخو ٻڌل هو ).
OWL ۾ وضاحتي منطق جا تصور طبقن سان ملن ٿا، ڪردار ملڪيتن سان ملن ٿا، فرد پنهنجو پويون نالو برقرار رکن ٿا. Axioms کي Axioms به سڏيو ويندو آهي.
مثال طور، نالي ماتر ۾ مانچسٽر نحو OWL نوٽيفڪيشن لاءِ هڪ محور اسان کي اڳ ۾ ئي معلوم آهي هن طرح لکيو ويندو:
Class: Human
Class: Parent
EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent
OWL لکڻ لاءِ ٻيا نحو آهن، جهڙوڪ فنڪشنل نحو، سرڪاري وضاحتن ۾ استعمال ٿيل، ۽ OWL/XML. اضافي طور تي، OWL سيريل ڪري سگهجي ٿو RDF نحو جو خلاصو ۽ اڳتي - ڪنهن به مخصوص نحو ۾.
OWL جو RDF سان ٻٽي تعلق آهي. هڪ پاسي، اهو سمجهي سگهجي ٿو هڪ قسم جي لغت جيڪا RDFS کي وڌائي ٿي. ٻئي طرف، اهو هڪ وڌيڪ طاقتور فارملزم آهي جنهن لاء آر ڊي ايف صرف هڪ سيريلائيشن فارميٽ آهي. نه سڀئي ابتدائي OWL تعميرات هڪ واحد RDF ٽرپلٽ استعمال ڪندي لکي سگهجن ٿيون.
ان تي منحصر آهي ته OWL تعميرات جي ذيلي سيٽ کي استعمال ڪرڻ جي اجازت ڏني وئي آهي، اهي نام نهاد جي باري ۾ ڳالهائيندا آهن OWL پروفائلز. معياري ۽ سڀ کان وڌيڪ مشهور آهن OWL EL، OWL RL ۽ OWL QL. پروفائل جو انتخاب عام مسئلن جي ڪمپيوٽري پيچيدگي کي متاثر ڪري ٿو. OWL تعميرات جو هڪ مڪمل سيٽ مطابق OWL DL سڏيو ويندو آهي. ڪڏهن ڪڏهن اهي OWL Full جي باري ۾ پڻ ڳالهائيندا آهن، جنهن ۾ OWL تعميرات کي استعمال ڪرڻ جي اجازت ڏني وئي آهي مڪمل آزادي سان RDF ۾ موروثي، بغير ڪنهن لفظي ۽ حسابي پابندين جي. . مثال طور، ڪا شيءِ ٻئي طبقي ۽ ملڪيت ٿي سگهي ٿي. OWL مڪمل ناقابل فيصلو آهي.
OWL ۾ نتيجن کي ڳنڍڻ جا اهم اصول کليل دنيا جي مفروضي کي اپنائڻ آهن. اوڪا) ۽ منفرد نالن جي تصور کي رد ڪرڻ (منفرد نالو فرض، ONE). هيٺ اسين ڏسنداسين ته اهي اصول ڪٿي رهن ٿا ۽ ڪجهه OWL تعميرات متعارف ڪرائي سگهن ٿا.
اچو ته آنٽولوجي هيٺ ڏنل ٽڪرا تي مشتمل هجي (مانچسٽر نحو ۾):
Class: manyChildren
EquivalentTo: Human that hasChild min 3
Individual: John
Types: Human
Facts: hasChild Alice, hasChild Bob, hasChild Carol
ڇا اھو ان جي پٺيان آھي جيڪو چيو ويو آھي ته جان ڪيترائي ٻار آھن؟ UNA کي رد ڪرڻ انفرنس انجڻ کي مجبور ڪندو ته هن سوال جو جواب منفي ۾، ڇو ته ايلس ۽ باب شايد ساڳيا ماڻهو هوندا. ھيٺ ڏنل ٿيڻ لاء، توھان کي ھيٺ ڏنل محور شامل ڪرڻو پوندو:
DifferentIndividuals: Alice, Bob, Carol, John
اچو ته ھاڻي آنٽولوجي جي ٽڪڙي کي ھيٺين شڪل ڏيو (جان کي ڪيترائي ٻار آھن، پر کيس صرف ٻه ٻار آھن):
Class: manyChildren
EquivalentTo: Human that hasChild min 3
Individual: John
Types: Human, manyChildren
Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John
ڇا هي آنٽولوجي متضاد هوندو (جنهن کي غلط ڊيٽا جي ثبوت طور تشريح ڪري سگهجي ٿو)؟ OWA کي قبول ڪرڻ سبب انفرنس انجڻ کي ناڪاري ۾ جواب ڏيڻو پوندو: ”ڪٿي“ ٻيو (ٻئي آنٽولوجي ۾) اهو چئبو ته ڪيرول به جان جو ٻار آهي.
ان جي امڪان کي رد ڪرڻ لاء، اچو ته جان بابت هڪ نئين حقيقت شامل ڪريو:
Individual: John
Facts: hasChild Alice, hasChild Bob, not hasChild Carol
ٻين ٻارن جي ظاهر کي خارج ڪرڻ لاء، اچو ته چوندا آهن ته ملڪيت جا سڀئي قدر "ٻار هجڻ" ماڻهو آهن، جن مان اسان وٽ صرف چار آهن:
ObjectProperty: hasChild
Domain: Human
Сharacteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }
ھاڻي آنٽولوجي متضاد ٿي ويندي، جنھن کي انفرنس انجڻ رپورٽ ڪرڻ ۾ ناڪام ٿيندو. آخري محور سان اسان وٽ، هڪ لحاظ سان، دنيا کي ”بند“ ڪيو ويو آهي، ۽ ڏسو ته جان جي پنهنجي ٻار هجڻ جي امڪان کي ڪيئن خارج ڪيو ويو آهي.
انٽرپرائز ڊيٽا کي ڳنڍڻ
لنڪ ٿيل ڊيٽا سيٽ طريقن ۽ ٽيڪنالاجيز جو اصل مقصد هو ويب تي ڊيٽا شايع ڪرڻ لاءِ. اندروني ڪارپوريٽ ماحول ۾ انهن جو استعمال ڪيترن ئي مشڪلاتن کي منهن ڏئي ٿو.
مثال طور، هڪ بند ڪارپوريٽ ماحول ۾، OWL جي ڪٽائي واري طاقت جي بنياد تي OWA کي اپنائڻ ۽ UNA کي رد ڪرڻ، فيصلا ويب جي کليل ۽ ورهايل فطرت جي ڪري، تمام ڪمزور آهي. ۽ هتي هيٺيان حل ممڪن آهن.
OWL کي سيمينٽڪس سان ختم ڪرڻ، OWA کي ڇڏڻ ۽ UNA کي اپنائڻ جو مطلب، لاڳاپيل آئوٽ انجڻ جي عمل کي لاڳو ڪرڻ. - هن رستي ۾ وڃي رهيو آهي Stardog RDF اسٽوريج.
حڪمراني انجڻ جي حق ۾ OWL جي ڪٽائي صلاحيتن کي ڇڏي ڏيڻ. - اسٽارڊگ سپورٽ ڪري ٿو SWRL؛ جينا ۽ گراف ڊي بي پيش ڪن ٿا پنهنجو پاڻٻوليون ضابطا
OWL جي ڪٽائي صلاحيتن کان انڪار، ماڊلنگ لاءِ RDFS جي ويجهو هڪ يا ٻئي سبسٽ جو استعمال. - هن جي باري ۾ وڌيڪ هيٺ ڏسو.
هڪ ٻيو مسئلو اهو آهي ته وڏو ڌيان اهو آهي ته ڪارپوريٽ دنيا شايد ڊيٽا جي معيار جي مسئلن تي هجي ۽ لنڪ ٿيل ڊيٽا اسٽيڪ ۾ ڊيٽا جي تصديق واري اوزار جي کوٽ. هتي جا نتيجا هن ريت آهن.
ٻيهر، OWL تعميرات جي تصديق لاءِ استعمال ڪريو بند دنيا جي لفظن ۽ منفرد نالن سان جيڪڏهن مناسب انفرنس انجڻ موجود هجي.
استعمال ڪريو SHACL، معياري ويب پرت ڪيڪ پرت جي فهرست کان پوءِ مقرر ڪئي وئي آهي (جڏهن ته، اهو پڻ استعمال ڪري سگهجي ٿو ضابطن جي انجڻ جي طور تي)، يا شيڪس.
اهو سمجھڻ ته سڀ ڪجهه آخرڪار SPARQL سوالن سان ڪيو ويندو آهي، انهن کي استعمال ڪندي توهان جي پنهنجي سادي ڊيٽا جي تصديق واري ميڪانيزم ٺاهي.
جيتوڻيڪ، ڪٽائي صلاحيتن ۽ تصديق جي اوزارن جو مڪمل رد ڪرڻ سان ڳنڍيل ڊيٽا اسٽيڪ کي ڪمن ۾ مقابلي کان ٻاهر ڪري ٿو جيڪي منظر ۾ هڪجهڙا آهن کليل ۽ ورهايل ويب - ڊيٽا انٽيگريشن ڪمن ۾.
هڪ باقاعده انٽرپرائز انفارميشن سسٽم بابت ڇا؟
اهو ممڪن آهي، پر توهان کي، يقينا، ڄاڻڻ گهرجي ته انهن مسئلن سان لاڳاپيل ٽيڪنالاجيز کي حل ڪرڻو پوندو. مان هتي بيان ڪندس ترقياتي شرڪت ڪندڙن جو هڪ عام رد عمل اهو ڏيکارڻ لاءِ ته هي ٽيڪنالاجي اسٽيڪ ڪهڙي طرح نظر اچي ٿو روايتي IT جي نقطي نظر کان. مون کي هاٿي جي مثال جو ٿورو ياد ڏياريندو آهي:
هتي، پڻ، سبب آهي موضوع جي علائقي جي پيچيدگي، جڏهن، مثال طور، اپ اسٽريم اسٽيج تي، جيڪڏهن اسان تيل ۽ گئس جي صنعت جي باري ۾ ڳالهايون ٿا، سادو اڪائونٽنگ ڪجهه CAD افعال جي ضرورت آهي.
ISO 15926، آخر ۾، تيل ۽ گيس جي صنعت کي ٿورو ڳري لڳي (۽ شايد ميڪيڪل انجنيئرنگ ۾ وڏي ايپليڪيشن ملي). صرف Statoil (Equinor) ان تي چڱيءَ طرح جڪڙيل ٿي ويو؛ ناروي ۾، سڄو ماحولياتي نظام. ٻيا پنهنجو ڪم ڪرڻ جي ڪوشش ڪري رهيا آهن. مثال طور، افواهون جي مطابق، توانائي جي گهرو وزارت جو ارادو رکي ٿو "ٻار ۽ توانائي جي ڪمپليڪس جو تصوراتي آنٽولوجي ماڊل"، ساڳئي طرح، ظاهري طور تي، بجلي جي صنعت لاء ٺهيل.
مالي تنظيمون (جيتوڻيڪ XBRL کي سمجهي سگهجي ٿو هڪ قسم جو هائبرڊ SDMX ۽ RDF Data Cube آنٽولوجي)؛
موجوده
سال جي شروعات ۾، LinkedIn فعال طور تي ليکڪ کي اسپام ڪيو ته تقريبن مالي صنعت جي تقريبن سڀني وڏن کان خالي جايون، جن کي هو ٽي وي سيريز "فورس ميجر" مان ڄاڻي ٿو: گولڊمين ساڪس، جي پي مارگن چيس ۽ / يا مورگن اسٽنلي، ويلز فارگو، SWIFT/Visa/Mastercard, Bank of America, Citigroup, Fed, Deutsche Bank... غالباً هر ڪو ڪنهن کي ڳولي رهيو هو جنهن ڏانهن هو موڪلي سگهي. علم گراف ڪانفرنس. ڪافي ڪجھ ڳولڻ ۾ ڪامياب ٿي ويا: مالي تنظيمون سڀ ڪجھ ورتو پهرين ڏينهن جي صبح.
شايد، ملڪي ۽ مغربي مالياتي ادارن جي لاڳاپيل ٽيڪنالاجيز جي محبت جي درجي ۾ فرق، بعد جي سرگرمين جي بين الاقوامي نوعيت جي ڪري آهي. ظاهري طور تي، رياستي سرحدن جي وچ ۾ انضمام کي معيار جي لحاظ کان مختلف تنظيمي ۽ ٽيڪنيڪل حلن جي ضرورت آهي.
تجارتي ايپليڪيشنن سان سوالن جا جواب سسٽم (IBM واٽسسن، ايپل سري، گوگل نالج گراف)؛
موجوده
رستي جي ذريعي، سري جو خالق، ٿامس گربر، آنٽولوجي جي بلڪل تعريف جو مصنف آهي (IT معنيٰ ۾) ”تصور جي وضاحت“ جي طور تي. منهنجي خيال ۾، هن وصف ۾ لفظن کي ٻيهر ترتيب ڏيڻ سان ان جي معني ۾ تبديلي نه ايندي آهي، جيڪو شايد اهو ظاهر ڪري ٿو ته اهو نه آهي.
منظم ڪيل ڊيٽا جي اشاعت (وڌيڪ جواز سان هن کي ڳنڍيل اوپن ڊيٽا ڏانهن منسوب ڪري سگهجي ٿو).
موجوده
ڳنڍيل ڊيٽا جا وڏا مداح نام نهاد GLAM آهن: گيلريز، لائبريريون، آرڪائيوز، ۽ ميوزيم. اهو چوڻ ڪافي آهي ته ڪانگريس جي لائبريري MARC21 جي متبادل کي فروغ ڏئي رهي آهي بي بي فريمته بائيبلوگرافڪ وضاحت جي مستقبل لاءِ بنياد فراهم ڪري ٿي ۽، يقينا، RDF جي بنياد تي.
Wikidata اڪثر ڪري لنڪڊ اوپن ڊيٽا جي ميدان ۾ هڪ ڪامياب منصوبي جي مثال طور حوالو ڏنو ويندو آهي - وڪيپيڊيا جو هڪ قسم جو مشين-پڙهڻ وارو نسخو، جنهن جو مواد، DBPedia جي برعڪس، آرٽيڪل انفارميشن باڪس مان درآمد ڪرڻ سان پيدا نه ڪيو ويو آهي، پر اهو آهي. وڌيڪ يا گهٽ دستي طور تي ٺاهي وئي (۽ بعد ۾ ساڳئي معلومات باڪس لاء معلومات جو ذريعو بڻجي ٿو).
اسان پڻ صلاح ڏيو ٿا ته توهان ان کي چيڪ ڪريو فهرست Stardog RDF اسٽوريج جا استعمال ڪندڙ Stardog ويب سائيٽ تي "ڪسٽمر" سيڪشن ۾.
جيئن ٿي سگهي، گارٽنر ۾ Hype Cycle for Emerging Technologies 2016 "انٽرپرائز ٽيڪسونومي ۽ آنٽولوجي مئنيجمينٽ" هڪ نزول جي وچ ۾ مايوسي جي وادي ۾ رکيل آهي "پيداوار واري پليٽ" تائين پهچڻ جي امڪان سان 10 سالن کان اڳ نه.
انٽرپرائز ڊيٽا کي ڳنڍڻ
اڳڪٿيون، اڳڪٿيون، اڳڪٿيون...
تاريخي دلچسپي کان ٻاهر، مون هيٺ ڏنل جدول ڪيو آهي گارٽنر جي اڳڪٿيون مختلف سالن لاءِ ٽيڪنالاجيون جيڪي اسان سان دلچسپي رکن ٿيون.
سال
ٽيڪنالاجي
رپورٽ ڪريو
جڳهه
پليٽ فارم تائين سال
2001
سامونڊي ويب
هنگامي ٽيڪنالاجيون
جدت جو محرڪ
5-10
2006
ڪارپوريٽ Semantic ويب
هنگامي ٽيڪنالاجيون
Inflated اميدن جي چوٽي
5-10
2012
سامونڊي ويب
وڏي ڊيٽا
Inflated اميدن جي چوٽي
> 10
2015
ڳنڍيل ڊيٽا
ترقي يافته تجزياتي ۽ ڊيٽا سائنس
مايوسيءَ جو خاتمو
5-10
2016
انٽرنيشنل آنٽولوجي مئنيجمينٽ
هنگامي ٽيڪنالاجيون
مايوسيءَ جو خاتمو
> 10
2018
علم جو گرافس
هنگامي ٽيڪنالاجيون
جدت جو محرڪ
5-10
بهرحال، اڳ ۾ ئي "هائپ سائيڪل ..." 2018 هڪ ٻيو اڀرندڙ رجحان ظاهر ٿيو آهي - علم گرافس. هڪ خاص ٻيهر جنم ورتو: گراف ڊي بي ايم ايس، جنهن ڏانهن صارفين جي توجه ۽ ڊولپرز جي ڪوششن کي تبديل ڪيو ويو، اڳوڻي درخواستن ۽ بعد جي عادتن جي اثر هيٺ، شڪل ۽ پوزيشن تي عمل ڪرڻ شروع ڪيو. انهن جي اڳوڻن مقابلي ۾.
تقريبن هر گراف ڊي بي ايم ايس هاڻي پاڻ کي ڪارپوريٽ "علم گراف" جي تعمير لاء هڪ مناسب پليٽ فارم جو اعلان ڪري ٿو ("ڳنڍيل ڊيٽا" ڪڏهن ڪڏهن "ڳنڍيل ڊيٽا" سان تبديل ڪيو ويندو آهي)، پر اهڙي دعوي ڪيئن صحيح آهن؟
گراف ڊيٽابيس اڃا تائين غير معمولي آهن؛ گراف ڊي بي ايم ايس ۾ ڊيٽا اڃا تائين ساڳيو ڊيٽا سائلو آهي. URIs جي بدران اسٽرنگ سڃاڻپ ڪندڙ ٻن گراف DBMSs کي ضم ڪرڻ جو ڪم اڃا به هڪ انضمام جو ڪم ڪن ٿا، جڏهن ته ٻن RDF اسٽورن کي ضم ڪرڻ اڪثر ڪري هيٺ اچي ٿو صرف ٻن RDF گرافس کي ضم ڪرڻ لاءِ. اسمانيت جو هڪ ٻيو پاسو ايل پي جي گراف ماڊل جي غير اضطراب آهي، جيڪا ساڳئي پليٽ فارم استعمال ڪندي ميٽاداٽا کي منظم ڪرڻ ڏکيو بڻائي ٿي.
آخرڪار، گراف DBMSs وٽ انجڻ انجڻ يا قاعدي انجڻ نه آھن. اهڙين انجڻين جا نتيجا پيچيده سوالن ذريعي ٻيهر پيدا ڪري سگهجن ٿا، پر اهو SQL ۾ به ممڪن آهي.
بهرحال، معروف RDF اسٽوريج سسٽم کي LPG ماڊل جي حمايت ڪرڻ ۾ ڪا به ڏکيائي نه آهي. سڀ کان وڌيڪ مضبوط طريقو سمجهيو ويندو آهي هڪ تجويز ڪيل هڪ وقت تي Blazegraph ۾: RDF * ماڊل، RDF ۽ LPG کي گڏ ڪندي.