سیمنٹک ویب اور لنکڈ ڈیٹا۔ تصحیحات اور اضافے

میں حال ہی میں شائع ہونے والی اس کتاب کا ایک ٹکڑا عوام کے سامنے پیش کرنا چاہتا ہوں:

کسی انٹرپرائز کی اونٹولوجیکل ماڈلنگ: طریقے اور ٹیکنالوجیز [متن]: مونوگراف / [ایس۔ V. Gorshkov, S. S. Kralin, O. I. Mushtak اور دیگر; ایگزیکٹو ایڈیٹر S.V. Gorshkov]۔ - Ekaterinburg: Ural University Publishing House, 2019. - 234 p.: ill., table; 20 سینٹی میٹر - مصنف۔ پچھلی چوچی پر اشارہ کیا گیا ہے۔ کے ساتھ۔ - کتابیات ch کے آخر میں — ISBN 978-5-7996-2580-1: 200 کاپیاں۔

Habré پر اس ٹکڑے کو پوسٹ کرنے کا مقصد چار گنا ہے:

  • اس بات کا امکان نہیں ہے کہ کوئی اس کتاب کو اپنے ہاتھ میں لے سکے اگر وہ کسی معزز کا مؤکل نہ ہو۔ سرج انڈیکس; یہ یقینی طور پر فروخت پر نہیں ہے۔
  • متن میں تصحیحیں کی گئی ہیں (ان کو نیچے نمایاں نہیں کیا گیا ہے) اور ایسے اضافے کیے گئے ہیں جو پرنٹ شدہ مونوگراف کے فارمیٹ کے ساتھ بالکل مطابقت نہیں رکھتے ہیں: ٹاپیکل نوٹس (اسپلرز کے نیچے) اور ہائپر لنکس۔
  • میں چاہتا ہوں سوالات اور تبصرے جمع کریں۔کسی بھی دوسری اشاعت میں اس متن کو نظر ثانی شدہ شکل میں شامل کرتے وقت ان کو مدنظر رکھنے کے لیے۔
  • بہت سے سیمنٹک ویب اور لنکڈ ڈیٹا کے پیروکار اب بھی یہ سمجھتے ہیں کہ ان کا دائرہ بہت تنگ ہے، اس کی بنیادی وجہ یہ ہے کہ عام لوگوں کو ابھی تک صحیح طریقے سے یہ نہیں بتایا گیا ہے کہ سیمنٹک ویب اور لنکڈ ڈیٹا کا پیروکار ہونا کتنا اچھا ہے۔ ٹکڑا کا مصنف اگرچہ اس دائرے سے تعلق رکھتا ہے، اس رائے کو نہیں مانتا، لیکن اس کے باوجود، خود کو ایک اور کوشش کرنے کا پابند سمجھتا ہے۔

اس طرح،

سیمنٹیکل ویب

انٹرنیٹ کے ارتقاء کو مندرجہ ذیل طور پر پیش کیا جا سکتا ہے (یا اس کے حصوں کے بارے میں بات کریں جو نیچے دی گئی ترتیب میں تشکیل دی گئی ہیں):

  1. انٹرنیٹ پر دستاویزات. کلیدی ٹیکنالوجیز - گوفر، ایف ٹی پی، وغیرہ۔
    انٹرنیٹ مقامی وسائل کے تبادلے کے لیے ایک عالمی نیٹ ورک ہے۔
  2. انٹرنیٹ دستاویزات. کلیدی ٹیکنالوجیز HTML اور HTTP ہیں۔
    بے نقاب وسائل کی نوعیت ان کے ٹرانسمیشن میڈیم کی خصوصیات کو مدنظر رکھتی ہے۔
  3. انٹرنیٹ ڈیٹا. کلیدی ٹیکنالوجیز - REST اور SOAP API، XHR، وغیرہ۔
    انٹرنیٹ ایپلی کیشنز کا دور، نہ صرف لوگ وسائل کے صارفین بن جاتے ہیں۔
  4. انٹرنیٹ ڈیٹا. کلیدی ٹیکنالوجیز لنکڈ ڈیٹا ٹیکنالوجیز ہیں۔
    یہ چوتھا مرحلہ، جس کی پیشن گوئی برنرز لی نے کی ہے، جو دوسری بنیادی ٹیکنالوجیز کے خالق اور W3C کے ڈائریکٹر ہیں، کو سیمنٹک ویب کہا جاتا ہے۔ لنکڈ ڈیٹا ٹیکنالوجیز ویب پر ڈیٹا کو نہ صرف مشین پڑھنے کے قابل بنانے کے لیے ڈیزائن کی گئی ہیں بلکہ "مشین کے لیے قابل فہم" بھی ہیں۔

مندرجہ ذیل سے، قاری دوسرے اور چوتھے مراحل کے کلیدی تصورات کے درمیان خط و کتابت کو سمجھے گا:

  • یو آر ایل یو آر آئی کے مشابہ ہیں،
  • ایچ ٹی ایم ایل کا اینالاگ آر ڈی ایف ہے،
  • ایچ ٹی ایم ایل ہائپر لنکس آر ڈی ایف دستاویزات میں یو آر آئی کے واقعات سے ملتے جلتے ہیں۔

سیمنٹک ویب انٹرنیٹ کے مستقبل کے بارے میں ایک مخصوص خود بخود یا لاب شدہ رجحان سے زیادہ ایک نظامی نقطہ نظر ہے، حالانکہ یہ ان مؤخر الذکر کو مدنظر رکھ سکتا ہے۔ مثال کے طور پر، ویب 2.0 کہلانے والی ایک اہم خصوصیت کو "صارف کے ذریعے تیار کردہ مواد" سمجھا جاتا ہے۔ خاص طور پر، W3C کی سفارش کو مدنظر رکھنے کے لیے کہا جاتا ہے۔ویب اینوٹیشن آنٹولوجی"اور اس طرح کا وعدہ ٹھوس.

کیا سیمنٹک ویب مردہ ہے؟

اگر آپ انکار کرتے ہیں۔ غیر حقیقی توقعات، سیمنٹک ویب کے ساتھ صورتحال تقریبا وہی ہے جو ترقی یافتہ سوشلزم کے زمانے میں کمیونزم کے ساتھ تھی (اور آیا ایلیچ کے مشروط احکامات کے ساتھ وفاداری کا مشاہدہ کیا جاتا ہے، ہر ایک کو خود فیصلہ کرنے دیں)۔ تلاش کار کافی کامیابی سے ویب سائٹس کو RDFa اور JSON-LD استعمال کرنے پر مجبور کریں اور خود ان سے متعلقہ ٹیکنالوجیز استعمال کریں جو ذیل میں بیان کی گئی ہیں (گوگل نالج گراف، بنگ نالج گراف)۔

عام الفاظ میں، مصنف یہ نہیں کہہ سکتا کہ کون سی چیز زیادہ پھیلاؤ کو روک رہی ہے، لیکن وہ ذاتی تجربے کی بنیاد پر بات کر سکتا ہے۔ ایسے مسائل ہیں جنہیں SW جارحیت کے حالات میں "باکس سے باہر" حل کیا جا سکتا ہے، حالانکہ وہ بہت وسیع نہیں ہیں۔ نتیجے کے طور پر، جن لوگوں کو ان کاموں کا سامنا ہے، ان کے پاس ان لوگوں کے خلاف جبر کا کوئی ذریعہ نہیں ہے جو حل فراہم کرنے کے قابل ہیں، جب کہ بعد میں حل کی آزادانہ فراہمی ان کے کاروباری ماڈلز سے متصادم ہے۔ لہٰذا ہم HTML کو پارس کرتے رہتے ہیں اور مختلف APIs کو ایک دوسرے کے ساتھ جوڑتے رہتے ہیں۔

تاہم، لنکڈ ڈیٹا ٹیکنالوجیز مرکزی دھارے کی ویب سے آگے پھیل چکی ہیں۔ کتاب، درحقیقت، ان ایپلی کیشنز کے لیے وقف ہے۔ فی الحال، لنکڈ ڈیٹا کمیونٹی کو توقع ہے کہ یہ ٹیکنالوجیز گارٹنر کی ریکارڈنگ (یا اعلان، جیسا کہ آپ چاہیں) کی بدولت اور زیادہ پھیل جائیں گی جیسے کہ علم گراف и ڈیٹا فیبرک. میں یقین کرنا چاہوں گا کہ یہ ان تصورات کے "سائیکل" پر عمل درآمد نہیں ہوں گے جو کامیاب ہوں گے، بلکہ جو W3C معیارات سے متعلق ہیں جن پر ذیل میں بات کی گئی ہے۔

منسلک ڈیٹا

Berners-Lee نے Linked Data کو سیمنٹک ویب "صحیح کام" کے طور پر بیان کیا: نقطہ نظر اور ٹیکنالوجیز کا ایک مجموعہ جو اسے اپنے حتمی مقاصد حاصل کرنے کی اجازت دیتا ہے۔ لنکڈ ڈیٹا برنرز لی کے بنیادی اصول روشنی ڈالی مندرجہ ذیل.

اصول 1. اداروں کو نام دینے کے لیے URIs کا استعمال۔

URIs اندراجات کے لیے مقامی سٹرنگ شناخت کنندگان کے برخلاف عالمی ہستی کے شناخت کنندہ ہیں۔ اس کے بعد، اس اصول کو گوگل نالج گراف کے نعرے میں بہترین انداز میں بیان کیا گیا۔چیزیں، تار نہیں'.

اصول 2. HTTP اسکیم میں URIs کا استعمال کرنا تاکہ ان کا حوالہ نہ دیا جاسکے۔

یو آر آئی کا حوالہ دے کر، اس سیگنیفائر کے پیچھے اشارہ حاصل کرنا ممکن ہونا چاہیے (آپریٹر کے نام کے ساتھ مشابہت یہاں واضح ہے)۔*"C میں"؛ زیادہ واضح طور پر، اس کی کچھ نمائندگی حاصل کرنے کے لیے - HTTP ہیڈر کی قدر پر منحصر ہے۔ Accept:. شاید، AR/VR دور کی آمد کے ساتھ، وسائل کو خود حاصل کرنا ممکن ہو جائے گا، لیکن فی الحال، زیادہ تر امکان ہے کہ، یہ ایک RDF دستاویز ہو گی، جو SPARQL استفسار پر عمل کرنے کا نتیجہ ہے۔ DESCRIBE.

اصول 3. W3C معیارات کا استعمال - بنیادی طور پر RDF(S) اور SPARQL - خاص طور پر URIs کا حوالہ دیتے وقت۔

لنکڈ ڈیٹا ٹکنالوجی اسٹیک کی یہ انفرادی "پرتیں"، جسے بھی کہا جاتا ہے۔ سیمنٹک ویب لیئر کیک، ذیل میں بیان کیا جائے گا.

اصول 4. اداروں کی وضاحت کرتے وقت دیگر URIs کے حوالہ جات کا استعمال۔

RDF آپ کو اپنے آپ کو قدرتی زبان میں وسائل کی زبانی وضاحت تک محدود رکھنے کی اجازت دیتا ہے، اور چوتھا اصول ایسا نہ کرنے کا مطالبہ کرتا ہے۔ اگر پہلا اصول عالمی طور پر دیکھا جاتا ہے، تو یہ اس وقت ممکن ہو جاتا ہے جب کسی وسیلے کی وضاحت کرتے ہوئے دوسروں کا حوالہ دیا جائے، بشمول "غیر ملکی"، جس کی وجہ سے ڈیٹا کو منسلک کہا جاتا ہے۔ درحقیقت، RDFS الفاظ میں نامزد URIs کا استعمال تقریباً ناگزیر ہے۔

RDF

RDF (وسائل کی تفصیل کا فریم ورک) باہم منسلک اداروں کو بیان کرنے کے لیے ایک رسمیت ہے۔

"سبجیکٹ-پیڈیکیٹ-آبجیکٹ" قسم کے بیانات، جنہیں ٹرپلٹس کہتے ہیں، اداروں اور ان کے تعلقات کے بارے میں بنائے جاتے ہیں۔ آسان ترین صورت میں، موضوع، پیشین گوئی، اور آبجیکٹ سبھی URIs ہیں۔ ایک ہی URI مختلف ٹرپلٹس میں مختلف پوزیشنوں میں ہو سکتا ہے: ایک موضوع، ایک پیشین، اور ایک چیز؛ اس طرح، ٹرپلٹس ایک قسم کا گراف بناتے ہیں جسے RDF گراف کہتے ہیں۔

مضامین اور اشیاء نہ صرف URIs بلکہ نام نہاد بھی ہو سکتے ہیں۔ خالی نوڈس، اور اشیاء بھی ہو سکتی ہیں۔ لفظی. لٹریلز قدیم اقسام کی مثالیں ہیں جن میں سٹرنگ کی نمائندگی اور قسم کے اشارے ہوتے ہیں۔

لغوی لکھنے کی مثالیں (کچھی نحو میں، ذیل میں اس کے بارے میں مزید): "5.0"^^xsd:float и "five"^^xsd:string. قسم کے ساتھ لٹریلز rdf:langString زبان کے ٹیگ سے بھی لیس کیا جا سکتا ہے؛ ٹرٹل میں اس طرح لکھا جاتا ہے: "five"@en и "пять"@ru.

خالی نوڈس عالمی شناخت کنندگان کے بغیر "گمنام" وسائل ہیں، جن کے بارے میں، تاہم، بیان کیے جا سکتے ہیں۔ وجودی متغیرات کی قسم۔

تو (یہ، حقیقت میں، RDF کا پورا نقطہ ہے):

  • موضوع ایک URI یا خالی نوڈ ہے،
  • پیش گوئی ایک URI ہے،
  • آبجیکٹ ایک URI، ایک خالی نوڈ، یا لفظی ہے۔

پیش گوئیاں خالی نوڈس کیوں نہیں ہوسکتی ہیں؟

ممکنہ وجہ یہ ہے کہ غیر رسمی طور پر ٹرپلٹ کو فرسٹ آرڈر پریڈیکیٹ منطق کی زبان میں سمجھنے اور ترجمہ کرنے کی خواہش s p o جیسے کچھ سیمنٹک ویب اور لنکڈ ڈیٹا۔ تصحیحات اور اضافےجہاں سیمنٹک ویب اور لنکڈ ڈیٹا۔ تصحیحات اور اضافے - پیش گوئی کرنا، سیمنٹک ویب اور لنکڈ ڈیٹا۔ تصحیحات اور اضافے и سیمنٹک ویب اور لنکڈ ڈیٹا۔ تصحیحات اور اضافے - مستقل اس تفہیم کے آثار دستاویز میں موجود ہیں۔LBase: Semantics for Languages ​​of the Semantic Web"، جس کی حیثیت W3C ورکنگ گروپ نوٹ کی ہے۔ اس تفہیم کے ساتھ، ٹرپلٹ s p []جہاں [] - خالی نوڈ، کے طور پر ترجمہ کیا جائے گا سیمنٹک ویب اور لنکڈ ڈیٹا۔ تصحیحات اور اضافےجہاں سیمنٹک ویب اور لنکڈ ڈیٹا۔ تصحیحات اور اضافے - متغیر، لیکن پھر ترجمہ کیسے کریں۔ s [] o? W3C سفارش کی حیثیت کے ساتھ دستاویز "RDF 1.1 سیمنٹکسترجمہ کا ایک اور طریقہ پیش کرتا ہے، لیکن پھر بھی پیشین گوئی کے خالی نوڈس ہونے کے امکان پر غور نہیں کرتا۔

تاہم، مانو اسپورنی اجازت دی.

RDF ایک تجریدی ماڈل ہے۔ RDF کو مختلف نحو میں لکھا جا سکتا ہے (سیریلائزڈ) RDF/XML, کچھی (زیادہ تر انسان پڑھنے کے قابل) JSON-LD, ایچ ڈی ٹی (بائنری)۔

اسی RDF کو مختلف طریقوں سے RDF/XML میں سیریلائز کیا جا سکتا ہے، لہذا، مثال کے طور پر، XSD کا استعمال کرتے ہوئے نتیجے میں XML کی توثیق کرنا یا XPath کا استعمال کرتے ہوئے ڈیٹا نکالنے کی کوشش کرنا کوئی معنی نہیں رکھتا۔ اسی طرح، JSON-LD کا جاوا اسکرپٹ کے ڈاٹ اور مربع بریکٹ اشارے کا استعمال کرتے ہوئے RDF کے ساتھ کام کرنے کی اوسط جاوا اسکرپٹ ڈویلپر کی خواہش کو پورا کرنے کا امکان نہیں ہے (حالانکہ JSON-LD ایک طریقہ کار پیش کرکے اس سمت میں آگے بڑھتا ہے۔ فریمنگ).

زیادہ تر نحو طویل URIs کو مختصر کرنے کے طریقے پیش کرتے ہیں۔ مثال کے طور پر، ایک اشتہار @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> in Turtle پھر آپ کو اس کی بجائے لکھنے کی اجازت دے گا۔ <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> صرف rdf:type.

آر ڈی ایف ایس

آر ڈی ایف ایس (RDF سکیما) - ماڈلنگ کی ایک بنیادی لغت، جائیداد اور طبقے اور خصوصیات کے تصورات کو متعارف کراتی ہے جیسے rdf:type, rdfs:subClassOf, rdfs:domain и rdfs:range. RDFS لغت کا استعمال کرتے ہوئے، مثال کے طور پر، درج ذیل درست تاثرات لکھے جا سکتے ہیں:

rdf:type         rdf:type         rdf:Property .
rdf:Property     rdf:type         rdfs:Class .
rdfs:Class       rdfs:subClassOf  rdfs:Resource .
rdfs:subClassOf  rdfs:domain      rdfs:Class .
rdfs:domain      rdfs:domain      rdf:Property .
rdfs:domain      rdfs:range       rdfs:Class .
rdfs:label       rdfs:range       rdfs:Literal .

RDFS ایک وضاحت اور ماڈلنگ الفاظ کا ذخیرہ ہے، لیکن یہ کوئی رکاوٹ زبان نہیں ہے (حالانکہ سرکاری تفصیلات اور پتے اس طرح کے استعمال کا امکان)۔ لفظ "Schema" کو اسی معنی میں نہیں سمجھا جانا چاہیے جیسا کہ اظہار "XML Schema" میں ہے۔ مثال کے طور پر، :author rdfs:range foaf:Person اس کا مطلب ہے rdf:type تمام جائیداد کی اقدار :author - foaf:Person، لیکن اس کا مطلب یہ نہیں ہے کہ یہ پہلے سے کہا جانا چاہئے۔

SPARQL

SPARQL (SPARQL پروٹوکول اور RDF Query Language) - RDF ڈیٹا کے استفسار کے لیے ایک زبان۔ ایک سادہ سی صورت میں، ایک SPARQL استفسار نمونوں کا ایک مجموعہ ہے جس کے خلاف سوال کیے جانے والے گراف کے ٹرپلٹس کو ملایا جاتا ہے۔ پیٹرنز موضوع، پیشین گوئی، اور آبجیکٹ کی پوزیشنوں میں متغیرات پر مشتمل ہو سکتے ہیں۔

استفسار ایسی متغیر اقدار کو لوٹائے گا جو نمونوں میں تبدیل ہونے پر، استفسار شدہ RDF گراف (اس کے تین حصوں کا ذیلی سیٹ) کے ذیلی گراف کی صورت میں نکل سکتا ہے۔ تینوں کے مختلف نمونوں میں ایک ہی نام کے متغیرات کی قدریں ایک جیسی ہونی چاہئیں۔

مثال کے طور پر، مندرجہ بالا سات RDFS محوروں کے سیٹ کو دیکھتے ہوئے، درج ذیل استفسار واپس آجائے گا۔ rdfs:domain и rdfs:range اقدار کے طور پر ?s и ?p بالترتیب:

SELECT * WHERE {
 ?s ?p rdfs:Class .
 ?p ?p rdf:Property .
}

یہ بات قابل غور ہے کہ SPARQL اعلانیہ ہے اور گراف ٹراورسل کو بیان کرنے کی زبان نہیں ہے (تاہم، کچھ RDF اسٹورز استفسار پر عمل درآمد کے منصوبے کو ایڈجسٹ کرنے کے طریقے پیش کرتے ہیں)۔ لہذا، کچھ معیاری گراف کے مسائل، مثال کے طور پر، مختصر ترین راستہ تلاش کرنا، SPARQL میں حل نہیں کیا جا سکتا، بشمول جائیداد کے راستے (لیکن، دوبارہ، انفرادی RDF ذخیرے ان مسائل کو حل کرنے کے لیے خصوصی توسیعات پیش کرتے ہیں)۔

SPARQL دنیا کے کھلے پن کے مفروضے کا اشتراک نہیں کرتا ہے اور "نفی بطور ناکامی" کے نقطہ نظر کی پیروی کرتا ہے، جس میں ممکن ڈیزائن جیسے FILTER NOT EXISTS {…}. میکانزم کا استعمال کرتے ہوئے ڈیٹا کی تقسیم کو مدنظر رکھا جاتا ہے۔ وفاق کے سوالات.

SPARQL رسائی پوائنٹ - ایک RDF اسٹوریج جو SPARQL سوالات پر کارروائی کرنے کی صلاحیت رکھتا ہے - دوسرے مرحلے سے کوئی براہ راست اینالاگ نہیں ہے (اس پیراگراف کا آغاز دیکھیں)۔ اسے ڈیٹا بیس سے تشبیہ دی جا سکتی ہے، جس کے مشمولات کی بنیاد پر HTML صفحات بنائے گئے تھے، لیکن باہر سے قابل رسائی۔ SPARQL رسائی پوائنٹ تیسرے مرحلے سے API ایکسیس پوائنٹ سے زیادہ مشابہ ہے، لیکن دو اہم فرقوں کے ساتھ۔ سب سے پہلے، کئی "ایٹمک" سوالات کو ایک میں جمع کرنا ممکن ہے (جسے گراف کیو ایل کی ایک اہم خصوصیت سمجھا جاتا ہے)، اور دوسرا، ایسا API مکمل طور پر خود دستاویزی ہے (جسے HATEOAS نے حاصل کرنے کی کوشش کی)۔

سیاسی تبصرہ

RDF ویب پر ڈیٹا شائع کرنے کا ایک طریقہ ہے، لہذا RDF اسٹوریج کو ایک دستاویز DBMS سمجھا جانا چاہیے۔ سچ ہے، چونکہ RDF ایک گراف ہے نہ کہ درخت، اس لیے وہ بھی گراف پر مبنی نکلے۔ یہ حیرت انگیز ہے کہ اس نے بالکل کام کیا۔ کس نے سوچا ہوگا کہ ہوشیار لوگ ہوں گے جو خالی نوڈس کو نافذ کریں گے۔ Codd یہاں ہے یہ کام نہیں کیا.

RDF ڈیٹا تک رسائی کو منظم کرنے کے کم مکمل خصوصیات والے طریقے بھی ہیں، مثال کے طور پر، منسلک ڈیٹا کے ٹکڑے (LDF) اور لنکڈ ڈیٹا پلیٹ فارم (ایل ڈی پی)۔

OWL

OWL (ویب آنٹولوجی لینگویج) - علم کی نمائندگی کے لیے ایک رسمیت، وضاحت کی منطق کا ایک نحوی ورژن سیمنٹک ویب اور لنکڈ ڈیٹا۔ تصحیحات اور اضافے (نیچے ہر جگہ OWL 2 کہنا زیادہ درست ہے، OWL کا پہلا ورژن اس پر مبنی تھا۔ سیمنٹک ویب اور لنکڈ ڈیٹا۔ تصحیحات اور اضافے).

OWL میں وضاحتی منطق کے تصورات کلاسوں سے مطابقت رکھتے ہیں، کردار خصوصیات سے مطابقت رکھتے ہیں، افراد اپنا سابقہ ​​نام برقرار رکھتے ہیں۔ Axioms کو axioms بھی کہا جاتا ہے۔

مثال کے طور پر، نام نہاد میں مانچسٹر نحو OWL اشارے کے لیے ایک محور ہمیں پہلے سے معلوم ہے۔ سیمنٹک ویب اور لنکڈ ڈیٹا۔ تصحیحات اور اضافے اس طرح لکھا جائے گا:

Class: Human
Class: Parent
   EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent

OWL لکھنے کے لیے اور بھی نحو ہیں، جیسے فنکشنل نحو، سرکاری تفصیلات میں استعمال کیا جاتا ہے، اور OWL/XML. مزید برآں، OWL کو سیریلائز کیا جا سکتا ہے۔ خلاصہ RDF نحو کے لیے اور مزید - کسی بھی مخصوص نحو میں۔

OWL کا RDF کے ساتھ دوہرا تعلق ہے۔ ایک طرف، اسے ایک قسم کی لغت کے طور پر سمجھا جا سکتا ہے جو RDFS کو بڑھاتا ہے۔ دوسری طرف، یہ ایک زیادہ طاقتور رسمیت ہے جس کے لیے RDF صرف ایک سیریلائزیشن فارمیٹ ہے۔ تمام ابتدائی OWL تعمیرات کو ایک ہی RDF ٹرپلٹ کا استعمال کرتے ہوئے نہیں لکھا جا سکتا۔

اس پر منحصر ہے کہ OWL کنسٹرکٹس کے کس ذیلی سیٹ کو استعمال کرنے کی اجازت ہے، وہ نام نہاد کی بات کرتے ہیں۔ OWL پروفائلز. معیاری اور سب سے مشہور OWL EL، OWL RL اور OWL QL ہیں۔ پروفائل کا انتخاب عام مسائل کی کمپیوٹیشنل پیچیدگی کو متاثر کرتا ہے۔ OWL تعمیرات کا ایک مکمل سیٹ اس کے مطابق ہے۔ سیمنٹک ویب اور لنکڈ ڈیٹا۔ تصحیحات اور اضافےOWL DL کہا جاتا ہے۔ بعض اوقات وہ OWL Full کے بارے میں بھی بات کرتے ہیں، جس میں OWL تعمیرات کو RDF میں مکمل آزادی کے ساتھ استعمال کرنے کی اجازت دی جاتی ہے، بغیر کسی معنوی اور کمپیوٹیشنل پابندیوں کے۔ سیمنٹک ویب اور لنکڈ ڈیٹا۔ تصحیحات اور اضافے. مثال کے طور پر، کوئی چیز کلاس اور پراپرٹی دونوں ہو سکتی ہے۔ OWL مکمل ناقابل فیصلہ ہے۔

OWL میں نتائج کو منسلک کرنے کے کلیدی اصول کھلی دنیا کے مفروضے کو اپنانا ہیں۔ او ڈبلیو اے) اور منفرد ناموں کے قیاس کو مسترد کرنا (منفرد نام کا مفروضہ، ایک)۔ ذیل میں ہم دیکھیں گے کہ یہ اصول کہاں لے جا سکتے ہیں اور کچھ OWL تعمیرات کو متعارف کروا سکتے ہیں۔

آنٹولوجی میں درج ذیل ٹکڑا (مانچسٹر نحو میں):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human
   Facts: hasChild Alice, hasChild Bob, hasChild Carol

کیا یہ اس بات کی پیروی کرے گا جو کہا گیا ہے کہ یوحنا کے بہت سے بچے ہیں؟ UNA کو مسترد کرنے سے انفرنس انجن کو اس سوال کا نفی میں جواب دینے پر مجبور کیا جائے گا، کیونکہ ایلس اور باب ایک ہی شخص ہو سکتے ہیں۔ مندرجہ ذیل ہونے کے لیے درج ذیل محور کو شامل کرنا ضروری ہے:

DifferentIndividuals: Alice, Bob, Carol, John

اب آنٹولوجی کے ٹکڑے کی مندرجہ ذیل شکل ہے (جان کو بہت سے بچے قرار دیا گیا ہے، لیکن اس کے صرف دو بچے ہیں):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human, manyChildren
   Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John

کیا یہ آنٹولوجی متضاد ہو گی (جس کی تشریح غلط ڈیٹا کے ثبوت کے طور پر کی جا سکتی ہے)؟ OWA کو قبول کرنے سے انفرنس انجن منفی میں جواب دے گا: "کہیں" اور (ایک اور آنٹولوجی میں) یہ اچھی طرح کہا جا سکتا ہے کہ کیرول بھی جان کا بچہ ہے۔

اس کے امکان کو مسترد کرنے کے لیے، آئیے جان کے بارے میں ایک نئی حقیقت شامل کرتے ہیں:

Individual: John
   Facts: hasChild Alice, hasChild Bob, not hasChild Carol

دوسرے بچوں کی ظاہری شکل کو خارج کرنے کے لیے، ہم یہ کہتے ہیں کہ جائیداد کی تمام اقدار "بچے کا ہونا" ہیں، جن میں سے ہمارے پاس صرف چار ہیں:

ObjectProperty: hasChild
   Domain: Human
   Сharacteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }

اب آنٹولوجی متضاد ہو جائے گی، جس کی اطلاع دینے میں انفرنس انجن ناکام نہیں ہوگا۔ ہمارے پاس آخری محور کے ساتھ، ایک لحاظ سے، دنیا کو "بند" کر دیا گیا ہے، اور دیکھیں کہ جان کے اپنے بچے ہونے کے امکان کو کیسے خارج کر دیا گیا ہے۔

انٹرپرائز ڈیٹا کو لنک کرنا

نقطہ نظر اور ٹیکنالوجیز کا لنکڈ ڈیٹا سیٹ اصل میں ویب پر ڈیٹا شائع کرنے کے لیے تھا۔ اندرونی کارپوریٹ ماحول میں ان کے استعمال کو کئی مشکلات کا سامنا کرنا پڑتا ہے۔

مثال کے طور پر، ایک بند کارپوریٹ ماحول میں، OWA کو اپنانے اور UNA کو مسترد کرنے پر مبنی OWL کی کٹوتی طاقت، ویب کی کھلی اور تقسیم شدہ نوعیت کی وجہ سے فیصلے، بہت کمزور ہے۔ اور یہاں درج ذیل حل ممکن ہیں۔

  • OWL کو سیمنٹکس کے ساتھ عطا کرنا، OWA کو ترک کرنا اور UNA کو اپنانا، متعلقہ آؤٹ پٹ انجن کا نفاذ۔ - اس راستے کے ساتھ جا رہا ہے Stardog RDF اسٹوریج۔
  • رول انجنوں کے حق میں OWL کی کٹوتی صلاحیتوں کو ترک کرنا۔ - اسٹار ڈاگ سپورٹ کرتا ہے۔ ایس ڈبلیو آر ایل; جینا اور گراف ڈی بی کی پیشکش اپنا زبانیں قواعد
  • OWL کی کٹوتی صلاحیتوں سے انکار، ماڈلنگ کے لیے RDFS کے قریب ایک یا دوسرے سب سیٹ کا استعمال۔ - ذیل میں اس کے بارے میں مزید دیکھیں۔

ایک اور مسئلہ ڈیٹا کے معیار کے مسائل اور لنکڈ ڈیٹا اسٹیک میں ڈیٹا کی توثیق کرنے والے ٹولز کی کمی پر کارپوریٹ دنیا کی زیادہ توجہ ہے۔ یہاں کے نتائج درج ذیل ہیں۔

  • ایک بار پھر، OWL تعمیرات کی توثیق کے لیے بند عالمی الفاظ اور منفرد ناموں کے ساتھ استعمال کریں اگر کوئی مناسب انفرنس انجن دستیاب ہو۔
  • استعمال کریں SHACL، سیمنٹک ویب لیئر کیک کی پرتوں کی فہرست کو طے کرنے کے بعد معیاری بنایا گیا ہے (تاہم، اسے قواعد کے انجن کے طور پر بھی استعمال کیا جا سکتا ہے)، یا شی ایکس.
  • یہ سمجھنا کہ سب کچھ بالآخر SPARQL سوالات کے ساتھ ہوتا ہے، ان کا استعمال کرتے ہوئے آپ کا اپنا سادہ ڈیٹا کی توثیق کا طریقہ کار بناتا ہے۔

تاہم، کٹوتی صلاحیتوں اور توثیق کے ٹولز کو مکمل طور پر مسترد کرنے سے بھی لنکڈ ڈیٹا اسٹیک کو ان کاموں میں مقابلے سے باہر کر دیا جاتا ہے جو زمین کی تزئین میں کھلے اور تقسیم شدہ ویب سے ملتے جلتے ہیں - ڈیٹا انضمام کے کاموں میں۔

ایک باقاعدہ انٹرپرائز انفارمیشن سسٹم کے بارے میں کیا خیال ہے؟

یہ ممکن ہے، لیکن آپ کو یقیناً اس بات سے آگاہ ہونا چاہیے کہ متعلقہ ٹیکنالوجیز کو کن مسائل کو حل کرنا پڑے گا۔ میں یہاں ترقی کے شرکاء کا ایک عام ردعمل بیان کروں گا تاکہ یہ ظاہر کیا جا سکے کہ یہ ٹیکنالوجی اسٹیک روایتی IT کے نقطہ نظر سے کیسا لگتا ہے۔ مجھے ہاتھی کی ایک چھوٹی سی تمثیل یاد دلاتا ہے:

  • کاروباری تجزیہ کار: RDF ایک براہ راست ذخیرہ شدہ منطقی ماڈل کی طرح ہے۔
  • نظام تجزیہ کار۔: RDF کی طرح ہے ای اے وی، صرف اشاریہ جات کے ایک گروپ اور ایک آسان استفسار کی زبان کے ساتھ۔
  • خالق: ٹھیک ہے، یہ سب امیر ماڈل اور لو کوڈ کے تصورات کی روح میں ہے، پڑھ رہا تھا حال ہی میں اس کے بارے میں.
  • پروجیکٹ مینیجر: ہاں یہ وہی ہے۔ اسٹیک کو گرانا!

پریکٹس سے پتہ چلتا ہے کہ اسٹیک کو اکثر ڈیٹا کی تقسیم اور متفاوت سے متعلق کاموں میں استعمال کیا جاتا ہے، مثال کے طور پر، MDM (ماسٹر ڈیٹا مینجمنٹ) یا DWH (ڈیٹا ویئر ہاؤس) کلاس سسٹمز کی تعمیر کے وقت۔ اس طرح کے مسائل کسی بھی صنعت میں موجود ہیں.

صنعت کے لیے مخصوص ایپلی کیشنز کے لحاظ سے، لنکڈ ڈیٹا ٹیکنالوجیز فی الحال درج ذیل صنعتوں میں سب سے زیادہ مقبول ہیں۔

  • بائیو میڈیکل ٹیکنالوجیز (جہاں ان کی مقبولیت ڈومین کی پیچیدگی سے متعلق معلوم ہوتی ہے)؛

موجودہ

"بوائلنگ پوائنٹ" نے حال ہی میں "نیشنل میڈیکل نالج بیس" ایسوسی ایشن کے زیر اہتمام ایک کانفرنس کی میزبانی کی۔اونٹولوجی کو یکجا کرنا۔ تھیوری سے عملی اطلاق تک'.

  • پیچیدہ مصنوعات کی پیداوار اور آپریشن (بڑی مکینیکل انجینئرنگ، تیل اور گیس کی پیداوار؛ اکثر ہم معیاری کے بارے میں بات کر رہے ہیں ISO 15926);

موجودہ

یہاں، بھی، وجہ موضوع کے علاقے کی پیچیدگی ہے، جب، مثال کے طور پر، اپ اسٹریم مرحلے پر، اگر ہم تیل اور گیس کی صنعت کے بارے میں بات کریں، سادہ اکاؤنٹنگ کے لیے کچھ CAD افعال کی ضرورت ہوتی ہے۔

2008 میں، شیورون کے زیر اہتمام ایک نمائندہ تنصیب کا پروگرام ہوا۔ کانفرنس.

آئی ایس او 15926، آخر میں، تیل اور گیس کی صنعت کے لیے قدرے بھاری لگ رہا تھا (اور مکینیکل انجینئرنگ میں شاید زیادہ استعمال پایا گیا)۔ صرف Statoil (Equinor) اس پر پوری طرح سے جکڑے ہوئے تھے؛ ناروے میں، ایک مکمل ماحولیاتی نظام. دوسرے اپنا کام کرنے کی کوشش کر رہے ہیں۔ مثال کے طور پر، افواہوں کے مطابق، توانائی کی گھریلو وزارت "ایندھن اور توانائی کے کمپلیکس کا تصوراتی اونٹولوجیکل ماڈل" بنانے کا ارادہ رکھتی ہے، بظاہر، الیکٹرک پاور انڈسٹری کے لیے بنایا گیا ہے۔.

  • مالیاتی تنظیمیں (یہاں تک کہ XBRL کو SDMX اور RDF ڈیٹا کیوب آنٹولوجی کا ایک قسم کا ہائبرڈ سمجھا جا سکتا ہے)؛

موجودہ

سال کے آغاز میں، LinkedIn نے مصنف کو فعال طور پر مالیاتی صنعت کے تقریباً تمام بڑے اداروں کی اسامیوں کے ساتھ اسپام کیا، جنہیں وہ سیریز "فورس میجیور" سے جانتا ہے: گولڈمین سیکس، جے پی مورگن چیس اور/یا مورگن اسٹینلے، ویلز فارگو، سوئفٹ /Visa/Mastercard, Bank of America, Citigroup, Fed, Deutsche Bank... شاید ہر کوئی کسی ایسے شخص کی تلاش میں تھا جسے وہ بھیج سکے۔ نالج گراف کانفرنس. کافی کچھ تلاش کرنے میں کامیاب ہوئے: مالیاتی تنظیموں نے سب کچھ لے لیا۔ پہلے دن کی صبح.

HeadHunter پر، صرف Sberbank نے کچھ دلچسپ دیکھا؛ یہ "RDF نما ڈیٹا ماڈل کے ساتھ EAV اسٹوریج" کے بارے میں تھا۔

غالباً، ملکی اور مغربی مالیاتی اداروں کی متعلقہ ٹکنالوجیوں سے محبت کی ڈگری میں فرق مؤخر الذکر کی سرگرمیوں کی بین الاقوامی نوعیت کی وجہ سے ہے۔ بظاہر، ریاستی سرحدوں کے پار انضمام کے لیے معیار کے لحاظ سے مختلف تنظیمی اور تکنیکی حل درکار ہوتے ہیں۔

  • تجارتی ایپلی کیشنز کے ساتھ سوال جواب کے نظام (IBM واٹسن، ایپل سری، گوگل نالج گراف)؛

موجودہ

ویسے، سری کے خالق، تھامس گروبر، اونٹولوجی (آئی ٹی کے معنوں میں) ایک "تصوراتی تصریح" کے طور پر بہت تعریف کے مصنف ہیں۔ میری رائے میں، اس تعریف میں الفاظ کو دوبارہ ترتیب دینے سے اس کے معنی نہیں بدلتے، جو شاید اس بات کی نشاندہی کرتا ہے کہ یہ وہاں نہیں ہے۔

  • سٹرکچرڈ ڈیٹا کی اشاعت (زیادہ جواز کے ساتھ اسے لنکڈ اوپن ڈیٹا سے منسوب کیا جا سکتا ہے)۔

موجودہ

لنکڈ ڈیٹا کے بڑے پرستار نام نہاد GLAM ہیں: گیلریاں، لائبریریاں، آرکائیوز، اور عجائب گھر۔ یہ کہنا کافی ہے کہ لائبریری آف کانگریس MARC21 کے متبادل کو فروغ دے رہی ہے۔ BIBFRAMEکون سا کتابیات کی تفصیل کے مستقبل کے لیے ایک بنیاد فراہم کرتا ہے۔ اور، یقیناً، RDF پر مبنی۔

ویکیڈیٹا کو اکثر لنکڈ اوپن ڈیٹا کے میدان میں ایک کامیاب پروجیکٹ کی مثال کے طور پر پیش کیا جاتا ہے - ویکیپیڈیا کا ایک قسم کا مشین پڑھنے کے قابل ورژن، جس کا مواد، ڈی بی پیڈیا کے برعکس، آرٹیکل انفو باکسز سے درآمد کرکے نہیں بنایا جاتا، بلکہ کم و بیش دستی طور پر بنایا گیا (اور بعد میں انہی انفو باکسز کے لیے معلومات کا ذریعہ بن جاتا ہے)۔

ہم یہ بھی مشورہ دیتے ہیں کہ آپ اسے چیک کریں۔ فہرست Stardog کی ویب سائٹ پر Stardog RDF اسٹوریج کے صارفین "کسٹمرز" سیکشن میں۔

جیسا کہ یہ ہو سکتا ہے، گارٹنر میں ہائپ سائیکل برائے ابھرتی ہوئی ٹیکنالوجیز 2016 "انٹرپرائز ٹیکسونومی اینڈ آنٹولوجی مینجمنٹ" کو مایوسی کی وادی میں نزول کے درمیان میں رکھا گیا ہے جس میں 10 سال سے پہلے "پیداواری سطح مرتفع" تک پہنچنے کے امکانات ہیں۔

انٹرپرائز ڈیٹا کو جوڑ رہا ہے۔

پیشین گوئیاں، پیشین گوئیاں، پیشین گوئیاں...

تاریخی دلچسپی کے پیش نظر، میں نے ذیل میں گارٹنر کی پیشین گوئیوں کو مختلف سالوں کے لیے ان ٹیکنالوجیز پر ٹیبل کیا ہے جو ہماری دلچسپی رکھتی ہیں۔

سال Технология رپورٹ کریں۔ پوزیشن سطح مرتفع تک سال
2001 سیمنٹیکل ویب ابھرتی ہوئی ٹیکنالوجیز۔ انوویشن ٹرگر 5-10
2006 کارپوریٹ سیمنٹک ویب ابھرتی ہوئی ٹیکنالوجیز۔ انفلیٹڈ توقعات کی چوٹی 5-10
2012 سیمنٹیکل ویب بگ ڈیٹا انفلیٹڈ توقعات کی چوٹی > 10
2015 منسلک ڈیٹا اعلی درجے کی تجزیات اور ڈیٹا سائنس مایوسی کی گرت 5-10
2016 انٹرپرائز آنٹولوجی مینجمنٹ ابھرتی ہوئی ٹیکنالوجیز۔ مایوسی کی گرت > 10
2018 علم گراف ابھرتی ہوئی ٹیکنالوجیز۔ انوویشن ٹرگر 5-10

تاہم، پہلے سے ہی "ہائپ سائیکل..." 2018 ایک اور اوپر کا رجحان ظاہر ہوا ہے - نالج گرافس۔ ایک خاص تناسخ رونما ہوا: گراف DBMSs، جس کی طرف صارفین کی توجہ اور ڈویلپرز کی کوششوں کو تبدیل کیا گیا، سابقہ ​​درخواستوں اور بعد کی عادات کے زیر اثر، شکلوں اور پوزیشننگ کو اپنانا شروع کر دیا۔ ان کے پیشرو حریفوں کا۔

تقریباً ہر گراف ڈی بی ایم ایس اب خود کو کارپوریٹ "نالج گراف" بنانے کے لیے ایک موزوں پلیٹ فارم قرار دیتا ہے ("منسلک ڈیٹا" کو بعض اوقات "کنیکٹڈ ڈیٹا" سے بدل دیا جاتا ہے)، لیکن ایسے دعوے کتنے جائز ہیں؟

گراف ڈیٹا بیس اب بھی اسیمانٹک ہیں؛ گراف DBMS میں ڈیٹا اب بھی وہی ڈیٹا سائلو ہے۔ URIs کے بجائے سٹرنگ شناخت کنندگان دو گراف DBMSs کو ضم کرنے کے کام کو اب بھی ایک انضمام کا کام بناتے ہیں، جبکہ دو RDF اسٹورز کو انضمام کرنے سے اکثر صرف دو RDF گراف کو ملایا جاتا ہے۔ اسمینٹیسٹی کا ایک اور پہلو ایل پی جی گراف ماڈل کی غیر اضطراری صلاحیت ہے، جس کی وجہ سے ایک ہی پلیٹ فارم کا استعمال کرتے ہوئے میٹا ڈیٹا کا انتظام کرنا مشکل ہو جاتا ہے۔

آخر میں، گراف DBMSs میں انفرنس انجن یا رول انجن نہیں ہوتے ہیں۔ ایسے انجنوں کے نتائج پیچیدہ سوالات کے ذریعے دوبارہ تیار کیے جاسکتے ہیں، لیکن یہ ایس کیو ایل میں بھی ممکن ہے۔

تاہم، معروف RDF اسٹوریج سسٹمز کو LPG ماڈل کی حمایت کرنے میں کوئی دشواری نہیں ہے۔ بلیز گراف میں ایک وقت میں تجویز کردہ سب سے ٹھوس نقطہ نظر کو سمجھا جاتا ہے: RDF* ماڈل، RDF اور LPG کو ملا کر۔

مزید

آپ ایل پی جی ماڈل کے لیے RDF اسٹوریج سپورٹ کے بارے میں مزید پڑھ سکتے ہیں Habré پر پچھلے مضمون میں: "آر ڈی ایف اسٹوریج کے ساتھ اب کیا ہو رہا ہے". مجھے امید ہے کہ ایک دن نالج گرافس اور ڈیٹا فیبرک کے بارے میں ایک الگ مضمون لکھا جائے گا۔ حتمی سیکشن، جیسا کہ سمجھنا آسان ہے، جلدی میں لکھا گیا تھا، تاہم، چھ ماہ بعد بھی، ان تصورات کے ساتھ سب کچھ زیادہ واضح نہیں ہے۔

ادب

  1. ہالپین، ایچ، مونن، اے (ایڈز) (2014)۔ فلسفیانہ انجینئرنگ: ویب کے فلسفے کی طرف
  2. Allemang, D., Hendler, J. (2011) کام کرنے والے آنٹولوجسٹ کے لیے Semantic Web (2nd ed.)
  3. Staab, S., Studer, R. (eds.) (2009) ontologies پر ہینڈ بک (2nd ed.)
  4. ووڈ، ڈی (ایڈی)۔ (2011) انٹرپرائز ڈیٹا کو لنک کرنا
  5. Keet, M. (2018) آنٹولوجی انجینئرنگ کا ایک تعارف

ماخذ: www.habr.com

نیا تبصرہ شامل کریں