سیمالټ ویب او لینک شوي ډاټا. اصالحات او اضافه کول

زه غواړم د دې تازه چاپ شوي کتاب یوه برخه خلکو ته وړاندې کړم:

د یوې تصدۍ اونټولوژیکي ماډلینګ: میتودونه او ټیکنالوژي [متن]: مونوګراف / [S. V. Gorshkov، S. S. Kralin، O. I. Mushtak او نور؛ اجرایوي مدیر S.V. Gorshkov]. - ایکاترینبورګ: د یورال پوهنتون خپرندویه کور، 2019. - 234 مخ: ناروغ، میز؛ 20 سانتي متره - لیکوال. په شاتنۍ برخه کې اشاره شوې. سره. – کتابتون د ch په پای کې. — ISBN 978-5-7996-2580-1: 200 کاپي.

په هابري کې د دې برخې د پوسټ کولو هدف څلور چنده دی:

  • دا ناشونې ده چې څوک به دا کتاب په خپل لاس کې ونیسي که چیرې هغه د محترم مراجعین نه وي SergeIndex; دا یقینا په پلور کې ندي.
  • په متن کې اصالحات شوي دي (دوی لاندې نه په ګوته شوي) او اضافې شوي چې د چاپ شوي مونوګراف فارمیټ سره خورا مطابقت نلري: موضوعي یادښتونه (د سپیلر لاندې) او هایپر لینکس.
  • زه غواړم پوښتنې او نظرونه راټول کړئ, د دې لپاره چې دوی په پام کې ونیول شي کله چې دا متن په نورو خپرونو کې په بیاکتنې بڼه کې شامل شي.
  • ډیری سیمانټیک ویب او لینک شوي ډیټا پیروان لاهم پدې باور دي چې د دوی حلقه خورا تنګ ده ، په ځانګړي توګه ځکه چې عام خلک لاهم په سمه توګه ندي تشریح شوي چې د سیمانټیک ویب او لینک شوي ډیټا پیروان څومره عالي دی. د ټوټې لیکوال، که څه هم هغه د دې حلقې سره تړاو لري، دا نظر نه لري، مګر، بیا هم، ځان مکلف ګڼي چې بله هڅه وکړي.

او همداسې،

سیمیکټین ویب

د انټرنیټ تکامل په لاندې ډول ښودل کیدی شي (یا د هغې برخې په اړه خبرې وکړئ چې په لاندې ترتیب کې رامینځته شوي):

  1. په انټرنیټ کې اسناد. کلیدي ټیکنالوژي - ګوفر، FTP، او نور.
    انټرنیټ د سیمه ایزو سرچینو د تبادلې لپاره یوه نړیواله شبکه ده.
  2. د انټرنیټ اسناد. کلیدي ټیکنالوژي HTML او HTTP دي.
    د افشا شوي سرچینو طبیعت د دوی د لیږد وسیلې ځانګړتیاوې په پام کې نیسي.
  3. د انټرنیټ ډاټا. کلیدي ټیکنالوژي - REST او SOAP API، XHR، او نور.
    د انټرنیټ غوښتنلیکونو دوره، نه یوازې خلک د سرچینو مصرف کونکي کیږي.
  4. د انټرنیټ ډاټا. کلیدي ټیکنالوژي د لینک شوي ډیټا ټیکنالوژي دي.
    دا څلورمه مرحله، د برنرز لی لخوا وړاندوینه شوې، د دویم اصلي ټیکنالوژیو جوړونکي او د W3C رییس، د سیمانټیک ویب په نوم یادیږي؛ د لینک شوي ډیټا ټیکنالوژۍ ډیزاین شوي ترڅو په ویب کې ډیټا نه یوازې د ماشین لوستلو وړ وي ، بلکه "ماشین د پوهیدو وړ" هم وي.

له دې څخه، لوستونکی به د دویمې او څلورمې مرحلې د کلیدي مفاهیمو ترمنځ د اړیکو په اړه پوه شي:

  • URLs د URIs سره ورته دي،
  • د HTML انلاګ RDF دی،
  • د HTML هایپر لینکونه د RDF اسنادو کې د URI پیښو سره ورته دي.

سیمنټیک ویب د یو ځانګړي ناڅاپي یا لابی شوي رجحان په پرتله د انټرنیټ راتلونکي سیسټمیک لید ډیر دی ، که څه هم دا کولی شي دا وروستی په پام کې ونیسي. د مثال په توګه، د ویب 2.0 په نوم د هغه څه مهم ځانګړتیا د "کاروونکي لخوا تولید شوي منځپانګې" ګڼل کیږي. په ځانګړې توګه، د W3C سپارښتنې غوښتنه کیږي چې دا په پام کې ونیسي "د ویب تشریح اونټولوژي"او داسې یو تړون لکه د جامدو.

ایا سیمانټیک ویب مړ شوی؟

که تاسو انکار کوئ غیر واقعي توقعات، د سیمانټیک ویب سره وضعیت نږدې د پرمختللي سوسیالیزم په وخت کې د کمونیزم سره ورته دی (او ایا د ایلیچ مشروط غوښتنو ته وفاداري لیدل کیږي ، اجازه راکړئ هرڅوک پخپله پریکړه وکړي). ماشینونه ولټوه په بریالیتوب سره ویب سایټونه مجبوروي چې RDFa او JSON-LD وکاروي او پخپله د لاندې تشریح شوي ټیکنالوژیو څخه کار واخلي (د ګوګل د پوهې ګراف، د Bing پوهې ګراف).

په عموم کې، لیکوال نشي ویلای چې څه شی د لوی خپریدو مخه نیسي، مګر هغه کولی شي د شخصي تجربې پراساس خبرې وکړي. داسې ستونزې شتون لري چې د SW برید په شرایطو کې "د بکس څخه بهر" حل کیدی شي، که څه هم دوی خورا پراخه ندي. د پایلې په توګه، هغه کسان چې د دې کارونو سره مخ دي د هغو کسانو په وړاندې د جبر کولو وسیله نه لري چې د حل کولو توان لري، په داسې حال کې چې د حل لپاره وروستی خپلواک چمتو کول د دوی د سوداګرۍ ماډلونو سره مخالفت کوي. نو موږ د HTML پارس کولو ته دوام ورکوو او مختلف APIs سره یوځای کوو، یو بل شیټیر.

په هرصورت، د لینک شوي ډاټا ټیکنالوژي د اصلي ویب پاڼې څخه بهر خپره شوې ده؛ کتاب، په حقیقت کې، دې غوښتنلیکونو ته وقف شوی دی. اوس مهال، د لینک شوي ډیټا ټولنه تمه لري چې دا ټیکنالوژي به نوره هم پراخه شي د ګارټینر ثبت کولو (یا اعلان ، لکه څنګه چې تاسو غواړئ) د رجحاناتو لکه د پوهې ګرافونه и د معلوماتو پارچه. زه غواړم باور ولرم چې دا به د دې مفاهیمو "بایسکل" پلي کول نه وي چې بریالي به وي ، مګر د W3C معیارونو پورې اړوند چې لاندې بحث شوي.

لینک شوي ډاټا

برنرز-لي د لینک شوي ډاټا د سیمانټیک ویب "سمه شوي" په توګه تعریف کړه: د تګلارو او ټیکنالوژیو یوه مجموعه چې دا اجازه ورکوي خپل وروستي اهداف ترلاسه کړي. د لینک شوي ډیټا بنسټیز اصول برنر لی روښانه شوی لاندې.

اصول 1. د ادارو نومولو لپاره د URIs کارول.

URIs د نړیوال وجود پیژندونکي دي لکه څنګه چې د ننوتلو لپاره د محلي تار پیژندونکو سره مخالف دي. وروسته، دا اصول د ګوګل د پوهې ګراف شعار کې په غوره توګه څرګند شو "شیان، نه تارونه".

اصول 2. د HTTP سکیم کې د URIs کارول ترڅو دوی ته حواله شي.

د URI په حواله کولو سره، دا باید ممکنه وي چې د دې سیګنیفیر شاته لاسلیک ترلاسه کړئ (د آپریټر نوم سره مشابهت "دلته روښانه دی).*په C) کې؛ په دقیق ډول، د دې نښه شوي ځینې نمایش ترلاسه کولو لپاره - د HTTP سرلیک ارزښت پورې اړه لري Accept:. شاید، د AR/VR دورې په راتګ سره، دا به ممکنه وي چې سرچینې پخپله ترلاسه کړي، مګر د اوس لپاره، ډیری احتمال، دا به د RDF سند وي، کوم چې د SPARQL پوښتنې اجرا کولو پایله ده. DESCRIBE.

اصول 3. د W3C معیارونو کارول - په ابتدايي توګه RDF(S) او SPARQL - په ځانګړې توګه کله چې د URIs حواله کول.

د لینک شوي ډیټا ټیکنالوژۍ سټیک دا انفرادي "پرتونه" چې په نوم هم پیژندل کیږي د سیمانټیک ویب پرت کیک، لاندې به تشریح شي.

اصول 4. نورو URIs ته د حوالې کارول کله چې د ادارو تشریح کول.

RDF تاسو ته اجازه درکوي چې خپل ځان په طبیعي ژبه کې د یوې سرچینې لفظي توضیحاتو پورې محدود کړئ، او څلورم اصل د دې کولو غوښتنه نه کوي. که لومړی اصول په نړیواله کچه مشاهده شي، دا ممکنه ده کله چې د سرچینې تشریح کول نورو ته راجع کیږي، په شمول د "بهرنیو" په شمول، له همدې امله ډاټا ته لینک ویل کیږي. په حقیقت کې، دا د RDFS لغتونو کې نومول شوي URIs کارول تقریبا ناگزیر دي.

R.F.D.

R.F.D. (د منابعو تشریح چوکاټ) د یو بل سره تړلو ادارو تشریح کولو لپاره یو رسمیزم دی.

د "موضوع - وړاندوینې - څیز" ډوله بیانات چې د درېیو په نوم یادیږي، د ادارو او د دوی اړیکو په اړه جوړ شوي. په ساده حالت کې، موضوع، وړاندیز، او اعتراض ټول URIs دي. ورته URI کیدای شي په بیلابیلو دریو برخو کې په مختلفو پوستونو کې وي: یو موضوع، یو وړاندیز، او یو اعتراض؛ په دې توګه، درې ګونی یو ډول ګراف جوړوي چې د RDF ګراف په نوم یادیږي.

مضامین او توکي نه یوازې URIs کیدی شي ، بلکه ورته ویل کیږي خالي نوډونه، او توکي هم کیدی شي لغوي. لغوي د ابتدايي ډولونو مثالونه دي چې د تار نمایندګي او د ډول نښې لري.

د لغوي لیکلو مثالونه (د تورټل ترکیب کې، د دې په اړه نور لاندې): "5.0"^^xsd:float и "five"^^xsd:string. د ډول سره لغوي rdf:langString د ژبې ټګ سره هم سمبال کیدی شي؛ په کچو کې دا داسې لیکل کیږي: "five"@en и "пять"@ru.

خالي نوډونه "بې نومه" سرچینې دي پرته له نړیوال پیژندونکي، چې په اړه یې بیانونه کیدی شي؛ د موجود متغیرونو ډول.

نو (دا په حقیقت کې د RDF ټوله ټکی دی):

  • موضوع یو URI یا یو خالي نوډ دی،
  • وړاندوینه یو URI دی،
  • اعتراض یو URI، یو خالي نوډ، یا لفظي دی.

ولې وړاندوینې خالي نوډونه نشي کیدی؟

احتمالي دلیل دا دی چې په غیر رسمي ډول د لومړي ترتیب وړاندیز منطق په ژبه کې د درې اړخیز پوهیدو او ژباړلو هیله ده. s p o د یو څه په څیر سیمالټ ویب او لینک شوي ډاټا. اصالحات او اضافه کولچیرته سیمالټ ویب او لینک شوي ډاټا. اصالحات او اضافه کول - وړاندوینه سیمالټ ویب او لینک شوي ډاټا. اصالحات او اضافه کول и سیمالټ ویب او لینک شوي ډاټا. اصالحات او اضافه کول - ثابت. د دې تفاهم نښې په سند کې دي "LBase: د سیمانټیک ویب ژبو لپاره سیمانټیک"، کوم چې د W3C کاري ګروپ یادښت حالت لري. د دې پوهیدو سره، درې اړخیزه s p []چیرته [] - خالي نوډ، به په توګه ژباړل شي سیمالټ ویب او لینک شوي ډاټا. اصالحات او اضافه کولچیرته سیمالټ ویب او لینک شوي ډاټا. اصالحات او اضافه کول - متغیر، مګر بیا څنګه ژباړئ s [] o؟ د W3C سپارښتنې حالت سره سند "RDF 1.1 سیمانټیک" د ژباړې بله طریقه وړاندې کوي، مګر بیا هم د تشو نوډونو د وړاندوینې احتمال په پام کې نه نیسي.

په هرصورت، مانو سپورني اجازه.

RDF یو خلاص ماډل دی. RDF په مختلفو ترکیبونو کې لیکل کیدی شي (سیریل شوی): RDF/XML, کچی (ډیری انسان د لوستلو وړ) JSON-LD, HDT (بائنری).

ورته RDF په مختلفو لارو RDF/XML کې سریالیز کیدی شي، نو د بیلګې په توګه، دا هیڅ معنی نلري چې د XSD په کارولو سره د پایلې XML تایید کړي یا د XPath په کارولو سره د معلوماتو استخراج هڅه وکړي. په ورته ډول، د JSON-LD امکان نلري چې د جاواسکریپټ د ډاټ او مربع بریکٹ نوټیشن په کارولو سره د RDF سره کار کولو لپاره د اوسط جاواسکریپټ پراختیا کونکي لیوالتیا پوره کړي (که څه هم JSON-LD د میکانیزم وړاندیز کولو سره پدې لور حرکت کوي چوکاټ کول).

ډیری ترکیبونه د اوږدې URIs لنډولو لارې وړاندیز کوي. د مثال په توګه، یو اعلان @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> په Turtle کې به بیا تاسو ته اجازه درکړي چې پرځای یې ولیکئ <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> یوازې rdf:type.

RDFS

RDFS (RDF سکیما) - د ماډلینګ بنسټیز لغت، د ملکیت او ټولګي مفکورې معرفي کوي او ملکیتونه لکه rdf:type, rdfs:subClassOf, rdfs:domain и rdfs:range. د RDFS لغت په کارولو سره، د بیلګې په توګه، لاندې معتبر څرګندونې لیکل کیدی شي:

rdf:type         rdf:type         rdf:Property .
rdf:Property     rdf:type         rdfs:Class .
rdfs:Class       rdfs:subClassOf  rdfs:Resource .
rdfs:subClassOf  rdfs:domain      rdfs:Class .
rdfs:domain      rdfs:domain      rdf:Property .
rdfs:domain      rdfs:range       rdfs:Class .
rdfs:label       rdfs:range       rdfs:Literal .

RDFS د توضیحاتو او ماډلینګ لغت دی، مګر یوه محدوده ژبه نه ده (که څه هم رسمي مشخصات او پاڼي د دې ډول کارونې امکان). د "سکیما" کلمه باید په ورته معنی ونه پوه شي لکه څنګه چې د "XML سکیما" په بیان کې. د مثال په ډول، :author rdfs:range foaf:Person پدې معنی چې rdf:type د ملکیت ټول ارزښتونه :author - foaf:Person، مګر پدې معنی ندي چې دا باید دمخه وویل شي.

SPARQL

SPARQL (SPARQL پروتوکول او RDF پوښتنې ژبه) - د RDF ډیټا پوښتنو لپاره یوه ژبه. په یوه ساده قضیه کې، د SPARQL پوښتنه د نمونو یوه مجموعه ده چې په مقابل کې د ګراف درې ګوني سره سمون لري. نمونې کولی شي د موضوع، وړاندوینې، او اعتراض پوستونو کې متغیرات ولري.

پوښتنه به داسې متغیر ارزښتونه بیرته راوباسي چې کله په نمونو کې ځای په ځای شي، د پوښتل شوي RDF ګراف د فرعي ګراف پایله کیدی شي (د هغې د درې ګونو فرعي سیټ). د ورته نوم متغیرونه د درې اړخیزو نمونو په مختلفو نمونو کې باید ورته ارزښت ولري.

د مثال په توګه، د اوو RDFS محورونو پورته سیټ ته په پام سره، لاندې پوښتنه به بیرته راشي rdfs:domain и rdfs:range د ارزښتونو په توګه ?s и ?p په ترتیب سره:

SELECT * WHERE {
 ?s ?p rdfs:Class .
 ?p ?p rdf:Property .
}

د یادولو وړ ده چې SPARQL بیانونکی دی او د ګراف ټراورسل تشریح کولو لپاره ژبه نه ده (په هرصورت، ځینې RDF ذخیره د پوښتنو اجرا کولو پلان تنظیم کولو لپاره لارې وړاندې کوي). له همدې امله، د معیاري ګراف ځینې ستونزې، د بیلګې په توګه، د لنډې لارې موندل، په SPARQL کې نشي حل کیدی، په شمول د کارولو په شمول. د ملکیت لارې (مګر، بیا، د انفرادي RDF ذخیره د دې ستونزو د حل لپاره ځانګړي توسیع وړاندیز کوي).

SPARQL د نړۍ د خلاصون انګیرنه نه شریکوي او "د ناکامۍ په توګه منفي" چلند تعقیبوي، په کوم کې چې ممکنه ډیزاینونه لکه FILTER NOT EXISTS {…}. د معلوماتو ویش د میکانیزم په کارولو سره په پام کې نیول کیږي فدراسیون پوښتنې.

د SPARQL لاسرسي نقطه - د RDF ذخیره چې د SPARQL پوښتنو پروسس کولو وړتیا لري - د دویمې مرحلې څخه مستقیم انلاګونه نلري (د دې پراګراف پیل وګورئ). دا د ډیټابیس سره پرتله کیدی شي، د مینځپانګې پراساس چې HTML پاڼې رامینځته شوي ، مګر بهر ته د لاسرسي وړ دي. د SPARQL لاسرسي نقطه د دریمې مرحلې څخه د API لاسرسي نقطې سره ډیر ورته دی ، مګر د دوه اصلي توپیرونو سره. لومړی، دا ممکنه ده چې ډیری "اتومي" پوښتنې په یو کې سره یوځای کړئ (کوم چې د ګراف کیو ایل کلیدي ځانګړتیا ګڼل کیږي)، او دویم، دا ډول API په بشپړ ډول پخپله مستند دی (کوم چې HATEOAS هڅه کړې چې ترلاسه کړي).

سیاسي تبصره

RDF په ویب کې د معلوماتو خپرولو یوه لاره ده، نو د RDF ذخیره باید د DBMS سند په توګه وګڼل شي. ریښتیا، ځکه چې RDF یو ګراف دی او نه ونې، دوی هم د ګراف پر بنسټ وګرځیدل. دا حیرانتیا ده چې دا په بشپړ ډول کار وکړ. چا به فکر کاوه چې هوښیار خلک به وي چې خالي نوډونه پلي کړي. کوډ دلته دی دا کار ونه کړ.

د RDF معلوماتو ته د لاسرسي تنظیم کولو لپاره لږې بشپړې لارې هم شتون لري، د بیلګې په توګه، تړل شوي ډاټا ټوټې (LDF) او لینک شوي ډیټا پلیټ فارم (LDP).

OWL

OWL (د ویب اونټولوژي ژبه) - د پوهې نمایندګۍ لپاره یو رسمیزم، د تشریح منطق یوه نحوي نسخه سیمالټ ویب او لینک شوي ډاټا. اصالحات او اضافه کول (په هر ځای کې لاندې د OWL 2 ویل ډیر سم دي، د OWL لومړۍ نسخه پر بنسټ ولاړه وه سیمالټ ویب او لینک شوي ډاټا. اصالحات او اضافه کول).

په OWL کې د تشریحي منطق مفهوم د ټولګیو سره مطابقت لري، رولونه د ملکیتونو سره مطابقت لري، افراد خپل پخوانی نوم ساتي. محورونه هم محورونه بلل کیږي.

د مثال په توګه، په تش په نامه د مانچسټر ترکیب د OWL نوټیشن لپاره یو محور دمخه موږ ته پیژندل شوی سیمالټ ویب او لینک شوي ډاټا. اصالحات او اضافه کول داسې لیکل کیږي:

Class: Human
Class: Parent
   EquivalentClass: Human and (inverse hasParent) some Human
ObjectProperty: hasParent

د OWL لیکلو لپاره نور ترکیبونه شتون لري، لکه فعلي نحوپه رسمي توضیحاتو کې کارول کیږي، او OWL/XML. برسیره پردې، OWL کیدای شي سیریل شي د RDF ترکیب خلاصول او نور - په کوم ځانګړي ترکیب کې.

OWL د RDF سره دوه اړخیزه اړیکه لري. له یوې خوا، دا د یو ډول لغت په توګه ګڼل کیدی شي چې RDFS پراخوي. له بلې خوا، دا یو ډیر پیاوړی رسمیزم دی چې د هغې لپاره RDF یوازې د سریال کولو بڼه ده. د OWL ټول ابتدايي جوړښتونه د یو واحد RDF درې ګونی په کارولو سره لیکل کیدی نشي.

د دې پورې اړه لري چې د OWL ساختمانونو کوم فرعي سیټ کارولو ته اجازه ورکړل شوې ، دوی د تش په نوم خبرې کوي د OWL پروفایلونه. معیاري او خورا مشهور دي OWL EL، OWL RL او OWL QL. د پروفایل انتخاب د عادي ستونزو کمپیوټري پیچلتیا اغیزه کوي. د OWL ساختمانونو بشپړ سیټ ورته ورته دی سیمالټ ویب او لینک شوي ډاټا. اصالحات او اضافه کولد OWL DL په نوم یادیږي. ځینې ​​​​وختونه دوی د OWL بشپړ په اړه هم خبرې کوي، په کوم کې چې د OWL ساختمانونو ته اجازه ورکول کیږي چې په RDF کې د بشپړې ازادۍ سره وکارول شي، پرته له سیمانټیک او کمپیوټري محدودیتونو. سیمالټ ویب او لینک شوي ډاټا. اصالحات او اضافه کول. د مثال په توګه، یو څه کیدای شي دواړه ټولګي او ملکیت وي. OWL بشپړ د پریکړې وړ نه دی.

په OWL کې د پایلو ضمیمه کولو کلیدي اصول د خلاصې نړۍ انګیرنې منل دي. اووا) او د ځانګړو نومونو د انګیرنې رد کول (د ځانګړي نوم انګیرنه، ONE). لاندې به موږ وګورو چې دا اصول چیرته رهبري کولی شي او ځینې OWL جوړښتونه معرفي کوي.

اجازه راکړئ چې آنتولوژي لاندې ټوټه ولري (د مانچسټر ترکیب کې):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human
   Facts: hasChild Alice, hasChild Bob, hasChild Carol

ایا دا به د هغه څه څخه تعقیب شي چې ویل شوي چې جان ډیری ماشومان لري؟ د UNA رد کول به د انفرنس انجن مجبور کړي چې دې پوښتنې ته په منفي ځواب ورکړي، ځکه چې الیس او باب ممکن یو شان وي. د دې لپاره چې لاندې ترسره شي، اړینه ده چې لاندې محور اضافه کړئ:

DifferentIndividuals: Alice, Bob, Carol, John

اجازه راکړئ چې اوس د اونټولوژي ټوټه لاندې بڼه ولري (جان اعلان شوی چې ډیری ماشومان لري، مګر هغه یوازې دوه ماشومان لري):

Class: manyChildren
   EquivalentTo: Human that hasChild min 3
Individual: John
   Types: Human, manyChildren
   Facts: hasChild Alice, hasChild Bob
DifferentIndividuals: Alice, Bob, Carol, John

ایا دا اونټولوژي به متضاد وي (کوم چې د غلط معلوماتو د ثبوت په توګه تشریح کیدی شي)؟ د OWA منل به د دې لامل شي چې د انټرنېټ انجن منفي ځواب ورکړي: "یو ځای" (په بل انټولوژي کې) دا به ښه وویل شي چې کارول هم د جان ماشوم دی.

د دې احتمال د ردولو لپاره، راځئ چې د جان په اړه یو نوی حقیقت اضافه کړو:

Individual: John
   Facts: hasChild Alice, hasChild Bob, not hasChild Carol

د نورو ماشومانو ظاهري خارجولو لپاره، راځئ چې ووایو چې د ملکیت ټول ارزښتونه "د ماشوم درلودل" خلک دي، چې موږ یې یوازې څلور لرو:

ObjectProperty: hasChild
   Domain: Human
   Сharacteristics: Irreflexive
Class: Human
EquivalentTo: { Alice, Bill, Carol, John }

اوس اونټولوژي به متضاد شي، کوم چې د انټرنېټ انجن به راپور ورکولو کې پاتې راشي. د وروستي محورونو سره چې موږ لرو، په یوه معنی، نړۍ "تړلې" ده، او وګورئ چې څنګه د جان د خپل ماشوم احتمال له مینځه وړل شوی.

د تصدۍ ډیټا لینک کول

د روابطو او ټیکنالوژیو لینک شوي ډیټا سیټ په اصل کې په ویب کې د معلوماتو خپرولو لپاره و. په داخلي کارپوریټ چاپیریال کې د دوی کارول د یو شمیر ستونزو سره مخ دي.

د مثال په توګه، په تړل شوي کارپوریټ چاپیریال کې، د OWA د منلو او د UNA رد کولو پر بنسټ د OWL د مجرايي ځواک، د ویب د پرانیستې او توزیع شوي طبیعت له امله پریکړې خورا کمزورې دي. او دلته لاندې حلونه ممکن دي.

  • د سیمانټیک سره د OWL ملاتړ کول، د OWA پریښودل او د UNA منل، د ورته محصول انجن پلي کول. - د دې لارې په اوږدو کې روان دی د سټارډوګ RDF ذخیره.
  • د حاکم انجنونو په ګټه د OWL د مجرايي وړتیاو پریښودل. - سټارډوګ ملاتړ کوي SWRL; جینا او ګراف ډی بی وړاندیز کوي خپل ژبې قواعد
  • د OWL د مجرايي وړتیاوو څخه انکار، د ماډلینګ لپاره RDFS ته نږدې د یو یا بل سبسیټ کارول. - په دې اړه نور معلومات لاندې وګورئ.

بله مسله هغه لوی تمرکز دی چې کارپوریټ نړۍ ممکن د ډیټا کیفیت مسلو او د لینک شوي ډیټا سټیک کې د ډیټا تصدیق کولو وسیلو نشتوالی ولري. دلته پایلې په لاندې ډول دي.

  • یوځل بیا، د تړل شوي نړۍ سیمانټیکونو او ځانګړو نومونو سره د OWL ساختمانونو د اعتبار لپاره وکاروئ که چیرې یو مناسب انفرنس انجن شتون ولري.
  • کارول SHACL، د سیمانټیک ویب پرت کیک پرتونو لیست وروسته معیاري شوی (په هرصورت ، دا د قواعدو انجن په توګه هم کارول کیدی شي) ، یا شیکس.
  • پدې پوهیدل چې هرڅه په نهایت کې د SPARQL پوښتنو سره ترسره کیږي ، د دوی په کارولو سره خپل ساده ډیټا تایید میکانیزم رامینځته کړئ.

په هرصورت، حتی د مجرايي وړتیاوو او تایید کولو وسیلو بشپړ رد کول د لینک شوي ډیټا سټیک په دندو کې د سیالۍ څخه بهر پریږدي چې د خلاص او توزیع شوي ویب سره ورته وي - د ډیټا ادغام کارونو کې.

د منظم تصدۍ معلوماتو سیسټم په اړه څه؟

دا ممکنه ده، مګر تاسو باید په سمه توګه پوه شئ چې اړونده ټیکنالوژي به کومې ستونزې حل کړي. زه به دلته د پراختیایی برخه اخیستونکو یو عادي عکس العمل تشریح کړم ترڅو وښیې چې دا ټیکنالوژي سټیک د دودیز IT له لید څخه څه ښکاري. د هاتین د مثال لږ څه را په یاد کړم:

  • د سوداګرۍ شنونکی: RDF یو څه دی لکه مستقیم ذخیره شوي منطقي ماډل.
  • د سیسټم تحلیل کونکی: RDF داسې دی EAV، یوازې د یو لړ شاخصونو او د مناسبې پوښتنې ژبې سره.
  • د پراختیا: ښه، دا ټول د بډایه ماډل او ټیټ کوډ مفکورې په روح کې دي، لوستل یې په دې وروستیو کې په دې اړه.
  • پروژې سمبالګر: هو همداسی ده ډډ ماتول!

تمرین ښیي چې سټیک ډیری وختونه د ډیټا ویشلو او توپیر پورې اړوند دندو کې کارول کیږي ، د مثال په توګه ، کله چې د MDM (ماسټر ډیټا مدیریت) یا DWH (د ډیټا ګدام) ټولګي سیسټمونه رامینځته کول. دا ډول ستونزې په هر صنعت کې شتون لري.

د صنعت ځانګړي غوښتنلیکونو شرایطو کې، د لینک شوي ډاټا ټیکنالوژي اوس مهال په لاندې صنعتونو کې خورا مشهور دي.

  • بایومیډیکل ټیکنالوژي (چیرې چې د دوی شهرت د ډومین پیچلتیا پورې تړاو لري)؛

اوسنی

د "بویلنګ پوائنټ" په دې وروستیو کې د "ملي طبي پوهې بنسټ" ټولنې لخوا تنظیم شوي کنفرانس کوربه و.د انټولوژیو سره یوځای کول. له تیوري څخه تر عملي تطبیق پورې".

  • د پیچلو محصولاتو تولید او عملیات (لوی میخانیکي انجینري، د تیلو او ګاز تولید؛ ډیری وختونه موږ د معیاري په اړه خبرې کوو د ISO 15926);

اوسنی

دلته هم دلیل د موضوع د ساحې پیچلتیا ده، کله چې، د بیلګې په توګه، په پورته مرحله کې، که موږ د تیلو او ګاز صنعت په اړه وغږیږو، ساده محاسبه د CAD دندو ته اړتیا لري.

په 2008 کې، د نمایندګۍ نصبولو پیښه، د شیورون لخوا تنظیم شوې وه کنفرانس.

ISO 15926، په پای کې، د تیلو او ګاز صنعت ته یو څه دروند ښکاري (او شاید په میخانیکي انجینرۍ کې خورا لوی غوښتنلیک وموندل شي). یوازې Statoil (Equinor) په بشپړه توګه په دې کې ښکیل شو؛ په ناروې کې، په ټوله کې ایکوسیستم. نور هڅه کوي خپل کار وکړي. د مثال په توګه، د افواهاتو له مخې، د انرژی د کورنیو چارو وزارت اراده لري چې "د تیلو او انرژی کمپلیکس مفکوره انتوولوژیکي ماډل" رامینځته کړي، په ښکاره ډول، ورته. د بریښنایی بریښنا صنعت لپاره رامینځته شوی.

  • مالي سازمانونه (حتی XBRL د SDMX او RDF ډیټا کیوب اونټولوژي یو ډول هایبرډ ګڼل کیدی شي)؛

اوسنی

د کال په پیل کې ، لینکډین په فعاله توګه لیکوال ته د مالي صنعت نږدې ټولو لویانو څخه د خالي ځایونو سره سپیم کړی ، کوم چې هغه د تلویزیون لړۍ "فورس میجیور" څخه پیژني: ګولډمین سیکس ، JPMorgan چیس او / یا مورګان سټینلي ، ویلز فارګو ، SWIFT/Visa/Mastercard, Bank of America, Citigroup, Fed, Deutsche Bank... شاید هرڅوک د هغه چا په لټه کې و چې دوی ورته واستوي د پوهې ګراف کنفرانس. د موندلو لپاره کافي یو څو اداره شوي: مالي سازمانونو هرڅه اخیستي د لومړۍ ورځې سهار.

په HeadHunter کې، یوازې سبربینک یو څه په زړه پوري ولیدل؛ دا د "د RDF په څیر ډیټا ماډل سره د EAV ذخیره کولو" په اړه و.

ښایي، د کورنیو او لویدیځو مالي موسسو د اړونده ټیکنالوژیو سره د مینې د درجې توپیر د وروستیو فعالیتونو د نړیوال طبیعت له امله وي. په ښکاره ډول، د دولت د سرحدونو په اوږدو کې ادغام د کیفیت له پلوه مختلف سازماني او تخنیکي حلونو ته اړتیا لري.

  • د سوداګریزو غوښتنلیکونو سره د پوښتنې ځواب سیسټمونه (IBM واټسن، ایپل سری، د ګوګل پوهې ګراف)؛

اوسنی

په هرصورت، د سری جوړونکی، توماس ګروبر، د اونټولوژي (د معلوماتي ټکنالوجۍ په معنی کې) د "تصوراتو ځانګړتیا" په توګه د خورا تعریف لیکوال دی. زما په اند، په دې تعریف کې د کلمو بیا تنظیم کول د هغې معنی نه بدلوي، چې شاید دا په ګوته کړي چې دا شتون نلري.

  • د جوړښت شوي ډیټا خپرول (د لوی توجیه سره دا د لینک شوي خلاص ډیټا ته منسوب کیدی شي).

اوسنی

د لینک شوي ډیټا لوی مینه وال د GLAM په نوم یادیږي: ګالري، کتابتونونه، آرشیفونه، او موزیمونه. دا ووایو چې د کانګرس کتابتون د MARC21 لپاره بدیل هڅوي BIBFRAMEکوم چې د کتابي توضیحاتو راتلونکي لپاره بنسټ چمتو کوي او البته، د RDF پر بنسټ.

ویکیډاټا اکثرا د لینک شوي خلاص ډیټا په برخه کې د یوې بریالۍ پروژې د مثال په توګه حواله کیږي - د ویکیپیډیا یو ډول ماشین لوستلو وړ نسخه ، چې مینځپانګه یې د DBPedia برعکس ، د مقالې معلوماتو بکسونو څخه د واردولو له لارې نه رامینځته کیږي ، مګر دا دی. ډیر یا لږ په لاسي ډول رامینځته شوی (او وروسته د ورته معلوماتو بکسونو لپاره د معلوماتو سرچینه کیږي).

موږ دا هم وړاندیز کوو چې تاسو یې وګورئ لست د سټارډوګ RDF ذخیره کارونکي د سټارډوګ ویب پا onه کې د "پیرودونکو" برخه کې.

لکه څنګه چې کیدی شي، په ګارټینر کې د 2016 زیږدیز ټیکنالوژیو لپاره هایپ سایکل "د تصدۍ ټکسونومي او آنتولوژي مدیریت" د 10 کلونو په پرتله دمخه د "محصولیت پلیټ" ته د رسیدو احتمال سره د نا امیدۍ دره ته د نزول په مینځ کې ځای په ځای شوی.

د شرکت ډیټا سره نښلول

وړاندوینې، وړاندوینې، وړاندوینې...

د تاریخي ګټو څخه بهر، ما د ګارټینر وړاندوینې د مختلفو کلونو لپاره د ټیکنالوژیو په اړه چې زموږ سره علاقه لري لاندې جدول کړی دی.

کال ټیکنالوژي راپور حالت کلونه تر سطحي پورې
2001 سیمیکټین ویب د رامینځته کیدنې ټیکنالوژي د نوښت محرک 5-10
2006 کارپوریټ سیمانټیک ویب د رامینځته کیدنې ټیکنالوژي د انفلاسیون توقعاتو لوړوالی 5-10
2012 سیمیکټین ویب لوی ډاټا د انفلاسیون توقعاتو لوړوالی > زینکس
2015 لینک شوي ډاټا پرمختللي تحلیلونه او ډیټا ساینس د ناهیلۍ دوره 5-10
2016 د شرکت اونټولوژي مدیریت د رامینځته کیدنې ټیکنالوژي د ناهیلۍ دوره > زینکس
2018 د پوهې ګرافونه د رامینځته کیدنې ټیکنالوژي د نوښت محرک 5-10

په هرصورت، مخکې له دې "هایپ سایکل ..." 2018 یو بل لوړ رجحان څرګند شوی - د پوهې ګرافونه. یو ځانګړی بیا زیږون رامینځته شو: ګراف DBMSs ، کوم چې د کاروونکو پاملرنه او د پراختیا کونکو هڅې بدلې شوې ، د پخوانیو غوښتنو او د وروستي عادتونو تر اغیز لاندې ، د شکلونو او موقعیت په اخیستلو پیل وکړ. د خپلو پخوانیو سیالانو څخه.

نږدې هر ګراف DBMS اوس ځان د کارپوریټ "پوهې ګراف" جوړولو لپاره یو مناسب پلیټ فارم اعلانوي ("تړل شوي ډیټا" ځینې وختونه د "وصل شوي ډیټا" لخوا بدلیږي) ، مګر دا ډول ادعاګانې څومره توجیه کیږي؟

د ګراف ډیټابیسونه لاهم اسمانټیک دي؛ په ګراف DBMS کې ډاټا لاهم د ورته ډیټا سیلو ده. د URIs پرځای د سټینګ پیژندونکي د دوه ګراف DBMSs ادغام دنده لاهم د ادغام دنده رامینځته کوي ، پداسې حال کې چې د دوه RDF پلورنځیو ادغام اکثرا په ساده ډول د دوه RDF ګرافونو یوځای کولو ته راځي. د اسمانټیکیت بل اړخ د LPG ګراف ماډل غیر انعکاس دی ، کوم چې د ورته پلیټ فارم په کارولو سره د میټاډاټا اداره کول ستونزمن کوي.

په نهایت کې، ګراف DBMSs د انفرنس انجنونه یا قواعد انجنونه نلري. د داسې انجنونو پایلې د پیچلو پوښتنو له لارې بیا تولید کیدی شي، مګر دا حتی په SQL کې ممکنه ده.

په هرصورت، د RDF ذخیره کولو مخکښ سیسټمونه د LPG ماډل مالتړ کې کومه ستونزه نلري. تر ټولو کلک چلند په بلیزګراف کې په یو وخت کې وړاندیز شوی یوه ګڼل کیږي: د RDF* ماډل، د RDF او LPG ترکیب.

نور

تاسو کولی شئ د هابري په تیر مقاله کې د LPG ماډل لپاره د RDF ذخیره کولو ملاتړ په اړه نور ولولئ: "اوس د RDF ذخیره کولو سره څه پیښیږي". زه امید لرم چې یوه ورځ به د پوهې ګرافونو او ډیټا فیبریک په اړه جلا مقاله ولیکل شي. وروستۍ برخه، لکه څنګه چې پوهیدل اسانه دي، په چټکۍ سره لیکل شوي، مګر حتی شپږ میاشتې وروسته، هر څه د دې مفکورو سره ډیر روښانه نه دي.

ادبیات

  1. Halpin, H., Monnin, A. (eds.) (2014). فلسفي انجینري: د ویب فلسفې په لور
  2. الیمنګ، ډي.، هینډلر، جې. (۲۰۱۱) د کار کولو اونټولوژیسټ لپاره سیمانټیک ویب (دوهمه نسخه)
  3. سټاب، ایس.، سټوډر، آر.
  4. ووډ، D. (ed.). (2011) د تصدۍ ډاټا سره نښلول
  5. Keet, M. (2018) د اونټولوژي انجینرۍ پیژندنه

سرچینه: www.habr.com

Add a comment