تر ټولو لومړی، موږ موافقه وکړه چې اجزاوې باید یوازې د ځانګړو ډیټا جوړښتونو (قراردادونو) باندې تکیه وکړي چې د دوی ترمنځ تیریږي. دا د دوی تر مینځ ادغام کول اسانه کوي او د اجزاو ځانګړي ترکیب (او ترتیب) نه پلي کوي. د مثال په توګه، په ځینو مواردو کې دا موږ ته اجازه راکوي چې مستقیم د ترلاسه کولو سیسټم د خبرتیا تعقیب سیسټم سره یوځای کړو. په داسې حالت کې، دا به د اعلان شوي خبرتیا قرارداد سره سم ترسره شي. دا پدې مانا ده چې دواړه برخې به د تړون په کارولو سره مدغم شي چې کوم بل برخه یې کارولی شي. موږ به د ان پټ سیسټم څخه د تعقیب سیسټم ته خبرتیاو اضافه کولو لپاره اضافي قرارداد اضافه نه کړو. دا کړنلاره د لږ تر لږه قراردادونو د ټاکل شوي شمیر کارولو ته اړتیا لري او سیسټم او مخابراتو ساده کوي. اساسا ، موږ د "قرارداد لومړی ډیزاین" په نوم یوه تګلاره اخلو او د سټرینګ قراردادونو کې یې پلي کوو. [2]
په هرځای کې جریان کول
په سیسټم کې د دولت خوندي کول او اداره کول به حتمي د هغې په پلي کولو کې پیچلتیاوې رامینځته کړي. په عموم کې، دولت باید د هرې برخې څخه د لاسرسي وړ وي، دا باید ثابت وي او په ټولو برخو کې تر ټولو تازه ارزښت چمتو کړي، او دا باید د سمو ارزښتونو سره د اعتبار وړ وي. سربیره پردې ، د وروستي حالت ترلاسه کولو لپاره دوامداره ذخیره کولو ته زنګ وهل به د I/O اندازه او زموږ د ریښتیني وخت پایپ لاینونو کې کارول شوي الګوریتم پیچلتیا زیاته کړي. د دې له امله، موږ پریکړه وکړه چې دولتي ذخیره، که امکان ولري، په بشپړه توګه زموږ له سیسټم څخه لرې کړو. دا طریقه اړتیا لري چې ټول اړین معلومات د لیږد شوي ډیټا واحد (پیغام) کې شامل شي. د مثال په توګه، که موږ اړتیا ولرو چې د ځینې مشاهداتو ټولیز شمیر (د عملیاتو شمیر یا قضیې د ځانګړو ځانګړتیاو سره) محاسبه کړو، موږ دا په حافظه کې محاسبه کوو او د ورته ارزښتونو جریان رامینځته کوو. انحصاري ماډلونه به د ادارو لخوا جریان ویشلو او په وروستي ارزښتونو کار کولو لپاره د تقسیم کولو او بسته کولو څخه کار واخلي. دې طریقې د دې ډول معلوماتو لپاره د دوامداره ډیسک ذخیره کولو اړتیا له مینځه وړې. زموږ سیسټم کافکا د پیغام بروکر په توګه کاروي او دا د KSQL سره د ډیټابیس په توګه کارول کیدی شي. [3] مګر د دې کارول به زموږ حل په کلکه له کافکا سره وتړي، او موږ پریکړه وکړه چې دا ونه کاروو. هغه طریقه چې موږ غوره کړې موږ ته اجازه راکوي چې کافکا په سیسټم کې د لوی داخلي بدلونونو پرته د بل پیغام بروکر سره بدل کړو.
دا مفهوم پدې معنی ندي چې موږ د ډیسک ذخیره او ډیټابیس نه کاروو. د سیسټم فعالیت چک کولو او تحلیل کولو لپاره، موږ اړتیا لرو چې په ډیسک کې د پام وړ ډیټا ذخیره کړو، کوم چې د مختلفو شاخصونو او حالتونو استازیتوب کوي. دلته مهم ټکی دا دی چې د ریښتیني وخت الګوریتم په داسې معلوماتو پورې اړه نلري. په ډیرو مواردو کې، موږ خوندي شوي ډاټا د آفلاین تحلیل، ډیبګ کولو، او د ځانګړو قضیو او پایلو تعقیب لپاره کاروو چې سیسټم یې تولیدوي.
زموږ په سیسټم کې ستونزې
ځینې ستونزې شتون لري چې موږ یې تر یوې اندازې حل کړې، مګر دوی ډیر فکري حل ته اړتیا لري. د اوس لپاره، زه غواړم دوی دلته ذکر کړم، ځکه چې هر توکي د خپلې مقالې ارزښت لري.
موږ لاهم اړتیا لرو هغه پروسې او پالیسۍ تعریف کړو چې زموږ د اتوماتیک تحلیل ، کشف او سپړنې لپاره معنی لرونکي او اړونده ډیټا رامینځته کولو کې مرسته کوي.
د یو شخص لخوا د تحلیل پایلو معرفي کول د سیسټم په اتوماتيک ډول تنظیم کولو پروسه کې د وروستي معلوماتو سره تازه کولو لپاره. دا نه یوازې زموږ ماډل ته تازه کول دي، بلکې زموږ پروسو او زموږ د معلوماتو ښه پوهه هم تازه ده.
د IF-ELSE او ML د ټاکونکي چلند تر مینځ د توازن موندل. یو چا وویل: "ML د نا امیدۍ لپاره وسیله ده." دا پدې مانا ده چې تاسو غواړئ ML وکاروئ کله چې تاسو نور نه پوهیږئ چې څنګه خپل الګوریتم اصلاح او ښه کړئ. له بلې خوا، ټاکونکې کړنلاره اجازه نه ورکوي چې د بې نظمیو کشف کړي چې وړاندوینه نه وه.
موږ په ډیټا کې د میټریکونو ترمینځ زموږ فرضیې یا ارتباط ازموینې لپاره اسانه لارې ته اړتیا لرو.
سیسټم باید د ریښتینې مثبتو پایلو ډیری کچې ولري. د درغلیو قضیې یوازې د ټولو قضیو یوه برخه ده چې د سیسټم لپاره مثبت ګڼل کیدی شي. د مثال په توګه، شنونکي غواړي د بیاکتنې لپاره ټولې مشکوکې قضیې ترالسه کړي، او یوازې یوه کوچنۍ برخه یې درغلۍ دي. سیسټم باید په مؤثره توګه شنونکي د ټولو قضیو سره چمتو کړي، که دا ریښتینې درغلۍ وي یا یوازې شکمن چلند وي.
د ډیټا پلیټ فارم باید وکوالی شي تاریخي ډیټاسیټونه ترلاسه کړي محاسبې سره چې په الوتنه کې رامینځته شوي او حساب شوي.
لږترلږه په دریو مختلف چاپیریالونو کې د سیسټم هرې برخې ساده او اتوماتیک ګمارل: تولید ، تجربه (بیټا) ، او د پراختیا کونکو لپاره.