د هابري په خپرونو کې، ما دمخه د خپل ټیم سره د شراکت جوړولو په اړه زما د تجربې په اړه لیکلي ( د نوي سوداګرۍ پیل کولو پرمهال د شراکت تړون رامینځته کولو څرنګوالي په اړه خبرې کوي ترڅو سوداګرۍ له مینځه ویسي). او اوس زه غواړم د پیرودونکو سره د شراکت جوړولو څرنګوالي په اړه وغږیږم ، ځکه چې د دوی پرته به د جلا کیدو لپاره هیڅ شی شتون ونلري. زه امید لرم چې دا مقاله به د پیل کولو لپاره ګټوره وي څوک چې خپل محصول لوی سوداګرۍ ته پلوري.
زه دا مهال د MONQ ډیجیټل لابراتوار په نوم د پیل کولو مشري کوم ، چیرې چې زما ټیم او زه د کارپوریټ IT ملاتړ او چلولو پروسې اتومات کولو لپاره محصول رامینځته کوو. بازار ته ننوتل یو اسانه کار نه دی او موږ د یو کوچني کور کار سره پیل وکړ، د بازار متخصصینو، زموږ همکارانو ته لاړ او د بازار ویش ترسره کړ. اصلي پوښتنه دا وه چې پوه شي "د چا دردونه موږ ښه درملنه کولی شو؟"
بانکونه دا په غوره 3 برخو کې جوړ شوي. او البته، په لیست کې لومړی Tinkoff او Sberbank وو. کله چې موږ د بانکدارۍ بازار متخصصینو ته مراجعه وکړه، دوی وویل: خپل محصول هلته معرفي کړئ، د بانکدارۍ بازار ته به لاره خلاصه وي. موږ هڅه وکړه چې هلته او هلته دواړه ننوځو ، مګر ناکامي زموږ په سبربینک کې انتظار باسي ، او د ټینکوف هلکان د روسی پیل کونکو سره د ګټورو اړیکو لپاره خورا خلاص و (شاید د دې حقیقت له امله چې صبر په هغه وخت کې و. زموږ د لویدیځ سیالانو نږدې یو ملیارد). د یوې میاشتې دننه موږ یوه ازمایښتي پروژه پیل کړه. دا څنګه پیښ شوي، ولولئ.
موږ د ډیرو کلونو لپاره د عملیاتو او څارنې مسلو سره معامله کوو، اوس موږ خپل محصول په عامه سکتور کې پلي کوو، په بیمه کې، په بانکونو کې، په مخابراتي شرکتونو کې، یو پلي کول د هوایي شرکت سره وو (د پروژې دمخه، موږ هم نه و. فکر کوم چې هوايي چلند د معلوماتي ټکنالوجۍ پورې تړلی صنعت و، او اوس موږ واقعیا هیله لرو، د COVID سره سره، چې شرکت به راڅرګند شي او پیل شي).
هغه محصول چې موږ یې جوړوو د تصدۍ سافټویر پورې اړه لري، د AIOps (د IT عملیاتو لپاره مصنوعي استخبارات، یا ITOps) برخې. د داسې سیسټمونو پلي کولو اصلي اهداف لکه څنګه چې په شرکت کې د پروسې پایښت کچه لوړه کیږي:
- اورونه لرې کړئ: ناکامۍ وپیژنئ ، د خځلو څخه د خبرتیا جریان پاک کړئ ، مسؤلینو ته دندې او پیښې وټاکئ؛
- د معلوماتي ټکنالوجۍ خدماتو موثریت زیات کړئ: د پیښو حل کولو لپاره وخت کم کړئ، د ناکامۍ لاملونه په ګوته کړئ، د معلوماتي ټکنالوجۍ وضعیت روڼتیا زیاته کړئ؛
- د سوداګرۍ موثریت زیات کړئ: د لاسي کار مقدار کم کړئ ، خطرونه کم کړئ ، د پیرودونکي وفاداري زیاته کړئ.
زموږ په تجربه کې، بانکونه د ټولو لوی IT زیربناوو سره په ګډه د څارنې سره لاندې "دردونه" لري:
- "څوک څه پوهیږي": ډیری تخنیکي څانګې شتون لري، نږدې هرڅوک لږترلږه یو د څارنې سیسټم لري، او ډیری یې له یو څخه ډیر لري؛
- د خبرتیاو "د مچیو ډله": هر سیسټم سلګونه تولیدوي او ټول هغه کسان بمباروي چې د دوی سره مسؤل دي (کله ناکله د څانګو ترمینځ هم). دا ستونزمنه ده چې په دوامداره توګه په هر خبرتیا باندې د کنټرول تمرکز وساتل شي؛
- لوی بانکونه - د سکتور مشران نه یوازې غواړي چې د دوی سیسټمونه په دوامداره توګه وڅاري، ترڅو پوه شي چې چیرې ناکامۍ شتون لري، بلکې د AI ریښتینې جادو هم - ترڅو سیسټمونه پخپله څارنه وکړي، د ځان اټکل او ځان سم کړي.
کله چې موږ په ټینکوف کې لومړۍ غونډې ته راغلو، موږ ته سمدستي وویل شول چې دوی د څارنې په برخه کې کومه ستونزه نه لري او هیڅ شی دوی ته زیان نه رسوي، او اصلي پوښتنه دا وه: "موږ د هغو کسانو لپاره څه وړاندیز کولی شو چې دمخه یې ښه کار کوي؟"
خبرې اترې اوږدې وې، موږ بحث وکړ چې د دوی کوچني خدمتونه څنګه جوړ شوي، څرنګوالی څنګه کار کوي، د زیربناوو ستونزې ډیرې حساسې دي، کوم چې د کاروونکو لپاره لږ حساس دي، "ړوند ځایونه" چیرته دي، او د دوی اهداف او SLAs څه دي.
په هرصورت، د بانک SLAs واقعیا اغیزمن دي. د مثال په توګه، د لومړیتوب 1 شبکې شتون پیښه ممکن د حل کولو لپاره یوازې څو دقیقې وخت ونیسي. دلته د غلطۍ او کم وخت لګښت، البته، اغیزمن دی.
د پایلې په توګه، موږ د همکارۍ ډیری ساحې په ګوته کړې:
- لومړۍ مرحله د چترۍ څارنه ده ترڅو د پیښې د حل سرعت زیات کړي
- دویمه مرحله د پروسې اتومات کول دي ترڅو خطرونه کم کړي او د معلوماتي ټکنالوجۍ څانګې اندازه کولو لګښتونه کم کړي.
ډیری "سپینې ځایونه" یوازې د څو څارنې سیسټمونو څخه د معلوماتو پروسس کولو سره د خبرتیاو په روښانه رنګونو کې رنګ کیدی شي، ځکه چې په مستقیم ډول د میټریک اخیستل ناممکن وو؛ دا هم اړینه وه چې د مختلف څارنې سیسټمونو څخه ډاټا په ترتیب سره "یو سکرین" ته واړول شي د هغه څه په ټولیز انځور پوهیدل چې څه پیښ شوي. "چترۍ" د دې کار لپاره مناسب دي او موږ بیا دا اړتیاوې پوره کړې.
یو خورا مهم شی، زموږ په نظر، د پیرودونکو سره په اړیکو کې صداقت دی. د لومړي خبرو اترو او د جواز د لګښت محاسبه وروسته، ویل شوي چې څنګه چې لګښت خورا ټیټ دی، نو دا ممکن سمدلاسه د جواز اخیستلو ارزښت ولري (د شنه بانک په اړه د پورتنۍ مقالې څخه د ډیناټراس کلوچ-اسټروم په پرتله، زموږ د جواز لګښت د ملیارد دریمه برخه نه ده، مګر د 12 ګیګابایټ لپاره په میاشت کې 1 زره روبله، د Sber لپاره دا به څو چنده ارزانه وي). مګر موږ سمدلاسه ورته وویل چې موږ څه لرو او څه نه لرو. شاید د لوی ادغام کونکي څخه د پلور نماینده وویل شي "هو، موږ هرڅه کولی شو، البته زموږ جواز واخلئ،" مګر موږ پریکړه وکړه چې خپل ټول کارتونه په میز کې واچوو. د لانچ په وخت کې، زموږ بکس د پرومیتیس سره ادغام نه درلود، او د اتوماتیک سب سیسټم سره نوې نسخه د خوشې کیدو په حال کې وه، مګر موږ تر اوسه دا پیرودونکو ته نه دی لیږلی.
ازمایښتي پروژه پیل شوه، حدود یې مشخص شول او موږ ته دوه میاشتې وخت ورکړل شو. اصلي دندې دا وې:
- د پلیټ فارم نوې نسخه چمتو کړئ او د بانک زیربنا کې یې ځای په ځای کړئ
- د 2 څارنې سیسټمونو سره وصل کړئ (زابکس او پرومیتیس)؛
- په سلیک او د SMS له لارې مسؤلینو ته خبرتیاوې واستوئ؛
- د اتوماتیک شفاهي سکریپټ چلول.
د ازمایښتي پروژې لومړۍ میاشت د پیلوټ پروژې اړتیاو لپاره په خورا ګړندۍ حالت کې د پلیټ فارم نوې نسخه چمتو کولو کې مصرف شوې. نوې نسخه سمدلاسه د پرومیټیوس او اتوماتیک شفاهي سره یوځای کول شامل دي. زموږ د پراختیایی ټیم څخه مننه، دوی د څو شپې خوب نه دی کړی، مګر هغه څه یې خپاره کړل چې دوی یې ژمنه کړې پرته له دې چې د نورو پخوانیو ژمنو لپاره د وخت نیټې له لاسه ورکړي.
پداسې حال کې چې موږ پیلوټ تنظیم کوو، موږ د یوې نوې ستونزې سره مخ شو چې کولی شي د مهال ویش څخه مخکې پروژه وتړي: د فوري میسینجرونو او د SMS له لارې د خبرتیاو لیږلو لپاره، موږ د مایکروسافټ Azure سرورونو سره راتلونکو او وتلو اړیکو ته اړتیا درلوده (په هغه وخت کې موږ دا پلیټ فارم کارولی و. سلیک ته د خبرتیاو لیږلو لپاره) او د بهرني لیږلو خدمت SMS. مګر په دې پروژه کې، خوندیتوب ځانګړی تمرکز درلود. د بانک د پالیسۍ سره سم، دا ډول "سوري" په هیڅ حالت کې نشي خلاصیدلی. هرڅه باید د تړل شوي لوپ څخه کار وکړي. موږ ته د خپلو داخلي خدماتو API کارولو وړاندیز شوی و چې سلیک ته او د SMS له لارې خبرتیاوې لیږي، مګر موږ فرصت نه درلود چې دا ډول خدمتونه له بکس څخه وصل کړو.
د پرمختیایی ټیم سره د بحث یوه ماښام د حل لپاره د بریالۍ لټون سره پای ته ورسیده. د بیکلاګ له لارې په ګمراه کولو سره، موږ یو داسې دنده وموندله چې موږ یې هیڅکله کافي وخت او لومړیتوب نه درلود - د پلګ ان سیسټم رامینځته کول ترڅو پلي کونکي ټیمونه یا پیرودونکي وکولی شي پخپله اضافې ولیکي ، د پلیټ فارم ظرفیتونه پراخه کړي.
مګر موږ دقیقا یوه میاشت پاتې وه ، په جریان کې موږ باید هرڅه نصب کړو ، اتوماتیک تنظیم او ځای په ځای کړو.
د سرګي په وینا، زموږ د مشر معمار، د پلگ ان سیسټم پلي کول لږترلږه یوه میاشت وخت نیسي.
موږ وخت نه درلود ...
یوازې یو حل شتون درلود - پیرودونکي ته لاړ شئ او هرڅه ورته ووایاست. د نیټې د بدلون په اړه په ګډه بحث وکړئ. او دا کار وکړ. موږ ته دوه اونۍ اضافي وخت راکړل شو. دوی د پایلو ښودلو لپاره خپل وخت او داخلي مکلفیتونه هم درلودل، مګر دوی 2 ریزرو اونۍ درلودې. په پای کې، موږ هرڅه په لیکه کې واچوو. دا ناشونې وه چې ګډوډ شي. صداقت او د شراکت چلند یو ځل بیا تادیه شوی.
د پیلوټ په پایله کې، ډیری مهم تخنیکي پایلې او پایلې ترلاسه شوي:
موږ د خبرتیاو پروسس کولو لپاره نوی فعالیت ازمویلی
ګمارل شوي سیسټم په سمه توګه د پرومیټیوس څخه خبرتیا ترلاسه کول پیل کړل او دوی یې ګروپ کړل. د Prometheus پیرودونکي څخه د ستونزې په اړه خبرتیاوې په هر 30 ثانیو کې الوتنه کوله (د وخت په واسطه ګروپ کول فعال شوي ندي)، او موږ حیران وو چې ایا دا به ممکن وي چې دوی پخپله "چترۍ" کې ګروپ کړي. دا معلومه شوه چې دا ممکنه ده - په پلیټ فارم کې د خبرتیاو پروسس کول د سکریپټ لخوا پلي کیږي. دا د دوی د پروسس کولو لپاره نږدې هر منطق پلي کول ممکنه کوي. موږ دمخه په پلیټ فارم کې معیاري منطق د ټیمپلیټونو په شکل پلي کړی دی - که تاسو نه غواړئ د خپل ځان سره یو څه راوړئ ، تاسو کولی شئ چمتو شوی وکاروئ.

"مصنوعي محرک" انٹرفیس. د مربوط څارنې سیسټمونو څخه د خبرتیاو پروسس کول
د سیسټم "روغتیا" حالت رامینځته کړی
د خبرتیاو پراساس، د څارنې پیښې رامینځته شوي چې د ترتیب کولو واحدونو (CUs) روغتیا اغیزه کړې. موږ د سرچینې خدماتو ماډل (RSM) پلي کوو، کوم چې کولی شي داخلي CMDB وکاروي یا یو بهرنی وصل کړي - د ازمایښتي پروژې په جریان کې پیرودونکي خپل CMDB سره وصل نه کړ.

د سرچینې - خدماتو ماډل سره کار کولو لپاره انٹرفیس. پیلوټ RSM.
ښه، په حقیقت کې، پیرودونکي په پای کې یو واحد نظارت سکرین لري، چیرې چې د مختلفو سیسټمونو پیښې لیدل کیږي. اوس مهال، دوه سیسټمونه د "چتر" سره وصل دي - زیبکس او پرومیتیس، او پخپله د پلیټ فارم داخلي نظارت سیسټم.

د تحلیل انٹرفیس. د واحد نظارت سکرین.
د پروسې اتومات کول پیل کړل
د پیښو نظارت د دمخه ترتیب شوي عملونو پیل پیل کړ - د خبرتیاو لیږل ، د سکریپټونو چلول ، د پیښو ثبت کول / بډایه کول - وروستی د دې ځانګړي پیرودونکي سره هڅه نه وه شوې ، ځکه چې په ازمایښتي پروژه کې د خدماتو میز سره هیڅ ادغام نه و.

د عمل تنظیماتو انٹرفیس. سلیک ته خبرتیاوې واستوئ او سرور ریبوټ کړئ.
د محصول فعالیت پراخ شوی
کله چې د اتوماتیک سکریپټونو په اړه بحث کول، پیرودونکي د بش ملاتړ او یو انٹرفیس غوښتنه وکړه چې په کې دا سکریپټونه په اسانۍ سره تنظیم کیدی شي. نوې نسخه یو څه نور کار کړی دی (په لوا کې د بشپړ منطقي جوړښتونو لیکلو وړتیا د CURL ، SSH او SNMP ملاتړ سره) او پلي شوي فعالیت چې تاسو ته اجازه درکوي د سکریپټ ژوند دوره اداره کړئ (جوړول ، ترمیم کول ، نسخه کنټرول ، ړنګول او آرشیف کول).

د اتوماتیک شفاهي سکریپټونو سره کار کولو لپاره انٹرفیس. د SSH له لارې د سرور ریبوټ سکریپټ.
کلیدي موندنې
د پیلوټ په جریان کې ، د کارونکي کیسې هم رامینځته شوې چې اوسني فعالیت ته وده ورکوي او د پیرودونکي لپاره ارزښت ډیروي ، دلته ځینې یې دي:
- په مستقیم ډول د خبرتیا څخه د اتوماتیک سکریپټ ته د متغیرونو لیږلو وړتیا پلي کول؛
- د فعال لارښود له لارې پلیټ فارم ته اجازه اضافه کړئ.
او موږ ډیرې نړیوالې ننګونې ترلاسه کړې - د نورو وړتیاو سره د محصول "جوړولو" لپاره:
- د ML پر بنسټ د سرچینو - خدماتو ماډل اتوماتیک جوړول، د قواعدو او اجنټانو پر ځای (شاید اوس اصلي ننګونه)؛
- د اضافي سکریپټینګ او منطق ژبو لپاره ملاتړ (او دا به جاواسکریپټ وي).
زما په نظر تر ټولو مهمهغه څه چې دا پیلوټ ښیې دوه شیان دي:
- د پیرودونکي سره ملګرتیا د اغیزمنتیا کلیدي ده، کله چې مؤثره اړیکه د صداقت او خلاصون پر بنسټ رامینځته کیږي، او پیرودونکي د ټیم برخه کیږي چې په لنډ وخت کې د پام وړ پایلې ترلاسه کوي.
- په هیڅ حالت کې دا اړینه نده چې "تقاضا" او "بیسکه" جوړ کړئ - یوازې د سیسټم حلونه. دا غوره ده چې لږ نور وخت ولګوو، مګر د سیسټم حل جوړ کړئ چې د نورو پیرودونکو لخوا به وکارول شي. په هرصورت، دا هغه څه دي چې د پلگ ان سیسټم او په Azure باندې د انحصار له منځه وړل نورو پیرودونکو ته اضافي ارزښت چمتو کوي (سلام، فدرالي قانون 152).
سرچینه: www.habr.com
