د اولیګ اناستاسیوف سره مینی مرکه: په اپاچی کاسیندرا کې د خطا زغم

د اولیګ اناستاسیوف سره مینی مرکه: په اپاچی کاسیندرا کې د خطا زغم

Odnoklassniki په RuNet کې د Apache Cassandra ترټولو لوی کارونکي او په نړۍ کې یو له لویو څخه دی. موږ په 2010 کې د عکس درجه بندي ذخیره کولو لپاره د کاسندرا کارول پیل کړل، او اوس کاسیندرا په زرګونو نوډونو کې د پیټابایټ ډیټا اداره کوي، په حقیقت کې، موږ حتی خپل ځان جوړ کړی. د نوي ایس کیو ایل لیږد ډیټابیس.
د سپتمبر په 12 به زموږ په سینټ پیټرزبرګ دفتر کې ترسره شي دویمه ناسته اپاچی کیسیندرا ته وقف شوې. د غونډې اصلي ویناوال به د Odnoklassniki لوی انجنیر اولیګ اناستاسییف وي. اولیګ د توزیع شوي او د خطا زغمونکي سیسټمونو په برخه کې ماهر دی؛ هغه د 10 کلونو څخه ډیر وخت د کاسندرا سره کار کوي او په مکرر ډول په کنفرانسونو کې د دې محصول کارولو ځانګړتیاو په اړه خبرې وکړې.

د غونډې په ماښام ، موږ د اولیګ سره د کاسندرا سره د توزیع شوي سیسټمونو د خطا زغم په اړه خبرې وکړې ، پوښتنه یې وکړه چې هغه به په ناسته کې د څه په اړه وغږیږي او ولې پدې پیښه کې د ګډون ارزښت لري.

اولیګ په 1995 کې خپل د پروګرام کولو دنده پیل کړه. هغه د بانکدارۍ، مخابراتو، او ټرانسپورټ سافټویر جوړ کړ. هغه د پلیټ فارم ټیم کې له 2007 راهیسې په اوډنوکلاسنیکي کې د مخکښ پراختیا کونکي په توګه کار کوي. د هغه په ​​مسؤلیتونو کې د لوړ بار سیسټمونو لپاره د معمارۍ او حلونو رامینځته کول ، د لوی ډیټا ګودامونه ، او د پورټل فعالیت او اعتبار ستونزې حل کول شامل دي. هغه د شرکت دننه پراختیا کونکي هم روزي.

- اولیګ، سلام! د می په میاشت کې ترسره شو لومړی ملاقاتاپاچی کیسیندرا ته وقف شوی، ګډونوال وايي چې بحثونه د شپې تر ناوخته پورې روان وو، مهرباني وکړئ ما ته ووایاست، ستاسو د لومړۍ ناستې تاثرات څه دي؟

د مختلف شرکتونو څخه د مختلف شالیدونو سره پراختیا کونکي د خپل درد ، ستونزو غیر متوقع حلونو او حیرانتیا کیسې سره راغلي. موږ وکولای شو چې د غونډې ډیری برخه د خبرو اترو په بڼه ترسره کړو، مګر دومره ډیر بحثونه شتون درلود چې موږ یوازې د پالن شوي موضوعاتو په دریمه برخه کې تماس نیولی شو. موږ دې ته ډیره پاملرنه کړې چې زموږ د اصلي تولید خدماتو مثال په کارولو سره څنګه او څه څارنه کوو.

زه علاقه لرم او واقعیا یې خوښوم.

- د اعلان له مخې قضاوت، دوهمه ناسته په بشپړ ډول به د ګناه زغم ته وقف وي، تاسو ولې دا موضوع غوره کړه؟

کاسندرا یو عادي مصروف توزیع شوی سیسټم دی چې د کاروونکو غوښتنو ته مستقیم خدمت کولو هاخوا د فعالیت لوی مقدار سره لري: ګپ شپ ، د ناکامۍ کشف ، د سکیما بدلونونو تبلیغ ، د کلستر پراخول / کمیدل ، انټروپی ضد ، بیک اپ او رغونه ، او داسې نور. لکه څنګه چې په هر توزیع شوي سیسټم کې ، لکه څنګه چې د هارډویر مقدار ډیریږي ، د ناکامۍ احتمال ډیریږي ، نو د کاسندرا تولید کلسترونو عملیات د دې جوړښت ژور پوهاوي ته اړتیا لري ترڅو د ناکامیو او آپریټر کړنو په صورت کې د چلند وړاندوینه وکړي. د ډیرو کلونو لپاره د کاسندرا کارولو وروسته، موږ د پام وړ مهارتونه راټول کړي، کوم چې موږ یې شریکولو ته چمتو یو، او موږ غواړو په دې هم بحث وکړو چې څنګه په هټۍ کې همکاران عادي ستونزې حل کوي.

- کله چې د کاسندرا خبره راځي ، تاسو د غلط زغم څخه څه معنی لرئ؟

له هرڅه دمخه ، البته ، د سیسټم وړتیا د هارډویر عادي ناکامیو څخه ژوندي پاتې کیدل: د ماشینونو له لاسه ورکول ، ډیسکونه یا د نوډونو / ډیټا مرکزونو سره د شبکې ارتباط. مګر موضوع پخپله خورا پراخه ده او په ځانګړې توګه د ناکامیو څخه بیا رغونه شامله ده، په شمول د ناکامۍ په شمول چې خلک په ندرت سره چمتو کیږي، د بیلګې په توګه، د چلونکي تېروتنې.

- ایا تاسو کولی شئ د ډیری بار شوي او لوی ډیټا کلستر مثال ورکړئ؟

زموږ یو له لویو کلسترونو څخه د ډالۍ کلستر دی: له 200 څخه ډیر نوډونه او په سلګونو TB ډیټا. مګر دا خورا بار شوی ندی ، ځکه چې دا د توزیع شوي کیچ لخوا پوښل شوی. زموږ ترټولو بوخت کلسترونه د لیکلو لپاره لسګونه زره RPS او د لوستلو لپاره زرګونه RPS اداره کوي.

- وا! څو ځله یو څه ماتیږي؟

هو هر وخت! په مجموع کې، موږ له 6 زرو څخه ډیر سرورونه لرو، او هره اونۍ یو څو سرورونه او څو درجن ډیسکونه ځای پر ځای کیږي (پرته له دې چې د ماشین بیړۍ د نوي کولو او پراخولو موازي پروسې په پام کې ونیول شي). د هر ډول ناکامۍ لپاره، واضح لارښوونې شتون لري چې څه وکړي او په کوم ترتیب کې، هر څه چې هرکله ممکن وي اتوماتیک وي، نو ناکامي معمول دي او په 99٪ قضیو کې د کاروونکو لخوا د پام وړ نه وي.

- تاسو د دې ډول انکارونو سره څنګه چلند کوئ؟

د کیسیندرا د عملیاتو او لومړیو پیښو له پیل څخه ، موږ د دوی څخه د بیک اپ او بیا رغولو لپاره میکانیزمونو باندې کار وکړ ، د ګمارنې طرزالعملونه یې رامینځته کړل چې د کاسندرا کلسترونو حالت په پام کې نیسي او د مثال په توګه ، نوډونو ته اجازه نه ورکوي چې بیا پیل شي. که چیرې د معلوماتو ضایع ممکن وي. موږ پلان لرو چې په غونډه کې د دې ټولو په اړه خبرې وکړو.

- لکه څنګه چې تاسو وویل، هیڅ د اعتبار وړ سیسټمونه شتون نلري. تاسو د کوم ډول ناکامیو لپاره چمتو یاست او د سمبالولو توان لرئ؟

که موږ د کاسندرا کلسترونو زموږ د تاسیساتو په اړه وغږیږو ، نو کاروونکي به هیڅ شی ونه ګوري که موږ په یوه DC یا یو بشپړ DC کې څو ماشینونه له لاسه ورکړو (دا پیښ شوي). د DCs شمیر ډیروالي سره ، موږ د دوه DCs د ناکامۍ په صورت کې د فعالیت ډاډ ترلاسه کولو پیل کولو په اړه فکر کوو.

- تاسو څه فکر کوئ چې کاسندرا د خطا زغم په برخه کې نشتوالی لري؟

Cassandra، لکه د نورو نورو ابتدايي NoSQL پلورنځیو په څیر، د دې داخلي جوړښت او متحرک پروسو په اړه ژورې پوهې ته اړتیا لري. زه به ووایم چې دا سادگي، وړاندوینه او مشاهده نلري. خو دا به په زړه پورې وي چې د غونډې د نورو ګډونوالو نظرونه واورئ!

اولیګ ، د پوښتنو ځوابونو لپاره د وخت اخیستو لپاره ډیره مننه!

موږ د هرچا په تمه یو څوک چې غواړي د اپاچي کاسیندرا عملیاتي برخه کې متخصصینو سره د سپتمبر په 12 زموږ په سینټ پیټرزبرګ دفتر کې ناسته کې اړیکه ونیسي.

راځئ، دا به په زړه پورې وي!

د پیښې لپاره راجستر کړئ.

سرچینه: www.habr.com

Add a comment