Oleg Anastasyev سان ميني انٽرويو: Apache Cassandra ۾ غلطي رواداري

Oleg Anastasyev سان ميني انٽرويو: Apache Cassandra ۾ غلطي رواداري

Odnoklassniki RuNet تي Apache Cassandra جو سڀ کان وڏو استعمال ڪندڙ ۽ دنيا ۾ سڀ کان وڏو استعمال ڪندڙ آھي. اسان 2010 ۾ Cassandra استعمال ڪرڻ شروع ڪيو تصوير جي درجه بندي کي ذخيرو ڪرڻ لاء، ۽ هاڻي Cassandra هزارين نوڊس تي ڊيٽا جي پيٽابائيٽس کي منظم ڪري ٿو، حقيقت ۾، اسان پڻ پنهنجو پاڻ کي ترقي ڪيو NewSQL ٽرانزيڪشن ڊيٽابيس.
12 سيپٽمبر تي اسان جي سينٽ پيٽرسبرگ آفيس ۾ منعقد ڪنداسين ٻي ملاقات اپاچي ڪئاسندرا لاءِ وقف ڪئي وئي. تقريب جو مکيه اسپيڪر Odnoklassniki Oleg Anastasyev جو چيف انجنيئر هوندو. اوليگ ورهايل ۽ غلطي برداشت ڪرڻ واري نظام جي شعبي ۾ ماهر آهي؛ هو 10 سالن کان وڌيڪ عرصي تائين ڪئاسندرا سان ڪم ڪري رهيو آهي ۽ بار بار ڪانفرنس ۾ هن پراڊڪٽ کي استعمال ڪرڻ جي خاصيتن بابت ڳالهايو.

ملاقات جي موقعي تي، اسان اوليگ سان ورهايل نظام جي غلطي رواداري بابت ڪاسندرا سان ڳالهايو، پڇيو ته هو ملاقات تي ڇا ڳالهائيندو ۽ هن واقعي ۾ شرڪت ڪرڻ جي لائق ڇو هئي.

اوليگ پنهنجي پروگرامنگ ڪيريئر کي 1995 ۾ واپس شروع ڪيو. هن بئنڪنگ، ٽيلي ڪام ۽ ٽرانسپورٽ ۾ سافٽ ويئر ٺاهيا. هو پليٽ فارم ٽيم تي 2007 کان وٺي Odnoklassniki ۾ هڪ معروف ڊولپر طور ڪم ڪري رهيو آهي. هن جي ذميوارين ۾ شامل آهن ترقي ڪندڙ آرڪيٽيڪچرز ۽ اعلي لوڊ سسٽم لاءِ حل، وڏي ڊيٽا گودام، ۽ پورٽل جي ڪارڪردگي ۽ اعتبار جي مسئلن کي حل ڪرڻ. هو ڪمپني جي اندر ڊولپرز کي پڻ تربيت ڏئي ٿو.

- اوليگ، هيلو! مئي ۾ ٿيو پهرين ملاقات، Apache Cassandra لاءِ وقف ٿيل ، شرڪت ڪندڙن جو چوڻ آهي ته بحث رات دير تائين هليو ، مهرباني ڪري مون کي ٻڌايو ته پهرين ملاقات جا توهان جا تاثرات ڇا آهن؟

مختلف ڪمپنين کان مختلف پس منظر رکندڙ ڊولپر پنهنجن دردن سان گڏ آيا، مسئلن جي غير متوقع حل ۽ حيرت انگيز ڪهاڻيون. اسان اڪثر گڏجاڻين کي بحث جي شڪل ۾ منظم ڪيو، پر اتي تمام گهڻيون بحثون هيون جو اسان صرف رٿيل موضوعن جي ٽئين تي رابطو ڪرڻ جي قابل هئاسين. اسان تمام گهڻو ڌيان ڏنو ته ڪيئن ۽ ڇا مانيٽر ڪريون ٿا اسان جي حقيقي پيداوار جي خدمتن جو مثال استعمال ڪندي.

مون کي دلچسپي هئي ۽ واقعي پسند ڪيو.

- اعلان سان فيصلو ڪندي، ٻي ملاقات مڪمل طور تي غلطي رواداري لاء وقف ٿي ويندي، توهان هي موضوع ڇو چونڊيو آهي؟

Cassandra هڪ عام مصروف ورهايل نظام آهي جنهن ۾ ڪارڪردگي جي وڏي مقدار سان سڌو سنئون صارف جي درخواستن جي خدمت ڪرڻ کان ٻاهر آهي: گپ شپ، ناڪامي جي نشاندهي، اسڪيما تبديلين جي پروپيگيشن، ڪلستر جي توسيع / ​​ڇڪڻ، اينٽي اينٽروپي، بيڪ اپ ۽ بحالي، وغيره. جيئن ته ڪنهن به ورهايل سسٽم ۾، جيئن هارڊويئر جي مقدار ۾ اضافو ٿيندو آهي، ناڪامي جو امڪان وڌندو آهي، تنهنڪري Cassandra پيداوار جي ڪلستر جي آپريشن کي ان جي جوڙجڪ جي گهري ڄاڻ جي ضرورت آهي ته ناڪامي ۽ آپريٽر جي عملن جي صورت ۾ رويي جي اڳڪٿي ڪرڻ لاء. ڪيترن سالن تائين Cassandra استعمال ڪرڻ کان پوء، اسان اهم ماهر گڏ ڪيا آهن، جنهن کي اسان شيئر ڪرڻ لاءِ تيار آهيون، ۽ اسان اهو پڻ بحث ڪرڻ چاهيون ٿا ته دڪان ۾ ساٿي ڪيئن عام مسئلا حل ڪن ٿا.

- جڏهن اهو اچي ٿو Cassandra، توهان جو مطلب ڇا آهي غلطي رواداري کان؟

سڀ کان پهريان، يقينا، سسٽم جي صلاحيت عام هارڊويئر ناڪامي کان بچڻ لاء: مشينن جي نقصان، ڊسڪ يا نيٽ ورڪ رابطي سان نوڊس / ڊيٽا سينٽرن سان. پر موضوع پاڻ تمام وسيع آهي ۽ خاص طور تي ناڪامين کان وصولي شامل آهي، جنهن ۾ ناڪاميون شامل آهن جن لاءِ ماڻهو تمام گهٽ تيار آهن، مثال طور، آپريٽر جون غلطيون.

- ڇا توھان ھڪڙو مثال ڏئي سگھوٿا سڀ کان وڌيڪ لوڊ ٿيل ۽ وڏي ڊيٽا ڪلستر؟

اسان جو سڀ کان وڏو ڪلستر گفٽ ڪلسٽر آھي: 200 کان وڌيڪ نوڊس ۽ سوين ٽي بي ڊيٽا. پر اهو سڀ کان وڌيڪ لوڊ ٿيل نه آهي، ڇاڪاڻ ته اهو ورهايل ڪيش سان ڍڪيل آهي. اسان جا مصروف ترين ڪلسٽرز لکڻ لاءِ هزارين RPS ۽ پڙهڻ لاءِ هزارين RPS سنڀاليندا آهن.

- واهه! ڪيترا ڀيرا ڪجهه ڀڃي ٿو؟

هو هر وقت! مجموعي طور تي، اسان وٽ 6 هزار کان وڌيڪ سرور آهن، ۽ هر هفتي هڪ ٻه سرورز ۽ ڪيترن ئي درجن ڊسڪ کي تبديل ڪيو ويندو آهي (بغير مشين جي جهاز جي اپ گريڊ ۽ توسيع جي متوازي عملن جي حساب ۾). هر قسم جي ناڪامي لاءِ، واضح هدايتون آهن ته ڇا ڪجي ۽ ڪهڙي ترتيب ۾، هر شيءِ خودڪار ٿي ويندي آهي جڏهن به ممڪن هجي، تنهن ڪري ناڪاميون معمول جيان هونديون آهن ۽ 99 سيڪڙو ڪيسن ۾ صارفين جو ڌيان ئي نه پوندو آهي.

- توهان اهڙين انڪارن سان ڪيئن ڊيل ڪندا آهيو؟

Cassandra جي آپريشن ۽ پهرين واقعن جي شروعات کان وٺي، اسان انهن مان بيڪ اپ ۽ وصولي جي ميڪانيزم تي ڪم ڪيو، ٺاھڻ جي طريقيڪار ٺاهيا جيڪي اڪائونٽ ۾ Cassandra ڪلستر جي حالت ۾ وٺن ٿا ۽ مثال طور، نوڊس کي ٻيهر شروع ڪرڻ جي اجازت نه ڏيو. جيڪڏهن ڊيٽا نقصان ممڪن آهي. اسان گڏجاڻي ۾ هن سڀني بابت ڳالهائڻ جو ارادو ڪيو.

- جيئن توهان چيو، اتي بلڪل قابل اعتماد سسٽم نه آهن. توهان ڪهڙي قسم جي ناڪامين لاءِ تيار آهيو ۽ زنده رهڻ جي قابل آهيو؟

جيڪڏهن اسان اسان جي Cassandra ڪلستر جي تنصيب جي باري ۾ ڳالهايون ٿا، صارف ڪجهه به نوٽيس نه ڪندا جيڪڏهن اسان ڪيترن ئي مشينن کي هڪ ڊي سي يا هڪ سڄي ڊي سي ۾ وڃائي ڇڏيو (اهو ٿي چڪو آهي). ڊي سيز جي تعداد ۾ واڌ سان، اسان ٻن ڊي سيز جي ناڪامي جي صورت ۾ آپريشنليت کي يقيني بڻائڻ جي باري ۾ سوچي رهيا آهيون.

- توهان ڇا ٿا سمجهو ته ڪاسندرا غلطي رواداري جي لحاظ کان گهٽ آهي؟

Cassandra، ٻين ڪيترن ئي ابتدائي NoSQL اسٽورن وانگر، ان جي اندروني جوڙجڪ ۽ متحرڪ عملن جي گهڻي ڄاڻ جي ضرورت آهي. مان چوندس ته ان ۾ سادگي، اڳڪٿي ۽ مشاهدي جي کوٽ آهي. پر اهو دلچسپ ٿيندو ته ٻين اجلاس جي شرڪت ڪندڙن جا رايا ٻڌي!

اوليگ، سوالن جا جواب ڏيڻ لاء وقت وٺڻ لاء توهان جي مهرباني!

اسان هر ڪنهن لاءِ انتظار ڪري رهيا آهيون جيڪو اسان جي سينٽ پيٽرسبرگ آفيس ۾ سيپٽمبر 12 تي ملاقات دوران آپريٽ اپاچي ڪاسندرا جي شعبي جي ماهرن سان رابطو ڪرڻ چاهي ٿو.

اچو، اهو دلچسپ ٿيندو!

واقعي لاءِ رجسٽر ٿيو.

جو ذريعو: www.habr.com

تبصرو شامل ڪريو