Oleg Anastasyev bilan mini-intervyu: Apache Kassandradagi xatolarga chidamlilik

Oleg Anastasyev bilan mini-intervyu: Apache Kassandradagi xatolarga chidamlilik

Odnoklassniki - RuNetdagi Apache Cassandra-ning eng yirik foydalanuvchisi va dunyodagi eng yiriklaridan biri. Biz 2010 yilda fotosuratlar reytingini saqlash uchun Cassandra-dan foydalanishni boshladik va hozir Kassandra minglab tugunlarda petabayt ma'lumotlarni boshqaradi, aslida biz o'zimiznikini ishlab chiqdik. NewSQL tranzaksiya ma'lumotlar bazasi.
12 sentyabr kuni Sankt-Peterburgdagi ofisimizda o'tkazamiz Apache Kassandraga bag'ishlangan ikkinchi uchrashuv. Tadbirning asosiy spikeri Odnoklassniki bosh muhandisi Oleg Anastasyev bo‘ladi. Oleg taqsimlangan va nosozliklarga chidamli tizimlar sohasida mutaxassis bo'lib, u Kassandra bilan 10 yildan ortiq va bir necha bor ishlagan. konferentsiyalarda ushbu mahsulotdan foydalanish xususiyatlari haqida gapirdi.

Uchrashuv arafasida biz Oleg bilan Kassandra bilan taqsimlangan tizimlarning nosozliklarga chidamliligi haqida suhbatlashdik, u uchrashuvda nima haqida gaplashishini va nima uchun ushbu tadbirda qatnashish kerakligini so'radik.

Oleg dasturlash faoliyatini 1995 yilda boshlagan. U bank, telekommunikatsiya va transportda dasturiy ta'minot ishlab chiqdi. U 2007 yildan beri Odnoklassniki’da platforma jamoasida yetakchi dasturchi sifatida ishlab kelmoqda. Uning mas'uliyatiga yuqori yuklangan tizimlar, katta ma'lumotlar omborlari uchun arxitektura va echimlarni ishlab chiqish, portalning ishlashi va ishonchliligi muammolarini hal qilish kiradi. Shuningdek, u kompaniya ichida dasturchilarni o'qitadi.

- Oleg, salom! May oyida bo'lib o'tdi birinchi uchrashuv, Apache Kassandraga bag'ishlangan, ishtirokchilarning aytishicha, munozaralar kechgacha davom etgan, iltimos, ayting-chi, birinchi uchrashuvdan taassurotlaringiz qanday?

Turli kompaniyalardan turli xil kelib chiqishi bo'lgan ishlab chiquvchilar o'zlarining og'riqlari, muammolarga kutilmagan echimlar va ajoyib hikoyalar bilan kelishdi. Biz uchrashuvning ko'p qismini munozara formatida o'tkazishga muvaffaq bo'ldik, ammo muhokamalar shunchalik ko'pki, biz rejalashtirilgan mavzularning faqat uchdan bir qismiga to'xtala oldik. Biz haqiqiy ishlab chiqarish xizmatlarimiz misolida qanday va nima nazorat qilishimizga katta e'tibor qaratdik.

Menga qiziq va juda yoqdi.

- E'longa ko'ra, ikkinchi uchrashuv butunlay xatolarga chidamlilikka bag'ishlangan bo'ladi, nima uchun bu mavzuni tanladingiz?

Cassandra odatiy band taqsimlangan tizim bo'lib, foydalanuvchi so'rovlariga bevosita xizmat ko'rsatishdan tashqari juda ko'p funktsional imkoniyatlarga ega: g'iybat, nosozliklarni aniqlash, sxema o'zgarishlarini ko'paytirish, klasterni kengaytirish/kamaytirish, antientropiya, zaxira va tiklash va hk. Har qanday taqsimlangan tizimda bo'lgani kabi, apparat miqdori ortib borishi bilan, nosozliklar ehtimoli ortadi, shuning uchun Cassandra ishlab chiqarish klasterlarining ishlashi nosozliklar va operator harakatlarida xatti-harakatlarni bashorat qilish uchun uning tuzilishini chuqur tushunishni talab qiladi. Ko'p yillar davomida Cassandra foydalangandan so'ng, biz muhim tajriba to‘plagan, biz baham ko'rishga tayyormiz, shuningdek, do'kondagi hamkasblar odatiy muammolarni qanday hal qilishlarini muhokama qilishni xohlaymiz.

— Kassandra haqida gap ketganda, xatolarga chidamlilik deganda nimani tushunasiz?

Albatta, birinchi navbatda, tizimning odatiy apparat nosozliklaridan omon qolish qobiliyati: mashinalar, disklar yoki tugunlar / ma'lumotlar markazlari bilan tarmoq ulanishining yo'qolishi. Ammo mavzuning o'zi ancha kengroq bo'lib, xususan, muvaffaqiyatsizliklarni tiklashni o'z ichiga oladi, shu jumladan odamlar kamdan-kam tayyor bo'ladigan muvaffaqiyatsizliklar, masalan, operator xatolar.

— Eng yuklangan va eng katta maʼlumotlar klasteriga misol keltira olasizmi?

Eng yirik klasterlarimizdan biri sovg'a klasteridir: 200 dan ortiq tugunlar va yuzlab TB ma'lumotlar. Ammo u eng yuklangan emas, chunki u taqsimlangan kesh bilan qoplangan. Bizning eng band klasterlarimiz yozish uchun o'n minglab RPS va o'qish uchun minglab RPS bilan ishlaydi.

- Voy-buy! Biror narsa qanchalik tez-tez buziladi?

Ha doim! Hammasi bo'lib bizda 6 mingdan ortiq serverlar mavjud va har hafta bir nechta serverlar va bir necha o'nlab disklar almashtiriladi (mashinalar parkini yangilash va kengaytirishning parallel jarayonlarini hisobga olmagan holda). Har bir nosozlik turi uchun nima qilish kerakligi va qanday tartibda aniq ko'rsatmalar mavjud bo'lsa, hamma narsa imkon qadar avtomatlashtirilgan, shuning uchun nosozliklar muntazam bo'lib, 99% hollarda foydalanuvchilar tomonidan sezilmasdan sodir bo'ladi.

— Bunday rad etishlarga qanday munosabatdasiz?

Kassandra ishining boshidan va birinchi hodisalardan boshlab biz zaxira nusxalarini yaratish va ulardan tiklash mexanizmlari ustida ishladik, Cassandra klasterlarining holatini hisobga oladigan va, masalan, tugunlarni qayta ishga tushirishga yo'l qo'ymaydigan joylashtirish protseduralarini qurdik. agar ma'lumotlar yo'qolishi mumkin bo'lsa. Bularning barchasi haqida uchrashuvda gaplashishni rejalashtirganmiz.

— Aytganingizdek, mutlaqo ishonchli tizimlar mavjud emas. Siz qanday muvaffaqiyatsizliklarga tayyorlanasiz va omon qola olasiz?

Agar biz Cassandra klasterlarini o'rnatishimiz haqida gapiradigan bo'lsak, agar biz bitta DC yoki butun DCda bir nechta mashinani yo'qotsak, foydalanuvchilar hech narsani sezmaydilar (bu sodir bo'ldi). DClar sonining ko'payishi bilan biz ikkita DC ishdan chiqqan taqdirda ishlashni ta'minlashni boshlash haqida o'ylaymiz.

— Nima deb o'ylaysiz, Kassandraga xatolarga chidamlilik nuqtai nazaridan nima etishmaydi?

Kassandra, boshqa ko'plab dastlabki NoSQL do'konlari kabi, uning ichki tuzilishi va sodir bo'layotgan dinamik jarayonlarni chuqur tushunishni talab qiladi. Unda soddalik, bashorat qilish va kuzatish mumkin emas, deyman. Ammo boshqa uchrashuv ishtirokchilarining fikrlarini eshitish qiziqarli bo'ladi!

Oleg, savollarga javob berishga vaqt ajratganingiz uchun katta rahmat!

Biz 12-sentabr kuni Sankt-Peterburgdagi ofisimizda Apache Cassandra bilan ishlash bo'yicha mutaxassislar bilan muloqot qilishni xohlovchilarni kutamiz.

Keling, qiziqarli bo'ladi!

Tadbir uchun ro'yxatdan o'ting.

Manba: www.habr.com

a Izoh qo'shish