Mini-Interview mam Oleg Anastasyev: Feeler Toleranz an Apache Cassandra

Mini-Interview mam Oleg Anastasyev: Feeler Toleranz an Apache Cassandra

Odnoklassniki ass de gréisste Benotzer vun Apache Cassandra um RuNet an ee vun de gréissten op der Welt. Mir hunn ugefaang Cassandra am Joer 2010 ze benotzen fir Fotobewäertungen ze späicheren, an elo geréiert d'Cassandra Petabytes vun Daten op Dausende vun Noden, tatsächlech hu mir souguer eis eegen entwéckelt NewSQL Transaktiounsdatenbank.
Den 12. September an eisem Sankt Petersburg Büro halen mir zweet Meetup gewidmet dem Apache Cassandra. Den Haaptspeaker vum Event wäert de Chefingenieur vun Odnoklassniki Oleg Anastasyev sinn. Oleg ass en Expert am Beräich vun verdeelt a Feeler-tolerant Systemer; hien schafft mat Cassandra fir méi wéi 10 Joer an ëmmer erëm iwwer d'Features vun dësem Produkt op Konferenzen geschwat.

Um Virowend vum Meetup hu mir mam Oleg iwwer d'Feeltoleranz vu verdeelt Systemer mat Cassandra geschwat, gefrot wat hien op der Meetup schwätzt a firwat et derwäert wier dëst Evenement deelzehuelen.

Oleg huet seng programméiere Carrière zréck an 1995. Hien huet Software am Banken, Telekom an Transport entwéckelt. Hie schafft als féierende Entwéckler bei Odnoklassniki zënter 2007 op der Plattform Team. Seng Verantwortung beinhalt d'Entwécklung vun Architekturen a Léisunge fir High-load Systemer, grouss Datelager, an d'Léisung vu Probleemer vu Portalleistung an Zouverlässegkeet. Hien trainéiert och Entwéckler an der Firma.

- Oleg, Moien! Am Mee stattfonnt éischt Meetup, dem Apache Cassandra gewidmet, d'Participanten soen datt d'Diskussiounen bis spéit an der Nuecht weidergaange sinn, sot mir w.e.g., wat sinn Är Impressiounen vum éischte Meetup?

Entwéckler mat verschiddenen Hannergrënn aus verschiddene Firmen koumen mat hiren eegene Péng, onerwaart Léisunge fir Problemer an erstaunlech Geschichten. Mir hunn et fäerdeg bruecht de gréissten Deel vun der Meetup an engem Diskussiounsformat ze féieren, awer et goufe sou vill Diskussiounen, datt mir nëmmen en Drëttel vun de geplangten Themen konnte beréieren. Mir hu vill Opmierksamkeet bezuelt wéi a wat mir iwwerwaachen mam Beispill vun eise richtege Produktiounsservicer.

Ech war interesséiert an huet et wierklech gär.

- No der Ukënnegung beurteelen, zweete Meetup wäert ganz op Feeler Toleranz gewidmet sinn, firwat hutt Dir dëst Thema gewielt?

Cassandra ass en typesche beschäftegt verdeelt System mat enger enormer Quantitéit u Funktionalitéit doriwwer eraus direkt Benotzer Ufroen ze servéieren: Klatsch, Versoenerkennung, Verbreedung vu Schema Ännerungen, Cluster Expansioun / Reduktioun, Anti-Entropie, Backups an Erhuelung, etc. Wéi an all verdeelt System, wéi d'Quantitéit vun der Hardware eropgeet, erhéicht d'Wahrscheinlechkeet vu Feeler, sou datt d'Operatioun vu Cassandra Produktiounscluster en déiwe Verständnis vu senger Struktur erfuerdert fir Verhalen am Fall vu Feeler a Bedreiweraktiounen virauszesoen. Nodeems mir Cassandra fir vill Jore benotzt hunn, hu mir bedeitend Expertise gesammelt hunn, déi mir bereet sinn ze deelen, a mir wëllen och diskutéieren wéi d'Kollegen am Buttek typesch Problemer léisen.

- Wann et ëm d'Cassandra geet, wat mengt Dir mat Fehltoleranz?

Éischtens, natierlech, d'Fäegkeet vum System fir typesch Hardwarefehler ze iwwerliewen: Verloscht vu Maschinnen, Disken oder Netzwierkverbindung mat Noden / Datenzenteren. Awer d'Thema selwer ass vill méi breet a besonnesch enthält d'Erhuelung vu Feeler, och Feeler, op déi d'Leit selten virbereet sinn, zum Beispill Bedreiwerfehler.

- Kënnt Dir e Beispill vum meescht geluedenen a gréissten Datecluster ginn?

Ee vun eise gréisste Stärekéip ass de Kaddo-Cluster: méi wéi 200 Wirbelen an Honnerte vun TB vun Daten. Awer et ass net déi meescht gelueden, well et ass vun engem verdeelt Cache bedeckt. Eis beschäftegt Cluster handhaben Zéngdausende vu RPS fir ze schreiwen an Dausende vu RPS fir ze liesen.

- Wow! Wéi oft brécht eppes?

Jo déi ganzen Zäit! Am Ganzen hu mir méi wéi 6 dausend Serveren, an all Woch ginn e puer Serveren an e puer Dosen Disken ersat (ouni d'Parallelprozesser vum Upgrade an Expansioun vun der Maschinneflotte berücksichtegt). Fir all Typ vu Feeler ginn et kloer Instruktioune wat ze maachen an a wéi enger Reiefolleg, alles gëtt automatiséiert wann et méiglech ass, sou datt d'Feeler routinéiert sinn an an 99% vun de Fäll onnotéiert vun de Benotzer geschéien.

- Wéi gitt Dir mat esou Refusen ëm?

Vun Ufank un vun der Operatioun vu Cassandra an den éischten Tëschefäll hu mir un de Mechanismen fir Backups an Erhuelung vun hinnen geschafft, Deploymentprozeduren gebaut, déi den Zoustand vu Cassandra-Cluster berücksichtegen an zum Beispill net erlaben datt d'Noden nei gestart ginn. wann Dateverloscht méiglech ass. Mir plangen iwwer all dëst um Meetup ze schwätzen.

- Wéi Dir sot, et gëtt keng absolut zouverlässeg Systemer. Op wéi eng Aarte vu Feeler preparéiert Dir Iech a sidd fäeg ze handhaben?

Wa mir iwwer eis Installatiounen vu Cassandra Cluster schwätzen, wäerten d'Benotzer näischt bemierken wa mir e puer Maschinnen an engem DC oder engem ganzen DC verléieren (dëst ass geschitt). Mat der Erhéijung vun der Unzuel vun DCen, denken mir drun unzefänken d'Operabilitéit ze garantéieren am Fall vun engem Ausfall vun zwee DCs.

- Wat mengt Dir feelt dem Cassandra a Saache Feelertoleranz?

Cassandra, wéi vill aner fréi NoSQL Geschäfter, erfuerdert en déif Verständnis vu senger interner Struktur an déi dynamesch Prozesser déi optrieden. Ech géif soen datt et Simplicitéit, Prévisibilitéit an Observabilitéit feelt. Awer et wäert interessant sinn d'Meenungen vun anere Versammlungsparticipanten ze héieren!

Oleg, villmools Merci fir d'Zäit ze huelen fir d'Froen ze beäntweren!

Mir waarden op jiddereen, deen mat Experten am Beräich vun der Operatioun Apache Cassandra op der Meetup den 12. September an eisem St.

Kommt, et wäert interessant sinn!

Aschreiwen fir d'Evenement.

Source: will.com

Setzt e Commentaire