Mini-entèvyou ak Oleg Anastasyev: tolerans fòt nan Apache Cassandra

Mini-entèvyou ak Oleg Anastasyev: tolerans fòt nan Apache Cassandra

Odnoklassniki se pi gwo itilizatè Apache Cassandra sou RuNet la ak youn nan pi gwo nan mond lan. Nou te kòmanse itilize Cassandra an 2010 pou sere evalyasyon foto, e kounye a Cassandra jere petabyte done sou dè milye de nœuds, an reyalite, nou menm devlope pwòp pa nou. NewSQL baz done tranzaksyon.
Sou 12 septanm nan biwo St Petersburg nou pral kenbe dezyèm rankont dedye a Apache Cassandra. Oratè prensipal la nan evènman an pral enjenyè an chèf nan Odnoklassniki Oleg Anastasyev. Oleg se yon ekspè nan domèn sistèm distribiye ak toleran fay; li te travay ak Cassandra pou plis pase 10 ane ak plizyè fwa. te pale sou karakteristik yo ki nan lè l sèvi avèk pwodui sa a nan konferans.

Sou Ev nan reyinyon an, nou te pale ak Oleg sou tolerans nan fay nan sistèm distribiye ak Cassandra, te mande sou sa li ta pale sou nan reyinyon an ak poukisa li te vo patisipe nan evènman sa a.

Oleg te kòmanse karyè pwogram li an 1995. Li devlope lojisyèl nan bank, telecom, ak transpò. Li te travay kòm yon pwomotè dirijan nan Odnoklassniki depi 2007 nan ekip la platfòm. Responsablite li genyen ladan yo devlope achitekti ak solisyon pou sistèm gwo chaj, gwo depo done, ak rezoud pwoblèm pèfòmans pòtal ak fyab. Li fòme tou devlopè nan konpayi an.

- Oleg, alo! Nan mwa me te pran plas premye rankont, dedye a Apache Cassandra, patisipan yo di ke diskisyon yo te kontinye jouk byen ta nan mitan lannwit, tanpri di m ', ki enpresyon ou yo nan premye rankont la?

Devlopè ki gen diferan orijin nan diferan konpayi yo te vini ak pwòp doulè yo, solisyon inatandi nan pwoblèm ak istwa etonan. Nou te jere fè pi fò nan reyinyon an nan yon fòma diskisyon, men te gen anpil diskisyon ke nou te sèlman kapab manyen sou yon tyè nan sijè ki te planifye yo. Nou te peye anpil atansyon sou fason ak sa nou kontwole lè l sèvi avèk egzanp sèvis pwodiksyon reyèl nou an.

Mwen te enterese ak vrèman renmen li.

- Jije pa anons la, dezyèm rankont pral antyèman konsakre nan tolerans fòt, poukisa ou te chwazi sijè sa a?

Cassandra se yon sistèm distribye tipik okipe ak yon gwo kantite fonksyonalite pi lwen pase demann itilizatè dirèkteman sèvi: tripotay, deteksyon echèk, pwopagasyon chanjman nan chema, ekspansyon / rediksyon gwoup, anti-entropi, sovgad ak rekiperasyon, elatriye. Kòm nan nenpòt sistèm distribiye, kòm kantite pyès ki nan konpitè ogmante, chans pou echèk ogmante, kidonk operasyon an nan grap pwodiksyon Cassandra mande pou yon konpreyansyon pwofon nan estrikti li yo predi konpòtman an ka ta gen echèk ak aksyon operatè yo. Apre itilize Cassandra pou anpil ane, nou te akimile ekspètiz enpòtan, ke nou pare yo pataje, epi nou vle tou diskite sou fason kòlèg nan boutik la rezoud pwoblèm tipik.

— Lè li rive Cassandra, ki sa ou vle di pa tolerans fòt?

Premye a tout, nan kou, kapasite sistèm nan siviv echèk pyès ki nan konpitè tipik: pèt nan machin, disk oswa koneksyon rezo ak nœuds / sant done. Men, sijè a li menm se pi laj epi an patikilye gen ladan rekiperasyon nan echèk, ki gen ladan echèk pou ki moun yo raman prepare, pou egzanp, erè operatè.

— Èske w ka bay yon egzanp gwoup done ki pi chaje ak pi gwo?

Youn nan pi gwo gwoup nou yo se gwoup kado a: plis pase 200 nœuds ak dè santèn de TB done. Men, li pa pi chaje a, paske li kouvri pa yon kachèt distribye. Gwoup ki pi okipe nou yo okipe plizyè dizèn milye RPS pou ekri ak plizyè milye RPS pou lekti.

- Wow! Konbyen fwa yon bagay kraze?

Wi toutan! An total, nou gen plis pase 6 mil serveurs, ak chak semèn yon koup nan serveurs ak plizyè douzèn disk yo ranplase (san yo pa pran an kont pwosesis yo paralèl nan ajou ak ekspansyon nan flòt machin nan). Pou chak kalite echèk, gen enstriksyon klè sou sa yo dwe fè ak nan ki lòd, tout bagay se otomatize chak fwa sa posib, kidonk echèk yo se woutin ak nan 99% nan ka yo rive inapèsi pa itilizatè yo.

— Ki jan ou fè fas ak refi sa yo?

Depi nan konmansman an nan operasyon Cassandra ak premye ensidan yo, nou te travay sou mekanis yo pou sovgad ak rekiperasyon nan men yo, bati pwosedi deplwaman ki pran an kont eta a nan grap Cassandra epi, pou egzanp, pa pèmèt nœuds yo dwe rekòmanse. si pèt done posib. Nou planifye pou pale sou tout bagay sa yo nan reyinyon an.

— Kòm ou te di, pa gen okenn sistèm absoliman serye. Pou ki kalite echèk ou prepare epi ou kapab siviv?

Si nou pale sou enstalasyon nou yo nan grap Cassandra, itilizatè yo pa pral remake anyen si nou pèdi plizyè machin nan yon sèl DC oswa yon sèl DC antye (sa a te rive). Avèk ogmantasyon nan kantite DC, nou ap panse sou kòmanse asire operasyon an nan evènman an nan yon echèk nan de DC.

— Kisa ou panse Cassandra manke an tèm de tolerans fòt?

Cassandra, tankou anpil lòt magazen NoSQL bonè, mande pou yon konpreyansyon pwofon sou estrikti entèn li yo ak pwosesis dinamik k ap fèt. Mwen ta di ke li manke senplisite, previzibilite ak obsèvabilite. Men, li pral enteresan pou tande opinyon lòt patisipan reyinyon yo!

Oleg, mèsi anpil paske w te pran tan pou w reponn kesyon yo!

N ap tann tout moun ki vle kominike ak ekspè nan domèn opere Apache Cassandra nan rankont 12 septanm nan biwo St Petersburg.

Vini non, li pral enteresan!

Enskri pou evènman an.

Sous: www.habr.com

Add nouvo kòmantè