Mini-interview kay Oleg Anastasyev: fault tolerance sa Apache Cassandra

Mini-interview kay Oleg Anastasyev: fault tolerance sa Apache Cassandra

Ang Odnoklassniki mao ang pinakadako nga tiggamit sa Apache Cassandra sa RuNet ug usa sa pinakadako sa kalibutan. Nagsugod kami sa paggamit sa Cassandra kaniadtong 2010 sa pagtipig sa mga rating sa litrato, ug karon si Cassandra nagdumala sa mga petabytes sa datos sa libu-libo nga mga node, sa tinuud, nakahimo pa kami sa among kaugalingon. NewSQL transactional database.
Sa Septiyembre 12 sa among opisina sa St. Petersburg among ipahigayon ikaduhang meetup nga gipahinungod sa Apache Cassandra. Ang panguna nga mamumulong sa kalihokan mao ang punoan nga inhenyero sa Odnoklassniki Oleg Anastasyev. Si Oleg usa ka eksperto sa natad sa gipang-apod-apod ug fault-tolerant nga mga sistema; nagtrabaho siya uban ni Cassandra sobra sa 10 ka tuig ug balik-balik naghisgot bahin sa mga bahin sa paggamit niini nga produkto sa mga komperensya.

Sa bisperas sa meetup, nakigsulti kami ni Oleg mahitungod sa fault tolerance sa gipang-apod-apod nga mga sistema uban ni Cassandra, nangutana kung unsa ang iyang hisgutan sa miting ug ngano nga takus ang pagtambong niini nga kalihokan.

Gisugdan ni Oleg ang iyang karera sa programming kaniadtong 1995. Naghimo siya og software sa banking, telecom, ug transport. Nagtrabaho siya isip usa ka nanguna nga developer sa Odnoklassniki sukad sa 2007 sa platform team. Ang iyang mga responsibilidad naglakip sa pagpalambo sa mga arkitektura ug mga solusyon alang sa mga high-load nga sistema, dagkong mga bodega sa datos, ug pagsulbad sa mga problema sa performance sa portal ug kasaligan. Gibansay usab niya ang mga developer sa sulod sa kompanya.

- Oleg, hello! Sa Mayo nahitabo unang panagkita, nga gipahinungod sa Apache Cassandra, ang mga partisipante nag-ingon nga ang mga diskusyon nagpadayon hangtod sa lawom nga gabii, palihug sultihi ako, unsa ang imong mga impresyon sa una nga panagkita?

Ang mga nag-develop nga adunay lainlaing mga kagikan gikan sa lainlaing mga kompanya nag-uban sa ilang kaugalingon nga kasakit, wala damha nga mga solusyon sa mga problema ug katingalahang mga istorya. Kami nakahimo sa pagpahigayon sa kadaghanan sa meetup sa usa ka diskusyon format, apan adunay daghan kaayo nga mga diskusyon nga kami makahimo lamang sa paghikap sa ikatulo nga bahin sa giplano nga mga hilisgutan. Gihatagan namon og daghang pagtagad kung giunsa ug unsa ang among gibantayan gamit ang panig-ingnan sa among tinuud nga serbisyo sa produksiyon.

Interesado ko ug ganahan kaayo ko.

- Paghukom pinaagi sa pahibalo, ikaduhang panagkita bug-os nga ipahinungod sa pag-antos sa sayup, nganong gipili nimo kini nga hilisgutan?

Ang Cassandra usa ka kasagaran nga busy nga gipang-apod-apod nga sistema nga adunay daghang mga gamit nga labaw sa direkta nga pagserbisyo sa mga hangyo sa gumagamit: tsismis, pagtuki sa kapakyasan, pagpadaghan sa mga pagbag-o sa schema, pagpalapad / pagkunhod sa cluster, anti-entropy, pag-backup ug pagbawi, ug uban pa. Sama sa bisan unsang giapod-apod nga sistema, samtang ang gidaghanon sa hardware nagdugang, ang posibilidad sa mga kapakyasan nagdugang, mao nga ang operasyon sa Cassandra production clusters nanginahanglan usa ka lawom nga pagsabut sa istruktura niini aron matagna ang pamatasan kung adunay mga kapakyasan ug aksyon sa operator. Human sa paggamit sa Cassandra sa daghang mga tuig, kami adunay natigom nga mahinungdanong kahanas, nga andam namong ipaambit, ug gusto usab namo nga hisgutan kung giunsa pagsulbad sa mga kauban sa shop ang kasagarang mga problema.

— Kon bahin kang Cassandra, unsay imong gipasabot sa fault tolerance?

Una sa tanan, siyempre, ang abilidad sa sistema nga mabuhi sa kasagaran nga mga kapakyasan sa hardware: pagkawala sa mga makina, mga disk o koneksyon sa network nga adunay mga node / data center. Apan ang hilisgutan mismo mas lapad ug sa partikular naglakip sa pagbawi gikan sa mga kapakyasan, lakip na ang mga kapakyasan diin ang mga tawo panagsa ra andam, pananglitan, mga sayup sa operator.

— Makahatag ka ba usa ka pananglitan sa labing puno ug pinakadako nga cluster sa datos?

Usa sa among pinakadako nga cluster mao ang gift cluster: labaw pa sa 200 node ug gatusan ka TB nga data. Apan dili kini ang labing puno, tungod kay kini gitabonan sa usa ka giapod-apod nga cache. Ang among pinakabusy nga mga pungpong nagdumala sa napulo ka libo nga RPS alang sa pagsulat ug liboan ka RPS alang sa pagbasa.

- Wow! Unsa ka sagad maguba ang usa ka butang?

Oo sa tanang panahon! Sa kinatibuk-an, kami adunay labaw pa sa 6 ka libo nga mga server, ug matag semana usa ka magtiayon nga mga server ug pipila ka dosena nga mga disk ang gipulihan (nga wala gikonsiderar ang managsama nga mga proseso sa pag-upgrade ug pagpalapad sa armada sa makina). Alang sa matag matang sa kapakyasan, adunay tin-aw nga mga panudlo kung unsa ang buhaton ug sa unsang pagkasunud-sunod, ang tanan awtomatiko kung mahimo, busa ang mga kapakyasan naandan ug sa 99% sa mga kaso nahitabo nga wala mamatikdan sa mga tiggamit.

— Giunsa nimo pag-atubang ang ingon nga mga pagdumili?

Gikan sa sinugdanan sa operasyon ni Cassandra ug sa unang mga insidente, nagtrabaho kami sa mga mekanismo alang sa pag-backup ug pagbawi gikan kanila, nagtukod og mga pamaagi sa pag-deploy nga naghunahuna sa kahimtang sa Cassandra clusters ug, pananglitan, dili tugotan ang mga node nga ma-restart. kung mahimo ang pagkawala sa datos. Nagplano kami nga hisgutan kining tanan sa miting.

— Sama sa imong giingon, wala’y hingpit nga kasaligan nga mga sistema. Unsa nga mga matang sa mga kapakyasan ang imong giandam ug mahimo nga mabuhi?

Kung maghisgot kami bahin sa among mga pag-install sa mga pungpong sa Cassandra, ang mga tiggamit dili makamatikod bisan unsa kung mawad-an kami daghang mga makina sa usa ka DC o usa ka tibuuk nga DC (nahitabo kini). Uban sa pagdugang sa gidaghanon sa mga DC, kami naghunahuna mahitungod sa pagsugod sa pagsiguro sa operability sa panghitabo sa usa ka kapakyasan sa duha ka DCs.

— Unsa sa imong hunahuna ang kulang ni Cassandra bahin sa pagtugot sa sayup?

Ang Cassandra, sama sa daghang uban pang sayo nga mga tindahan sa NoSQL, nanginahanglan usa ka lawom nga pagsabut sa internal nga istruktura niini ug ang mga dinamikong proseso nga nahitabo. Moingon ko nga kini kulang sa kayano, predictability ug observability. Apan makapainteres nga madungog ang mga opinyon sa ubang mga partisipante sa miting!

Oleg, salamat kaayo sa paggahin ug oras sa pagtubag sa mga pangutana!

Naghulat kami alang sa tanan nga gusto nga makigsulti sa mga eksperto sa natad sa pag-operate sa Apache Cassandra sa miting kaniadtong Setyembre 12 sa among opisina sa St.

Dali, kini mahimong makapaikag!

Pagrehistro alang sa kalihokan.

Source: www.habr.com

Idugang sa usa ka comment