Cyfweliad bach gydag Oleg Anastasyev: goddef diffygion yn Apache Cassandra

Cyfweliad bach gydag Oleg Anastasyev: goddef diffygion yn Apache Cassandra

Odnoklassniki yw defnyddiwr mwyaf Apache Cassandra ar y RuNet ac un o'r rhai mwyaf yn y byd. Dechreuon ni ddefnyddio Cassandra yn 2010 i storio graddfeydd lluniau, a nawr mae Cassandra yn rheoli petabytes o ddata ar filoedd o nodau, mewn gwirionedd, fe wnaethon ni hyd yn oed ddatblygu ein rhai ein hunain. Cronfa ddata trafodion NewSQL.
Ar Fedi 12 yn ein swyddfa St Petersburg byddwn yn cynnal ail gyfarfod ymroddedig i Apache Cassandra. Prif siaradwr y digwyddiad fydd prif beiriannydd Odnoklassniki Oleg Anastasyev. Mae Oleg yn arbenigwr ym maes systemau gwasgaredig sy'n gallu goddef diffygion; mae wedi bod yn gweithio gyda Cassandra ers dros 10 mlynedd a dro ar ôl tro. siarad am nodweddion defnyddio'r cynnyrch hwn mewn cynadleddau.

Ar drothwy'r cyfarfod, buom yn siarad ag Oleg am oddefgarwch bai systemau gwasgaredig gyda Cassandra, gofynnodd beth fyddai'n siarad amdano yn y cyfarfod a pham ei bod yn werth mynychu'r digwyddiad hwn.

Dechreuodd Oleg ei yrfa raglennu yn ôl yn 1995. Datblygodd feddalwedd mewn bancio, telathrebu a thrafnidiaeth. Mae wedi bod yn gweithio fel datblygwr blaenllaw yn Odnoklassniki ers 2007 ar y tîm platfform. Mae ei gyfrifoldebau'n cynnwys datblygu pensaernïaeth ac atebion ar gyfer systemau llwyth uchel, warysau data mawr, a datrys problemau perfformiad porth a dibynadwyedd. Mae hefyd yn hyfforddi datblygwyr o fewn y cwmni.

- Oleg, helo! Ym mis Mai cymerodd Mr cyfarfod cyntaf, Yn ymroddedig i Apache Cassandra, mae'r cyfranogwyr yn dweud bod trafodaethau wedi mynd ymlaen tan yn hwyr yn y nos, dywedwch wrthyf, beth yw eich argraffiadau o'r cyfarfod cyntaf?

Daeth datblygwyr o wahanol gefndiroedd o wahanol gwmnïau gyda'u poen eu hunain, atebion annisgwyl i broblemau a straeon anhygoel. Llwyddwyd i gynnal y rhan fwyaf o’r cyfarfod ar ffurf trafodaeth, ond cafwyd cymaint o drafodaethau fel mai dim ond traean o’r pynciau a gynlluniwyd y bu modd inni gyffwrdd â nhw. Fe wnaethon ni dalu llawer o sylw i sut a beth rydyn ni'n ei fonitro gan ddefnyddio enghraifft ein gwasanaethau cynhyrchu go iawn.

Roedd gen i ddiddordeb ac yn ei hoffi yn fawr.

- A barnu yn ôl y cyhoeddiad, ail gyfarfod Bydd yn gwbl ymroddedig i goddefgarwch bai, pam wnaethoch chi ddewis y pwnc hwn?

Mae Cassandra yn system ddosbarthedig brysur nodweddiadol gyda llawer iawn o ymarferoldeb y tu hwnt i wasanaethu ceisiadau defnyddwyr yn uniongyrchol: clecs, canfod methiant, lluosogi newidiadau sgema, ehangu / crebachu clwstwr, gwrth-entropi, copïau wrth gefn ac adferiad, ac ati. Fel mewn unrhyw system ddosbarthedig, wrth i faint o galedwedd gynyddu, mae'r tebygolrwydd o fethiannau yn cynyddu, felly mae gweithrediad clystyrau cynhyrchu Cassandra yn gofyn am ddealltwriaeth ddwfn o'i strwythur i ragfynegi ymddygiad rhag ofn methiannau a gweithredoedd gweithredwr. Ar ôl defnyddio Cassandra am flynyddoedd lawer, rydym ni wedi cronni arbenigedd sylweddol, yr ydym yn barod i'w rannu, ac rydym hefyd am drafod sut mae cydweithwyr yn y siop yn datrys problemau nodweddiadol.

— O ran Cassandra, beth a olygwch wrth oddef bai?

Yn gyntaf oll, wrth gwrs, gallu'r system i oroesi methiannau caledwedd nodweddiadol: colli peiriannau, disgiau neu gysylltedd rhwydwaith â nodau / canolfannau data. Ond mae'r pwnc ei hun yn llawer ehangach ac yn arbennig mae'n cynnwys adferiad o fethiannau, gan gynnwys methiannau y mae pobl yn aml yn barod ar eu cyfer, er enghraifft, gwallau gweithredwr.

— A allwch chi roi enghraifft o'r clwstwr data mwyaf llwythedig a mwyaf?

Un o'n clystyrau mwyaf yw'r clwstwr rhoddion: mwy na 200 o nodau a channoedd o TB o ddata. Ond nid dyma'r un sydd wedi'i lwytho fwyaf, gan ei fod wedi'i orchuddio â storfa ddosbarthedig. Mae ein clystyrau prysuraf yn trin degau o filoedd o RPS ar gyfer ysgrifennu a miloedd o RPS ar gyfer darllen.

- Waw! Pa mor aml mae rhywbeth yn torri?

Ydy drwy'r amser! Yn gyfan gwbl, mae gennym fwy na 6 mil o weinyddion, a phob wythnos mae cwpl o weinyddion a sawl dwsin o ddisgiau yn cael eu disodli (heb ystyried y prosesau cyfochrog o uwchraddio ac ehangu fflyd y peiriant). Ar gyfer pob math o fethiant, mae cyfarwyddiadau clir ar beth i'w wneud ac ym mha drefn, mae popeth yn awtomataidd pryd bynnag y bo modd, felly mae methiannau yn arferol ac mewn 99% o achosion yn digwydd heb i ddefnyddwyr sylwi arnynt.

— Sut ydych chi'n delio â gwrthodiadau o'r fath?

O ddechrau gweithrediad Cassandra a'r digwyddiadau cyntaf, buom yn gweithio ar y mecanweithiau ar gyfer copïau wrth gefn ac adfer ohonynt, wedi adeiladu gweithdrefnau lleoli sy'n ystyried cyflwr clystyrau Cassandra ac, er enghraifft, nad ydynt yn caniatáu ailgychwyn nodau os yw'n bosibl colli data. Rydyn ni'n bwriadu siarad am hyn i gyd yn y cyfarfod.

— Fel y dywedasoch, nid oes unrhyw systemau cwbl ddibynadwy. Pa fathau o fethiannau ydych chi'n paratoi ar eu cyfer ac yn gallu goroesi?

Os byddwn yn siarad am ein gosodiadau o glystyrau Cassandra, ni fydd defnyddwyr yn sylwi ar unrhyw beth os byddwn yn colli nifer o beiriannau mewn un DC neu un DC cyfan (mae hyn wedi digwydd). Gyda'r cynnydd yn nifer y DCs, rydym yn ystyried dechrau sicrhau gweithrediad os bydd dau DC yn methu.

— Beth ydych chi'n meddwl sydd gan Cassandra o ran goddef diffygion?

Mae Cassandra, fel llawer o siopau NoSQL cynnar eraill, yn gofyn am ddealltwriaeth ddofn o'i strwythur mewnol a'r prosesau deinamig sy'n digwydd. Byddwn yn dweud ei fod yn brin o symlrwydd, rhagweladwyedd ac arsylwi. Ond bydd yn ddiddorol clywed barn cyfranogwyr eraill y cyfarfod!

Oleg, diolch yn fawr iawn am gymryd yr amser i ateb y cwestiynau!

Rydym yn aros i bawb sydd am gyfathrebu ag arbenigwyr ym maes gweithredu Apache Cassandra yn y cyfarfod ar Fedi 12 yn ein swyddfa yn St Petersburg.

Dewch, bydd yn ddiddorol!

Cofrestrwch ar gyfer y digwyddiad.

Ffynhonnell: hab.com

Ychwanegu sylw