Kif tiflaħ tagħbijiet akbar fuq is-sistema: nitkellmu dwar preparazzjonijiet fuq skala kbira għall-Ġimgħa l-Iswed

Ħej Habr!

Fl-2017, matul il-Ġimgħa l-Iswed, it-tagħbija żdiedet bi kważi darba u nofs, u s-servers tagħna kienu fil-limitu tagħhom. Matul is-sena, in-numru ta 'klijenti kiber b'mod sinifikanti, u deher ċar li mingħajr preparazzjoni preliminari bir-reqqa, il-pjattaforma tista' sempliċement ma tiflaħx it-tagħbijiet tal-2018.

Stabbilijna l-aktar mira ambizzjuża possibbli: ridna nkunu ppreparati bis-sħiħ għal kwalunkwe żieda qawwija ta’ attività, anke l-aktar qawwija, u bdejna nniedu kapaċitajiet ġodda minn qabel matul is-sena.

CTO tagħna Andrey Chizh (chizh_andrey) jirrakkonta kif ħejjejna għall-Black Friday 2018, liema miżuri ħadna biex nevitaw il-waqgħat, u, ovvjament, ir-riżultati ta 'preparazzjoni bir-reqqa bħal din.

Kif tiflaħ tagħbijiet akbar fuq is-sistema: nitkellmu dwar preparazzjonijiet fuq skala kbira għall-Ġimgħa l-Iswed

Illum irrid nitkellem dwar it-tħejjijiet għall-Black Friday 2018. Għaliex issa, meta l-biċċa l-kbira tal-bejgħ ewlieni qiegħed warajna? Bdejna nippreparaw madwar sena qabel avvenimenti fuq skala kbira, u bi prova u żball sibna l-aħjar soluzzjoni. Nirrakkomandaw li tieħu ħsieb l-istaġuni sħan bil-quddiem u tipprevjeni scams li jistgħu joħorġu fl-iktar mument inopportun.
Il-materjal se jkun utli għal kull min irid jagħfas il-profitt massimu minn ħażniet bħal dawn, għaliex In-naħa teknika tal-kwistjoni mhix inferjuri għan-naħa tal-kummerċjalizzazzjoni hawn.

Karatteristiċi tat-traffiku fil-bejgħ kbir

Kuntrarjament għat-twemmin popolari, il-Ġimgħa l-Iswed mhix biss ġurnata waħda fis-sena, iżda kważi ġimgħa sħiħa: l-ewwel offerti ta 'skont jaslu 7-8 ijiem qabel il-bejgħ. It-traffiku tal-websajt jibda jikber bla xkiel matul il-ġimgħa, jilħaq il-quċċata tiegħu nhar il-Ġimgħa u jonqos pjuttost drastikament is-Sibt għal-livelli regolari tal-maħżen.

Kif tiflaħ tagħbijiet akbar fuq is-sistema: nitkellmu dwar preparazzjonijiet fuq skala kbira għall-Ġimgħa l-Iswed

Dan huwa importanti li jiġi kkunsidrat: il-ħwienet onlajn isiru speċjalment sensittivi għal kwalunkwe "tnaqqis" fis-sistema. Barra minn hekk, il-linja tagħna ta 'newsletter bl-email esperjenzat ukoll żieda sinifikanti fin-numru ta' sottomissjonijiet.

Huwa strateġikament importanti għalina li ngħaddu mill-Black Friday mingħajr ħabtiet, għax... L-iktar funzjonalità importanti ta’ websajts u newsletters tal-ħwienet tiddependi fuq l-operat tal-pjattaforma, jiġifieri:

  • It-traċċar u l-ħruġ ta' rakkomandazzjonijiet tal-prodotti,
  • Ħruġ ta' materjali relatati (pereżempju, immaġini tad-disinn ta' blokki ta' rakkomandazzjoni, bħal vleġeġ, logos, ikoni u elementi viżwali oħra),
  • Nipprovdu immaġini tal-prodott tad-daqs meħtieġ (għal dawn il-finijiet għandna "ImageResizer" - sottosistema li tniżżel immaġni mis-server tal-maħżen, tikkompressaha għad-daqs meħtieġ u, permezz ta 'servers ta' caching, tipproduċi immaġini tad-daqs meħtieġ għal kull prodott f' kull blokk ta’ rakkomandazzjoni).

Fil-fatt, matul il-Black Friday 2019, it-tagħbija fuq is-servizz żdiedet b’40%, i.e. in-numru ta 'avvenimenti li s-sistema Rocket bl-imnut issegwi u tipproċessa fuq siti tal-ħwienet onlajn żdied minn 5 għal 8 elf talba kull sekonda. Minħabba l-fatt li konna qed nippreparaw għal tagħbijiet aktar serji, bqajna ħajja bħal din faċilment.

Kif tiflaħ tagħbijiet akbar fuq is-sistema: nitkellmu dwar preparazzjonijiet fuq skala kbira għall-Ġimgħa l-Iswed

Taħriġ ġenerali

Il-Ġimgħa l-Iswed hija żmien impenjattiv għall-bejgħ bl-imnut u l-kummerċ elettroniku kollu b'mod partikolari. In-numru ta 'utenti u l-attività tagħhom f'dan iż-żmien qed jikber b'mod sinifikanti, għalhekk aħna, bħal dejjem, ippreparajna sewwa għal dan iż-żmien impenjattiv. Ejja nżidu hawn il-fatt li għandna ħafna ħwienet online konnessi mhux biss fir-Russja, iżda wkoll fl-Ewropa, fejn l-eċċitament huwa ħafna ogħla, u jkollna livell ta 'passjoni agħar mis-serje Brażiljana. X'għandu jsir biex tkun ippreparat bis-sħiħ għal tagħbijiet miżjuda?

Ħidma ma 'servers

L-ewwel, kien meħtieġ li nsiru nafu x'neħtieġu eżattament biex inżidu l-qawwa tas-server. Diġà f'Awwissu, bdejna nordnaw servers ġodda speċifikament għall-Black Friday - b'kollox żidna 10 magni addizzjonali. Sa Novembru kienu kompletament fil-ġlieda.

Fl-istess ħin, xi wħud mill-magni tal-bini ġew installati mill-ġdid għall-użu bħala servers tal-Applikazzjoni. Immedjatament ħejjejna biex jużaw funzjonijiet differenti: kemm għall-ħruġ ta’ rakkomandazzjonijiet kif ukoll għas-servizz ImageResizer, sabiex, skont it-tip ta’ tagħbija, kull wieħed minnhom ikun jista’ jintuża għal wieħed minn dawn ir-rwoli. Fil-modalità normali, is-servers ta 'Applikazzjoni u ImageResizer għandhom funzjonijiet definiti b'mod ċar: l-ewwel joħorġu rakkomandazzjonijiet, l-aħħar jipprovdu stampi għal ittri u blokki ta' rakkomandazzjoni fuq websajts ta 'xiri onlajn. Bi tħejjija għall-Black Friday, ġie deċiż li jsiru s-servers kollha bi skop doppju sabiex jiġi bilanċjat it-traffiku bejniethom skont it-tip ta’ tniżżil.

Imbagħad żidna żewġ servers kbar għal Kafka (Apache Kafka) u ltqajna raggruppament ta '5 magni qawwija. Sfortunatament, kollox ma marx bla xkiel kif nixtiequ: matul il-proċess ta 'sinkronizzazzjoni tad-dejta, żewġ magni ġodda okkupaw il-wisa' kollu tal-kanal tan-netwerk, u kellna nifhmu b'mod urġenti kif inwettqu l-proċess ta 'żieda malajr u b'mod sikur għall- infrastruttura kollha. Biex isolvu din il-kwistjoni, l-amministraturi tagħna kellhom jissagrifikaw bil-qalb il-weekends tagħhom.

Ħidma bid-dejta

Minbarra s-servers, iddeċidejna li nottimizzaw il-fajls biex inħaffu t-tagħbija u pass kbir għalina kien it-traduzzjoni ta 'fajls statiċi. Il-fajls statiċi kollha li qabel kienu ospitati fuq servers ġew imċaqalqa għal S3 + Cloudfront. Ilna rridu nagħmlu dan għal żmien twil, peress li t-tagħbija fuq is-server kienet qrib il-valuri tal-limitu, u issa nħolqot opportunità kbira.

Ġimgħa qabel il-Ġimgħa l-Iswed, żidna l-ħin tal-caching tal-immaġni għal 3 ijiem, sabiex jekk ImageResizer iġġarraf, immaġini preċedentement cache jiġu rkuprati mis-cdn. Naqqas ukoll it-tagħbija fuq is-servers tagħna, peress li iktar ma tkun maħżuna l-immaġni, inqas spiss ikollna bżonn nonfqu r-riżorsi fuq id-daqs.

U l-aħħar iżda mhux l-inqas: 5 ijiem qabel il-Ġimgħa l-Iswed, tħabbar moratorju fuq l-iskjerament ta 'kwalunkwe funzjonalità ġdida, kif ukoll fuq kwalunkwe xogħol bl-infrastruttura - l-attenzjoni kollha hija mmirata biex tlaħħaq ma' tagħbijiet miżjuda.

Pjanijiet biex jirrispondu għal sitwazzjonijiet diffiċli

Ma jimpurtax kemm tkun ta 'kwalità għolja l-preparazzjoni, il-fakaps huma dejjem possibbli. U żviluppajna 3 pjanijiet ta' rispons għal sitwazzjonijiet kritiċi possibbli:

  • tnaqqis fit-tagħbija,
  • tiddiżattiva xi servizzi,
  • għeluq sħiħ tas-servizz.

Pjan A: Naqqas it-tagħbija. Kellu jiġi attivat jekk, minħabba żieda fit-tagħbija, is-servers tagħna marru lil hinn mill-ħinijiet ta 'rispons aċċettabbli. F'dan il-każ, ħejjejna mekkaniżmi biex inaqqas it-tagħbija gradwalment billi naqleb parti mit-traffiku għal servers ta 'Amazon, li sempliċement iwieġbu għat-talbiet kollha b'"200 OK" u jagħtu tweġiba vojta. Fhimna li din kienet degradazzjoni tal-kwalità tas-servizz, iżda l-għażla bejn il-fatt li s-servizz ma jaħdem xejn jew ma juri rakkomandazzjonijiet għal madwar 10% tat-traffiku hija ovvja.

Pjan B: Iddiżattiva s-servizzi. Degradazzjoni parzjali implikata tas-servizz. Pereżempju, it-tnaqqis tal-veloċità tal-kalkolu tar-rakkomandazzjonijiet personali sabiex jinħatt xi databases u kanali ta 'komunikazzjoni. Fil-modalità normali, ir-rakkomandazzjonijiet huma kkalkulati f'ħin reali, u joħolqu verżjoni differenti tal-ħanut online għal kull viżitatur, iżda taħt kundizzjonijiet ta 'tagħbija akbar, it-tnaqqis tal-veloċità jippermetti li servizzi ewlenin oħra jkomplu jaħdmu.

Pjan Ċ: fil-każ ta 'Armageddon. Jekk isseħħ falliment sħiħ tas-sistema, ħejjejna pjan li jippermettilna li nkunu skonnettjati b'mod sikur mill-klijenti tagħna. Ix-xerrejja tal-maħżen sempliċement jieqfu milli jaraw ir-rakkomandazzjonijiet il-prestazzjoni tal-ħanut online ma jsofru bl-ebda mod. Biex nagħmlu dan, ikollna rrisettja l-fajl tal-integrazzjoni tagħna sabiex utenti ġodda jieqfu jinteraġixxu mas-servizz. Jiġifieri, aħna tiddiżattiva l-kodiċi ta 'traċċar ewlieni tagħna, is-servizz jieqaf jiġbor id-dejta u jikkalkula r-rakkomandazzjonijiet, u l-utent sempliċement jara paġna mingħajr blokki ta' rakkomandazzjoni. Għal dawk kollha li qabel irċevew fajl ta 'integrazzjoni, ipprovdejna l-għażla li jaqilbu r-rekord DNS għal Amazon u l-200 OK stub.

Riżultati ta '

Immaniġġajna t-tagħbija kollha anki mingħajr il-ħtieġa li nużaw magni addizzjonali tal-bini. U grazzi għall-preparazzjoni bil-quddiem, ma kellna bżonn l-ebda pjan ta 'rispons żviluppat. Iżda x-xogħol kollu li jsir huwa esperjenza imprezzabbli li tgħinna nkampaw mal-aktar influssi ta’ traffiku mhux mistennija u kbar.
Bħal fl-2017, it-tagħbija fuq is-servizz żdiedet b'40%, u n-numru ta 'utenti fil-ħwienet onlajn żdied b'60% fil-Ġimgħa l-Iswed. Id-diffikultajiet u l-iżbalji kollha seħħew matul il-perjodu preparatorju, li salvaw lilna u lill-klijenti tagħna minn sitwazzjonijiet mhux previsti.

Kif qed tlaħħaq mal-Black Friday? Kif tipprepara għal tagħbijiet kritiċi?

Sors: www.habr.com

Żid kumment