Záloha je pripravená: búranie mýtov na počesť sviatku

Záloha je pripravená: búranie mýtov na počesť sviatku

Zálohovanie nepatrí medzi módne technológie, o ktorých každý kričí. Malo by to byť v každej serióznej spoločnosti, to je všetko. Naša banka zálohuje niekoľko tisíc serverov – je to zložitá, zaujímavá práca a rád by som hovoril o niektorých jej zložitostiach, ako aj o typických mylných predstavách o zálohovaní.

Tejto téme sa venujem takmer 20 rokov, z toho posledné 2 roky v Promsvyazbank. Na úplnom začiatku mojej praxe som robil zálohy takmer manuálne, pomocou skriptov, ktoré jednoducho kopírovali súbory. Potom sa vo Windows objavili pohodlné nástroje: nástroj Robocopy na prípravu súborov a NT Backup na kopírovanie. A až potom prišiel čas na špecializovaný softvér, predovšetkým Veritas Backup Exec, ktorý sa teraz nazýva Symantec Backup Exec. Takže som sa so zálohami oboznámil už dlho.

Zjednodušene povedané, zálohovanie je ukladanie kópie údajov (virtuálnych počítačov, aplikácií, databáz a súborov) pre každý prípad s určitou pravidelnosťou. Každý prípad sa väčšinou prejaví v podobe hardvérového alebo logického zlyhania a vedie k strate dát. Účelom zálohovacieho systému je znížiť straty zo straty informácií. Porucha hardvéru je napríklad porucha servera alebo úložiska, kde sa databáza nachádza. Logická je strata alebo zmena časti údajov, a to aj v dôsledku ľudského faktora: tabuľka alebo súbor bol omylom vymazaný alebo bol spustený skript na vykonanie krivky. Existujú aj regulačné požiadavky na uchovávanie určitých typov informácií na dlhé obdobie, napríklad až niekoľko rokov.

Záloha je pripravená: búranie mýtov na počesť sviatku

Najtypickejším využitím záloh je obnovenie uloženej kópie databáz na nasadenie rôznych testovacích systémov a klonov pre vývojárov.

Okolo zálohovania existuje niekoľko bežných mýtov, ktoré sa už dávno majú vyvrátiť. Tu sú najznámejšie z nich.

Mýtus 1. Zálohovanie bolo dlho len vedľajšou funkciou v rámci bezpečnostných alebo úložných systémov

Záložné systémy stále zostávajú samostatnou triedou riešení a sú veľmi nezávislé. Boli poverení príliš dôležitou úlohou. V podstate sú poslednou líniou obrany, pokiaľ ide o bezpečnosť údajov. Zálohovanie teda funguje vlastným tempom, podľa vlastného plánu. Na serveroch sa generuje denná správa, existujú udalosti, ktoré fungujú ako spúšťače pre monitorovací systém.

Záloha je pripravená: búranie mýtov na počesť sviatku

Navyše, model prístupu k zálohovaciemu systému vám umožňuje delegovať niektoré právomoci na správcov cieľových systémov na správu záloh.

Mýtus 2. Keď existuje RAID, zálohovanie už nie je potrebné

Záloha je pripravená: búranie mýtov na počesť sviatku

Polia RAID a replikácia dát sú nepochybne dobrým spôsobom, ako chrániť informačné systémy pred zlyhaním hardvéru, a ak máte záložný server, rýchlo zorganizujte prepnutie naň v prípade zlyhania hlavného počítača.

Redundancia a replikácia vás nezachránia pred logickými chybami používateľov systému. Tu je pohotovostný server s oneskoreným nahrávaním - áno, môže pomôcť, ak sa pred synchronizáciou zistí chyba. Čo ak ten moment premeškáme? Tu pomôže len včasná záloha. Ak viete, že údaje sa včera zmenili, môžete obnoviť systém predvčerom a extrahovať z neho potrebné údaje. Vzhľadom na to, že logické chyby sú najčastejšie, stará dobrá záloha zostáva osvedčeným a potrebným nástrojom.

Mýtus 3. Zálohovanie je niečo, čo sa robí raz za mesiac.

Frekvencia zálohovania je konfigurovateľný parameter, ktorý primárne závisí od požiadaviek zálohovacieho systému. Je celkom možné nájsť údaje, ktoré sa takmer nikdy nemenia a nie sú obzvlášť dôležité, ich strata nebude pre spoločnosť kritická.
V skutočnosti môžu byť zálohované raz za mesiac alebo dokonca menej často. Ale kritickejšie údaje sa ukladajú častejšie v závislosti od indikátora RPO (obj. bodu obnovy), ktorý nastavuje prijateľnú stratu údajov. Môže to byť raz týždenne, raz denne alebo dokonca niekoľkokrát za hodinu. Pre nás sú to protokoly transakcií z DBMS.

Záloha je pripravená: búranie mýtov na počesť sviatku

Pri uvádzaní systémov do komerčnej prevádzky musí byť schválená zálohovacia dokumentácia, ktorá odráža hlavné body, aktualizačné predpisy, postupy obnovy systému, postupy ukladania záloh a podobne.

Mýtus 4. Objem kópií neustále rastie a úplne zaberá akékoľvek pridelené miesto

Zálohy majú obmedzenú životnosť. Nemá zmysel napríklad ukladať všetkých 365 denných záloh počas celého roka. Spravidla je povolené uchovávať denné kópie po dobu 2 týždňov, potom sa nahradia novými a pri dlhodobom skladovaní zostáva verzia, ktorá bola vytvorená ako prvá v mesiaci. Na druhej strane je tiež uložená na určitý čas - každá kópia má svoju životnosť.

Záloha je pripravená: búranie mýtov na počesť sviatku

Existuje ochrana proti strate údajov. Platí pravidlo: pred odstránením zálohy je potrebné vytvoriť ďalšiu. Údaje sa preto nevymažú, ak záloha zlyhá, napríklad z dôvodu nedostupnosti servera. Dodržiavajú sa nielen časové limity, ale kontroluje sa aj počet kópií v súprave. Ak systém vyžaduje, aby existovali dve úplné zálohy, vždy budú dve a stará sa vymaže až po úspešnom zapísaní novej tretej. Takže zvýšenie objemu obsadeného zálohou je spojené iba so zvýšením množstva chránených údajov a nezávisí od času.

Mýtus 5. Po spustení zálohovania všetko zamrzne

Je lepšie povedať toto: ak všetko visí, znamená to, že ruky správcu odtiaľ nerastú. Vo všeobecnosti závisí výkon zálohovania od mnohých faktorov. Napríklad na výkon samotného zálohovacieho systému: ako rýchle je diskové úložisko a páskové knižnice. Od výkonu serverov zálohovacieho systému: či majú čas na spracovanie údajov, vykonanie kompresie a deduplikácie. A tiež na rýchlosti komunikačných liniek medzi klientom a serverom.

Záloha môže ísť do jedného alebo viacerých vlákien v závislosti od toho, či zálohovací systém podporuje multithreading. Napríklad Oracle DBMS umožňuje odoslať niekoľko vlákien podľa počtu dostupných procesorov, kým prenosová rýchlosť nedosiahne limit šírky pásma siete.

Ak sa pokúsite zálohovať veľké množstvo vlákien, existuje možnosť preťaženia bežiaceho systému, skutočne sa začne spomaľovať. Preto sa volí optimálny počet vlákien, aby sa zabezpečil dostatočný výkon. Ak je kritický aj najmenší pokles výkonu, potom je tu vynikajúca možnosť, keď sa záloha nevykonáva z produkčného servera, ale z jeho klonu – v databázovej terminológii pohotovostného režimu. Tento proces nezaťažuje hlavný pracovný systém. Údaje je možné získať cez viacero vlákien, pretože server sa nepoužíva na údržbu.

Vo veľkých organizáciách je vytvorená samostatná sieť pre zálohovací systém, aby zálohovanie neovplyvňovalo produkciu. Okrem toho sa prevádzka môže prenášať nie cez sieť, ale cez SAN.
Záloha je pripravená: búranie mýtov na počesť sviatku
Záťaž sa snažíme rozložiť aj v čase. Zálohovanie sa väčšinou vykonáva v mimopracovných hodinách: v noci, cez víkendy. Tiež nezačínajú všetky súčasne. Špeciálnym prípadom sú zálohy virtuálnych strojov. Proces nemá prakticky žiadny vplyv na výkon samotného stroja, takže zálohovanie môže byť rozložené na celý deň, namiesto toho, aby sa všetko odkladalo na noc. Existuje veľa jemností, ak vezmete do úvahy všetko, zálohovanie neovplyvní výkon systému.

Mýtus 6. Spustený záložný systém – to je pre vás odolnosť voči chybám

Nikdy nezabúdajte, že záložný systém je poslednou obrannou líniou, čo znamená, že pred ním musí byť ešte päť systémov, ktoré zabezpečia kontinuitu, vysokú dostupnosť a odolnosť podnikovej IT infraštruktúry a informačných systémov voči katastrofám.

Nemá zmysel dúfať, že záloha obnoví všetky dáta a rýchlo obnoví spadnutú službu. Strata dát od momentu zálohovania až do momentu zlyhania je zaručená a dáta je možné nahrať na nový server aj niekoľko hodín (alebo dní, v závislosti od šťastia). Preto má zmysel vytvárať plnohodnotné systémy odolné voči chybám bez presúvania všetkého do zálohy.

Mýtus 7. Raz som nastavil zálohu a skontroloval som, či funguje. Zostáva len pozrieť sa do denníkov

Toto je jeden z najškodlivejších mýtov, ktorého falošnosť si uvedomíte až počas incidentu. Protokoly o úspešnom zálohovaní nie sú zárukou, že všetko skutočne prebehlo podľa očakávania. Je dôležité vopred skontrolovať uloženú kópiu pre nasadenie. To znamená, že spustite proces obnovy v testovacom prostredí a pozrite sa na výsledok.

A trochu o práci správcu systému

Nikto dlho nekopíruje dáta ručne. Moderné SRC dokážu zálohovať takmer všetko, len si to treba správne nakonfigurovať. Ak bol pridaný nový server, nastavte politiky: vyberte obsah, ktorý sa bude zálohovať, zadajte parametre úložiska a použite plán.

Záloha je pripravená: búranie mýtov na počesť sviatku

Zároveň je tu stále veľa práce kvôli rozsiahlej flotile serverov vrátane databáz, poštových systémov, klastrov virtuálnych strojov a súborových prostriedkov na Windows a Linux/Unix. Zamestnanci, ktorí udržiavajú záložný systém, nesedia nečinne.

Na počesť sviatku prajem všetkým adminom pevné nervy, čisté pohyby a nekonečný priestor na ukladanie záloh!

Zdroj: hab.com

Pridať komentár