Veeam Backup & Replication: Užitočné tipy na zabezpečenie životaschopnosti záloh a replík

Dnes vám opäť s potešením predstavujem užitočné tipy od môjho kolegu Evgenija Ivanova, vedúceho tímu tímu technickej podpory Veeam. Tentoraz Zhenya zdieľala odporúčania pre prácu so zálohami a replikami. Dúfam, že vám pomôžu vyhnúť sa bežným chybám a vaše repliky a zálohy nikdy nebudú v prípade potreby „slabým článkom“ procesu obnovy.

Takže vitajte v mačke.

Veeam Backup & Replication: Užitočné tipy na zabezpečenie životaschopnosti záloh a replík

V mojom predošlom článok pozreli sme sa na to, ako optimalizovať zaťaženie komponentov záložnej infraštruktúry a pozreli sme sa na bežné chyby konfigurácie. Prejdime k ďalšej dôležitej téme – správnej príprave a realizácii rekonvalescencie. Rozoberieme to aj na reálnych príkladoch, s ktorými mal tím technickej podpory možnosť pracovať.

Zálohovanie bez reštaurácie - peniaze fuč

Pravidelne nás kontaktujú používatelia, ktorí sa ocitli v podobne zložitých situáciách: je potrebné obnoviť zo zálohy, no keď sa o to pokúsia, ľudia natrafia na problém, ktorý je pre nich neriešiteľný. A týmto problémom nie je nedostatok zálohy, aktivita CryptoLocker ani nič podobné. Toto je „len“ nedostatočná pozornosť testovaniu záloh a replík na obnovenie. Mnoho ľudí sa často zameriava výlučne na proces vytvárania zálohy a zabúda na to, že mať záložnú kópiu nie je všeliekom na možné problémy. Musíte pochopiť, že obnova je úplne iný proces, ktorý má svoje vlastné charakteristiky a ktorý sa musí pred spustením do výroby monitorovať a testovať. Tu je niekoľko názorných príkladov:

  1. Používateľ zaznamenal výpadok kritického virtuálneho počítača s kapacitou 20 TB. Prestoje sú, samozrejme, neprijateľné a správca spustí proces okamžitej obnovy (VM instant recovery) – po 5 minútach je stroj v prevádzke. Pamätáme si však, že tento stav stroja je možné použiť len dočasne – musí sa migrovať do produkčného úložiska údajov. A v tomto príklade, ako sa ukázalo, možnosti infraštruktúry neumožnili skopírovať 20 TB dát v primeranom čase. V nastaveniach procesu okamžitej obnovy bolo vybraté uloženie zmien na disk s: Server Veeam Backup & Replication (na rozdiel od vSphere snapshot) – v dôsledku toho sa, samozrejme, rýchlo zaplnilo voľné miesto na disku. V čase, keď používateľ kontaktoval podporu, mal VM zmeny, ktoré nebolo možné ignorovať. To znamená, že sme v situácii, keď nie je možné rýchlo dokončiť proces okamžitej obnovy kritického stroja – ako môžeme zachrániť dáta?

    Úprimne povedané, v priebehu rokov si už nepamätám všetky detaily finále, ale pamätám si, že nakoniec sme neprišli na nič skvelé. Klienti na ich strane prinajmenšom vyriešili tento problém rozšírením disku C: z rezerv, skopírovaním najdôležitejších súborov a až potom vypnutím VM a migráciou týmto spôsobom. Vo všeobecnosti sa žiadny zázrak nestal.

  2. V infraštruktúre používateľa bol spustený jeden radič domény a všetky komponenty Veeam Backup & Replication boli nakonfigurované pomocou DNS. Áno, áno, je to tak, počuli ste dobre. Možností vývoja udalostí bolo sto, nie menej, ale v skutočnosti všetko prebiehalo takto: ľudia plánovali údržbu a rozhodli sa prejsť na repliku svojho doménového radiča. Použili plánovaný prepínač, ktorý sa v takýchto situáciách všeobecne odporúča. V prvej fáze prebehlo všetko v poriadku, ale v druhej sa zdrojový VM nakrátko vypol, aby sa preniesli zostávajúce údaje. Úloha prepnutia samozrejme okamžite zlyhala, pretože DNS prestal fungovať.

    Našťastie sme tu situáciu dokázali zvládnuť manuálnym povolením repliky z vSphere (v skutočnosti sa to neodporúča robiť sami, ako uvidíte v nasledujúcom príklade). Ako však viete, proces údržby bol prerušený a oneskorený. Okrem toho sme museli manuálne zadať názvy hostiteľov do súboru C:WindowsSystem32driversesetchosts na serveri Veeam Backup & Replication, aby sa zabezpečila správnosť počas prepínania.

  3. Ďalší klient mal celú zálohovaciu infraštruktúru vybudovanú okolo páskových jednotiek, pričom na disku boli uložené iba krátke reťazce súborov. Keď potrebovali obnoviť množstvo súborov z veľkého súborového servera, zistili, že ani jeden stroj nemožno použiť ako sekundárne úložisko na obnovu pásky, pretože žiadny nemal dostatok voľného miesta. (O obnove z magnetickej pásky si môžete prečítať priamo a pomocou pomocného úložiska tu (zatiaľ v angličtine)).

Myslím, že vo všetkých troch príkladoch používateľov takpovediac uchvátili ilúzie – predpokladali, že ak bude záloha úspešná, tak s obnovou nebudú žiadne problémy. Ale to, ako ste pochopili, nie je v žiadnom prípade vždy prípad, a preto sa musíte pripraviť na obnovu rovnako starostlivo ako na zálohovanie. Na začiatok sa oplatí študovať užívateľská príručka, ktorý obsahuje pomerne podrobné informácie o rôznych typoch obnovy. Na začiatku každého odseku sú uvedené požiadavky, prípravné činnosti a možné obmedzenia. Popis obnovy z magnetických pások alebo zo snímok hardvérového úložiska nájdete v sekciách dokumentácie a v našom články na Habré. Okrem toho sú v časti „Plánovanie a príprava“ opísané kroky na prípravu obnovy objektov aplikácie pomocou Veeam Explorers. sprievodcov pre každý z nástrojov. Odporúčam vám, aby ste si ich pozorne prečítali – pomôže vám to v prípade potreby správne pripraviť systém na obnovu. Pokyny na obnovenie databázy servera SQL sú uvedené v ruštine: tu.

Prečo by som nemal pracovať s replikami z konzoly vSphere?

Teoreticky sú repliky Veeam bežné virtuálne stroje, s ktorými by sa zdalo logické pracovať pomocou nástrojov vSphere, najmä klienta vSphere. Neodporúčame to však robiť a tu je dôvod: prechod na repliku v aplikácii Veeam Backup & Replication je pomerne komplikovaný proces, ktorý si vyžaduje prísne sekvenčné kroky (takže ak sa niečo stane, môžete sa vrátiť o krok späť) a opraviť záverečné akcie – stačí sa pozrieť na obrázok ilustrujúci proces:

Veeam Backup & Replication: Užitočné tipy na zabezpečenie životaschopnosti záloh a replík

Ak sa rozhodnete povoliť repliku z klienta vSphere, v budúcnosti sa s najväčšou pravdepodobnosťou stretnete s niekoľkými problémami:

  1. Mechanizmus prechodu na repliku z Veeam Backup & Replication (zobrazený v diagrame) už nebude pre tento počítač fungovať.
  2. Údaje v databáze Veeam Backup nebudú zodpovedať skutočnému stavu virtuálneho počítača. V najhoršom prípade budete musieť upraviť databázu, aby ste to opravili.
  3. Strata dát je dokonca možná, ako v tomto príklade: používateľ manuálne povolil repliku v klientovi vSphere a rozhodol sa s ňou ďalej pracovať. Po určitom čase si všimol, že replika sa stále zobrazuje v konzole Veeam Backup & Replication, a rozhodol sa ju odstrániť ako nepotrebnú. Kliknite naň pravým tlačidlom myši a vydal príkaz "Odstrániť z disku". Veeam Backup & Replication okamžite vymazal repliku z disku, ktorý bol na chvíľu už plne využívaný ako bežný VM a obsahoval potrebné a užitočné dáta.

Samozrejme, sú situácie, keď stále musíte zapnúť repliku z klienta vSphere – spravidla ide o prípady, keď je server Veeam vypnutý a repliku je potrebné zapnúť s oneskorením. Ak je však všetko v poriadku so serverom Veeam, musíte pracovať s replikami z jeho konzoly.

Tiež by ste nemali odstraňovať repliky pomocou klienta vSphere. Veeam Backup & Replication o tejto zmene nebude vedieť, čo môže viesť k chybám a zastaraným údajom. Ak už nepotrebujete repliku, odstráňte ju pomocou konzoly Veeam, nie ako virtuálny počítač z klienta vSphere. Takto budete mať vždy aktuálny zoznam replík.

"Oh" - buďte opatrní, aktualizácie!

Máme tu samozrejme na mysli aktualizácie pre hypervízory a rôzne aplikácie, ktoré sú zálohované pomocou Veeamu. Ak sa na ne pozriete z pohľadu práce s Veeam Backup & Replication, aktualizácie možno rozdeliť do 2 kategórií: veľké, vážne, prinášajúce množstvo zmien – a malé.

Najprv sa pozrime na prvú kategóriu.

Najdôležitejšie aktualizácie sú tie, ktoré sa zameriavajú na hypervízor. Pred inštaláciou takejto aktualizácie sa uistite, že ju podporuje Veeam Backup & Replication. Tieto aktualizácie prinášajú veľa zmien do knižníc a rozhraní API, ktoré Veeam Backup & Replication používa, takže kód Veeam Backup & Replication musí byť aktualizovaný a dôkladne otestovaný, aby ich mohol oficiálne podporovať.

Musíme mať tiež na pamäti, že napríklad VMware neposkytuje výrobcom softvéru pokročilý prístup k najnovším verziám vSphere, takže vývojári a testeri Veeam dostávajú novú verziu v rovnakom čase ako zvyšok progresívneho ľudstva – preto existuje je zvyčajne oneskorenie medzi vydaním VMware a oficiálne oznámenou podporou určitý čas. Počet a rozmanitosť požadovaných zmien je taká, že je malá šanca, že sa dajú začleniť do jednoduchej rýchlej opravy – a oficiálna podpora sa spravidla oznamuje spolu s vydaním verzie Veeam Backup & Replication.

V dôsledku toho nastáva ten nepríjemný moment, keď sa po vydaní novej verzie vSphere prudko zvýši počet žiadostí o technickú podporu, pretože používatelia sa bezhlavo vrhnú na inštaláciu novej verzie a ich zálohy, samozrejme, okamžite prestanú fungovať. . My, technická podpora Veeam, musíme používateľom vysvetliť, čo presne urobili zle, požiadať ich, aby sa vrátili späť (ak je to možné), alebo vymyslieť zložité spôsoby, ako sa dostať zo slepej uličky. Preto pred inštaláciou serióznej aktualizácie nezabudnite skontrolovať jej kompatibilitu so softvérom, ktorý používate, prosím!

Všetko uvedené platí aj pre aplikácie, ktoré zálohujete a očakávate ich obnovenie pomocou Veeamu. Rad nástrojov Veeam Explorers obsahuje aj zoznam podporovaných verzií príslušných aplikácií, ktorý sa aktualizuje s každým vydaním Veeam Backup & Replication. Preto si pred inštaláciou novej verzie vašej aplikácie – či už je to Exchange, Oracle alebo SharePoint – nezabudnite znovu prečítať príslušnú časť Dokumentácia Veeam Explorers.

Do druhej kategórie, t.j. Medzi malé aktualizácie zahŕňam napríklad nové verzie VMware Tools, kumulatívne aktualizácie Exchange, bezpečnostné aktualizácie vSphere atď. Zvyčajne nezavádzajú žiadne veľké úpravy a vo väčšine prípadov s nimi Veeam Backup & Replication nemá problémy. (Preto pre nich neexistujú žiadne verejné oznámenia o oficiálnej podpore v produkte.) V našej praxi sa však vyskytli prípady, keď takéto aktualizácie zmenili zaužívaný chod vecí tak výrazne, že viedli k chybám vo fungovaní Veeam Backup. & Replikácia. V takýchto situáciách sa inžinieri Veeam po potvrdení problému pokúsia rýchlo vydať rýchlu opravu.

Pre tých, ktorí ovládajú technickú angličtinuAk chcete mať aktuálne informácie o tom, na čom pracujú inžinieri a s čím sa stretávajú systémoví architekti a špecialisti technickej podpory, odporúčam prihlásiť sa na odber naše fóra. Každý týždeň pre jeho predplatiteľov vychádza newsletter „Word from Gostev“. TheRealGostev. Anton Gostev, vedúci oddelenia produktového manažmentu v ňom hovorí o nedávno nájdených problémoch (a to nielen na strane Veeamu), plánoch nových verzií a novinkách zo sveta IT. Ak potrebujete viac informácií, môžete si preštudovať témy fóra - ak má niektorý z klientov problém s prevádzkou produktu po akejkoľvek aktualizácii, pravdepodobne o tom už písal na fóre.

Ako viete, opravy a aktualizácie môžu viesť k problémom nielen so zálohami, ale aj s aplikáciami, pre ktoré sa tieto zálohy vytvárajú. A tu vám pomôžu virtuálne laboratóriá – Veeam DataLabs. Určite ste už počuli o SureBackup, funkcii určenej na overovanie záloh. Je založený práve na využití DataLabs, s vytvorením izolovaného prostredia, v ktorom môžete najmä testovať aktualizácie pred ich inštaláciou do produkcie. Vrelo vám to odporúčam – ušetríte si veľa nervových buniek. A ak niekto ešte nevie o SureBackup, odporúčam si ho prečítať dokumentácia.

Myslím, že to je na dnes všetko, ďakujem za pozornosť!

Čo ešte čítať

Články o Habrém:

Návod na použitie (v ruštine)

Zdroj: hab.com

Pridať komentár