Còpia de seguretat a punt: trencar mites en honor a les vacances

Còpia de seguretat a punt: trencar mites en honor a les vacances

La còpia de seguretat no és una de les tecnologies de moda que es criden des de cada planxa. Només ha de ser en qualsevol empresa seriosa, això és tot. Realitzem una còpia de seguretat de diversos milers de servidors al nostre banc: aquesta és una feina complexa i interessant, algunes de les subtileses de la qual, així com les típiques idees errònies sobre les còpies de seguretat, només volem explicar-los.

He estat treballant en aquest tema durant gairebé 20 anys, dels quals els últims 2 anys han estat a Promsvyazbank. Al principi de la pràctica, vaig fer còpies de seguretat gairebé manualment, amb scripts que simplement copiaven fitxers. Aleshores van aparèixer eines convenients a Windows: la utilitat Robocopy per preparar fitxers i NT Backup per copiar. I només llavors va arribar el moment del programari especialitzat, principalment Veritas Backup Exec, que ara s'anomena Symantec Backup Exec. Així que fa temps que estic familiaritzat amb les còpies de seguretat.

En termes senzills, la còpia de seguretat és mantenir una còpia de les dades (màquines virtuals, aplicacions, bases de dades i fitxers) per si de cas amb una certa regularitat. Cada cas sol manifestar-se com una fallada de maquinari o lògica i provoca la pèrdua de dades. L'objectiu d'un sistema de còpia de seguretat és reduir la pèrdua d'informació. Una fallada de maquinari és, per exemple, una fallada del servidor o de l'emmagatzematge on es troba la base de dades. Lògic: aquesta és la pèrdua o el canvi d'una part de les dades, fins i tot a causa del factor humà: van eliminar accidentalment una taula, un fitxer, van llançar un script tort per a l'execució. També hi ha requisits reguladors per emmagatzemar un determinat tipus d'informació durant un període llarg, per exemple, fins a diversos anys.

Còpia de seguretat a punt: trencar mites en honor a les vacances

L'ús més habitual de les còpies de seguretat és la restauració d'una còpia desada de bases de dades per al desplegament de diversos sistemes de prova, clons per a desenvolupadors.

Hi ha uns quants mites típics sobre la còpia de seguretat que s'haurien de dissipar fa temps. Aquests són els més famosos d'ells.

Mite 1. La còpia de seguretat ha estat durant molt de temps una petita funció dins dels sistemes de seguretat o d'emmagatzematge

Els sistemes de còpia de seguretat segueixen sent una classe separada de solucions i molt independents. Tenen massa feina per fer. De fet, són l'última línia de defensa pel que fa a la integritat de les dades. Així, la còpia de seguretat funciona al seu ritme, segons el seu propi horari. Es genera un informe diari per als servidors, hi ha esdeveniments que actuen com a activadors del sistema de monitorització.

Còpia de seguretat a punt: trencar mites en honor a les vacances

A més, el model d'accés al sistema de còpia de seguretat us permet delegar part de l'autoritat als administradors dels sistemes de destinació per gestionar les còpies de seguretat.

Mite 2. Quan hi ha un RAID, ja no cal una còpia de seguretat.

Còpia de seguretat a punt: trencar mites en honor a les vacances

Sens dubte, les matrius RAID i la rèplica de dades són una bona manera de protegir els sistemes d'informació de fallades de maquinari, i si teniu un servidor en espera, podeu organitzar ràpidament el canvi a ell en cas que la màquina principal falli.

A partir dels errors lògics que van cometre els usuaris del sistema, la redundància i la replicació no es salva. Aquí hi ha un servidor d'espera de reescriptura: sí, pot ajudar si es detecta un error abans de sincronitzar-lo. I si es perd el moment? Només una còpia de seguretat oportuna ajudarà aquí. Si sabeu que les dades van canviar ahir, podeu restaurar el sistema a abans-d'ahir i extreure'n les dades necessàries. Tenint en compte que els errors lògics són els més habituals, la còpia de seguretat antiga segueix sent una eina provada i necessària.

Mite 3. Una còpia de seguretat és una cosa que es fa un cop al mes.

La freqüència de còpia de seguretat és una configuració configurable que depèn principalment dels requisits del vostre sistema de còpia de seguretat. És molt possible trobar dades que gairebé mai canvien i que no són especialment importants, la seva pèrdua no serà crítica per a l'empresa.
De fet, es poden fer còpies de seguretat un cop al mes i encara menys sovint. Però les dades més crítiques es guarden amb més freqüència, depenent de l'indicador RPO (objectiu del punt de recuperació), que estableix la pèrdua de dades permesa. Això pot ser un cop per setmana, un cop al dia o fins i tot diverses vegades per hora. Tenim aquests registres de transaccions del SGBD.

Còpia de seguretat a punt: trencar mites en honor a les vacances

Quan els sistemes es posen en funcionament comercial, s'ha d'aprovar la documentació de còpies de seguretat, que reflecteixi els punts principals, el procediment d'actualització, el procediment de restauració del sistema, el procediment d'emmagatzematge de còpies de seguretat, etc.

Mite 4. El volum de còpies està en constant creixement i ocupa completament qualsevol espai assignat.

Les còpies de seguretat tenen un període de retenció limitat. No té sentit, per exemple, emmagatzemar les 365 còpies de seguretat diàries durant l'any. Com a regla general, és acceptable conservar còpies diàries durant 2 setmanes, després de les quals es substitueixen per unes de noves i la versió que es va fer primer durant el mes roman en emmagatzematge a llarg termini. Al seu torn, també s'emmagatzema durant un temps determinat: cada còpia té una vida útil.

Còpia de seguretat a punt: trencar mites en honor a les vacances

Hi ha protecció contra la pèrdua de dades. S'aplica la regla: abans de suprimir una còpia de seguretat, s'ha de formar la següent. Per tant, les dades no s'eliminaran si no s'ha completat la còpia de seguretat, per exemple, a causa de la indisponibilitat del servidor. No només es respecten els terminis, sinó que també es controla el nombre de còpies del conjunt. Si el sistema està dissenyat per tenir dues còpies de seguretat completes, sempre n'hi haurà dues, i l'antiga només s'eliminarà quan s'hagi escrit una tercera amb èxit. Per tant, el creixement del volum ocupat per l'arxiu de còpia de seguretat només s'associa amb el creixement de la quantitat de dades protegides i no depèn del temps.

Mite 5. La còpia de seguretat va començar: tot es va penjar

És millor dir això: si tot està penjat, les mans de l'administrador no creixen a partir d'aquí. En general, el rendiment d'una còpia de seguretat depèn de molts factors. Per exemple, sobre la velocitat del propi sistema de còpia de seguretat: quina velocitat són els emmagatzematges en disc, les biblioteques de cintes. Des de la velocitat dels servidors del sistema de còpia de seguretat: si tenen temps per processar dades, realitzar compressió i deduplicació. I també sobre la velocitat de les línies de comunicació entre el client i el servidor.

La còpia de seguretat pot anar a un o més fluxos, depenent de si el sistema que es fa una còpia de seguretat admet multiprocés. Per exemple, el SGBD d'Oracle us permet donar diversos fils, segons el nombre de processadors disponibles, fins que la taxa de transferència arribi al límit d'ample de banda de la xarxa.

Si intenteu fer una còpia de seguretat d'un gran nombre de fils, hi ha la possibilitat de sobrecarregar un sistema en execució, realment començarà a alentir-se. Per tant, s'escull el nombre òptim de fils per garantir un rendiment suficient. Si fins i tot la menor disminució del rendiment és crítica, hi ha una opció excel·lent quan la còpia de seguretat no es realitza des d'un servidor de combat, sinó des del seu clon: en espera en la terminologia de la base de dades. Aquest procés no arrenca el sistema de treball principal. Les dades es poden recuperar a través de més fluxos, ja que el servidor no s'utilitza per al manteniment.

A les grans organitzacions, es crea una xarxa separada per al sistema de còpia de seguretat perquè la còpia de seguretat no afecti la producció. A més, és possible que el trànsit no es transmeti a través de la xarxa, sinó a través de la SAN.
Còpia de seguretat a punt: trencar mites en honor a les vacances
També intentem repartir la càrrega en el temps. Les còpies de seguretat es fan majoritàriament durant les hores no laborals: a la nit, els caps de setmana. A més, no tots corren al mateix temps. Les còpies de seguretat de màquines virtuals són un cas especial. El procés pràcticament no té cap efecte en el rendiment de la pròpia màquina, de manera que la còpia de seguretat es pot estendre durant el dia i no ajornar-ho tot a la nit. Hi ha moltes subtileses, si ho tens tot en compte, la còpia de seguretat no afectarà el rendiment dels sistemes.

Mite 6. S'ha llançat un sistema de còpia de seguretat: això és tolerància a errors per a vostè

No oblideu mai que un sistema de còpia de seguretat és l'última línia de defensa, la qual cosa significa que hi hauria d'haver cinc sistemes més al davant que garanteixin la continuïtat, l'alta disponibilitat i la tolerància als desastres de la infraestructura informàtica i els sistemes d'informació empresarial.

No val la pena esperar que la còpia de seguretat restauri totes les dades i augmenti ràpidament el servei caigut. Es garanteix la pèrdua de dades des del moment de la còpia de seguretat fins al moment de la fallada, i les dades es poden penjar a un nou servidor durant diverses hores (o dies, segons tinguis sort). Per tant, té sentit crear sistemes complets tolerants a errors sense canviar-ho tot a una còpia de seguretat.

Mite 7. He creat una còpia de seguretat una vegada, he comprovat que funciona. Només queda mirar els registres

Aquest és un dels mites més nocius, la falsedat del qual només us adoneu durant l'incident. Els registres de còpia de seguretat exitosos no són una garantia que tot hagi anat realment com hauria de ser. És important comprovar la còpia desada per poder desplegar-se amb antelació. És a dir, inicieu el procés de recuperació en un entorn de prova i observeu el resultat.

I una mica sobre la feina de l'administrador del sistema

En mode manual, ningú no ha estat copiant dades durant molt de temps. Els SRK moderns poden fer còpies de seguretat de gairebé tot, només heu de configurar-lo correctament. Si s'ha afegit un servidor nou, configureu polítiques: seleccioneu el contingut del qual es farà una còpia de seguretat, especifiqueu les opcions d'emmagatzematge i apliqueu la programació.

Còpia de seguretat a punt: trencar mites en honor a les vacances

Al mateix temps, encara hi ha molta feina a causa de l'extensa flota de servidors, incloses bases de dades, sistemes de correu, clústers de màquines virtuals i recursos compartits de fitxers tant a Windows com a Linux / Unix. Els empleats que mantenen el sistema de còpia de seguretat en funcionament no es queden inactius.

En honor a les vacances, m'agradaria desitjar a tots els administradors nervis forts, claredat en els moviments i espai infinit per emmagatzemar còpies de seguretat!

Font: www.habr.com

Afegeix comentari