Respaldo listo: rompiendo mitos en honor a la festividad

Respaldo listo: rompiendo mitos en honor a la festividad

La copia de seguridad no es una de las tecnologías de moda que se grita desde todos los puntos de vista. Solo tiene que estar en cualquier compañía seria, eso es todo. Hacemos copias de seguridad de varios miles de servidores en nuestro banco: este es un trabajo complejo e interesante, algunas de las sutilezas de las cuales, así como los conceptos erróneos típicos sobre las copias de seguridad, solo quieren ser contadas.

He estado trabajando en este tema durante casi 20 años, de los cuales los últimos 2 años han sido en Promsvyazbank. Al principio de la práctica, hacía copias de seguridad casi manualmente, con scripts que simplemente copiaban archivos. Luego aparecieron herramientas convenientes en Windows: la utilidad Robocopy para preparar archivos y NT Backup para copiar. Y solo entonces llegó el momento del software especializado, principalmente Veritas Backup Exec, que ahora se llama Symantec Backup Exec. Así que he estado familiarizado con las copias de seguridad durante mucho tiempo.

En términos simples, la copia de seguridad es mantener una copia de los datos (máquinas virtuales, aplicaciones, bases de datos y archivos) por si acaso con cierta regularidad. Cada caso generalmente se manifiesta como una falla lógica o de hardware y da como resultado la pérdida de datos. El propósito de un sistema de respaldo es reducir la pérdida de información. Una falla de hardware es, por ejemplo, una falla del servidor o almacenamiento donde se encuentra la base de datos. Lógico: esta es la pérdida o el cambio de parte de los datos, incluso debido al factor humano: eliminaron accidentalmente una tabla, un archivo, lanzaron un script torcido para su ejecución. También existen requisitos reguladores para almacenar cierto tipo de información durante un período prolongado, por ejemplo, hasta varios años.

Respaldo listo: rompiendo mitos en honor a la festividad

El uso más típico de las copias de seguridad es la restauración de una copia guardada de bases de datos para la implementación de varios sistemas de prueba, clones para desarrolladores.

Hay algunos mitos típicos en torno a las copias de seguridad que deberían disiparse hace mucho tiempo. Aquí están los más famosos de ellos.

Mito 1. Durante mucho tiempo, la copia de seguridad ha sido solo una pequeña función dentro de los sistemas de seguridad o almacenamiento

Los sistemas de copia de seguridad siguen siendo una clase separada de soluciones y muy independientes. Tienen demasiado trabajo que hacer. De hecho, son la última línea de defensa cuando se trata de la integridad de los datos. Por lo tanto, la copia de seguridad funciona a su propio ritmo, según su propio horario. Se genera un reporte diario para los servidores, existen eventos que actúan como disparadores para el sistema de monitoreo.

Respaldo listo: rompiendo mitos en honor a la festividad

Además, el modelo a seguir de acceso al sistema de copia de seguridad le permite delegar parte de la autoridad a los administradores de los sistemas de destino para gestionar las copias de seguridad.

Mito 2. Cuando hay un RAID, ya no se necesita una copia de seguridad.

Respaldo listo: rompiendo mitos en honor a la festividad

Sin duda, las matrices RAID y la replicación de datos son una buena manera de proteger los sistemas de información de fallas de hardware, y si tiene un servidor en espera, puede organizar rápidamente el cambio a él en caso de que falle la máquina principal.

De los errores lógicos que cometieron los usuarios del sistema, la redundancia y la replicación no guardan. Aquí hay un servidor en espera de reescritura: sí, puede ayudar si se detecta un error antes de que se sincronice. ¿Y si se pierde el momento? Solo una copia de seguridad oportuna ayudará aquí. Si sabe que los datos cambiaron ayer, puede restaurar el sistema a anteayer y extraer los datos necesarios de él. Dado que los errores lógicos son los más comunes, la buena copia de seguridad antigua sigue siendo una herramienta comprobada y necesaria.

Mito 3. Una copia de seguridad es algo que se hace una vez al mes.

La frecuencia de la copia de seguridad es una configuración configurable que depende principalmente de los requisitos de su sistema de copia de seguridad. Es muy posible encontrar datos que casi nunca cambian y no son particularmente importantes, su pérdida no será crítica para la empresa.
De hecho, se pueden realizar copias de seguridad una vez al mes e incluso con menos frecuencia. Pero los datos más críticos se guardan con más frecuencia, según el indicador RPO (objetivo del punto de recuperación), que establece la pérdida de datos permitida. Esto puede ser una vez a la semana, una vez al día o incluso varias veces por hora. Tenemos estos registros de transacciones del DBMS.

Respaldo listo: rompiendo mitos en honor a la festividad

Cuando los sistemas se ponen en operación comercial, se debe aprobar la documentación de respaldo, que refleja los puntos principales, el procedimiento de actualización, el procedimiento de restauración del sistema, el procedimiento de almacenamiento de respaldos, etc.

Mito 4. El volumen de copias crece constantemente y ocupa por completo cualquier espacio asignado.

Las copias de seguridad tienen un período de retención limitado. No tiene sentido, por ejemplo, almacenar las 365 copias de seguridad diarias durante el año. Como regla general, es aceptable guardar copias diarias durante 2 semanas, después de lo cual se reemplazan por otras nuevas, y la versión que se hizo primero en el mes permanece almacenada a largo plazo. A su vez, también se almacena durante un tiempo determinado: cada copia tiene una vida útil.

Respaldo listo: rompiendo mitos en honor a la festividad

Hay protección contra pérdida de datos. Se aplica la regla: antes de que se elimine una copia de seguridad, se debe formar la siguiente. Por lo tanto, los datos no se eliminarán si la copia de seguridad no se ha completado, por ejemplo, debido a la falta de disponibilidad del servidor. No solo se respetan los plazos, sino que también se controla el número de copias del conjunto. Si el sistema está diseñado para tener dos copias de seguridad completas, siempre habrá dos y la anterior se eliminará solo cuando se escriba con éxito una tercera nueva. Entonces, el crecimiento del volumen ocupado por el archivo de respaldo está asociado solo con el crecimiento de la cantidad de datos protegidos y no depende del tiempo.

Mito 5. Se inició la copia de seguridad: todo se colgó

Es mejor decir esto: si todo está colgando, las manos del administrador no crecen a partir de ahí. En general, el rendimiento de una copia de seguridad depende de muchos factores. Por ejemplo, sobre la velocidad del propio sistema de copia de seguridad: qué tan rápido son los almacenamientos en disco, las bibliotecas de cintas. De la velocidad de los servidores del sistema de respaldo: si tienen tiempo para procesar datos, realizar compresión y deduplicación. Y también de la velocidad de las líneas de comunicación entre el cliente y el servidor.

La copia de seguridad puede ir a uno o más flujos, dependiendo de si el sistema del que se está realizando la copia de seguridad admite subprocesos múltiples. Por ejemplo, el DBMS de Oracle le permite proporcionar varios subprocesos, de acuerdo con la cantidad de procesadores disponibles, hasta que la tasa de transferencia alcance el límite de ancho de banda de la red.

Si intenta hacer una copia de seguridad de una gran cantidad de subprocesos, existe la posibilidad de sobrecargar un sistema en ejecución, realmente comenzará a ralentizarse. Por lo tanto, se elige el número óptimo de subprocesos para garantizar un rendimiento suficiente. Si incluso la más mínima disminución en el rendimiento es crítica, existe una excelente opción cuando la copia de seguridad no se lleva a cabo desde un servidor de combate, sino desde su clon: en espera en la terminología de la base de datos. Este proceso no arranca el sistema de trabajo principal. Los datos se pueden recuperar a través de más flujos, ya que el servidor no se utiliza para el mantenimiento.

En organizaciones grandes, se crea una red separada para el sistema de respaldo para que el respaldo no afecte la producción. Además, es posible que el tráfico no se transmita a través de la red, sino a través de la SAN.
Respaldo listo: rompiendo mitos en honor a la festividad
También tratamos de repartir la carga a lo largo del tiempo. Las copias de seguridad se realizan principalmente durante las horas no laborales: por la noche, los fines de semana. Además, no todos funcionan al mismo tiempo. Las copias de seguridad de máquinas virtuales son un caso especial. El proceso prácticamente no tiene ningún efecto sobre el rendimiento de la máquina en sí, por lo que la copia de seguridad se puede distribuir durante el día y no posponer todo por la noche. Hay muchas sutilezas, si tiene todo en cuenta, la copia de seguridad no afectará el rendimiento de los sistemas.

Mito 6. Lanzó un sistema de respaldo: eso es tolerancia a fallas para usted

Nunca olvide que un sistema de respaldo es la última línea de defensa, lo que significa que debe haber cinco sistemas más frente a él que aseguren la continuidad, la alta disponibilidad y la tolerancia a desastres de la infraestructura de TI y los sistemas de información empresarial.

Esperar que la copia de seguridad restaure todos los datos y levante rápidamente el servicio caído no vale la pena. Se garantiza la pérdida de datos desde el momento de la copia de seguridad hasta el momento del fallo, y los datos se pueden cargar en un nuevo servidor durante varias horas (o días, si tiene suerte). Por lo tanto, tiene sentido crear sistemas completos tolerantes a fallas sin cambiar todo a una copia de seguridad.

Mito 7. Configuré una copia de seguridad una vez y comprobé que funcionaba. Solo queda mirar los registros.

Este es uno de los mitos más dañinos, cuya falsedad te das cuenta solo durante el incidente. Los registros de respaldo exitosos no son una garantía de que todo salió como debería. Es importante verificar la copia guardada para la implementación con anticipación. Es decir, inicie el proceso de recuperación en un entorno de prueba y observe el resultado.

Y un poco sobre el trabajo del administrador del sistema.

En modo manual, nadie ha estado copiando datos durante mucho tiempo. Los SRK modernos pueden hacer una copia de seguridad de casi todo, solo tiene que configurarlo correctamente. Si se ha agregado un nuevo servidor, establezca políticas: seleccione el contenido del que se realizará la copia de seguridad, especifique las opciones de almacenamiento y aplique la programación.

Respaldo listo: rompiendo mitos en honor a la festividad

Al mismo tiempo, todavía queda mucho trabajo debido a la amplia flota de servidores, que incluye bases de datos, sistemas de correo, clústeres de máquinas virtuales y recursos compartidos de archivos tanto en Windows como en Linux/Unix. Los empleados que mantienen el sistema de respaldo en funcionamiento no se quedan inactivos.

¡En honor a las vacaciones, me gustaría desearles a todos los administradores nervios fuertes, claridad de movimientos y espacio infinito para almacenar copias de seguridad!

Fuente: habr.com

Añadir un comentario