Veeam Backup & Replication: Consellos útiles para garantir a viabilidade das copias de seguranza e das réplicas

Hoxe teño o pracer de presentarvos de novo consellos útiles do meu compañeiro Evgeniy Ivanov, xefe de equipo do equipo de soporte técnico de Veeam. Esta vez Zhenya compartiu recomendacións para traballar con copias de seguridade e réplicas. Espero que che axuden a evitar erros comúns e que as túas réplicas e copias de seguranza nunca sexan un "eslabón débil" no proceso de recuperación, se é necesario.

Entón, benvido ao gato.

Veeam Backup & Replication: Consellos útiles para garantir a viabilidade das copias de seguranza e das réplicas

No meu anterior Artigo analizamos como optimizar a carga dos compoñentes da infraestrutura de copia de seguridade e analizamos os erros de configuración comúns. Pasemos a outro tema importante: a preparación e implementación adecuadas da recuperación. Tamén o analizaremos utilizando exemplos reais cos que o equipo de soporte técnico tivo a oportunidade de traballar.

Copia de seguranza sen restaurante: diñeiro polo sumidoiro

Contactándonos regularmente usuarios que se atopan en situacións difíciles similares: é necesario restaurar desde unha copia de seguridade, pero cando intentan facelo, a xente tropeza cun problema que lles resulta insoluble. E este problema non é unha falta de copia de seguridade, actividade de CryptoLocker ou nada parecido. Esta é "só" atención insuficiente para probar copias de seguridade e réplicas para a súa restauración. Moitas persoas adoitan centrarse exclusivamente no proceso de creación dunha copia de seguridade, esquecendo que simplemente ter unha copia de seguridade non é unha panacea para posibles problemas. Cómpre entender que a restauración é un proceso completamente diferente, que ten as súas propias características e que debe ser supervisado e probado antes de poñerse en produción. Aquí tes algúns exemplos ilustrativos:

  1. Un usuario experimentou un corte dunha máquina virtual crítica de 20 TB. O tempo de inactividade, por suposto, é inaceptable e o administrador inicia o proceso de recuperación instantánea (recuperación instantánea de VM): despois de 5 minutos a máquina está activa. Pero lembramos que este estado da máquina só se pode usar temporalmente: debe migrarse ao almacén de datos de produción. E neste exemplo, como se viu, as capacidades de infraestrutura non permitían copiar 20 TB de datos nun tempo razoable. Na configuración do proceso de recuperación instantánea, escolleuse para gardar os cambios no disco DE: Servidor Veeam Backup & Replication (en oposición á instantánea de vSphere): como resultado, por suposto, o espazo libre no disco encheuse rapidamente. Cando o usuario contactou co servizo de asistencia, a máquina virtual tiña cambios que non se podían ignorar. É dicir, temos unha situación na que é imposible finalizar rapidamente o proceso de recuperación instantánea dunha máquina crítica: como podemos gardar os datos?

    Francamente, co paso dos anos xa non lembro todos os detalles do final, pero lembro que ao final non chegamos a nada brillante. Os clientes do seu lado, polo menos, resolveron este problema ampliando a unidade C: desde as reservas, copiando os ficheiros máis importantes e só despois desactivando a máquina virtual e migrando dese xeito. En xeral, non ocorreu ningún milagre.

  2. A infraestrutura do usuario executaba un controlador de dominio e todos os compoñentes de Veeam Backup & Replication configuráronse mediante DNS. Si, si, é certo, escoitou ben. Había cen opcións para o desenvolvemento de eventos, nada menos, pero en realidade todo foi así: a xente planificou o mantemento e decidiu cambiar a unha réplica do seu controlador de dominio. Usaron un interruptor planificado, que xeralmente se recomenda en tales situacións. Na primeira fase, todo saíu ben, pero na segunda, a máquina virtual de orixe desactivouse brevemente para transferir os datos restantes. Por suposto, o traballo de cambio fallou inmediatamente porque o DNS deixou de funcionar.

    Afortunadamente, puidemos superar a situación aquí activando manualmente a réplica de vSphere (en realidade non se recomenda facelo vostede mesmo, como verá no seguinte exemplo). Pero, como entendes, o proceso de mantemento interrompeuse e atrasouse. Ademais, tivemos que introducir manualmente os nomes de host no ficheiro C: WindowsSystem32driversetchosts no servidor Veeam Backup & Replication para garantir a corrección durante o cambio.

  3. Outro cliente tiña toda unha infraestrutura de copia de seguridade construída arredor de unidades de cinta, con só pequenas cadeas de ficheiros almacenados no disco. Cando necesitaban recuperar varios ficheiros dun servidor de ficheiros grande, descubriron que ningunha das dúas máquinas podía utilizarse como repositorio secundario para a recuperación de cinta porque ningunha tiña espazo libre suficiente. (Podes ler sobre a recuperación desde cinta magnética directamente e usando un repositorio auxiliar aquí (de momento en inglés)).

Creo que nos tres exemplos, os usuarios, por así dicilo, quedaron cativados polas ilusións: asumiron que se a copia de seguridade tiña éxito, non habería problemas coa restauración. Pero isto, como entendes, non sempre é así e, polo tanto, cómpre prepararse para a recuperación co mesmo coidado que para a copia de seguridade. Para comezar, paga a pena estudar manual de usuario, que contén información bastante detallada sobre diferentes tipos de recuperación. Ao comezo de cada parágrafo enuméranse os requisitos, as accións preparatorias e as posibles restricións. Pódese atopar unha descrición da recuperación de cintas magnéticas ou de instantáneas de almacenamento de hardware nas seccións de documentación e no noso artigos sobre Habré. Ademais, na sección "Planificación e preparación" descríbense os pasos para preparar a restauración de obxectos da aplicación mediante Veeam Explorers. guías para cada un dos instrumentos. Recomendo que os leas atentamente; isto axudarache a preparar correctamente o sistema para a súa recuperación se é necesario. As instrucións para restaurar unha base de datos SQL Server danse en ruso: aquí.

Por que non debería traballar con réplicas desde a consola vSphere?

En teoría, as réplicas de Veeam son máquinas virtuais comúns, coas que parece lóxico traballar usando as ferramentas de vSphere, en particular, o cliente de vSphere. Non obstante, non recomendamos facelo, e velaí por que: cambiar a unha réplica en Veeam Backup & Replication é un proceso bastante complicado, que require pasos estrictamente secuenciais (de xeito que se ocorre algo podes facer retroceder un paso) e corrixir as accións finais. só mira a imaxe que ilustra o proceso:

Veeam Backup & Replication: Consellos útiles para garantir a viabilidade das copias de seguranza e das réplicas

Se decides habilitar unha réplica do cliente de vSphere, no futuro probablemente atopes unha serie de problemas:

  1. O mecanismo para cambiar a unha réplica de Veeam Backup & replication (que se mostra no diagrama) xa non funcionará para esta máquina.
  2. Os datos da base de datos de Veeam Backup non se corresponderán co estado real da máquina virtual. No peor dos casos, terás que editar a base de datos para solucionalo.
  3. Incluso é posible a perda de datos, como neste exemplo: o usuario activou manualmente a réplica no cliente de vSphere e decidiu seguir traballando con ela. Despois dun tempo, decatouse de que a réplica aínda se mostraba na consola Veeam Backup & Replication e decidiu eliminala por ser innecesaria. Fai clic co botón dereito sobre el e deu o comando "Eliminar do disco". Veeam Backup & Replication eliminou inmediatamente a réplica do disco, que, por un momento, xa estaba en pleno uso como unha máquina virtual normal e contiña os datos necesarios e útiles.

Por suposto, hai situacións nas que aínda tes que activar unha réplica do cliente de vSphere; por regra xeral, estes son casos nos que o servidor Veeam está desactivado e a réplica hai que activala cun atraso. Pero se todo está en orde co servidor Veeam, entón tes que traballar con réplicas desde a súa consola.

Tampouco debe eliminar réplicas usando o cliente de vSphere. Veeam Backup & Replication descoñecerá este cambio, o que pode producir erros e datos obsoletos. Se xa non necesitas unha réplica, elimínaa mediante a consola de Veeam, non como unha máquina virtual do cliente de vSphere. Deste xeito sempre terás unha lista actualizada de réplicas.

"Oh" - teña coidado, actualizacións!

Aquí queremos dicir, por suposto, actualizacións para hipervisores e varias aplicacións das que se fai copia de seguranza mediante Veeam. Se as miras desde o punto de vista de traballar con Veeam Backup & Replication, as actualizacións pódense dividir en dúas categorías: grandes, serias, que introducen moitos cambios e pequenas.

Vexamos primeiro a primeira categoría.

As actualizacións máis importantes son aquelas dirixidas ao hipervisor. Antes de instalar unha actualización deste tipo, asegúrese de asegurarse de que é compatible con Veeam Backup & Replication. Estas actualizacións introducen moitos cambios nas bibliotecas e nas API que usa Veeam Backup & Replication, polo que o código de Veeam Backup & Replication debe actualizarse e probalo exhaustivamente para admitilos oficialmente.

Tamén debemos ter en conta que, por exemplo, VMware non ofrece acceso anticipado ás últimas versións de vSphere para os fabricantes de software, polo que os desenvolvedores e probadores de Veeam reciben unha nova versión ao mesmo tempo que o resto da humanidade progresista; adoita ser un atraso entre o lanzamento de VMware e o soporte anunciado oficialmente en certo momento. O número e a variedade de cambios necesarios son tales que hai poucas posibilidades de encaixalos nun simple hotfix e, por regra xeral, anúnciase soporte oficial xunto co lanzamento da versión de lanzamento de Veeam Backup & Replication.

Como resultado, ese momento incómodo prodúcese cando, tras o lanzamento dunha nova versión de vSphere, o número de solicitudes de soporte técnico aumenta drasticamente, porque os usuarios se apresuran a instalar a nova versión e as súas copias de seguridade, por suposto, deixan de funcionar inmediatamente. . Nós, o soporte técnico de Veeam, temos que explicar aos usuarios o que fixeron exactamente mal, pedirlles que retrocedan (se é posible) ou atopar formas complicadas de saír do impasse. Polo tanto, antes de instalar unha actualización seria, asegúrese de comprobar a súa compatibilidade co software que está a executar.

Todo o anterior tamén se aplica ás aplicacións das que fas unha copia de seguranza e esperas restaurar con Veeam. A liña de ferramentas Veeam Explorers tamén ten unha lista de versións compatibles das aplicacións correspondentes, que se actualiza con cada versión de Veeam Backup & Replication. Polo tanto, antes de instalar unha nova versión da súa aplicación, xa sexa Exchange, Oracle ou SharePoint, asegúrese de volver ler a sección correspondente. Documentación de Veeam Explorers.

Á segunda categoría, é dicir. Por pequenas actualizacións inclúo, por exemplo, novas versións de VMware Tools, actualizacións acumulativas de Exchange, actualizacións de seguranza de vSphere, etc. Normalmente, non introducen ningunha modificación importante e, na maioría dos casos, Veeam Backup & Replication non ten problemas con elas. (É por iso que non hai anuncios públicos sobre o soporte oficial do produto para eles.) Non obstante, na nosa práctica, houbo casos nos que tales actualizacións cambiaron o curso habitual das cousas de forma tan significativa que provocaron erros no funcionamento de Veeam Backup. & Replicación. En tales situacións, despois de confirmar o problema, os enxeñeiros de Veeam tentan lanzar rapidamente un hotfix.

Para os que falan inglés técnicoSe queres estar ao día do que están a traballar os enxeñeiros e do que se enfrontan os arquitectos de sistemas e os especialistas en soporte técnico, recoméndoche subscribirte a os nosos foros. Cada semana, publícase un boletín informativo "Palabra de Gostev" para os seus subscritores. O RealGostev. Nela, Anton Gostev, xefe do departamento de xestión de produtos, fala dos problemas atopados recentemente (e non só no lado de Veeam), dos plans de novas versións e das novidades do mundo das TI. Se necesitas máis información, podes estudar os temas do foro: se un dos clientes ten un problema co funcionamento do produto despois de calquera actualización, probablemente xa escribiu sobre iso no foro.

Como entendes, os parches e as actualizacións poden provocar problemas non só coas copias de seguridade, senón tamén coas aplicacións para as que se realizan estas copias de seguridade. E aquí os laboratorios virtuais - Veeam DataLabs - axudarano. Probablemente xa escoitou falar de SureBackup, unha funcionalidade deseñada para verificar as copias de seguridade. Baséase precisamente no uso de DataLabs, coa creación dun entorno illado no que se poden, en particular, probar as actualizacións antes de instalalas en produción. Recomendo encarecidamente facelo: aforrarás moitas células nerviosas. E se alguén aínda non coñece SureBackup, recoméndolle a súa lectura documentación.

Creo que é todo o que teño para hoxe, grazas pola túa atención!

Que máis ler

Artigos sobre Habré:

Manual de usuario (en ruso)

Fonte: www.habr.com

Engadir un comentario