Veeam Backup & Replication : Conseils utiles pour assurer la viabilité des sauvegardes et des répliques

Aujourd'hui, j'ai à nouveau le plaisir de vous présenter les conseils utiles de mon collègue Evgeny Ivanov, responsable de l'équipe de support technique de Veeam. Cette fois, Zhenya a partagé ses recommandations pour travailler avec des sauvegardes et des répliques. J'espère qu'ils vous aideront à éviter les erreurs courantes et que vos répliques et sauvegardes ne seront jamais un "maillon faible" dans le processus de récupération, le cas échéant.

Alors, bienvenue au chat.

Veeam Backup & Replication : Conseils utiles pour assurer la viabilité des sauvegardes et des répliques

Dans mon précédent article nous avons compris comment optimiser la charge des composants de l'infrastructure de sauvegarde et examiné les erreurs de configuration courantes. Passons à un autre sujet important - une préparation et une récupération compétentes. Nous l'analyserons également à l'aide d'exemples réels avec lesquels l'équipe de support technique a eu la chance de travailler.

Sauvegarde sans restauration - argent gaspillé

Nous sommes régulièrement contactés par des utilisateurs qui se retrouvent dans des situations difficiles similaires : il faut restaurer à partir d'une sauvegarde, mais en essayant de le faire, les gens tombent sur un problème insoluble pour eux. Et ce problème n'est pas du tout le manque de sauvegarde, l'activité de CryptoLocker, ou quelque chose comme ça. Il s'agit "juste" d'une attention insuffisante à la vérification des sauvegardes et des répliques pour la récupérabilité. Beaucoup de gens se concentrent souvent exclusivement sur le processus de création d'une sauvegarde, oubliant que le simple fait d'avoir une sauvegarde n'est pas une panacée pour d'éventuels maux. Vous devez comprendre que la récupération est un processus complètement différent, qui a ses propres caractéristiques, et qui doit être contrôlé et testé avant de se lancer en production. Voici quelques exemples illustratifs :

  1. Un utilisateur a rencontré une défaillance critique d'une machine virtuelle de 20 To. Les temps d'arrêt, bien sûr, sont inacceptables et l'administrateur lance le processus de récupération instantanée (récupération instantanée de la machine virtuelle) - après 5 minutes, la machine est en marche. Mais rappelons qu'un tel état de la machine ne peut être utilisé que temporairement - il doit être migré vers le datastore de production (datastore). Et dans cet exemple, il s'est avéré que les capacités de l'infrastructure ne permettaient pas de copier 20 To de données dans un délai raisonnable. Dans les paramètres du processus de récupération instantanée, il a été choisi d'enregistrer les modifications sur le disque C: Serveur Veeam Backup & Replication (par opposition à un instantané vSphere) - en conséquence, bien sûr, l'espace disque libre s'est rapidement rempli. Au moment où l'utilisateur a contacté l'assistance, la machine virtuelle avait des modifications qui ne pouvaient pas être ignorées. Autrement dit, nous avons une situation où il est impossible de finaliser rapidement le processus de récupération instantanée d'une machine critique - comment pouvons-nous enregistrer des données ici ?

    Franchement, pour la prescription des années, je ne me souviens plus de tous les détails de la finale, mais je me souviens qu'au final, nous n'avons jamais rien trouvé de brillant. Les clients de leur côté ont en quelque sorte résolu ce problème en étendant le lecteur C: à partir des réserves, en copiant les fichiers les plus importants, puis en éteignant la machine virtuelle et en migrant comme ça. En général, le miracle ne s'est pas produit.

  2. Dans l'infrastructure, l'utilisateur disposait d'un contrôleur de domaine et tous les composants de Veeam Backup & Replication étaient configurés à l'aide de DNS. Oui, c'est vrai, vous avez bien entendu. Il y avait une centaine d'options pour le développement d'événements, pas moins, mais en réalité tout s'est passé comme ça : les gens ont planifié la maintenance et ont décidé de passer à une réplique de leur contrôleur de domaine. Ils ont utilisé la commutation programmée, ce qui, en général, est recommandé dans de telles situations. À la première étape, tout s'est bien passé, et à la deuxième étape, la VM d'origine a été brièvement éteinte pour transférer le reste des données. Bien entendu, la tâche de basculement a immédiatement échoué car le DNS a cessé de fonctionner.

    Heureusement, nous avons pu gérer la situation ici en activant manuellement la réplique à partir de vSphere (généralement, nous ne recommandons pas de le faire vous-même, comme vous le verrez dans l'exemple suivant). Mais, comme vous le comprenez, le processus de maintenance a été interrompu et reporté. De plus, nous avons dû entrer manuellement les noms d'hôtes dans le fichier C:WindowsSystem32driverestosts sur le serveur Veeam Backup & Replication pour assurer un basculement correct.

  3. Un autre client disposait d'une infrastructure de sauvegarde complète construite autour de lecteurs de bande, avec uniquement de courtes chaînes de fichiers stockées sur disque. Lorsqu'ils ont dû restaurer un certain nombre de fichiers à partir d'un serveur de fichiers volumineux, ils ont constaté qu'aucune des machines ne pouvait être utilisée comme référentiel de sauvegarde lors de la restauration à partir d'une bande, car aucune n'avait suffisamment d'espace libre. (Vous pouvez en savoir plus sur la restauration directe à partir d'une bande magnétique et l'utilisation d'un référentiel auxiliaire ici (jusqu'à présent en anglais)).

Je pense que dans les trois exemples, les utilisateurs, pour ainsi dire, étaient captifs d'illusions - ils supposaient que si la sauvegarde réussissait, la restauration ne poserait aucun problème. Mais ceci, comme vous le comprenez, n'est en aucun cas toujours le cas, et il est donc nécessaire de préparer la récupération aussi soigneusement que pour la sauvegarde. Pour commencer, ça vaut le coup d'explorer Manuel d'utilisation, qui contient des informations assez détaillées sur les différents types de récupération. Au début de chaque paragraphe, les exigences, les étapes préparatoires et les éventuelles restrictions sont répertoriées. La description de la restauration à partir de bandes ou d'instantanés de stockage peut être trouvée dans les sections de documentation et dans notre des articles sur Habr. De plus, les étapes de préparation de la restauration des objets applicatifs à l'aide des outils Veeam Explorers sont décrites dans la section Planification et préparation. guides pour chacun des instruments. Je vous recommande de les lire attentivement - cela vous aidera à préparer correctement le système pour la récupération si nécessaire. En russe, des instructions pour restaurer la base de données SQL Server sont données ici.

Pourquoi ne pas travailler avec des répliques depuis la console vSphere ?

En théorie, les répliques Veeam sont des machines virtuelles ordinaires, avec lesquelles il semblerait logique de travailler à l'aide de la boîte à outils vSphere, en particulier du client vSphere. Cependant, nous vous déconseillons de le faire, et voici pourquoi : le passage à un réplica dans Veeam Backup & Replication est un processus plutôt difficile, nécessitant des étapes strictement séquentielles (auquel cas vous pouvez revenir en arrière d'une étape) et des actions finales correctes - il suffit de regarder l'image illustrant le processus :

Veeam Backup & Replication : Conseils utiles pour assurer la viabilité des sauvegardes et des répliques

Si vous décidez d'activer une réplique à partir du client vSphere, vous rencontrerez probablement à l'avenir un certain nombre de problèmes :

  1. Le mécanisme de basculement vers un réplica depuis Veeam Backup & réplication (illustré dans le schéma) ne fonctionnera plus pour cette machine.
  2. Les données de la base de données de Veeam Backup ne correspondront pas à l'état réel de la VM. Dans le pire des cas, vous devrez modifier la base de données pour y remédier.
  3. Même la perte de données est possible, comme dans cet exemple : l'utilisateur a activé manuellement la réplique dans le client vSphere et a décidé de continuer à travailler avec. Au bout d'un moment, il a remarqué que la réplique était toujours affichée dans la console Veeam Backup & Replication et a décidé de la supprimer car elle était inutile. Faites un clic droit dessus et donnez la commande "Supprimer du disque". Veeam Backup & Replication a immédiatement supprimé la réplique du disque, qui, pendant un moment, était déjà pleinement utilisée en tant que VM normale et contenait les données nécessaires et utiles.

Bien sûr, il existe des situations où vous devez encore activer la réplique à partir du client vSphere - en règle générale, ce sont des cas où le serveur Veeam est éteint et la réplique doit être activée avec un retard. Mais si tout est en ordre avec le serveur Veeam, alors vous devez travailler avec des répliques depuis sa console.

De plus, ne supprimez pas les répliques à l'aide du client vSphere. Veeam Backup & Replication ne sera pas au courant d'un tel changement, et cela est semé d'erreurs et de données obsolètes. Si vous n'avez plus besoin d'un réplica, supprimez-le à l'aide de la console Veeam, et non en tant que VM depuis le client vSphere. Ainsi, vous aurez toujours une liste à jour des répliques.

"Oh" - attention aux mises à jour !

Nous entendons ici, bien sûr, les mises à jour des hyperviseurs et des applications diverses qui sont sauvegardées à l'aide de Veeam. Si vous les examinez du point de vue de l'utilisation de Veeam Backup & Replication, les mises à jour peuvent être divisées en 2 catégories : grandes, majeures, apportant beaucoup de changements - et petites.

Regardons d'abord la première catégorie.

Les mises à jour les plus importantes sont celles de l'hyperviseur. Avant d'installer une telle mise à jour, vous devez vous assurer qu'elle est prise en charge par Veeam Backup & Replication. Ces mises à jour introduisent de nombreux changements dans les bibliothèques et les API utilisées par Veeam Backup & Replication. Le code de Veeam Backup & Replication doit donc être mis à jour et testé de manière approfondie avant de pouvoir être officiellement déclaré pris en charge.

Il convient également de garder à l'esprit que, par exemple, VMware ne fournit pas d'accès préliminaire aux dernières versions de vSphere pour les fabricants de logiciels, de sorte que les développeurs et les testeurs de Veeam reçoivent une nouvelle version en même temps que le reste de l'humanité progressiste - par conséquent, entre la sortie de VMware et le support officiellement annoncé, il y a généralement un certain temps d'écart. Le nombre et la variété des changements à apporter sont tels qu'il y a peu de chance de les intégrer dans un simple correctif - et le support officiel, en règle générale, est annoncé avec la version finale de Veeam Backup & Replication.

En conséquence, il y a ce moment gênant où, après la sortie d'une nouvelle version de vSphere, le nombre de tickets de support technique augmente considérablement, car les utilisateurs se précipitent tête baissée pour installer la nouvelle version, et leurs sauvegardes, bien sûr, cessent immédiatement de fonctionner. . Nous, le support Veeam, devons expliquer aux utilisateurs exactement ce qu'ils ont fait de mal, leur demander de revenir en arrière (si possible) ou trouver des moyens complexes de sortir de l'impasse. Par conséquent, avant d'installer une mise à jour majeure, assurez-vous de vérifier sa compatibilité avec votre logiciel, je vous en prie !

Tout ce qui précède s'applique aux applications que vous sauvegardez et que vous prévoyez de restaurer à l'aide de Veeam. La gamme d'outils Veeam Explorers contient également une liste des versions prises en charge des applications respectives, qui est mise à jour avec chaque version de Veeam Backup & Replication. Par conséquent, avant d'installer une nouvelle version de votre application - que ce soit Exchange, Oracle ou SharePoint - assurez-vous de relire la section appropriée Documentation Veeam Explorer.

À la deuxième catégorie, c'est-à-dire les mises à jour mineures incluent, par exemple, les nouvelles versions de VMware Tools, les mises à jour cumulatives Exchange, les mises à jour de sécurité vSphere, etc. En règle générale, ils ne comportent pas de modifications majeures et, dans la plupart des cas, Veeam Backup & Replication ne rencontre aucun problème avec eux. (Par conséquent, il n'y a pas d'annonces publiques de support officiel dans le produit pour eux.) Cependant, dans notre pratique, il y a eu des cas où de telles mises à jour ont tellement changé le cours habituel des choses qu'elles ont entraîné des erreurs dans Veeam Backup & Replication. Dans de telles situations, une fois le problème confirmé, les ingénieurs de Veeam essaient de publier rapidement le correctif.

Ceux qui parlent anglais techniqueSi vous souhaitez vous tenir au courant de ce sur quoi travaillent les ingénieurs et de ce à quoi les architectes système et les spécialistes du support technique sont confrontés, je vous recommande de vous abonner à nos forums. Chaque semaine, pour ses abonnés, il y a une newsletter "Word from Gostev" rédigée par LeRealGostev. Dans celui-ci, Anton Gostev, responsable du département de gestion des produits, évoque les problèmes récemment rencontrés (et pas seulement du côté de Veeam), les projets de nouvelles versions et les actualités du monde informatique. Si vous avez besoin de plus d'informations, vous pouvez parcourir les sujets du forum - si l'un des clients a un problème avec le produit après une mise à jour, il est fort probable qu'il en ait déjà parlé sur le forum.

Comme vous le comprenez, les correctifs et les mises à jour peuvent entraîner des problèmes non seulement avec les sauvegardes, mais également avec les applications pour lesquelles ces sauvegardes sont effectuées. Et ici, vous serez aidé par des laboratoires virtuels - Veeam DataLabs. Vous avez probablement entendu parler de la fonctionnalité de SureBackup pour vérifier les sauvegardes. Il repose uniquement sur l'utilisation de DataLabs, avec la création d'un environnement isolé dans lequel on peut notamment tester les mises à jour avant de les installer en production. Je vous conseille fortement de le faire - vous vous épargnerez beaucoup de cellules nerveuses. Et si quelqu'un d'autre ne connaît pas SureBackup, je recommande de lire documentation.

Je suppose que c'est tout pour aujourd'hui, merci pour votre attention !

Quoi d'autre à lire

Articles sur Habré :

Manuel d'utilisation (en russe)

Source: habr.com

Achetez un hébergement fiable pour les sites avec protection DDoS, serveurs VPS VDS 🔥 Achetez un hébergement web fiable avec protection DDoS, serveurs VPS et VDS | ProHoster