Veeam Backup & Replication: Nützliche Tipps, um die Funktionsfähigkeit von Backups und Replikaten sicherzustellen

Heute freue ich mich erneut, Ihnen nützliche Tipps von meinem Kollegen Evgeny Ivanov, Teamleiter des technischen Supportteams von Veeam, präsentieren zu können. Diesmal teilte Zhenya seine Empfehlungen für die Arbeit mit Backups und Replikaten mit. Ich hoffe, dass sie Ihnen dabei helfen, häufige Fehler zu vermeiden, und dass Ihre Replikate und Backups niemals ein „schwaches Glied“ im Wiederherstellungsprozess darstellen, wenn überhaupt.

Also, willkommen bei cat.

Veeam Backup & Replication: Nützliche Tipps, um die Funktionsfähigkeit von Backups und Replikaten sicherzustellen

In meinem vorherigen Artikel Wir haben herausgefunden, wie wir die Belastung der Komponenten der Backup-Infrastruktur optimieren können, und haben uns häufige Konfigurationsfehler angesehen. Kommen wir zu einem weiteren wichtigen Thema – der kompetenten Vorbereitung und Genesung. Wir werden es auch anhand realer Beispiele analysieren, mit denen das technische Support-Team arbeiten konnte.

Backup ohne Wiederherstellung – Geld den Bach runter

Wir werden regelmäßig von Benutzern kontaktiert, die sich in ähnlich schwierigen Situationen befinden: Es ist notwendig, eine Wiederherstellung aus einem Backup durchzuführen, aber bei dem Versuch, dies zu tun, stoßen Benutzer auf ein für sie unlösbares Problem. Und dieses Problem ist keineswegs das Fehlen eines Backups, die Aktivität von CryptoLocker oder ähnliches. Dies ist „einfach“ unzureichende Aufmerksamkeit für die Überprüfung von Backups und Replikaten auf Wiederherstellbarkeit. Viele Menschen konzentrieren sich oft ausschließlich auf den Prozess der Erstellung eines Backups und vergessen dabei, dass das bloße Vorhandensein eines Backups kein Allheilmittel gegen mögliche Krankheiten ist. Sie müssen verstehen, dass die Wiederherstellung ein völlig anderer Prozess ist, der seine eigenen Merkmale aufweist und vor der Einführung in die Produktion kontrolliert und getestet werden muss. Hier einige anschauliche Beispiele:

  1. Bei einem Benutzer ist ein kritischer Ausfall einer virtuellen 20-TB-Maschine aufgetreten. Ausfallzeiten sind natürlich inakzeptabel und der Administrator startet den sofortigen Wiederherstellungsprozess (VM-Sofortwiederherstellung) – nach 5 Minuten ist die Maschine betriebsbereit. Wir bedenken jedoch, dass ein solcher Zustand der Maschine nur vorübergehend genutzt werden kann – sie muss in den Produktionsdatenspeicher (Datenspeicher) migriert werden. Und in diesem Beispiel war es, wie sich herausstellte, aufgrund der Kapazitäten der Infrastruktur nicht möglich, 20 TB Daten in angemessener Zeit zu kopieren. In den Einstellungen des Instant-Recovery-Prozesses wurde ausgewählt, dass Änderungen auf der Festplatte gespeichert werden sollen C: Veeam Backup & Replication-Server (im Gegensatz zu einem vSphere-Snapshot) – dadurch war der freie Speicherplatz natürlich schnell erschöpft. Als der Benutzer den Support kontaktierte, hatte die VM Änderungen vorgenommen, die nicht ignoriert werden konnten. Das heißt, wir befinden uns in einer Situation, in der es unmöglich ist, den Prozess der sofortigen Wiederherstellung einer kritischen Maschine schnell abzuschließen – wie können wir hier Daten speichern?

    Ehrlich gesagt erinnere ich mich im Laufe der Jahre nicht mehr an alle Details des Finales, aber ich erinnere mich, dass uns am Ende nie etwas Geniales eingefallen ist. Clients auf ihrer Seite haben dieses Problem irgendwie gelöst, indem sie das Laufwerk C: aus den Reserven erweitert, die wichtigsten Dateien kopiert und erst dann die VM ausgeschaltet und so migriert haben. Im Allgemeinen geschah das Wunder nicht.

  2. In der Infrastruktur verfügte der Benutzer über einen Domänencontroller und alle Veeam Backup & Replication-Komponenten wurden mithilfe von DNS konfiguriert. Ja, das stimmt, Sie haben richtig gehört. Es gab nicht weniger als hundert Optionen für die Entwicklung von Ereignissen, aber in Wirklichkeit verlief alles so: Die Leute planten Wartungsarbeiten und beschlossen, auf eine Replik ihres Domänencontrollers umzusteigen. Sie verwendeten eine geplante Umschaltung, was in solchen Situationen im Allgemeinen empfohlen wird. Im ersten Schritt lief alles gut, im zweiten Schritt wurde die ursprüngliche VM kurzzeitig ausgeschaltet, um die restlichen Daten zu übertragen. Natürlich schlug der Umstellungsauftrag sofort fehl, weil DNS nicht mehr funktionierte.

    Glücklicherweise konnten wir die Situation hier bewältigen, indem wir das Replikat von vSphere manuell aktivierten (im Allgemeinen empfehlen wir nicht, dies selbst zu tun, wie Sie im folgenden Beispiel sehen werden). Aber wie Sie wissen, wurde der Wartungsprozess unterbrochen und verschoben. Außerdem mussten wir die Hostnamen manuell in die Datei eingeben C: WindowsSystem32driverposts auf dem Veeam Backup & Replication-Server, um ein korrektes Failover sicherzustellen.

  3. Ein anderer Kunde verfügte über eine komplette Backup-Infrastruktur, die auf Bandlaufwerken aufbaute und nur kurze Dateiketten auf der Festplatte speicherte. Als sie eine Reihe von Dateien von einem großen Dateiserver wiederherstellen mussten, stellten sie fest, dass keine der Maschinen als Backup-Repository für die Wiederherstellung vom Band verwendet werden konnte, da keine über genügend freien Speicherplatz verfügte. (Sie können mehr über die direkte Wiederherstellung von einem Magnetband und die Verwendung eines Hilfsrepositorys erfahren hier (bisher auf Englisch)).

Ich denke, dass die Benutzer in allen drei Beispielen sozusagen in Illusionen gefangen waren – sie gingen davon aus, dass es bei erfolgreicher Sicherung keine Probleme mit der Wiederherstellung geben würde. Wie Sie wissen, ist dies jedoch keineswegs immer der Fall, und daher ist es notwendig, sich auf die Wiederherstellung genauso sorgfältig vorzubereiten wie auf das Backup. Für den Anfang lohnt es sich, es zu erkunden Benutzerhandbuch, das ziemlich detaillierte Informationen über die verschiedenen Arten der Wiederherstellung enthält. Am Anfang jedes Absatzes werden Anforderungen, vorbereitende Schritte und mögliche Einschränkungen aufgeführt. Eine Beschreibung der Wiederherstellung von Bändern oder Speicher-Snapshots finden Sie in den Dokumentationsabschnitten und in unserem Artikel auf Habr. Darüber hinaus werden die Schritte zur Vorbereitung der Wiederherstellung von Anwendungsobjekten mithilfe der Veeam Explorers-Tools im Abschnitt „Planung und Vorbereitung“ beschrieben. Führer für jedes der Instrumente. Ich empfehle Ihnen, sie sorgfältig zu lesen – dies wird Ihnen helfen, das System bei Bedarf richtig auf die Wiederherstellung vorzubereiten. Auf Russisch werden Anweisungen zum Wiederherstellen der SQL Server-Datenbank gegeben hier.

Warum nicht mit Replikaten von der vSphere-Konsole aus arbeiten?

Theoretisch handelt es sich bei Veeam-Replikaten um gewöhnliche virtuelle Maschinen, mit denen es logisch erscheint, mit dem vSphere-Toolkit, insbesondere dem vSphere-Client, zu arbeiten. Wir empfehlen dies jedoch nicht, und zwar aus folgendem Grund: Der Wechsel zu einem Replikat in Veeam Backup & Replication ist ein ziemlich schwieriger Prozess, der strikt aufeinanderfolgende Schritte (sodass Sie in diesem Fall einen Schritt zurücksetzen können) und korrekte abschließende Aktionen erfordert – Schauen Sie sich einfach das Bild an, das den Vorgang veranschaulicht:

Veeam Backup & Replication: Nützliche Tipps, um die Funktionsfähigkeit von Backups und Replikaten sicherzustellen

Wenn Sie sich entscheiden, ein Replikat vom vSphere-Client aus zu aktivieren, werden Sie in Zukunft wahrscheinlich auf eine Reihe von Problemen stoßen:

  1. Der Mechanismus zum Wechseln zu einem Replikat von Veeam Backup & Replication (siehe Abbildung) funktioniert für diese Maschine nicht mehr.
  2. Die Daten in der Veeam Backup-Datenbank entsprechen nicht dem tatsächlichen Zustand der VM. Im schlimmsten Fall müssen Sie die Datenbank bearbeiten, um das Problem zu beheben.
  3. Sogar ein Datenverlust ist möglich, wie in diesem Beispiel: Der Benutzer hat das Replikat im vSphere-Client manuell aktiviert und beschlossen, damit weiterzuarbeiten. Nach einer Weile bemerkte er, dass das Replikat immer noch in der Veeam Backup & Replication-Konsole angezeigt wurde, und beschloss, es als unnötig zu entfernen. Klicken Sie mit der rechten Maustaste darauf und geben Sie den Befehl „Von Datenträger löschen“. Veeam Backup & Replication entfernte das Replikat sofort von der Festplatte, die für einen Moment bereits vollständig als reguläre VM genutzt wurde und die notwendigen und nützlichen Daten enthielt.

Natürlich gibt es Situationen, in denen Sie das Replikat noch vom vSphere-Client aus einschalten müssen – in der Regel handelt es sich dabei um Fälle, in denen der Veeam-Server ausgeschaltet ist und das Replikat verzögert eingeschaltet werden muss. Aber wenn mit dem Veeam-Server alles in Ordnung ist, müssen Sie von seiner Konsole aus mit Replikaten arbeiten.

Löschen Sie Replikate außerdem nicht mit dem vSphere-Client. Veeam Backup & Replication wird von einer solchen Änderung nichts wissen, was mit Fehlern und veralteten Daten behaftet ist. Wenn Sie ein Replikat nicht mehr benötigen, löschen Sie es über die Veeam-Konsole und nicht als VM vom vSphere-Client. So verfügen Sie immer über eine aktuelle Liste der Replikate.

„Oh“ – achten Sie auf Updates!

Damit meinen wir natürlich Updates für Hypervisoren und verschiedene Anwendungen, die mit Veeam gesichert werden. Betrachtet man sie aus der Sicht der Arbeit mit Veeam Backup & Replication, dann lassen sich Updates in zwei Kategorien einteilen: groß, umfangreich, mit vielen Änderungen – und klein.

Schauen wir uns zunächst die erste Kategorie an.

Die wichtigsten Updates sind die für den Hypervisor. Bevor Sie ein solches Update installieren, müssen Sie sicherstellen, dass es von Veeam Backup & Replication unterstützt wird. Diese Updates führen zu vielen Änderungen an den Bibliotheken und APIs, die Veeam Backup & Replication verwendet. Daher muss der Veeam Backup & Replication-Code aktualisiert und ausgiebig getestet werden, bevor er offiziell als unterstützt erklärt werden kann.

Es ist auch zu bedenken, dass VMware beispielsweise Softwareherstellern keinen Vorab-Zugriff auf die neuesten Versionen von vSphere gewährt, sodass Veeam-Entwickler und -Tester zeitgleich mit dem Rest der fortschrittlichen Menschheit eine neue Version erhalten – Daher liegt zwischen der Veröffentlichung von VMware und dem offiziell angekündigten Support in der Regel eine gewisse Zeitspanne. Die Anzahl und Vielfalt der vorzunehmenden Änderungen ist so groß, dass kaum eine Chance besteht, sie in einen einfachen Hotfix zu integrieren – und der offizielle Support wird in der Regel zusammen mit der Release-Version von Veeam Backup & Replication angekündigt.

Dadurch kommt es zu dem unangenehmen Moment, wenn nach der Veröffentlichung einer neuen Version von vSphere die Zahl der technischen Support-Tickets dramatisch ansteigt, weil Benutzer sich mit der Installation der neuen Version beeilen und ihre Backups natürlich sofort nicht mehr funktionieren . Wir, der Veeam-Support, müssen den Benutzern erklären, was genau sie falsch gemacht haben, sie zu einem Rollback auffordern (wenn möglich) oder komplizierte Wege finden, um aus der Sackgasse herauszukommen. Daher bitte ich Sie, vor der Installation eines größeren Updates unbedingt dessen Kompatibilität mit Ihrer Software zu überprüfen!

Alle oben genannten Punkte gelten für Anwendungen, die Sie mit Veeam sichern und wiederherstellen möchten. Die Veeam Explorers-Toolreihe verfügt außerdem über eine Liste der unterstützten Versionen der jeweiligen Anwendungen, die mit jeder Version von Veeam Backup & Replication aktualisiert wird. Lesen Sie daher vor der Installation einer neuen Version Ihrer Anwendung – sei es Exchange, Oracle oder SharePoint – unbedingt den entsprechenden Abschnitt noch einmal durch Veeam Explorer-Dokumentation.

Zur zweiten Kategorie, d.h. Zu den kleineren Updates gehören beispielsweise neue Versionen von VMware Tools, kumulative Exchange-Updates, vSphere-Sicherheitsupdates usw. Sie bringen in der Regel keine größeren Änderungen mit sich und in den meisten Fällen treten bei Veeam Backup & Replication keine Probleme damit auf. (Daher gibt es für sie keine öffentlichen Ankündigungen zur offiziellen Unterstützung des Produkts.) In unserer Praxis gab es jedoch Fälle, in denen solche Updates den üblichen Ablauf so sehr veränderten, dass sie zu Fehlern in Veeam Backup & Replication führten. In solchen Situationen versuchen die Veeam-Ingenieure, den Hotfix schnell zu veröffentlichen, nachdem das Problem bestätigt wurde.

Diejenigen, die technisches Englisch sprechenWenn Sie auf dem Laufenden bleiben möchten, woran Ingenieure arbeiten und was Systemarchitekten und Spezialisten für technischen Support erwartet, empfehle ich Ihnen, sich anzumelden Unsere Foren. Jede Woche gibt es für seine Abonnenten einen Newsletter „Word from Gostev“, verfasst von TheRealGostev. Darin spricht Anton Gostev, Leiter der Produktmanagementabteilung, über kürzlich festgestellte Probleme (und nicht nur auf Veeam-Seite), Pläne für neue Versionen und Neuigkeiten aus der IT-Welt. Wenn Sie weitere Informationen benötigen, können Sie sich die Forumsthemen ansehen. Wenn einer der Kunden nach einem Update ein Problem mit dem Produkt hat, hat er höchstwahrscheinlich bereits im Forum darüber geschrieben.

Wie Sie wissen, können Patches und Updates nicht nur zu Problemen bei Backups führen, sondern auch bei Anwendungen, für die diese Backups erstellt werden. Und hier helfen Ihnen virtuelle Labore – Veeam DataLabs. Sie haben wahrscheinlich schon von der Funktionalität von SureBackup zur Überprüfung von Backups gehört. Es basiert lediglich auf der Nutzung von DataLabs und der Schaffung einer isolierten Umgebung, in der Sie insbesondere Updates testen können, bevor Sie diese in der Produktion installieren. Ich empfehle Ihnen dringend, dies zu tun – Sie sparen sich viele Nervenzellen. Und wenn jemand anderes SureBackup nicht kennt, empfehle ich die Lektüre Dokumentation.

Ich denke, das ist alles für heute, vielen Dank für Ihre Aufmerksamkeit!

Was gibt es sonst noch zu lesen?

Artikel über Habré:

Benutzerhandbuch (auf Russisch)

Source: habr.com

Kommentar hinzufügen