Windows Server Summit 2026 | Teil 19: Failover-Clustering: Das Herzstück der Private Cloud und des Rechenzentrums

Typischerweise werden Server nicht alleinstehend, sondern in Verbünden eingesetzt, um eine hohe Verfügbarkeit zu erzielen und gegen Ausfälle einzelner Systeme gewappnet zu sein. Auch lässt sich die Last mittels solcher Verbünde effizient auf mehrere Systeme verteilen.
Herzstück solcher Verbünde ist i.d.R. die Serverfunktion "Failover-Clustering". Hiermit lassen sich mit relativ geringem Aufwand mehrere Server mit gleichartiger Hardware zu einem logischen Verbund zusammenfassen. Dieser Verbund kann dann Rollen und Produkte wie beispielsweise Virtualisierung (Hyper-V), Dateidienste, SQL Server redundant bereitstellen.
Dieser Artikel geht auf Funktionen ein, die das Failover-Clustering heute schon beherrscht und gibt einen Ausblick auf Funktionen, die in der Zukunft verfügbar gemacht werden.
Live-Migration
Die folgenden Kapitel gehen auf einige Funktionen in Bezug auf die Funktion "Live-Migration" ein. Diese ermöglicht das Verschieben von virtuellen Maschinen im laufenden Betrieb, ohne dass die VM dazu heruntergefahren werden muss.
Arbeitsgruppen-Cluster
Seit Windows Server 2016 ist es möglich, Failovercluster auch außerhalb eines Active Directory zu betreiben. Neben Kostenersparnisgründen mag dies auch aus Sicherheitserwägungen heraus genutzt werden, um beispielsweise eine separate Authentifizierungsplattform für die Virtualisierungsebene zu verwenden.
Allerdings ist es bislang nicht möglich, virtuelle Maschinen in einem solchen Cluster zwischen den Knoten im laufenden Betrieb zu verschieben. Dies ändert sich jedoch jetzt. Damit fällt eine erhebliche Einschränkung für die Nutzung solcher Cluster weg und der Einsatz wird deutlich vereinfacht.
GPU-Partitionierung
Eine weitere Neuerung betrifft virtuelle Maschinen, die Zugriff auf eine physikalische Grafikkarte haben. Mit der Funktion "GPU-Partitionierung" ist es möglich, die Ressourcen der Grafikkarte auf mehrere virtuelle Maschinen aufzuteilen. Diese virtuellen Maschinen können nun ebenfalls im laufenden Betrieb zwischen den Knoten verschoben werden und müssen nicht vorher heruntergefahren werden.
AccelNet für hochverfügbare virtuelle Maschinen
AccelNet ermöglicht es einer virtuellen Maschine, direkt auf die physikalische Netzwerkkarte des Knotens zuzugreifen. Dies reduziert Latenzen und CPU-Last und ermöglicht u.a. den Betrieb zusätzlicher VM auf dem Knoten im Vergleich zu einer Konfiguration ohne AccelNet.
Diese Funktion ist bereits in Azure für virtuelle Maschinen im Einsatz und wird nun auch in Windows Server verfügbar gemacht. Voraussetzung hierfür ist der Einsatz von Netzwerk-ATC (Advanced Traffic Control).
Neue Failover-Clustering-Szenarien
Windows Server 2025 unterstützt neue Szenarien für den Aufbau und Betrieb von Failover-Clustern. Diese werden in der Folge beschrieben.
Koexistenz von S2D und SAN-Systemen
S2D unterstützt nun die Einbindung von bereits vorhandenen SAN-Systemen, so dass die beiden Technologien miteinander kombiniert werden können. Es ist also nicht mehr erforderlich, für den Einsatz von S2D neue Server-Hardware einzukaufen.
S2D Campus Cluster
Mit S2D Campus Cluster lassen sich die Datenträger von Servern in zwei Rechenzentren zu einem virtuellen Pool zusammenfassen. Bislang war dies nur mit Servern am gleichen Standort möglich.
Optimierung von Rack-lokalen Lesevorgängen
Bislang werden alle Kopien eines Datenblocks bei einem Lesevorgang als gleichwertig betrachtet. Daher kann es vorkommen, dass ein Lesevorgang nicht auf die am nächsten gelegene, sondern auf eine beliebige andere Kopie zugreift. Dies wäre bei einem S2D Campus Cluster von Nachteil, da Lesevorgänge so versehentlich auch auf die andere Seite geleitet werden und dadurch langsamer werden könnten.
Um dieses Verhalten zu mitigieren, wird nun eine Priorisierung von Lesevorgängen eingeführt. Das System evaluiert entsprechend, wo sich die am nächsten gelegene Kopie befindet und leitet die Leseanforderung dorthin. Hierbei wird nach einer Hierarchie vorgegangen:
- Gleicher Knoten
- Gleiches Chassis
- Gleiches Rack
- Gleiche Site
Cloud-Zeuge mit verwalteter Identität
Einem Failover-Cluster wird normalerweise ein kleiner Speicherbereich zugeordnet, in dem sich Steuerungsinformationen für den Cluster befinden. Dies ermöglicht einen problemfreien Wiederanlauf im Falle eines Komplettausfalls oder wenn der Cluster nicht über eine ungleiche Anzahl an Knoten verfügt.
Hierfür kann auch ein Azure Blob-Speicher verwendet werden. Allerdings ist der Zugriff auf diesen Speicher bislang nur mit einem Zugriffschlüssel (vergleichbar mit einem Kennwort) möglich, welcher in der Failovercluster-Datenbank hinterlegt wird.
Um hier die Sicherheit zu erhöhen, ist es nun möglich, eine verwaltete Identität für den Zugriff zu verwenden.
Verteilter S2D-Cluster mit Speicherreplikation
Windows Server unterstützt bereits seit Windows Server 2008 R2 verteilte Cluster. Die Replikation der Speichersysteme musste bislang jedoch über separate Mechanismen in den Speichersystemen selbst realisiert werden.
Demnächst wird es möglich sein, auch S2D-basierten Speicher mittels der in Windows Server integrierten Funktion "Speicherreplikation" zwischen den Standorten zu replizieren.
Künftige Entwicklungen
Microsoft gibt auch einen Ausblick auf Funktionen, die in der Zukunft hinzukommen sollen. Diese werden in der Folge näher erläutert.
Cluster-native Aktualisierung
Für Failover-Cluster gibt es eine spezielle Rolle namens "clusterfähige Aktualisierung" (CAU). Diese ermöglicht eine Automatisierung der Installation von Aktualisierungen in einem Failover-Cluster, indem verhindert wird, dass mehrere Knoten parallel aktualisiert und/oder neu gestartet werden. Diese verwendet verschiedene Aufsätze (z.B. für Hotfixes, Aktualisierungen und angepasste Bedarfe).
Diese Funktionalität wird nun nativ in die Clusterrolle eingebaut und in diesem Zuge in "Cluster-native Aktualisierung" (CNU) umbenannt. Es werden auch einige Verbesserungen an der Funktion vorgenommen:
- Verbesserte Steuerung der Knoten im Rahmen einer Aktualisierung mit eingebauten Fernwartungsfunktionen
- Plugin-basierte Architektur für bessere Erweiterbarkeit sowie einfache Entwicklung von benutzerdefinierten Plugins (auch für CAU!)
- Verbesserte Konfigurationsoberfläche und Diagnosefunktionen
- Erstellung und Verwendung von Vorlagen für Aktualisierungszyklen
Zugangssteuerung
Der Begriff ist etwas irreführend, wird jedoch auch von VMware für die dahinterstehende Funktionalität verwendet. Die Zugangssteuerung hat zum Ziel, ausreichende Clusterkapazität für den Fall eines Knotenausfalls oder einer Wartung sicherzustellen. Hierzu können Mindestreserven für CPU, RAM und GPU konfiguriert werden. Ebenso kann die Auslastung des Clusters überwacht werden.
Die Zugangssteuerung kann in zwei Modi betrieben werden:
- Sanfte Erzwingung (es wird eine Warnung gesendet, die aktuelle Aktion wird jedoch nicht unterbrochen)
- Harte Erzwingung (die aktuelle Aktion wird abgebrochen, sobald die Grenzwerte überschritten werden)
Die Zugangssteuerung greift beispielsweise in folgenden Fällen:
- Hinzufügen/Entfernen einer virtuellen Maschine
- Ein-/Ausschalten einer virtuellen Maschine
- Verändern der Größe einer virtuellen Maschine
- Hinzufügen/Entfernen eines Clusterknotens
Hat Dir der Beitrag gefallen? Lass es andere wissen!



One thought on “Windows Server Summit 2026 | Teil 19: Failover-Clustering: Das Herzstück der Private Cloud und des Rechenzentrums”