Ein Cluster Manager ist eine Software für das Management eines Computerclusters (Verbund aus mehreren Rechnern). Er steht für Verwaltungsvorgänge im Cluster zur Verfügung und automatisiert meist Vorgänge wie den Failover vom Primärsystem zum Standby-System im Fehlerfall sowie Switchover für Wartungszwecke. Als Synonym ist auch der Begriff Clusterware gebräuchlich.
Für die Erkennung eines Ausfalls eines Rechners im Cluster wird meist der sogenannte Cluster Heartbeat in Verbindung bzw. in Ergänzung mit einem Quorum verwendet, ein Signal, das über eine Netzwerkverbindung zwischen den Clusterknoten (einzelne Rechner im Cluster) ausgetauscht wird. Verstummt der Heartbeat eines Rechners, wird ein Ausfall desselben angenommen und ein Failover (eine Übernahme der Dienste wie Datenbanken, Webserver oder Application Server) eingeleitet.
Einige Cluster Manager bieten die Möglichkeit, eigene Agenten zu entwickeln. Diese Variante deckt den Fall ab, dass ein Rechner zwar verfügbar ist und sein Cluster Heartbeat weiter über das Cluster-Netzwerk gesandt wird, jedoch der Applikationsdienst (zum Beispiel ein Datenbankservice) nicht mehr zur Verfügung steht. So kann ein Cluster Agent prüfen, ob eine Datenbankverbindung möglich ist. Sofern diese nicht erfolgreich ist, kann ebenfalls mittels des Agents ein Failover initiiert werden.
Typische Cluster Manager sind
- Sun Cluster für Solaris
- Veritas Cluster Server für verschiedene Betriebssysteme wie AIX, HP-UX, Linux, Solaris und Windows
- HP Serviceguard für HP-UX
- PowerHA für AIX (ehemals HACMP)
- SteelEye Lifekeeper für Linux
- Heartbeat für Linux, FreeBSD und Solaris
- Oracle Cluster Ready Services für Linux und Windows, ab Version 10.2 auch zur Absicherung von nicht-Oracle-Diensten
- Tivoli System Automation für z/OS, AIX, Linux, Windows Server 2003
- Pacemaker, skalierbarer High-Availability Cluster Ressourcen Manager für Linux, ehemals Teil von Heartbeat
- OSL Storage Cluster für Solaris
Siehe auch
Literatur
- Joseph Bianco, Peter Lees, Kevin Rabito: Sun Cluster 3 Programming. Prentice Hall (2004), ISBN 0-13-047975-6
- Charles Bookmann: Linux Clustering. SAMS (2002), ISBN 1-57870-274-7
- William Gropp, Ewing Lusk, Thomas L. Sterling: Beowolf Cluster Computing with Linux. MIT Press (2003), ISBN 0-262-69292-9
- Matthew Hart, Scott Jesse: Oracle Database 10g High Availability with RAC, Flashback & Data Guard. McGraw-Hill (2004), ISBN 0-07-225428-9
- Andrea Held: Oracle 10g Hochverfügbarkeit mit Real Application Cluster. Addison-Wesley (2004), ISBN 3-8273-2163-8
- Pankaj Jalote: Fault Tolerance in Distributed Systems. Prentice Hall (1994), ISBN 0-13-301367-7
- Evan Marcus, Hal Stern: Blueprints for High Availability. John Wiley & Sons Inc (2004), ISBN 0-471-35601-8
- Heiko Bauke, Stephan Mertens: Cluster Computing. Springer (2005), ISBN 3-540-42299-4
- Michael Soltau: Unix/Linux Hochverfügbarkeit. MITP (2002), ISBN 3-8266-0775-9
- Alex Vrenios: Linux Cluster Architectur. SAMS (2002), ISBN 0-672-32368-0
- Joseph D. Sloan: High Performance Linux Clusters with OSCAR, Rocks, openMosix, and MPI. O’Reilly & Associates (2004), ISBN 0-596-00570-9
- Volker Herminghaus, Albrecht Scriba: Veritas Storage Foundation. Springer (2006), ISBN 3-540-34610-4