Quorum (Informatik)
Unter einem Quorum(system) oder einer Voting Disk in einem Verteilten System versteht man eine Komponente des Cluster Managers eines Computerclusters zur Wahrung der Datenintegrität im Fall eines Teilausfalls, zu dessen Zeitdauer weiterhin Daten geschrieben werden könnten. Für jegliche Lese- und Schreiboperation müssen mehrere Knoten, angelehnt an ein Quorum in der Politik, zustimmen, oder konkreter, exklusiv gelockt werden. Wie viele Knoten für Lese- und Schreiboperationen exklusiv gelockt werden müssen, hängt davon ab, ob in dem Verteilten System Verfügbarkeit oder Konsistenz (siehe CAP-Theorem) Vorrang haben. Bei Ausfall des Cluster Interconnects (der Verbindung zwischen den Clusterknoten) besteht das Risiko einer Aufspaltung des Gesamtsystems in unerwünschterweise autonom agierende Einheiten (Netzwerkpartitionen), die fast immer die Datenintegrität bedroht (Split-Brain-Problem). Durch wechselweises oder konkurrierendes Schreiben in die logische Struktur der Voting Disk wird im Falle eines unterbrochenen Interconnects entschieden, welcher Teil des Clusters überleben soll. Die Voting Disk liegt auf Shared Storage.
Anders formuliert: Ein Cluster stimmt einer Schreiboperation zu, wenn N Knoten die Schreiboperation in ihrem Speicher umgesetzt und dies bestätigt haben. Diese Zahl N nennt man das Quorum.
Ein Beispiel für den Fall des Oracle RAC, es überlebt:
- bei asymmetrischer Teilung (zum Beispiel 2:3 Knoten) der größere Teil
- bei gerader Teilung (zum Beispiel 2:2 Knoten) der Teil mit dem größeren Workload.
Eine derartige Unterscheidung nach einem Ausfall des Interconnects als Kommunikationskanal wäre ohne eine „Abstimmung“ auf Massenspeicher unmöglich. Da fast alle Clustermanager auf einen Ausfall der Zwischenverbindung mit dem Neustart mindestens eines Knotens reagieren, ist auch die persistente Speicherung des Clusterstatus in der Voting Disk von Vorteil: Es entfällt ein Gutteil der Neuverhandlungen über Verfügbarkeiten und Masterstatus. Diese Verhandlungen bedingen ohne die persistente Voting Disk oft mehrere Neustarts. Damit steigt bei Verwendung eines Quorums die Verfügbarkeit der Einzelknoten durch entfallende Neustartzyklen.