Der Fibonacci-Baum ist Gegenstand der Graphentheorie, vor allem aber eine Datenstruktur in der Informatik. Er stellt einen Spezialfall des AVL-Baums dar, und zwar zu gegebener Höhe denjenigen AVL-Baum mit der kleinsten Anzahl Knoten. Der Name deutet an, dass Fibonacci-Bäume ähnlich den Fibonacci-Zahlen rekursiv definiert werden können.

Entfernt man einen beliebigen Knoten eines Fibonacci-Baums, so entsteht ab der dritten Stufe ein Baum, der nicht mehr Fibonacci-Baum ist. Im Beispiel unten ist er auch nicht mehr AVL-Baum, wenn z. B. eine 1, die nicht die linkeste ist, entfernt wird.

Eine Art „Basis des Logarithmus“ ist wie bei den Fibonacci-Zahlen die Zahl    des goldenen Schnittes. Ideal wäre für einen Binärbaum natürlich die Basis , das Aufrechterhalten schärferer Balancekriterien, z. B. der Höhenausgewogenheit beim vollständig balancierten Binärbaum, ist aber nach Modifikationen des Baums so aufwändig, dass im Mittel die Gesamtkosten solcher Bäume höher werden, es sei denn, die Anwendung ist ganz extrem vom Suchen dominiert. Das AVL-Kriterium erscheint als attraktiver Kompromiss.

Fibonacci-Bäume werden vor allem bei Effizienzüberlegungen zu höhen-balancierten Bäumen, insbesondere AVL-Bäumen, als Extremfälle und Vergleichsobjekte herangezogen.

Rekursive Definition

Die rekursive Definition erfolgt in der Art:

  • Der Fibonacci-Baum der Stufe 0 ist der leere Baum.
  • Der Fibonacci-Baum der Stufe 1 ist ein Baum, der nur aus einem Knoten besteht.
  • Ein Fibonacci-Baum der Stufe (mit ) besteht aus einer Wurzel, deren linkes Kind ein Fibonacci-Baum der Stufe und deren rechtes Kind ein Fibonacci-Baum der Stufe ist.

Eigenschaften

  • Alle internen Knoten (Knoten, die nicht Blätter sind) haben den Balance-Faktor −1.
  • Der Fibonacci-Baum der Stufe (mit ) hat die Höhe .
  • Ist die Anzahl der Knoten des Fibonacci-Baums der Stufe , dann gilt
    für
  • Ist die Anzahl der Blattknoten des Fibonacci-Baums der Stufe , dann gilt
    für
  • Ist die Anzahl der Einfügepunkte (Halbblätter; 1 Blatt = 2 Halbblätter) des Fibonacci-Baums der Stufe , dann gilt
    für
  • Mit Hilfe der Bezeichnung für die -te Fibonacci-Zahl lassen sich diese Größen auch so ausdrücken:
(Für jeden gerichteten Binärbaum gilt .)
  • Zu einer gegebenen Höhe entspricht ein Fibonacci-Baum einem AVL-Baum mit minimaler Knotenanzahl, er ist also am schlechtesten balanciert.
  für und
  für .
  • Damit lässt sich die Höhe in Abhängigkeit von der Knotenanzahl abschätzen zu
 
mit   ,     und  .

Andere dünnste AVL-Bäume

Vertauscht man an einem Knoten das linke mit dem rechten Kind, entsteht wieder ein dünnster AVL-Baum. Damit ergibt sich für die Anzahl dünnster AVL-Bäume der Höhe

a0 =1
a1 =1
ah = (ah–1ah–2) • 2   (für h 2)
  (h–1 links & h–2 rechts) + umgekehrt

Das ist in geschlossener Form , welches sich für der Funktion

mit annähert.

Die Anzahl aller AVL-Bäume der Höhe lässt sich wie folgt berechnen:

A0 =1
A1 =1
Ah = (Ah–1Ah–2) • 2 + (Ah–1Ah–1) (für h 2)
  (h–1 links & h–2 rechts) + umgekehrt + (h–1 links & h–1 rechts)

Es handelt sich um die Folge A029758 in OEIS, die sich für der Funktion

mit oder annähert.

Beide Folgen sind doppelexponentiell, allerdings mit unterschiedlichen Exponenten – mit dem Ergebnis, dass die dünnsten Bäume mit wachsender Baumhöhe anteilig rasch (doppelexponentiell) selten werden.

Daraus folgt, dass die Knotenanzahlen für linken und rechten Teilbaum sehr unterschiedlich sein können. Z. B. kann ein AVL-Baum der Höhe 32–4=28 im Extremfall links einen Ast mit 227–1 = 134217727 (vollständiger Binärbaum der Höhe 27) und rechts einen mit (Fibonacci-Baum der Höhe 26) Knoten haben, was ein Knotenverhältnis von 134217727/514227 ≈ 261 ergibt. Bei einer Höhe von 64–5=59 kommen wir mit 258–1 = 288230376151711743 und n57 = 1548008755918 auf ein Verhältnis von ungefähr 186194.

Suchtiefe

Die Suchtiefe eines Knotens ist die Anzahl der Kanten von der Wurzel bis zum Knoten. Bei einem externen Knoten in einem binären Suchbaum entspricht sie der Anzahl der erforderlichen Vergleiche; bei internen Knoten ist letztere um 1 höher.

Maximale und minimale Suchtiefe eines externen Knotens

Die maximale Suchtiefe eines externen Knotens in einem Fibonacci-Baum ist mit als der Höhe.

Die minimale Suchtiefe eines externen Knotens in einem Fibonacci-Baum ist .
Beweis:
Die beiden externen Blätter eines Baums der Höhe 1 haben Suchtiefe 1.
Das rechte externe Blatt eines Fibonacci-Baums der Höhe 2 hat Suchtiefe 1.
Bei der rekursiven Zusammensetzung eines Fibonacci-Baum der Höhe aus einem der Höhe und einem der Höhe findet sich die minimale Suchtiefe im Unterbaum der Höhe . Daraus folgt die Behauptung.  

Da das Verhältnis zwischen maximaler und minimaler Suchtiefe bei Rot-Schwarz-Bäumen ist, können die Fibonacci-Bäume mit den Farben rot und schwarz nach den Regeln des Rot-Schwarz-Baums eingefärbt werden.

Pfadlängensumme und mittlere Suchtiefe

Die Summe der Suchtiefen über alle internen Knoten des Fibonacci-Baums der Stufe , in der Notation des Abschnitts Suchtiefen und Pfadlängensummen, lässt sich wie folgt rekursiv berechnen:

(leerer Suchbaum)
(nur Wurzel)
(neue Wurzel)(linkes Kind)(rechtes Kind)
für h 2.

Dies wird befriedigt durch

.

Beweis:

.  

Die externe Pfadlänge, d. i. die Summe der Suchtiefen über alle externen Knoten mit des Fibonacci-Baums der Stufe , ist dann

Damit ist die Folge A067331 in OEIS.

Vermöge der Formel von Moivre-Binet lässt sich hieraus für Fibonacci-Bäume über die mittlere Suchtiefe der Limes der Effizienz , vorhandene Schlüssel aufzusuchen, für ableiten zu:

Für den Limes der Effizienz , das Nichtvorhandensein von Schlüsseln festzustellen, ergibt sich derselbe Wert.

Anteil der unausgewogenen Knoten bei AVL-Bäumen

Eine etwas differenziertere Rekursion gestattet Einblick in die inneren Asymmetrien der AVL-Bäume. Sei dazu Uh,u,g die Anzahl der AVL-Bäume der Höhe h mit u unausgewogenen (rechts- oder linkslastigen) und g ausgewogenen Knoten (mit gleich hohen Kindern). Dann ist nach Überlegungen analog zu oben

leerer Baum hat h=0, u=0, g=0
nur Wurzel hat h=1, u=0, g=1
,

denn bei den ungleich hohen Kindern kommt ein u-Knoten hinzu und bei den gleich hohen Kindern ein g-Knoten. Der Anteil der unausgewogenen Knoten an allen Knoten ist , und dieser hat die Vielfachheit , so dass sich als Anteil gemittelt über alle AVL-Bäume der Höhe h

ergibt. Denn die Anzahl aller AVL-Bäume der Höhe ist mit demselben wie oben.

In Tabelle 2 finden sich Zahlenwerte für kleine .

Mittlere Suchtiefe bei AVL-Bäumen

Abschätzung mittels Rekursion über die Höhe

Nach demselben Schema lassen sich mittlere Suchtiefen berechnen. Wir wählen der Vergleichbarkeit halber die Suchtiefe der externen Knoten (Blätter), d. i. die externe Pfadlänge. Sei dazu die Anzahl der AVL-Bäume der Höhe mit externen Blättern und der externen Pfadlänge . Dann ist

   der leere Baum der Höhe 0 mit 1 externen Blatt und externer Pfadlänge 0   
der Baum der Höhe 1 (nur Wurzel) mit 2 externen Blättern und externer Pfadlänge 2
,

denn bei der rekursiven Zusammensetzung zweier AVL-Bäume erhöht sich die Zahl der externen Blätter von

nlundnraufnl+nr=: n

und die externe Pfadlänge von

plundpraufpl+pr+n=: p,

da sich der Weg zur Wurzel für jedes Blatt um 1 verlängert. Die Anzahl aller AVL-Bäume der Höhe ist

.

Es ist dasselbe wie oben.

HöheAnzahl
Bäume
Anteil
unausge-
wogene
Anzahl
externe
Blätter
externe
Pfadlänge
mittl.
Verlän-
gerung
KnotenWurzelnnhphvh
110,0000,0000022,0000222,000021,0000
230,3330,6666733,3333456,000081,0344
3150,3110,4000056,133381216,533241,0263
43150,3030,28571811,467162541,524641,0260
51086750,2850,086961322,4703250103,341601,0228
6118787208750,2745,76e-32144,8766496251,213841,0194
7141106591
466142946875
0,2691,83e-53489,751128180592,168961,0167
819911
070158545297
149037891328
865229296875
0,2671,7e-1055179,502563311363,820481,0146
Tabelle 2: Unausgewogene Knoten und externe Pfadlänge nach Höhe

Die Spalte Anteil unausgewogene Knoten enthält das des Abschnitts #Anteil der unausgewogenen Knoten bei AVL-Bäumen, wogegen die Spalte Anteil unausgewogene Wurzeln den Anteil der Bäume mit unausgewogener Wurzel innerhalb der Gesamtheit der AVL-Bäume der Höhe bedeutet.

In der Spalte vh ist die externe Pfadlänge mit der idealen (minimalen) externen Pfadlänge , die von der Knotenzahl abhängt (s. Tabelle 3), verglichen und dann über alle AVL-Bäume der Höhe gemittelt.

Genaue Rechnung

Die Annahme von gleichen Wahrscheinlichkeiten für alle AVL-Baumformen ist eine Vereinfachung. Zwar kann eine jede mögliche Form eines Binärbaums durch gezielte Einfügungen aufgebaut werden, bei den AVL-Bäumen gibt es aber bevorzugte Formen, die nach Rotationen häufiger entstehen als andere. Werden alle Reihenfolgen (Permutationen) der Einfügung als gleich wahrscheinlich angesehen, dann ergibt sich z. B. bei den 17 AVL-Bäumen mit der Knotenzahl 7 (s. Tabelle 3) beim ausgewogenen Baum (einem vollständigen Binärbaum der Höhe 3) eine Häufigkeit von 2160 und bei den restlichen 16 (die allesamt Fibonacci-Bäume der Höhe 4 sind) für die eine Hälfte eine Häufigkeit von 144 und für die andere eine von 216.

Kno-
ten-
zahl
mittl.
Höhe
Anzahl
Bäume
Anteil
unausge-
wogener
Häufigkeitexterne
Pfad-
länge
mittl.
Verlän-
gerung
hnKnotenWurzelnpnvn
11,0010,0000,0001122,0021,0000
22,0020,5001,0001155,0051,0000
32,0010,0000,0006688,0081,0000
43,0040,5001,000661212,00121,0000
53,0060,2800,60012361616,00161,0000
63,0040,1670,0001442162020,00201,0000
73,57170,3270,57114421602424,57251,0238
84,00320,3931,00028832402929,36301,0123
94,00440,3330,7143456259203434,24351,0070
104,00600,2860,429250561944003939,07401,0018
114,00700,2490,11711404823328004444,00441,0000
124,191840,2670,193466560174182404949,19501,0039
134,514760,3110,5099331202426112005454,58561,0108
144,798720,3420,790882316827748656005960,10621,0187
154,9615530,3510,888116173440549794304006465,72681,0268
165,0027200,3400,7765197478401498602384007071,41731,0201
175,0042880,3240,609276950016019785876480007677,13791,0149
185,0063120,3090,45360134731776228127544640008282,88851,0107
195,0090040,2960,2959048054067203987945861120008888,66911,0075
205,02160880,2870,179539469564480039689604896256009494,52971,0056
215,10369000,2870,1591078939128960074716118765568000100100,491031,0049
225,22829840,2930,237974804616576001134885141276480000106106,551101,0052
235,381743740,3040,380136276071902208028970685819518976000112112,711171,0064
245,543460480,3150,5437172727971696640337716405039775104000118118,951231,0080
255,706530960,3250,691708936739006003207478785384139059200000124125,261301,0101
265,8211993840,3310,795990569400644966400134732114837823140352000130131,631371,0125
Tabelle 3: Unausgewogene Knoten und externe Pfadlänge nach Einfügereihenfolge

Bei der Aufstellung der Tabelle 3 wurden pro Knotenzahl alle Reihenfolgen der Einfügung nach dem AVL-Einfügealgorithmus mit demselben Gewicht versehen. (Deshalb summieren die Häufigkeiten zu n! auf.) Der große Unterschied zwischen minimaler und maximaler Häufigkeit resp. zeigt, dass die entstehenden Baumformen sehr unterschiedlich häufig sind, wobei die häufigsten gleichzeitig minimale externe Pfadlänge haben. Letzteres ist gleichzeitig Bezugspunkt für die mittlere Verlängerung der externen Pfadlänge vn. Fibonacci-Bäume sind durchaus selten, haben aber nicht notwendigerweise maximale externe Pfadlänge .

Diese Häufigkeiten sind wesentlich schwerer zu berechnen als die obigen Baumanzahlen und Verlängerungen der Pfadlänge vh, bei denen die AVL-Bäume einer festen Höhe als gleich wahrscheinlich angenommen werden. Für kleine Bäume unterscheiden sich vn und vh allerdings nur geringfügig. R. W. Floyd schätzt den mittleren Aufwand, unter Schlüsseln das Fehlen eines -ten festzustellen, auf , was asymptotisch einem Wert von für vn entspricht.

Die Spalten , und sind die Folgen A006265, A001855 resp. A228155 in OEIS.

Flankentiefe

Als linke bzw. rechte Flankentiefe sei die Länge des Pfades von der Wurzel bis zum Minimum resp. zum Maximum bezeichnet. Da man durch links-rechts-Spiegelung eines AVL-Baums wieder einen AVL-Baum derselben Höhe erhält, haben linke wie rechte Flankentiefe dieselbe Wertemenge. Für einen AVL-Baum der Höhe ist sie höchstens und mindestens

,

entsprechend den Überlegungen zur minimalen Suchtiefe von Fibonacci-Bäumen.

Auf ähnliche Weise wie oben lässt sich die linke und rechte Flankentiefe mitteln über alle AVL-Bäume der Höhe . Sei dazu die Anzahl der AVL-Bäume der Höhe mit linker Flankentiefe und rechter Flankentiefe . Dann ist

denn bei der rekursiven Zusammensetzung zweier AVL-Bäume erhöht sich die Flankentiefe auf beiden Seiten um 1 und es können in jeder der Gruppen „links höher“, „rechts höher“ und „gleich hoch“ alle Möglichkeiten links mit allen Möglichkeiten rechts kombiniert und diese Anzahlen insgesamt aufsummiert werden. Als Kontrolle gilt: Die Anzahl aller AVL-Bäume der Höhe ist

.

Es ist dasselbe wie oben.

Die mittlere linke wie rechte Flankentiefe für einen AVL-Baum der Höhe ist dann

dh .

Zahlenwerte für kleine sind in Tabelle 1.

Mittlere Abstiegstiefe beim Löschen

Ähnlich lässt sich eine mittlere Abstiegstiefe berechnen, die beim Löschen eines Knotens von seiner Höhe bis zu den (Halb-)Blättern zu seiner Linken oder Rechten hinabgestiegen werden muss, um einen Knoten zu finden, der an die Stelle des zu löschenden Knotens treten kann. Für einen einzelnen Knoten auf der Höhe entspricht ihr Mittelwert dem soeben berechneten dh.

Der Mittelwert über alle Knoten eines AVL-Baumes ist aber wesentlich niedriger, da die meisten Knoten auf geringer Höhe liegen. Sei dazu die Anzahl der AVL-Bäume der Höhe mit Knoten, linker Flankentiefe und Flankentiefensumme und rechter Flankentiefe und Flankentiefensumme . Dabei sei Flankentiefensumme die Summe aller linken resp. rechten Flankentiefen eines gegebenen Baums. Dann ist

AVL-Baum mit 1 Knoten
AVL-Baum mit 2 Knoten linkslastig
AVL-Baum mit 2 Knoten rechtslastig
AVL-Baum mit 3 Knoten
  
 
 

denn bei der rekursiven Zusammensetzung zweier AVL-Bäume erhöhen sich durch das Hinzukommen der neuen Wurzel die Flankentiefen auf beiden Seiten um 1, bei der linken und rechten Flankentiefensumme kommt zum Beitrag der 2 Bäume noch die beziehentliche Flankentiefe hinzu und es können in jeder der Gruppen „links höher“, „rechts höher“ und „gleich hoch“ alle Möglichkeiten links mit allen Möglichkeiten rechts kombiniert und diese Anzahlen insgesamt aufsummiert werden.

Die Anzahl der AVL-Bäume der Höhe mit Knoten und linker Flankentiefensumme ist

.

Diese Bäume haben damit pro Knoten die mittlere linke Flankentiefe . Die Flankentiefe gemittelt über alle AVL-Bäume der Höhe ist somit

.

Denn wir haben mit demselben wie oben.

Da aus Symmetriegründen die Länge eines Weges von der Wurzel zu einem Knoten auf einer bestimmten Höhe bei Einheits-Zugriffswahrscheinlichkeiten nicht von Richtungswechseln abhängt, ist die mittlere Abstiegstiefe gemittelt über alle AVL-Bäume der Höhe ebenfalls .

Einige Zahlenwerte:

dh
10000
200,666710,27778
311,533320,49921
412,409530,66886
523,371440,79391
624,368750,87686
735,368660,92801
836,368670,95865
947,368680,97660
1048,368690,98693
Tabelle 1

Die ganz einfache Überlegung aus dem Abschnitt Löschen liefert

.

Siehe auch

Literatur

  • Kurt Mehlhorn Datenstrukturen und effiziente Algorithmen Teubner Stuttgart 1988, ISBN 3-519-12255-3.

Einzelnachweise

  1. Die Höhe als Maximalzahl der Knotenebenen oder zahlenmäßig gleich, wenn es wie bei #Knuth (schlüssellose) externe Blätter gibt, als Maximalzahl der Kanten vom externen Blatt zur Wurzel.
  2. laut Knuth Theorem A die Formulierung von Adelson-Velsky / Landis
  3. #Knuth a. a. O., S. 467.
  4. A. V. Aho and N. J. A. Sloane: Some Doubly Exponential Sequences. In: Fib. Quart., 11, Bell Laboratories Murray Hill, New Jersey. 1970, S. 429–437.
  5. external path length bei #Knuth a. a. O. pp. 399–400
  6. Bspw. hat der Fibonacci-Baum mit die externe Pfadlänge . Der AVL-Baum mit und hat auf der einen Seite den vollständigen Binärbaum mit 15 Knoten und auf der anderen Seite einen Fibonacci-Baum mit 4 Knoten.
  7. Bei den Anteilen der Bäume mit unausgewogener Wurzel wird allerdings die unterschiedliche Gewichtung in extremer Form sichtbar.
  8. zitiert nach #Knuth a. a. O., S. 468
  9. https://oeis.org/A006265
  10. https://oeis.org/A001855
  11. https://oeis.org/A228155
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.