Einleitung - Konvergenzraten
Die Verfahren, die wir bisher im Zusammenhang mit der Lösung linearer Gleichungssysteme und Ausgleichsprobleme vorgestellt haben, bestimmen in endlich vielen Schritten eine Lösung, welche, wenn man exakt rechnen könnte, immer die exakte Lösung des Problems wäre. In der Praxis lassen sich aber viele mathematische Probleme nur mittels eines Iterationsverfahrens näherungsweise lösen.
Iterationsverfahren
d. h. mittels wiederholter Anwendung derselben Rechenvorschriften, wobei in der
-ten Iteration („Wiederholung“), ausgehend von einer Näherung
, eine neue und möglichst genauere Näherung
für eine gesuchte Lösung des Problems berechnet wird. Für den Start eines solchen Verfahrens muss man folglich eine Startnäherung
vorgeben.
Iterationsverfahren würden im allgemeinen, wenn sie nicht nach endlich vielen Schritten abgebrochen würden, eine unendliche Folge
von Iterierten generieren. Aufgabe des Numerikers ist es zu zeigen, dass jede konvergente Teilfolge oder die ganze vom Verfahren erzeugte Folge
für jeden Startpunkt aus einer gewissen Menge gegen eine (ja a priori unbekannte!) Lösung
des gegebenen Problems konvergiert. In diesem Zusammenhang spricht man von globaler Konvergenz eines Verfahrens, wenn diese Konvergenz für jede Wahl des Startpunktes aus einer wohlbestimmten Menge (z. B. dem ganzen
) gegeben ist, und von lokaler Konvergenz, wenn dies nur für Startpunkte aus einer (im Allgemeinen nicht spezifizierbaren) Umgebung einer Lösung der Fall ist. In der Praxis wird ein Iterationsverfahren natürlich nach einer endlichen Anzahl von Iterationen gestoppt und zwar dann, wenn zum ersten Mal ein Abbruchkriterium erfüllt ist, welches ausreichende Genauigkeit der aktuellen Näherung im Hinblick auf eine Lösung des Problems sicherstellt. Die Angabe eines sinnvollen Abbruchkriteriums kann dabei durchaus ein schwieriges Unterfangen sein.
Für ein gegebenes Verfahren ist neben dem rechnerischen Aufwand, der pro Iteration zu leisten ist, naturgemäß von Interesse, wie schnell es, wenn es nicht abgebrochen würde, gegen eine gesuchte Lösung konvergieren würde und damit, ob im Schnitt nur wenige oder viele Iterationen durchlaufen werden müssen, bis ein gegebenes Abbruchkriterium erfüllt ist. Wir wollen daher als nächstes den Begriff der Konvergenzgeschwindigkeit eines Verfahrens genauer fassen.
Definition 5.1
- Sei
eine Norm auf dem
und
eine Folge in
mit
.
- (i) Die Folge
konvergiert von (mindestens) der Ordnung
(gegen
), wenn mit einem
und einem
- (5.1)

- gilt, wobei
für
sei. Im Fall
spricht man auch von linearer und im Fall
von quadratischer Konvergenz.
- (ii) Die Folge
konvergiert superlinear (gegen
), wenn
für ein
gilt sowie
- (5.2)

Die drei wichtigsten Konvergenzraten bei Algorithmen sind lineare, superlineare und quadratische Konvergenz, so dass wir uns im Folgenden nur auf sie beziehen werden.
Die (praktisch irrelevante) Voraussetzung „
für ein
“ bei der Definition der superlinearen Konvergenz kann man vermeiden, indem man diese mit einer Folge
von Zahlen
mit
durch
- (5.3)

für ein
definiert. Für
kann man superlineare Konvergenz der Folge
auch durch die Beziehung

ausdrücken und quadratische Konvergenz durch

Beispiel 5.2
Die Folgen
und
mit

konvergieren für
gegen
. Man errechnet



Also konvergiert
linear,
superlinear und
quadratisch gegen 1. Die folgende Tabelle demonstriert, was die unterschiedlichen Konvergenzraten praktisch bedeuten.

Quadratische Konvergenz impliziert superlineare Konvergenz und diese wiederum lineare Konvergenz. Denn im Fall quadratischer Konvergenz hat man mit einem
und einem

was wegen
die Bedingung (5.3) impliziert. Ist andererseits (5.2) gegeben, dann existiert zu jedem
ein
, so dass gilt:
- (5.4)

Letztere Beziehung drückt gerade die lineare Konvergenz aus.
Im Fall der superlinearen Konvergenz gilt ja (5.4), d. h. lineare Konvergenz mit einem
, so dass man bei der Definition der linearen und superlinearen Konvergenz auf die Voraussetzung
verzichten könnte. Denn die Ungleichung (5.1) impliziert im Fall der linearen Konvergenz

und damit wegen
auch die Konvergenz
. Bei der Definition einer Konvergenzordnung
muss man aber, da dort nicht
gefordert ist, die Konvergenz der Folge
explizit voraussetzen.
Man beachte, dass lineare Konvergenz mit einer Konstanten
sehr langsame Konvergenz bedeuten kann.
Beispiel 5.3
Für die gegen 1 konvergierende Folge
mit
gilt

Die langsame Konvergenz sei mit der Berechnung einiger Folgenglieder gezeigt:

Man hofft also, dass die Konstante
in der Praxis im Fall der linearen Konvergenz
ist und im Fall der quadratischen Konvergenz nicht allzu groß wird. In letzterem Fall besagt die Ungleichung (5.1) für
, dass sich für einen Fehler
die Anzahl der korrekten Stellen hinter dem Dezimalpunkt von
bezüglich
gegenüber der von
ungefähr verdoppelt. Denn dann ist

so dass man bei einer Genauigkeit von
Stellen hinter dem Dezimalpunkt für
bezüglich der Norm
im
-ten Schritt einen Fehler
hat und somit im
-ten Schritt einen Fehler

Quadratische Konvergenz ist demnach eine für die Praxis sehr gute Eigenschaft eines Verfahrens und meist die schnellste Konvergenz, die man mit vernünftigen Mitteln erreichen kann.
Es sei jedoch darauf hingewiesen, dass eine gute Konvergenzrate eines Verfahrens alleine nicht dessen Effizienz garantiert. Von einem gegebenen Verfahren ausgehend, kann man ja immer ein noch schnelleres Verfahren erzeugen, indem man mehrere Iterationen des ersten Verfahrens zu einer einzigen zusammenfasst. Neben der Konvergenzgeschwindigkeit eines Verfahrens hat man also bei der Beurteilung eines Verfahrens den numerischen Aufwand pro Iteration und natürlich auch seine Stabilität zu berücksichtigen.
Wir bemerken ferner, dass die Eigenschaften der superlinearen und quadratischen Konvergenz einer Folge
gegen einen Punkt
im
aufgrund der Äquivalenz aller Normen im
unabhängig von der gewählten Norm sind. Denn die Äquivalenz zweier Normen
und
auf dem
besagt, dass mit zwei Konstanten
und

gilt, so dass z. B. die Beziehung in (5.3) bezogen auf die Norm

impliziert und damit für die Nullfolge
mit
auch

Ähnlich garantiert quadratische Konvergenz bezüglich der Norm
auch die quadratische Konvergenz

bezüglich einer Norm
, wobei die Konstante
von der Norm
abhängt. Dagegen muss lineare Konvergenz einer Folge im
bezüglich einer Norm nicht notwendig die lineare Konvergenz hinsichtlich einer anderen Norm auf dem
zur Folge haben. Zwar gilt beispielsweise für jede linear bezüglich
konvergente Folge
auch

mit einer Konstanten
für eine Norm
, jedoch nicht notwendig
. Sprechen wir also von linearer Konvergenz, so müssen wir klarstellen, bezüglich welcher Norm wir dies tun. Wenn nichts Anderes gesagt wird, beziehen wir uns immer auf Konvergenz im Sinne der Euklidischen Norm
.
Die hier eingeführten Begriffe der linearen, superlinearen und quadratischen Konvergenz werden gelegentlich auch als
-lineare,
-superlineare bzw.
-quadratische Konvergenz bezeichnet, im Unterschied zur
-linearen,
-superlinearen bzw.
-quadratischen Konvergenz (siehe z. B. das Buch von Ortega und Rheinboldt aus dem Jahre 1970). Das „
“ steht dabei für „Quotient“, da die Konvergenzrate in allen Fällen mittels des Quotienten
ausgedrückt werden kann (während „
“ für engl. „Root“, also „Wurzel“ steht).
Siehe auch
Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.
Wiki2Reveal
Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Numerik I' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.