Die F-Verteilung oder Fisher-Verteilung, auch Fisher-Snedecor-Verteilung (nach Ronald Aylmer Fisher und George W. Snedecor), ist eine stetige Wahrscheinlichkeitsverteilung. Eine F-verteilte Zufallsvariable ergibt sich als Quotient zweier jeweils durch die zugehörige Anzahl der Freiheitsgrade geteilter Chi-Quadrat-verteilter Zufallsvariablen. Die F-Verteilung besitzt zwei unabhängige Freiheitsgrade als Parameter und bildet so eine Zwei-Parameter-Verteilungsfamilie.
Die F-Verteilung wird häufig in einem Test verwendet (F-Test), um festzustellen, ob der Unterschied zweier Stichprobenvarianzen auf statistischer Schwankung beruht oder ob er auf unterschiedliche Grundgesamtheiten hinweist. Auch im Rahmen der Varianzanalyse wird mit einer F-Statistik auf signifikante Unterschiede zwischen Grundgesamtheiten (Gruppen) getestet.[1]
Definition
Eine stetige Zufallsvariable genügt der F-Verteilung
, mit
Freiheitsgraden im Zähler und
Freiheitsgraden im Nenner, wenn sie die Wahrscheinlichkeitsdichte

besitzt. Dabei ist mit
die Gammafunktion an der Stelle
bezeichnet.
Den historischen Ursprung obiger Definition der F-Verteilung bildet die Verteilung

wobei
und
unabhängige, Chi-Quadrat-verteilte Zufallsvariablen mit
bzw.
Freiheitsgraden sind.
Eigenschaften
Erwartungswert
Der Erwartungswert existiert nur für
und hat dann den Wert
.
Varianz
Die Varianz ist nur für
definiert und lautet dann
.
Verteilungsfunktion
Die Werte der Verteilung
werden meist numerisch ermittelt und in einer Tabelle angegeben. Eine komplette Tabellierung bezüglich aller Freiheitsgrade ist i. A. nicht notwendig, sodass die meisten Verteilungstabellen die Quantile bezüglich ausgewählter Freiheitsgrade und Wahrscheinlichkeiten angeben. Man macht sich hier auch die Beziehung zunutze:

wobei
das
-Quantil der F-Verteilung mit
und
Freiheitsgraden bedeutet.
Die F-Verteilung lässt sich geschlossen ausdrücken als

wobei
die regularisierte unvollständige Betafunktion darstellt.
Maximum
Für
nimmt
an der Stelle

das Maximum an.
Entropie
Die Entropie der F-Verteilung (ausgedrückt in nats) beträgt

wobei
die Digamma-Funktion bezeichnet.
Beziehungen zu anderen Verteilungen
Das Zeichen
bedeutet im Folgenden „ist verteilt wie“.
Beziehung zur Beta-Verteilung
Die Zufallsvariable

ist betaverteilt mit Parametern
und
Es gilt:

wobei
und
unabhängige Chi-Quadrat-verteilte Zufallsgrößen sind mit
bzw.
Freiheitsgraden.
Beziehung zur Chi-Quadrat-Verteilung
Aus den unabhängigen
und
Chi-Quadrat-verteilten Zufallsgrößen mit
bzw.
Freiheitsgraden lässt sich

konstruieren. Diese Zufallsvariable ist
-verteilt.
Beziehung zur nichtzentralen F-Verteilung
Für unabhängige Zufallsvariablen
und
ist

verteilt nach der nichtzentralen F-Verteilung
mit Nichtzentralitäts-Parameter
. Dabei ist
eine nichtzentrale Chi-Quadrat-Verteilung mit Nichtzentralitäts-Parameter
und
Freiheitsgraden. Für
ergibt sich die zentrale F-Verteilung
.
Dichte der nichtzentralen F-Verteilung
[2]
Die Funktion
ist eine spezielle hypergeometrische Funktion, auch Kummersche Funktion genannt und
repräsentiert die oben angegebene Dichte der zentralen F-Verteilung.
Erwartungswert und Varianz der nichtzentralen F-Verteilung sind gegeben durch
mit 
und
mit 
Beide ergeben bei
die Formeln der zentralen F-Verteilung.
Beziehung zur Normalverteilung
Wenn die unabhängigen normalverteilten Zufallsvariablen
die Parameter


besitzen, sind die jeweiligen Stichprobenvarianzen
und
unabhängig, und es gilt:


Deshalb unterliegt die Zufallsvariable

einer F-Verteilung mit
Freiheitsgraden im Zähler und
Freiheitsgraden im Nenner.
Beziehung zur Studentschen t-Verteilung
Wenn
(Studentsche t-Verteilung), dann ist
Das Quadrat einer t-verteilten Zufallsvariablen mit
Freiheitsgraden folgt einer F-Verteilung mit
und
Freiheitsgraden.
Herleitung der Dichte
Die Wahrscheinlichkeitsdichte der F-Verteilung lässt sich herleiten (vgl. Herleitung der Dichte der Studentschen t-Verteilung) aus der gemeinsamen Dichte der beiden unabhängigen Zufallsvariablen
und
, die beide Chi-Quadrat-verteilt sind.[3]
.
Mit der Transformation

bekommt man die gemeinsame Dichte von
und
, wobei
und
gilt.
Die Jacobideterminante dieser Transformation ist:

Der Wert
ist unwichtig, weil er bei der Berechnung der Determinante mit 0 multipliziert wird. Die neue Dichtefunktion schreibt sich also

Gesucht ist nun die Randverteilung
als Integral über die nicht interessierende Variable
:

Quantilfunktionen
Das
-Quantil der F-Verteilung
ist die Lösung der Gleichung
und damit prinzipiell über die Umkehrfunktion zu berechnen. Konkret gilt hier

mit
als Inverse der regularisierten unvollständigen Betafunktion. Dieser Wert
ist in der F-Verteilungstabelle unter den Koordinaten
,
und
eingetragen oder in der Quantiltabelle der Fisher-Verteilung zu finden.
Für einige Werte
,
lassen sich die Quantilsfunktionen
explizit ausrechnen. Man löst das Beta-Integral
mit
wobei für ein paar Indizes invertierbare Funktionen auftreten:

Aus der jeweils vollständigen Zeile und Spalte kann man sogar die allgemeinen Ausdrücke für höhere Indizes ablesen. Man findet:


Siehe auch
Literatur
- Joachim Hartung, Bärbel Elpelt, Karl-Heinz Klösener: Statistik. 12. Auflage, Oldenbourg 1999, S. 156 ff., ISBN 3-486-24984-3.
Weblinks
Einzelnachweise
- ↑ P. R. Kinnear, C. D. Gray (2004): SPSS 12 MADE SIMPLE. Psychology Press. New York. S. 208–209.
- ↑ Eric W. Weisstein: Snedecor’s F-Distribution. In: MathWorld (englisch).
- ↑ Frodesen, Skjeggestad, Tofte: Probability and Statistics in Particle Physics. Universitetsforlaget, Bergen – Oslo – Tromsø S. 145 f.