Überdispersion
In der Statistik ist Überdispersion (von lateinisch dispersio = „Zerstreuung“; gelegentlich auch Überstreuung oder Hyperdispersion genannt) ein Phänomen, das oft bei der Modellierung von Zähldaten auftritt. Man spricht von Überdispersion, wenn die empirische Varianz in den Daten größer ist als die vom Modell (z. B. Binomialmodell oder Poisson-Modell) angenommene erwartete „theoretische Varianz“. Die tatsächlich gemessene Variation in den Daten übersteigt also die theoretisch erwartete Variation. Das Diagnostizieren von Überdispersion ist Thematik der Regressionsdiagnostik. Bei Vorliegen eines Poisson-Modells stellt die Anwesenheit von Überdispersion die häufigste in der Praxis auftretende Verletzung der Modellannahmen dieses Modells dar. In der Theorie gilt für eine Poisson-verteilte Zielgröße, dass Varianz und Erwartungswert gleich sind. In der Praxis übersteigt die empirisch beobachtete Varianz jedoch häufig den Erwartungswert. Die Zähldaten streuen also in einem größeren Maße um den Erwartungswert, als durch das Poisson-Modell erwartet wird.
Das Gegenstück der Überdispersion, bei der in der Praxis weniger Variation vorliegt als durch das Modell zu erwarten ist, wird Unterdispersion genannt. Sie tritt allerdings weniger häufig auf als Überdispersion. Die Anwesenheit von Überdispersion hat eine Reihe von negativen Konsequenzen für die Validität eines statistischen Modells und den daraus abgeleiteten Schlussfolgerungen. Beispielsweise ist es möglich, dass das Vorhandensein von Überdispersion die Parameterschätzer verzerrt. Die Hauptgründe für Überdispersion sind unbeobachtete Heterogenität und eine positive Korrelationen zwischen den individuellen Beobachtungen der binären Antwortvariablen.
Überdispersion findet in einer Reihe von biologischen Wissenschaften, wie der Parasitologie und Ökologie und in der Epidemiologie Anwendung.