Die Bonferroni-Korrektur ist ein Verfahren der mathematischen Statistik zur Adjustierung der Signifikanzniveaus der Einzeltests bei multiplen Testen, um der Alphafehler-Kumulierung entgegenzuwirken und für die Durchschnittshypothese ein vorgegebenes Signifikanzniveau einzuhalten. Die Adjustierung vermindert die Signifikanzniveaus der Einzeltests und damit tendenziell die Anzahl der Ablehnungen richtiger Nullhypothesen (falsch-positiver Befunde in biometrischer Terminologie), so dass die verbleibenden Ablehnungen von Nullhypothesen mit einer höheren statistischen Signifikanz verbunden sind. Die Bonferroni-Methode (nach Carlo Emilio Bonferroni) umfasst neben der Bonferroni-Korrektur ein ähnliches Vorgehen zur Anpassung der Konfidenzniveaus bei der Konstruktion simultaner Konfidenzintervalle für einen mehrdimensionalen Parametervektor.

Adjustierte Signifikanzniveaus

Zu statistischen Tests mit den Nullhypothesen kann die Durchschnittshypothese gebildet werden. Die Hypothesen heißen in diesem Zusammenhang Elementarhypothesen und heißt Globalhypothese. Ein Test für die Nullhypothese kann auf den Tests für die einzelnen Elementarhypothesen aufgebaut werden, da die Nullhypothese genau dann falsch ist, wenn mindestens eine der Elementarhypothesen falsch ist. Eine mögliche Testprozedur besteht also darin, genau dann abzulehnen, wenn mindestens eine der Hypothesen abgelehnt wird. Ein vorgegebenes globales Signifikanzniveau für den Test von kann im Allgemeinen nicht eingehalten werden, wenn dieses als Signifikanzniveau für jeden der Einzeltests verwendet wird, da es dann zur so genannten Alphafehler-Kumulierung kommen kann.

Um das gewünschte globale Signifikanzniveau für den Test der Globalhypothese einzuhalten, besteht die Bonferroni-Korrektur darin, für die einzelnen Tests das lokale Signifikanzniveau

vorzugeben. Die so angepassten Signifikanzniveaus

für die Einzeltests werden auch adjustierte Signifikanzniveaus genannt. Die Verwendung der adjustierten Signifikanzniveaus führt dazu, das für den Test der Globalhypothese das Signifikanzniveau gültig ist.

Adjustierte p-Werte

Bei einer klassischen Testdurchführung erfolgt die Ablehnung einer Nullhypothese, falls eine Teststatistik im Ablehnbereich (kritischen Bereich) liegt, der vom vorgegebenen Signifikanzniveau abhängt. Bei einer -Wert-basierten Testdurchführung, die typisch für die Anwendung statistischer Software ist, wird ein berechneter -Wert mit dem vorgegebenen Signifikanzniveau verglichen und die Nullhypothese wird abgelehnt, falls der -Wert kleiner als das vorgegebene Signifikanzniveau ist.

Bei einer -Wert-basierten Testdurchführung wird die Bonferroni-Korrektur durchgeführt, indem die -Werte der Einzeltests mit den adjustierten Signifikanzniveaus verglichen werden, dabei wird die -te Nullhypothese abgelehnt, falls gilt.

Alternativ können adjustierte -Werte

für die Einzeltests gebildet werden, die um den Faktor größer sind als die ursprünglichen -Werte, und diese mit dem globalen Signifikanzniveau verglichen werden. Die -te Nullhypothese wird abgelehnt, falls gilt.

Beide Vorgehensweisen führen zu denselben Testentscheidungen, da die beiden Regeln und äquivalent sind.

Beispiel

Gegeben seien die p-Werte dreier Hypothesentests, die eine Hypothesenfamilie bilden. Unter Vernachlässigung der multiplen Testung und alleiniger Betrachtung lokaler Signifikanzniveaus erfolgt die Ablehnung der Nullhypothesen 1 und 2, da und , während die dritte Hypothese nicht abgelehnt wird, da . Berücksichtigt man jedoch die Bonferroni-Korrektur (mit ), so erfolgt nur noch die Ablehnung der Nullhypothese 1, da und .

Theoretischer Hintergrund

Die Globalhypothese wird genau dann abgelehnt, wenn mindestens eine Elementarhypothesen abgelehnt wird. Das Ereignis kann als Vereinigung der Ereignisse für dargestellt werden. Mit der ersten Bonferroni-Ungleichung, die auch Boolesche Ungleichung heißt, ergibt sich die Ungleichung

Betrachtet man den Fall, dass richtig ist, und damit auch die Hypothesen richtig sind, und beschränkt für diesen Fall die Wahrscheinlichkeiten , die dann Fehlerwahreinlichkeiten 1. Art sind, jeweils durch das lokale Signifikanzniveau nach oben, so ist durch

nach oben beschränkt.

Die Bonferroni-Korrektur kann sehr konservativ sein. Deshalb wurden genauere Methoden entwickelt, die den -Fehler weniger konservativ kontrollieren und das Signifikanzniveau der multiplen Testprozedur weiter ausschöpfen (siehe Alphafehler-Kumulierung). Im Vergleich zur allgemein anwendbaren Bonferroni-Methode ergibt sich, allerdings nur unter einschränkenden Voraussetzungen, mit der Šidák-Korrektur ein verbessertes Verfahren.

Literatur

  • H. Abdi: Encyclopedia of Measurement and Statistics. Hrsg.: N. J. Salkind. Sage, Thousand Oaks, CA 2007, Bonferroni and Sidak corrections for multiple comparisons (utdallas.edu [PDF]).
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.