Trennschärfe eines Tests
Trennschärfe eines Tests beschreibt die Unterscheidungsfähigkeit eines statistischen Tests zwischen konkurrierenden Hypothesen. Andere Ausdrücke hierfür sind Güte, Macht, Power, Schärfe eines Tests, Teststärke oder Testschärfe. Das entsprechende Fachgebiet ist die Testtheorie, ein Teilgebiet der mathematischen Statistik. Im Kontext der Beurteilung eines binären Klassifikators wird die Trennschärfe eines Tests auch als Sensitivität (recall) bezeichnet. Die Trennschärfe eines Tests ist genauso wie das Niveau eines Tests ein Begriff, der aus der Gütefunktion (Trennschärfefunktion) abgeleitet ist.
Die Trennschärfe eines Tests gibt die Fähigkeit eines Tests an, Unterschiede (Effekte) zu erkennen, wenn sie in Wirklichkeit vorhanden sind. Genauer gesagt gibt die Trennschärfe an, mit welcher Wahrscheinlichkeit ein statistischer Test die abzulehnende Nullhypothese („Es gibt keinen Unterschied“) korrekt zurückweist, wenn die Alternativhypothese („Es gibt einen Unterschied“) wahr ist. Unter der Annahme, dass die Nullhypothese die Abwesenheit einer bestimmten Krankheit („nicht krank“), die Alternativhypothese das Vorhandensein der Krankheit („krank“) und die Ablehnung der Nullhypothese einen positiven diagnostischen Test darstellt, ist die Trennschärfe des Tests äquivalent zur Sensitivität des Tests (der Wahrscheinlichkeit, dass ein Kranker ein positives Testergebnis aufweist). Zugleich stellt diese Tatsache einen Brückenschlag zwischen der Testtheorie und der Theorie diagnostischen Testens dar.
Die Trennschärfe des Tests kann also als „Ablehnungskraft“ des Tests interpretiert werden. Es wird versucht, den Ablehnbereich so zu bestimmen, dass die Wahrscheinlichkeit für die Ablehnung einer „falschen Nullhypothese“ , d. h. für Beibehaltung der Alternativhypothese unter der Bedingung, dass wahr ist, möglichst groß ist: . Um die Trennschärfe eines Tests berechnen zu können, muss die Alternativhypothese in Form einer konkreten Punkthypothese spezifiziert sein.
Sie bildet das Komplement zur Typ-II-Fehlerwahrscheinlichkeit , d. h. der Wahrscheinlichkeit, bei Gültigkeit von fälschlich zugunsten der Nullhypothese () zu entscheiden. Die Trennschärfe selbst ist also die Wahrscheinlichkeit, einen ebensolchen Fehler zu vermeiden.