Trennschärfe eines Tests

Trennschärfe eines Tests beschreibt die Unterscheidungsfähigkeit eines statistischen Tests zwischen konkurrierenden Hypothesen. Andere Ausdrücke hierfür sind Güte, Macht, Power, Schärfe eines Tests, Teststärke oder Testschärfe. Das entsprechende Fachgebiet ist die Testtheorie, ein Teilgebiet der mathematischen Statistik. Im Kontext der Beurteilung eines binären Klassifikators wird die Trennschärfe eines Tests auch als Sensitivität (recall) bezeichnet. Die Trennschärfe eines Tests ist genauso wie das Niveau eines Tests ein Begriff, der aus der Gütefunktion (Trennschärfefunktion) abgeleitet ist.

Die Trennschärfe eines Tests gibt die Fähigkeit eines Tests an, Unterschiede (Effekte) zu erkennen, wenn sie in Wirklichkeit vorhanden sind. Genauer gesagt gibt die Trennschärfe an, mit welcher Wahrscheinlichkeit ein statistischer Test die abzulehnende Nullhypothese („Es gibt keinen Unterschied“) korrekt zurückweist, wenn die Alternativhypothese („Es gibt einen Unterschied“) wahr ist. Unter der Annahme, dass die Nullhypothese die Abwesenheit einer bestimmten Krankheit („nicht krank“), die Alternativhypothese das Vorhandensein der Krankheit („krank“) und die Ablehnung der Nullhypothese einen positiven diagnostischen Test darstellt, ist die Trennschärfe des Tests äquivalent zur Sensitivität des Tests (der Wahrscheinlichkeit, dass ein Kranker ein positives Testergebnis aufweist). Zugleich stellt diese Tatsache einen Brückenschlag zwischen der Testtheorie und der Theorie diagnostischen Testens dar.

Die Trennschärfe des Tests kann also als „Ablehnungskraft“ des Tests interpretiert werden. Es wird versucht, den Ablehnbereich so zu bestimmen, dass die Wahrscheinlichkeit für die Ablehnung einer „falschen Nullhypothese“ , d. h. für Beibehaltung der Alternativhypothese unter der Bedingung, dass wahr ist, möglichst groß ist: . Um die Trennschärfe eines Tests berechnen zu können, muss die Alternativhypothese in Form einer konkreten Punkthypothese spezifiziert sein.

Sie bildet das Komplement zur Typ-II-Fehlerwahrscheinlichkeit , d. h. der Wahrscheinlichkeit, bei Gültigkeit von fälschlich zugunsten der Nullhypothese () zu entscheiden. Die Trennschärfe selbst ist also die Wahrscheinlichkeit, einen ebensolchen Fehler zu vermeiden.

  1. Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz: Statistik. Der Weg zur Datenanalyse. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin/Heidelberg 2016, ISBN 978-3-662-50371-3, S. 460.
  2. Otfried Beyer, Horst Hackel: Wahrscheinlichkeitsrechnung und mathematische Statistik. 1976, S. 154.
  3. Bernd Rönz, Hans G. Strohe (1994): Lexikon Statistik. Gabler Verlag, S. 147
  4. Otfried Beyer, Horst Hackel: Wahrscheinlichkeitsrechnung und mathematische Statistik. 1976, S. 154.
  5. Bernd Rönz, Hans G. Strohe (1994): Lexikon Statistik. Gabler Verlag, S. 147
  6. Lothar Sachs, Jürgen Hedderich: Angewandte Statistik: Methodensammlung mit R. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin/Heidelberg 2018, ISBN 978-3-662-56657-2, S. 460.
  7. Lothar Sachs, Jürgen Hedderich: Angewandte Statistik: Methodensammlung mit R. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin/Heidelberg 2018, ISBN 978-3-662-56657-2, S. 460.
  8. Bernd Rönz, Hans G. Strohe (1994): Lexikon Statistik. Gabler Verlag, S. 147
  9. Dies gilt, da . Für die Bedeutung der Notation, siehe Wahrheitsmatrix: Richtige und falsche Klassifikationen.
  10. F. J. Dorey: Statistics in brief: Statistical power: what is it and when should it be used? In: Clinical orthopaedics and related research. Band 469, Nummer 2, Februar 2011, S. 619–620, doi:10.1007/s11999-010-1435-0, PMID 20585913, PMC 3018227 (freier Volltext).
  11. Ludwig von Auer: Ökonometrie. Eine Einführung. 6., durchges. u. aktualisierte Auflage. Springer, 2013, ISBN 978-3-642-40209-8, S. 128.