Statistische Signifikanz

Dieser Beitrag ist ein Nachtrag zur Serie „Traue keiner Statistik, die Du nicht selbst gefälscht hast„. Er wurde größtenteils schon vor längerer Zeit geschrieben, blieb aber dann eine Weile unveröffentlicht.

Aussagen aus Statistiken sind, vor allem dann wenn nur wenige Stichproben ausgewertet werden, immer nur eine Wahrscheinlichkeitsaussage. Das heißt, dass es tatsächlich gar keinen Unterschied in der Wahrscheinlichkeit geben muss, nur weil sich zwei statistisch erfasste Größen unterscheiden. Wenn zum Beispiel bei der Untersuchung eines neuen Medikaments diejenigen Patienten, die das Medikament bekommen haben, häufiger (oder früher, besser…) geheilt wurden, so kann das auch auf einen Zufall zurück zu führen sein und muss nicht unbeding am Medikament selbst liegen. Der Einfluss zufälliger Schwankungen sinkt dabei mit steigender Anzahl an Patienten, die an der Untersuchung teilgenommen haben. (Dieses Problem ist dabei unabhängig vom Placeboeffekt und tritt natürlich auch bei korrekt durchgeführten Blindstudien auf.)

Daher versucht man bei Statistiken die Irrtumswahrscheinlichkeit der durchgeführten Untersuchungen festzustellen. Meist kann man annehmen, dass die Wahrscheinlichkeit des Ergebnisses einer Statistik einer Normalverteilung entspricht. Damit lässt sich aus der Streuung der Ergebnisse oder theoretischen Überlegungen zur statistischen Verteilung relativ einfach abschätzen, wie hoch die Irrtumswahrscheinlichkeit der Statistik tatsächlich ist, das heißt wie hoch die Wahrscheinlichkeit ist, dass ein statistische erfasster Zusammenhang zwischen den erfassten Daten tatsächlich besteht (z.B. das Medikament tatsächlich wirkt).

In der Wissenschaft werden meist Ergebnisse mit einer Irrtumswahrscheinlichkeit von unter 5% erwartet. Trotzdem bleibt immer eine gewisse Wahrscheinlichkeit, dass die Aussage der Statistik falsch ist. Wenn die Irrtumswahrscheinlichkeit zu hoch ist, muss man unter Umständen mehr Daten erheben (das heißt zum Beispiel mehr Patienten untersuchen).

Weitere Informationen zur statistischen Signifikanz finden sich natürlich auch in der Wikipedia. Und für Freunde von schwarzem Humor und toten Katzen zur Abwechslung mal noch ein passendes Chat-Zitat.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.