Café Mathe - eine Kolumne in der Aargauer Zeitung
April 2018: Medikament oder Placebo – Das ist hier die Frage
20180401

Stellen wir uns vor, ein Forscherteam hat ein neues Medikament gegen eine bestimmte Krankheit entwickelt und möchte nun untersuchen, ob es tatsächlich wirkt oder nicht. Dazu wird eine Doppelblindstudie mit 200 Personen durchgeführt, von denen die Hälfte, die Gruppe M, das neue Medikament und die andere Hälfte, die Gruppe P, ein Placebo erhält. Nehmen wir einmal an, in der Gruppe M werden 50 Personen geheilt und 50 nicht, während in der Gruppe P 40 Personen geheilt werden und 60 nicht. Wir können also festhalten, dass das Medikament eine Erfolgsquote von 50% hat, das Placebo dagegen nur von 40%. Aufgrund dieser Ergebnisse würde ein Arzt das Medikament wohl empfehlen.

Nehmen wir weiter an, das Forscherteam möchte die Wirkung geschlechterspezifisch untersuchen, die Zahlen werden also auf Männer und Frauen heruntergebrochen, und dabei entstehen die Zahlen in der Abbildung. Wie man leicht nachrechnen kann, passen die Zahlen der Tabellen perfekt zu den Zahlen der ursprünglichen Auswertung: Beispielsweise teilen sich die 50 geheilten Personen der M-Gruppe auf in 44 Männer und 6 Frauen, und die vier Zahlen der Männer-Tabelle addieren sich auch tatsächlich auf 100, und so weiter.

Verblüffend ist nun Folgendes: Die Erfolgsquoten bei den Männern betragen 59% für das Medikament und 69% für das Placebo, und die entsprechenden Zahlen bei den Frauen sind 23% und 30%. Das Placebo schneidet also bei beiden Geschlechtern besser ab als das Medikament, und derselbe Arzt würde nun wohl gegen das Medikament entscheiden. Aber wie ist das möglich, wenn doch in der gesamten Gruppe aus beiden Geschlechtern das Medikament besser abschneidet?

Die Zahlen zeigen ganz nüchtern, dass das möglich ist, auch wenn es paradox erscheint. In der Mathematik ist dieses Phänomen als «Paradoxon von Simpson» bekannt geworden. Edward Simpson hat es 1951 sorgfältig analysiert, entdeckt wurde es aber schon 1899 vom englischen Mathematiker Karl Pearson. Tatsächlich kann eine statistische Bewertung unterschiedlich ausfallen, je nachdem, ob man die Ergebnisse der Teilgruppen kombiniert oder nicht, und leider gibt es hierfür auch keine einfache Lösung. 1973 ist ein Auftreten dieses Paradoxons sogar vor Gericht verhandelt worden: Damals waren die Zulassungsquoten zur University of California, Berkeley, bei Frauen sehr viel tiefer (35%) als bei Männern (44%), weswegen man eine gezielte Diskriminierung der Frauen vermutete. Brach man die Zahlen aber auf die einzelnen Fakultäten herunter, so war kein Ungleichgewicht mehr festzustellen. Die Frauen hatten sich einfach mehrheitlich für Fächer angemeldet, die stark überlaufen waren und bei denen folglich eine höhere Ablehnungsquote wirkte.

Wenn Sie gerne knobeln, sollten Sie versuchen, ein Simpson-Paradoxon zu konstruieren, bei dem alle acht Zahlen in den beiden abgebildeten Tabellen zwischen 1 und 4 liegen. Gibt es solche Fälle? Und wenn ja: wie viele?

(Dieser Text basiert lose auf einem schönen Artikel von Jean-Paul Delahaye im Spektrum der Wissenschaften 2.17.)

Armin P. Barth ist Gymnasiallehrer an der Kantonsschule Baden und Autor. Die Lösung erscheint am nächsten Dienstag auf der Seite Leben&Wissen.