Zufall

Handlungswuerfel

Gute Entscheidungen benötigen wenige Informationen. Manchmal ist ein Würfel hilfreicher als stundenlange Recherche.

Auf einem Fest werden alle Gäste die am heutigen Tag Geburtstag haben auf die Bühne gebeten. Drei Geburtstagskinder trauen sich nach vorne und werden gefeiert. Der Gastgeber sagt ganz entzückt: ‚Welch ein Zufall!‘

Dabei ist es gar kein Zufall sondern simple Mathematik oder besser bekannt als das Geburtstagsparadoxon… Dieser Beitrag beschreibt zufällig verschiedene Probleme der Wahrscheinlichkeitsrechnung.

Mit an Sicherheit grenzender Wahrscheinlichkeit

Die Eintrittswahrscheinlichkeit (engl.: probability) eines zufälligen Ereignisses wird oft mit P(X) angegeben wobei X das Ereignis beschreibt.

  • Ein sicheres Ereignis ereignet sich immer und P(X) ist 1
  • Ein unmögliches Ereignis ereignet sich nie und P(X) ist 0

P(X) kann also alle Werte zwischen 0 und 1 annehmen. Nie mehr und nie weniger. Wenn man eine Münze wirft so hat man zwei Ereignisse: Kopf oder Zahl. Die Wahrscheinlichkeit von Kopf nennen wir P(Kopf) und sie beträgt 1/2. Die Wahrscheinlichkeit von Zahl beträgt ebenfalls 1/2. Die Wahrscheinlichkeit von Kopf oder Zahl, also P(Kopf oder Zahl) beträgt natürlich 1/1 und ist daher ein sicheres Ereignis. Die Wahrscheinlichkeit von Kopf und Zahl beträgt natürlich 0 und ist daher ein unmögliches Ereignis. Ganz anders sieht es aus wenn man zwei Münzen wirft.

Aber was sagt die Wahrscheinlichkeit P(Kopf) = 1/2 aus? Wie oft muss man Münzen werfen um anhand von Stichproben die Wahrscheinlichkeit nachzuweisen? 10mal, 100mal, 1000mal?

Ist es denkbar, dass man 5 mal nacheinander Kopf wirft? Wer denkt da nicht an Betrug. Ob wir nun eine Münze 5 mal oder 5 Münzen einmal werfen ist egal. Die Wahrscheinlichkeit für 5 mal Kopf beträgt immerhin 1/2 * 1/2 * 1/2 * 1/2 * 1/2 = (1/2)5 = 1/32 also immerhin 3,125% und ist damit fast doppelt so hoch wie ein 3er im Lotto.

Das Ziegenproblem

Das Ziegenproblem ist eine „einfache“ Aufgabenstellung aus der Wahrscheinlichkeitstheorie:

Sie sind in einer Spielshow und haben die freie Auswahl zwischen drei Toren. Hinter einem Tor steht Ihr Hauptgewinn, ein Auto. Hinter den anderen beiden Toren stehen jeweils eine Ziege. Sie wählen ein Tor, sagen wir, Tor Nummer 1.

Der Showmaster weiß was hinter den Toren versteckt ist und öffnet nun ein anderes Tor, sagen wir, Nummer 3. Hinter dem Tor steht, wie zu erwarten eine Ziege. Der Showmaster fragt Sie nun: ‚Möchten Sie Ihre Entscheidung überdenken und das Tor Nummer 2 wählen?

Ist es von Vorteil, die eigene Entscheidung zu ändern? Die meisten Menschen würden sagen, dass man seine Entscheidung nicht ändern und bei dem ursprünglich gewählten Tor bleiben sollte da sich an der Gewinnwahrscheinlichkeit (ein Auto hinter einem der drei Tore) nichts ändern würde. Diese Gruppe geht also weiterhin von einer Gewinnwahrscheinlichkeit von 1/3 aus und ignoriert die Hilfestellung des Moderators.

Nur wenige Menschen würden in jedem Fall wechseln und das bislang geschlossene Tor wählen. Diese Gruppe verspricht sich von einem Wechsel eine erhöhte Gewinnwahrscheinlichkeit von immerhin 2/3.

Das „Ziegenproblem“ beschäftigt viele knobel-freudige Menschen und füllt zahlreiche Internetseiten, zB:

Ursache und Wirkung

Jeder von uns würde gut und gerne folgende Thesen glauben schenken:

  • In Münster leben die glücklichsten Menschen
  • Einkommensmillionäre bevorzugen Bayern
  • Die seltene Erkrankung XYZ tritt häufig in der Nähe von ABC auf

Wir glauben den Thesen, da wir uns ein Zusammenhang vorstellen können. Dabei ignorieren wir, dass es u.U. keinen Zusammenhang zwischen der vermeintlichen Ursache und dem erfassten Effekt gibt. Der Spruch „Nachts sind alle Katzen grau“ suggeriert: Die Farbe der Katzen (=Effekt) hängt von der Tageszeit (=Ursache) ab. Das war natürlich ein offensichtlich dummes Beispiel denn jeder weiß, dass es keinen Zusammenhang zwischen der Fellfarbe und der Tageszeit gibt. Wie wäre es denn mit der These „Vitamin C schützt vor Erkältung“? Gibt es da einen Zusammenhang?

100 mal zwei Würfel geworfen und die Zahlen als Koordinaten notiert.

Häufig werden Zahlenbeispiele oder Studien herangezogen, um einen Zusammengang zwischen Ursache und Effekt zu belegen. Aber was ist, wenn es keinen Zusammenhang gibt? Ein einfaches Beispiel soll verdeutlichen, wie wir Menschen uns von mathematischen Zusammenhängen (Häufigkeit von Ereignissen) in die Irre leiten lassen. Für den folgenden Versuch benötigen wir:

  • Zwei verschiedenfarbige Würfel (z.B. beige und rot)
  • Ein Blatt Papier und ein Bleistift

Zunächst zeichnen wir ein Gitternetz mit 6×6 Linien auf das Papier. Die einzelnen Kreuzungspunkte (=36 Stück) sollen Koordinaten einer gedachten Landschaft darstellen. Dann malen wir an verschiedenen Stellen „Industrieanlagen“ hin:

  • Ein Atomkraftwerk
  • Eine Chemiefabrik
  • Ein Kohlekraftwerk
  • Eine Ölraffinerie

Nun würfeln wir mit beiden Würfeln und nutzen den einen Würfel als X-Koordinate und den anderen Würfel als Y-Koordinate. Die beiden Würfel kennzeichnen also pro Wurf genau eine der 36 Koordinaten. Wir machen wir an dieser Stelle einen Strich und wiederholen das Ganze 100 mal. Das nebenstehende Bild zeigt ein mögliches Resultat nach 100 Würfen. Die Farben kennzeichnen die Häufigkeit von Ereignissen an bestimmten Koordinaten. Es ist „eindeutig eine Häufung“ an der Koordinate X5:Y4 zu erkennen. An dieser Stelle sind 6 bis 8 Ereignisse gezählt worden während in den grünen Bereichen nur maximal 2 Ereignisse aufgetreten sind. Die grünen Bereiche scheinen von den Ereignissen verschont zu sein. Nun haben wir genügend Stichproben gesammelt und können eine erste These aufstellen:

Die seltene Erkrankung XYZ tritt häufig in der Nähe im Bereich X5:Y4, also in unmittelbarer Nähe der Industrieanlage ABC auf!

Was meinen Sie: Ist die von Ihnen erstelle These haltbar? Wenn Sie zweifeln, dann sollten Sie auch an anderen Thesen oder „Studien“ zweifeln und deren Erfassungsmethoden hinterfragen. Ach ja: Vergessen Sie bitte nicht, das dieser Versuch mit einfachen Würfeln durchgeführt wurde ;-)

Vierfeldertest

Der Vierfeldtest ist ein einfaches aber effektives Verfahren um die statistische Signifikanz von zwei unabhängigen Proben zu ermitteln. Die folgende Tabelle zeigt eine Tabelle mit zwei Proben (Probe 1 und Probe 2). In jeder Probe werden zwei Fälle (Fall A und Fall B) unterschieden:

Fall A Fall B
Probe 1 a b a+b
Probe 2 c d c+d
 ∑ a+c b+d

Aus den Werten a, b, c und d kann die Prüfwert ermittelt werden:

Ist der Prüfwert kleiner als 3,841, so ist die Verteilung der beiden Proben nicht signifikant sondern eher zufällig. Erst wenn der Prüfwert größer oder gleich 3.841 ist kann von einer statistischen Signifikanz oder Effekt gesprochen werden. Der Vierfeldertest kann auch auf die These im Beispiel „Ursache und Wirkung“ angewandt werden. Dabei schauen wir auf die Häufung der seltenen Erkrankung XYZ an der Koordinate X5:Y4 unserer gedachten Industrielandschaft und würfeln weitere 100 mal um ein neues Koordinatenfeld zu erstellen.

Anhand der beiden Versuche kann die These nicht unterstützt werden, da der Prüfwert X² = 3,77 und damit kleiner als der kritische Wert 3,841 ist.

Literatur, Quellen & Links

  • Gero von Randow: Das Ziegenproblem; Rowohlt 2009; ISBN 3 499 61905 2
  • Hans-Hermann Dubben, Hand-Peter Beck-Bornholdt: Der Hund der Eier legt; Rowohlt 2009; ISBN 978 3 499 62196 3
  • Craig F. Whitaker: „Ask Marilyn“, Parade Magazine; 9. September 1990, S. 16.
Veröffentlicht in Kopfsache Getagged mit:

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

*