mathpoint.ch    
 

Wahrscheinlichkeit und Kombinatorik, 1.Teil

   
 
 
cartoon fortuna
  Fortuna und das Glücksrad
Zu "Wahrscheinlichkeit 2.Teil"

Zum Mathpoint-Index

Zu "Wahrscheinlichkeit 3.Teil"

 
Zu "Wahrscheinlichkeit 4.Teil"  
Spezialthemen zu Wahrscheinlichkeit und Kombinatorik - schwierigere Beispiele

 

     

Möchten Sie zur Simulation von Zufallsprozessen Zufallszahlen erzeugen?
Hier ein Link dazu: www.random.org
 
  Inhalt 1. Teil Inhalt 2. Teil Inhalt 3. Teil Inhalt 4. Teil  
  1. Anfänge, historische Problemstellungen 10. Grundlagen der beschreibenden Statistik 13. Ist die Münze echt? 21. Statistische Sündenfälle  
  2. Einführende Beispiele, Werkzeuge 10.1. Skalenarten 14. Lage- und Streuparameter von Zufallsvariablen 22. Vertrauensintervalle für eine Wahrscheinlichkeit  
  3. Zusammenfassung der Werkzeuge 10.2. Grundbegriffe 15. Das Gesetz der grossen Zahlen    
  4. Theoretische Betrachtung 10.3. Klassenbildung bei stetigen Daten 16. Der Zentrale Grenzwertsatz    
  5. Kombinatorik 10.4. Lagemasse 17. Vertrauensintervalle    
 

5.1. Permutationen

10.5. Streumasse 18. t-Tests    
 

5.2. Multiplikationsregel

10.6. Boxplot und Stem-Leave-Plot 18.1. t-Test für eine Stichprobe    
 

5.3. Variationen mit und ohne Wiederholung

11. Erwartungswert, Varianz, Standardabweichung 18.2. t-Verteilungstabelle    
 

5.4. Kombinationen ohne Wiederholung

12. Wir testen Werksgarantien 18.3. t-Test für zwei unverbundene Stichproben    
  6. Lotto-Modell: Hypergeometrische Verteilung  Ungleichung von Tschebyscheff heuristisch hergeleitet 18.4. t-Test für zwei verbundene Stichproben    
  7. Bernoulli-Modell: Binomialverteilung 18.5. Bemerkungen zu den t-Tests    
  8. Bedingte Wahrscheinlichkeit, "false positive"-Effekte 19. Rangsummentests (Wilcoxon)    
  9. Von der Binomial- zur Normalverteilung 19.1. Wilcoxon-Test für eine Stichprobe    
  19.2. Wilcoxon-Test für zwei verbundene Stichproben    
  19.3. U-Test von Mann, Whitney, Wilcoxon für zwei unverbundene Stichproben    
      20. Chi-Quadrat-Tests    

 

 

1. Anfänge und historische Wahrscheinlichkeitsprobleme

Bereits in der Antike wurden Volkszählungen durchgeführt und die Daten ausgewertet. Im 14. Jahrhundert entstanden die ersten Versicherungsgesellschaften, die vor allem Schiffe versicherten. Hier war eine Risikoabschätzung wichtig, um die Prämie festzulegen.
In der Renaissancezeit wurde das Experiment als Hilfsmittel der Forschung eingeführt, und damit entstand das Bedürfnis, die bei den Messungen eintretenden Zufallsfehler abzuschätzen.
Fragen um Zufall und Kausalität hatten zudem die Philosophen schon seit der Antike beschäftigt. "Zufall" wurde gelegentlich in einen Zusammenhang mit "Freiheit" gebracht: Wer sich dem Zufälligen öffnet, kann sich von einer allzu fest gefügten Vergangenheit lösen.
Im 16. Jahrhundert begann man sich dann systematisch mit der Analyse von Glücksspielen zu beschäftigen, allerdings meist nicht der Spiele wegen, sondern weil man sich bereits bewusst war, dass sich die gewonnenen Erkenntnisse weit über diese Spiele hinaus anwenden liessen. So verfasste Geronimo Cardano eine Abhandlung über Würfelspiele mit mehr als einem Würfel.

becher

 

Einige Aufgabenstellungen des 17. Jahrhunderts:

  • Vorzeitiger Spielabbruch: Wie sind die Einsätze zu verteilen?
    Ein Glücksspiel wird auf 3 Punkte gespielt. Der Sieger erhält 64 Dukaten.
    Beim Stand von 2 : 1 muss die Partie aus Zeitgründen abgebrochen werden. Wie ist der Einsatz von 64 Dukaten auf die beiden Spieler gerecht zu verteilen?
    Wie steht es, wenn das Spiel beim Stand von 2 : 0 abgebrochen wird?
    Die Mathematiker Blaise Pascal und Pierre de Fermat erörterten 1654 dieses Problem in einem Briefwechsel.

  • Huygens' Problem der schwarzen und weissen Kugeln
    Christiaan Huygens, 1657: Drei Personen, A, B und C, haben vor sich ein Gefäss, das 4 weisse und 8 schwarze Kugeln enthält. Gezogen wird jeweils blind eine Kugel, die nicht mehr zurückgelegt wird. A beginnt und zieht. Zieht er Weiss, hat er gewonnen. Zieht er Schwarz, ist B an der Reihe. Bei Weiss hat B gewonnen, andernfalls zieht nun C. Zieht auch C keine weisse Kugel, ist erneut A an der Reihe, usw. Wer zuerst Weiss zieht, hat gewonnen. Offensichtlich haben A, B und C nicht die gleichen Gewinn-Chancen. Wie sind diese Gewinn-Chancen verteilt?
    Wer das Problem selber untersuchen will, wähle weniger Kugeln: 5 schwarze und 3 weisse Kugeln. Wie sind nun die Chancen verteilt?

  • Galileis Problem: Augensumme 9 oder 10 beim Würfeln mit drei Würfeln
    Galilei stellte experimentell fest, dass beim wiederholten Wurf mit drei Würfeln die Augensumme 10 öfter auftritt als die Augensumme 9, obwohl beide Summen durch gleich viele, nämlich sechs, Kombinationen erreicht werden können:
    Augensumme   9:   1+2+6;   1+3+5;   1+4+4;   2+2+5;   2+3+4;   3+3+3
    Augensumme 10:   1+3+6;   1+4+5;   2+2+6;   2+3+5;   2+4+4;   3+3+4
    Warum tritt Augensumme 10 häufiger auf? Wo steckt der Fehler in obiger Ùberlegung?

  • 1764 untersuchte Thomas Bayes die Wahrscheinlichkeit, mit der eine wissenschaftliche Hypothese richtig ist, wenn bereits gewisse Beobachtungsergebnisse vorliegen.
 
 
 
 
  2. Einführende Beispiele und "Lösungs-Werkzeuge"  

Tipps und Werkzeuge zu den Aufgaben links

 
 

werkzeug

  1. Man würfelt mit zwei normalen Spielwürfeln (Augenzahlen 1 bis 6) zugleich oder, was gleichwertig ist, man wirft einen Würfel zwei Mal hintereinander. Die Würfel seien verschiedenfarbig, der eine sei z.B. rot, der andere blau.
    a) Wieviele verschiedene Wurf-Resultate sind möglich?
    b) Ist Augensumme 7 oder 8 wahrscheinlicher?


  2. Aus dem Wort MISSISSIPPI wird auf gut Glück ein Buchstabe ausgewählt.
    Mit welcher Wahrscheinlichkeit wird
    a) ein M,
    b) ein I,
    c) ein Konsonant gezogen?


  3. Aus den Ziffern 2 und 4 werden rein zufällig dreistellige Zahlen gebildet. Wie gross ist die Wahrscheinlichkeit, dass die Zahlen lauter gleiche Ziffern enthalten?


  4. Man wirft einen roten und einen blauen Würfel. Mit welcher Wahrscheinlichkeit
    a) wirft man einen Pasch (= 2 gleiche Werte),
    b) ist die Augensumme gleich 5,
    c) zeigt der blaue Würfel einen Punkt mehr als der rote,
    d) wirft man weder 3 noch 5?


    rad
  5. Ein Glücksrad hat 8 gleichgrosse Sektoren. Sie tragen folgende Nummern:
    1, 2, 1, 2, 3, 2, 1, 2. Nach Stillstand des Rades zeigt der oberhalb des Rades fix montierte Pfeil auf einen Sektor mit Nummer.
    a) Das Rad wird einmal gedreht. Mit welcher Wahrscheinlichkeit erscheint 2?
    b) Das Rad wird zweimal gedreht. Mit welcher Wahrscheinlichkeit sind beide Ziffern gleich?
    c) Das Rad wird fünfmal gedreht. Mit welcher Wahrscheinlichkeit ist die Ziffernfolge 12321?


  6. In einer Urne befinden sich 4 rote, 3 schwarze und 1 grüne Kugel. Es werden zwei Kugeln mit Zurücklegen gezogen. Bestimmen Sie die Wahrscheinlichkeit des Ereignisses E: "Mindestens eine rote Kugel ist dabei."


  7. In einem Kasten befinden sich gleichartige Kärtchen mit folgenden Buchstaben:
    L, S, E, E, E, E, E, E, E, E. Es werden nacheinander 4 Kärtchen ohne Zurücklegen gezogen. Mit welcher Wahrscheinlichkeit entsteht das Wort ESEL?


  8. Vier Personen, a, b, c, d, sollen an einem runden Tisch Platz nehmen. Die Plätze werden jedoch durch das Los zugeteilt. Mit welcher Wahrscheinlichkeit sitzt Person b neben Person a?


  9. Mit welcher Wahrscheinlichkeit wird beim Werfen von 3 Würfeln gleichzeitig die Punktesumme 5 resultieren?


  10. Wie gross ist die Wahrscheinlichkeit, in einem Wurf mit 5 Würfeln genau 4 gleiche Augenzahlen zu werfen? Wie gross ist die Wahrscheinlichkeit, 5 verschiedene Augenzahlen zu werfen?


  11. Eine Klasse besteht aus 10 Schülerinnen und 14 Schülern. Durch das Los werden 5 Personen dieser Klasse ausgewählt. Wie gross ist die Wahrscheinlichkeit, dass
    a) alle fünf Personen Schülerinnen sind
    b) alle fünf Personen Schüler sind
    c) unter den 5 Personen Schülerinnen und Schüler vorkommen?


  12. Aus einer Schulklasse werden zufällig 3 Personen ausgewählt. Wie gross ist die Wahrscheinlichkeit, dass ihre Geburtsmonate alle verschieden sind, wenn man annimmt, dass die Geburtsmonate in der Klasse zufällig "verteilt" sind?


  13. Lotto: 6 aus 45: Jemand schaut im Fernsehen die Ziehung an und denkt sich seine Lieblingszahl 13. Wie gross ist die Wahrscheinlichkeit, dass
    a) 13 als erste gezogene Zahl erscheint
    b) 13 unter den gezogenen 6 Zahlen ist?
    lottokugeln
 

Aufgabe 1:
3gitter
Werkzeug: Zweidimensionales Gitter. Horizontal: roter Würfel, vertikal: blauer Würfel. Jeder Gitterpunkt stellt ein Wurfbild dar. Es gibt insgesamt 36 verschiedene Wurfbilder.
Mittleres Bild: Augensumme 7: 6 Möglichkeiten aus 36. Wahrscheinlichkeit 6/36.
Rechtes Bild: Augensumme 8: 5 Möglichkeiten aus 36. Wahrscheinlichkeit 5/36.

Aufgabe 2:
a) 1 von 11. Wahrscheinlichkeit p = 1/11.   b) 4 von 11. p = 4/11.   c) 7/11.
Werkzeug: Wahrscheinlichkeit = Anzahl günstige Ereignisse geteilt durch Anzahl mögliche Ereignisse: p = #Günstige : #Mögliche.

Aufgabe 3:
Erste Ziffer: egal, was gezogen wird. Zweite Ziffer: p = 1/2, dass es die gleiche Ziffer wie die erste ist. Dritte Ziffer: p = 1/2, dass es erneut dieselbe Ziffer ist. Gesamtwahrscheinlichkeit = 1⋅1/2⋅1/2 = 1/4.
Werkzeug: "Erste Wahl egal."
Oder: Mögliche Ziffern: 222, 224, 242, 244, 422, 424, 442, 444; das sind 8 mögliche Zahlen. Davon sind 2 günstig ⇒ p = 2/8 = 1/4.
Werkzeug: Lexikografische Liste aller Möglichkeiten aufstellen.

Aufgabe 4: Gitter herstellen oder aufzählen:
a) Erster Wurf egal, zweiter Wurf: Wahrscheinlichkeit = 1/6, dass gleich. ⇒ p = 1/6
b) 4 von 36 ⇒ p = 1/9        c) 5 von 36 ⇒ p = 5/36       d) 16/36 = 4/9.

Aufgabe 5:a) 4/8 = 1/2   b) Da nicht alle Ziffern gleich wahrscheinlich sind, zeichnet man am besten einem Baum:


baum
Erste Drehung: Drei Möglichkeiten: 1, oder 2 oder 3 erscheint. Die Wahrscheinlichkeiten werden an den Ästen notiert. Zweite Drehung: Wir zeichnen nur noch die für das Ergebnis massgebenden Äste (gleiche Ziffer).
Die Wahrscheinlichkeiten der Äste hintereinander werden multipliziert. Die Gesamtwahrscheinlichkeit entsteht durch Addition der so erhaltenen Zahlen (siehe Diagramm). Ergebnis: 26/64 = 13/32 = 0.40625 ≈40.6%.
Werkzeug: Baumdiagramm.

Aufgabe 6: r r r r s s s g . Ereignis E: "Mindestens 1 rote Kugel dabei.
Wir betrachten das Gegenereignis E‾ : "Keine rote Kugel dabei."
Die Wahrscheinlichkeit dafür ist 4/8 ⋅ 4/8 = 1/4. Das ist die Wahrscheinlichkeit "keine rote dabei". Die Wahrscheinlichkeit für das Ereignis E beträgt dann 1 - 1/4 = 3/4.
Werkzeug: Gegenwahrscheinlichkeit berechnen.

Aufgabe 7: 8/10 ⋅ 1/9 ⋅ 7/8 ⋅ 1/7 = 1/90 ≈ 1.1%.
Man beachte die Veränderung der Nenner beim Ziehen ohne Zurücklegen.

Aufgabe 8: a wird an einen der vier Plätze gesetzt. Für b bleiben jetzt noch 3 mögliche Plätze; 2 davon sind Nachbarplätze von a. Die Wahrscheinlichkeit, einen solchen zu erwischen, beträgt also 2/3. (Werkzeug: "Erste Wahl egal.")

Aufgabe 9: Lexikografische Liste: (1;1;3), (1;2;2), (1;3;1), (2;1;2), (2;2;1), (3;1;1).
6 günstige von 216 Möglichkeiten: p = 6/216 = 1/36 ≈ 2.8%.

Aufgabe 10: Möglichkeiten: x x x x y; x x x y x; x x y x x; x y x x x; y x x x x.
Jede Möglichkeit hat dieselbe Wahrscheinlichkeit; Beispiel der Berechnung für die Möglichkeit x x x x y: Erster Wurf egal: x, Wahrscheinlichkeit 1. Zweiter Wurf: Wahrscheinlichkeit 1/6, dass erneut x kommt, dito 3. und 4. Wurf. 5. Wurf: Wahrscheinlichkeit 5/6, dass ein y ≠ x erscheint. Somit Wahrscheinlichkeit für x x x x y :     p = 1 ⋅1/6 ⋅1/6⋅1/6 ⋅5/6 =5/ 1296 ≈ 0.4%.

b) 1 ⋅ 5/6 ⋅ 4/6 ⋅ 3/6 ⋅ 2/6 = 5/54 ≈ 9.3%.

Aufgabe 11:
a) 10/24 ⋅ 9/23 ⋅ 8/22 ⋅ 7/21 ⋅ 6/20 ≈ 0.59 %
b) 14/24 ⋅ 13/23 ⋅ 12/22 ⋅ 11/21 ⋅ 10/29 ≈ 4.7%
c) Ergebnis c) ist gleich 1 minus Ergebnis a) minus Ergebnis b) ≈ 94.7%.

Aufgabe 12: Erster Geburtsmonat egal; restliche jeweils verschieden von den bereits "gezogenen": 1 ⋅ 11/12 ⋅ 10/12 = 110/144 ≈ 76.4%

Aufgabe 13: a) 1/45     b) Gegenereignis: 13 nicht darunter: 44/45⋅43/44⋅42/43⋅41/42⋅40/41⋅39/40 = 39/45 = 13/15. Folglich hat das gesuchte Ereignis die Wahrscheinlichkeit 1 - 13/15 = 2/15 ≈ 13.3%.

 
 
 
 
 

3. Zusammenfassung der "Werkzeuge"

  • Gitter (Würfeln mit 2 Würfeln gleichzeitig bzw. 2 Würfe hintereinander)
  • Lexikografische Liste (Zahlen aufsteigend, "Wörter" alphabetisch)
  • Mehrstufige Bäume
    • Die Wahrscheinlichkeiten der Äste hintereinander werden multipliziert
    • Die Wahrscheinlichkeiten der Äste nebeneinander werden addiert
    • Die Äste werden mit den Wahrscheinlichkeiten beschriftet
    • Der Baum ist in deutliche Stufen zu gliedern (1. Wahl, 2. Wahl, ...)
    • Man zeichne nur die für das gesuchte Ereignis relevanten Äste.
  • Oft ist das Berechnen des Gegen-Ereignisses einfacher. Die Wahrscheinlichkeit des Ereignisses selber ist dann Eins minus die Wahrscheinlichkeit des Gegenereignisses.
  • Oft ist das Ergebnis des ersten Wurfs "egal" (vgl. Aufg. 3, 8, 12).
  • Jedes Wahrscheinlichkeitsproblem in Sinn obiger Aufgaben kann auf das Ziehen von Kugeln aus einem undurchsichtigen Behälter zurückgeführt werden (Standard-Modell). Beispiel: Aufg. 12, oben: Statt Personen zu betrachten, zieht man "Monats-Kugeln" aus einem Vorrat von 12 Kugeln.

Die Wahrscheinlichkeit im Sinn obiger Aufgaben ist grob gesagt die relative Häufigkeit auf lange Sicht.

 

Beispiel:
p("Augensumme 8 beim Würfeln mit zwei Würfeln"): Mögliche Werkzeuge:

wz

 
 
 
 
 

4. Theoretische Betrachtung: Wahrscheinlichkeitstheorie und Mengen

  1. Alle möglichen Ergebnisse eines Zufallsexperiments bilden die Ergebnismenge Ω. Beispiel: Würfeln mit 2 verschiedenfarbigen Würfeln hintereinander:
    Ω = {(1;1), (1;2), ... , (6;6)} = Menge der möglichen Zahlenpaare.

  2. Verschiedene Ergebnisse können zu Ereignissen zusammengefasst werden. Ein Ereignis A ist eine Teilmenge von Ω.
    Beispiel (s. Bild rechts):
    A = {(2;6), (3;5), (4;4), (5;3), (6;2)}: "Augensumme 8".
    B = {(1;3), (2;4), (3;5), (4;6)}: "2. Würfel zeigt 2 Punkte mehr als 1. Würfel"

  3. Das Ereignis A UND B besteht aus der Menge A ∩ B. Im Bsp: {(3;5)}.

  4. Das Ereignis A ODER B besteht aus der Menge A ∪ B.

  5. Die einelementigen Ereignisse {a}, {b}, {c}, ... heissen Elementarereignisse.

  6. Das Ereignis { } heisst unmögliches Ereignis, Ω selber ist das sichere Ereignis.

  7. Jedem Ereignis A wird eine Wahrscheinlichkeit p(A) zugeordnet. Dies ist eine Zahl zwischen 0 ("unmöglich") und 1 ("sicher").

  8. p(Ω) = 1

  9. Zwei Ereignisse A und B heissen unvereinbar, wenn A ∩ B = { } ist. Nur für unvereinbare Ereignisse gilt: p(A ODER B) = p(A ∪ B) = p(A) + p(B).
    Die Elementarereignisse sind auf jeden Fall unvereinbar.
    Bilden also einige Elementarereignisse ein grösseres Ereignis, könnnen die Wahrscheinlichkeiten der Elementarereignisse addiert werden.

  10. Ein Zufalls-Spiel, bei dem alle Elementarereignisse gleich wahrscheinlich sind, heisst Laplace-Spiel.
 

wth

Beispiel: Würfeln mit zwei verschiedenfarbigen Würfeln. Die 36 Gitterpunkte bilden die Menge Ω. Grün: Teilmenge A: "Augensumme 8". Rot: Teilmenge B: "2. Wurf zeigt 2 Punkte mehr als 1. Wurf".
Jeder Gitterpunkt stellt als einelementige Menge ein Elementarereignis dar. Seine Wahrscheinlichkeit beträgt 1/36.
Das grün markierte Ereignis A hat die Wahrscheinlichkeit 5/36, das rot markierte Ereignis B hat die Wahrscheinlichkeit 4/36 = 1/9.

Bei Laplace-Spielen gilt:


Wahrscheinlichkeit = Anzahl günstige Fälle ÷ Anzahl mögliche Fälle

 


 
 
 
 
  5. Kombinatorik - Wir lernen zählen      
  5.1. Anagramme (Permutationen)      
 

Anagramme sind Buchstabenumstellungen in einem Wort, z.B. in einem Namen.
Beispiele:
ADI und IDA
PETRA MEIER und MARIE PETER.
Wer (z.B. mit seinem eigenen Namen) selber Anagramme bilden will, findet hier einen Anagramm-Generator: http://www.sibiller.de/anagramme/

 

Aufgaben

  1. Wieviele verschiedene Anagramme sind möglich mit a) AL,   b) ADI,   c) SINA,   d) PETRA,    e) MARTIN?
  2. Auf wieviele verschiedene Arten können 4 verschiedene Personen, die auf einer Bank sitzen, ihre Plätze einnehmen? Wie steht es mit 1, 2, 3, 4, 5, ... Personen?
  3. Ebenso: a) ADA,   b) OTTO,   c) MISSISSIPPI?
 
 
 
 
 

Lösungen zu den Aufgaben 1 - 3

Aufgabe 1 und 2:
Auf wieviele Arten kann man n verschiedene Elemente anordnen?
Das erste Element kann auf n Plätze gesetzt werden, das zweite Element hat noch
(n - 1) Plätze, das dritte (n - 2), usw. Insgesamt ergeben sich so
n⋅(n - 1)⋅(n - 2)⋅...⋅1 verschiedene Anordnungen.

Der Ausdruck n⋅(n - 1)⋅(n - 2)⋅...⋅1 wird abgekürzt notiert als n! (sprich: "n Fakultät").

1 Element

a 1 Art
2 Elemente ab 2⋅1 = 2 Arten
3 Elemente abc 3⋅2⋅1 = 6 Arten
4 Elemente abcd 4⋅3⋅2⋅1 = 24 Arten
5 Elemente abcde 5⋅4⋅3⋅2⋅1 = 120 Arten

Man definiert ferner:

0! = 1.

(Das ist sinnvoll: Auf wieviele Arten kann man 0 Elemente anordnen: auf 1 Art.)

 

Aufgabe 3: Beispiel MISSISSIPPI:
Wären alle Buchstaben verschieden (z.B. verschiedenfarbig):
MISSISSIPPI, so gäbe es 11! verschiedene Anordungen (Anagramme).
Nun sind aber im einfarbigen Fall die 4! = 24 möglichen Vertauschungen der vier Buchstaben I nicht mehr unterscheidbar: Die Anzahl Möglichkeiten ist durch 4! zu dividieren. Dasselbe gilt nochmals für die vier Buchstaben S: Erneut ist durch 4! zu dividieren. Die beiden Buchstaben P erfordern schliesslich eine weitere Division durch 2!. Wir erhalten somit für MISSISSIPPI folgende Anzahl an Anagrammen (Permutationen): 11! ÷ (4!⋅4!⋅2!).


Zusammenfassung: Anzahl Anagramme (Permutationen):


Anzahl Anordnungen von n verschiedenen Elementen


n!

Anzahl Anordungen von n Elementen, von denen jeweils k₁, k₂, ... unter sich ununterscheidbar sind (MISSISSIPPI- oder ANAGRAMM-Formel):


anagrammformel
Dieser Ausdruck wird Multinomialkoeffizient genannt.

 
 
 
 
 

5.2. Drehtüren, Französische Speisekarten und Blütendolden

dolde

 

  1. 4 Damen und 4 Herren passieren eine Drehtür. Wieviele Anordnungsmöglichkeiten sind denkbar, wenn den Damen der Vortritt gelassen wird?

  2. Eine französische Speisekarte bietet 7 Entrées, 8 Hauptspeisen und 6 Desserts an. Wieviele Menü-Zusammenstellungen bestehend aus einer Vorspeise, einem Hauptgang und einem Dessert sind denkbar?

  3. Eine Blütendolde verzweigt sich 20-mal. Jedes der 20 Ästchen hat weitere 5 Verzweigungen. Jede dieser Unter-Verzweigungen hat erneut 10 Verzweigungen. Wieviele End-Verzweigungen besitzt diese Dolde?
 

drehtuer  menue

Lösungen:

  1. Die 4 Damen können sich auf 4! = 24 Arten aufstellen. Zu jeder dieser 24 Aufstellungen gibt es für die Herren hinten 4! = 24 Aufstellungen. Insgesamt gibt es somit 24⋅24 = 576 Aufstellungen, bei denen die Damen zuerst passieren.

  2. 7⋅8⋅6 = 336 Variationsmöglichkeiten.

  3. 20⋅5⋅10 = 1000 End-Ästchen.
 
 
 
 
 

Aufgaben

  1. Wieviele mögliche Positions-Varianten hat ein Fussballtrainer mit 10 Personen, die überall im Feld eingesetzt werden können?
  2. Wieviele 6-stellige Zahlen gibt es, die zweimal die 4, dreimal die 5 und einmal die 8 enthalten?
  3. Ein Schulzimmer hat 24 Sitzplätze, die durch eine Klasse mit 24 Personen alle besetzt sind. Wieviele verschiedene Sitzordnungen sind theoretisch möglich?
  4. Man hat ein Gefäss mit 20 weissen und 20 schwarzen Kugeln. Nun wird der Inhalt ausgeleert, tüchtig gemischt und geschüttelt und wieder eingefüllt. Wie gross ist die Wahrscheinlichkeit, dass sich in der unteren Gefässhälfte gerade die Kugeln der einen und in der oberen Hälfte diejenigen der andern Farbe befinden?
 

Lösungen

  1. 10! = 3'628'800
  2. Beispiel: 445558. MISSISSIPPI-Formel: 6!÷(2!⋅3!) = 60
  3. 24! = 620'448'401'733'239'439'360'000
  4. Eine "Drehtüraufgabe": Wir denken uns im Gefäss 40 Plätze für die Kugeln reserviert, 20 unten, 20 oben. Seien zuerst die 20 schwarzen Kugeln unten: Sie können sich auf 20! Arten auf die 20 unteren Plätze verteilen. Zu jeder dieser 20! Anordnungen existieren oben für die weissen Kugeln 20! Anordnungen. Insgesamt gibt es also 20!⋅20! Anordnungen mit "Schwarz unten". Nochmals so viele gibt es mit "Weiss unten", somit total 2⋅20!⋅20! farbsortierte Anordnungen ("Günstige").
    Total gibt es 40! Anordnungen von 40 Kugeln auf 40 Plätzen ("Mögliche").
    Die Wahrscheinlichkeit, nach dem Schütteln gerade eine farbsortierte Anordnung zu erhalten, beträgt also 2⋅20!⋅20! / 40! = 1.45⋅10-11 . (Die Wahrscheinlichkeit eines Lottosechsers ist über 8000-mal höher!) Die Wahrscheinlichkeit, dass sich zwei Molekülarten beim Mischen sortieren, ist praktisch null.
 
 
 
 
  5.3. Auswählen mit Berücksichtigung der Reihenfolge (Variationen)      
 

Gegeben seien n Kugeln. Wir ziehen aus diesem Vorrat blind k-mal hintereinander eine Kugel. Die Kugeln seien nummeriert. Die Reihenfolge der gezogenen Kugeln werde berücksichtigt, d.h. die Folge (1, 2, 4) sei nicht dasselbe wie die Folge (4, 1, 2). Wenn wir die Reihenfolge berücksichtigen, sprechen wir von Variationen und verwenden runde Klammern: (1, 2, 4), (4, 1, 2), usw.

Zwei Fälle sind denkbar:

  1. Ziehen mit Wiederholung bzw. mit Zurücklegen der gezogenen Kugel. Die Kugel wird gezogen, angeschaut, das Resultat wird notiert und die Kugel wird wieder zurückgelegt. Im neuen Zug stehen wieder alle Kugeln zur Verfügung.
    Beispiele: Mehrmaliges Würfeln mit Berücksichtigung der Reihenfolge; mehrmaliges Drehen eines Glücksrades.

  2. Ziehen ohne Wiederholung: Die Kugel wird gezogen und nicht mehr zurückgelegt. Beim neuen Zug ist die Auswahl um eine Kugel kleiner geworden.
    Beispiele: Bei einem Pferderennen mit n = 12 Pferden sind die ersten k = 3 Ränge zu erraten. Jedes Pferd kann nur einmal getippt werden.
    Wahl von k = 3 Personen in einen Vorstand mit Präsidium, Aktuariat und Quästorat aus n Mitgliedern.
 

Lösungen

  1. 1. Wahl: n Möglichkeiten, eine Kugel zu ziehen;  2. Wahl: ebenso; 3. bis k-te Wahl: ebenso.
    Insgesamt n⋅n⋅...⋅ = nk Möglichkeiten.

  2. 1. Wahl: n Möglichkeiten, 2. Wahl: (n - 1) Möglichkeiten, 3. Wahl: (n - 2) Möglichkeiten, usw.
    Insgesamt n⋅(n - 1)⋅(n - 2)⋅...⋅(n - k + 1) Möglichkeiten.

Zusammenfassung Variationen (Reihenfolge wichtig):

Variationen (Reihenfolge wichtig);
Ziehen von k Kugeln aus einem Vorrat von n Kugeln:
Anzahl Möglichkeiten
Mit Zurücklegen, mit Wiederholung nk
Ohne Zurücklegen, ohne Wiederholung n⋅(n - 1)⋅(n - 2)⋅...⋅(n - k + 1)
 
 
 
 
  5.4. Auswählen ohne Berücksichtigung der Reihenfolge (Kombinationen)      
 

Hier behandeln wir nur den Fall des Ziehens ohne Zurücklegen, d.h. ohne Wiederholung. Das Ziehen ohne Wiederholung und ohne Berücksichtigung der Reihenfolge ist gleichbedeutend dem "Ziehen in einem Griff": Auf's Mal werden aus dem Vorrat der n Kugeln k Kugeln herausgefischt. Die Reihenfolge, in der die Kugeln auf dem Tisch liegen, ist unerheblich, d.h. es ist z.B. {1, 2, 4} = {1, 4, 2} = {4, 1, 2}, usw. Wir stellen dies durch Mengenklammern dar.
Beispiele: Lotto: Man kreuzt k = 6 Zahlen aus n = 45 Zahlen an.

Der Fall mit Wiederholung und ohne Berücksichtigung der Reihenfolge wird hier beschrieben.


Definition der Binomialkoeffizienten ("n tief k")

bk04

Es gilt die "Symmetrieregel":

bk05

Begründung:

bk06

Die rot gefärbten Faktoren können gekürzt werden. Ungekürzt ergibt sich der Binomialkoeffizient links, gekürzt derjenige rechts.


 
  1. Auf wieviele Arten kann man in einem Raster von n = 10 Kästchen genau k = 3 Kästchen ankreuzen?

  2. Auf wieviele Arten kann man 3 Preise an 30 Personen, welche alle die richtige Wettbewerbslösung eingesandt haben, verteilen?

Antworten:

  1. Ein Beispiel:   X O X O O O X O O O
    Das erste Kreuz kann auf 10 Plätze gesetzt werden, das zweite auf 9, das dritte auf 8. Das ergäbe 10⋅9⋅8 Möglichkeiten. Nun sind aber die Kreuze ununterscheidbar, also werden die 3! Permutationen der drei Kreuze nicht unterschieden. Es ergeben sich also nur (10⋅9⋅8) / (3!) Möglichkeiten.
    Dieser Ausdruck wird abgekürzt notiert als
    bk01
    (gesprochen: "10 tief 3").

    Es ist also
    bk02
    oder auch
    bk03
    Diese Ausdrücke werden Binomialkoeffizienten genannt (dies, weil sie auch beim Potenzieren von Binomen auftreten).

    Es gibt also im Beispiel oben 720 verschiedene Ankreuz-Muster.

  2. Es gibt "30 tief 3" = 4060 Möglichkeiten der Preisverteilung.
 
 
 
 
 

Aufgaben

  1. Wieviele 5-stellige Zahlen kann man mit den Ziffern 1, 3, 5, 7 bilden (diese dürfen mehrfach vorkommen)?
  2. Wieviele verschiedene "Wörter" mit 5 Buchstaben lassen sich aus den Buchstaben des Wortes NAGELKOPF bilden?
  3. Auf wieviele Arten kann man im Schweizer Zahlenlotto 6 Zahlen aus 45 Zahlen ankreuzen?

Lösungen

  1. 1. Stelle: 4 Möglichkeiten, 2. bis 5. Stelle ebenso: 45 = 1024 Möglichkeiten
  2. 1. Buchstabe: 9 Möglichkeiten, 2. Buchstabe: 8 Möglichkeiten, usw. Insgesamt also 9⋅8⋅7⋅6⋅5 = 15'120 Möglichkeiten.
  3. "45 tief 6" = 8'145'060 verschiedene Lotto-Tipps. Die Wahrscheinlichkeit für einen Lotto-Sechser beträgt demnach 1 : 8'145'060.
 

Zusammenfassung Kombinationen (Reihenfolge unwichtig) ohne Wiederholung, d.h. ohne Zurücklegen:

 

Anzahl Möglichkeiten (k Kugeln in einem Griff aus n Kugeln):     bk00

 

 
 
 
 
  6. Das Lotto-Modell
(Hypergeometrische Verteilung)
     
 

lottoschein

Im Schweizer Zahlenlotto sind aus den Zahlen {1, 2, ..., 45} sechs Zahlen anzukreuzen. Es werden dann Ende Woche ebenfalls sechs Zahlen als Gewinnzahlen "gezogen".
Wie gross ist die Wahrscheinlichkeit, dass man genau 4 Richtige getippt hat ("Lotto-Vierer")?

* * * * * * | 0 0 0 ... 0 0
6 Gewinnzahlen      39 Nieten

4 aus 6 angekreuzt       2 aus 39 angekreuzt
bk07Möglichkeiten    bk08Möglichkeiten   → bk11günstige Fälle

Die Wahrscheinlichkeit eines Lotto-Vierers ist = Anzahl günstige Fälle dividiert durch Anzahl mögliche Fälle:

bk12

   

Beim Lotto-Modell hat man "Treffer" *) und "Nieten". Man zieht eine Stichprobe (im Lotto kreuzt man 6 Zahlen an) und fragt nach der Wahrscheinlichkeit, mit der man genau x Treffer gezogen hat.

Beispiel Lotto "6 aus 45":

Anzahl Richtige p in % Anzahl Richtige p in %
0 40.1 4 0.1
1 42.4 5 0.0
2 15.1 6 0.0
3 2.2    

histogramm

Stabdiagramm zur Wahrscheinlichkeitsverteilung für genau x Richtige im Schweizer Zahlenlotto. Die durch das Lotto-Modell erzeugte Verteilung wie sie in obigem Histogramm erscheint, wird hypergeometrische Verteilung genannt. Sie entsteht durch Ziehen ohne Zurücklegen.

*) Die "Treffer" können im Falle von Materialprüfungen auch "Schäden" bedeuten.

 
 
 
 
 

Aufgabe

kartenspiel

Ein normales französisches Kartenspiel besteht aus 36 Karten. Davon tragen 9 Karten die "Farbe" Herz. An einem Fest wird ein Glücksspiel gespielt: Je nach Geldeinsatz darf man mehrere Karten ziehen (ohne Zurücklegen). Die Herzkarten gelten als Glückstreffer und gewinnen einen kleinen Preis.
Anna entnimmt dem Spiel 16 Karten. Wie gross ist die Wahrscheinlichkeit, dass unter den gezogenen Karten genau 5 Herzkarten, also Glückstreffer, dabei sind? Ergebnis in % auf eine Stelle nach dem Komma gerundet.

 

Oben: Die Verteilung "genau x Glückstreffer" . x-Achse: Anzahl Glückstreffer; y-Achse: Wahrscheinlichkeit für genau x Glückstreffer.

Lösung: 22.5%, ablesbar als y-Wert für x = 5.

 
 
 
 
 

Hypergeometrische Verteilung allgemein:

Man hat insgesamt n "Kugeln", darunter m "Glückstreffer" und folglich (n - m) "Nieten". Man zieht ferner eine Stichprobe von a Kugeln.
Wie gross ist die Wahrscheinlichkeit pn,m,a (x), dass man genau x "Glückstreffer" in der Stichprobe auffindet?
Man hat folgende Situation:

hypergm

Beispiel: Eine Lieferung von 100 elektronischen Teilen enthält 5 fehlerhafte Teile. Man prüft jeweils routinemässig jede solche 100er-Lieferung, indem man 10 Teile herausfischt und testet. Die Lieferung wird angenommen, wenn dabei kein Teil fehlerhaft ist, ansonsten wird die Lieferung zurückgewiesen. Mit welcher Wahrscheinlichkeit wird obige schlechte Lieferung angenommen?
Wieviele Teile der 100er-Lieferung müsste man prüfen, um mit weniger als 5% Wahrscheinlichkeit eine Lieferung mit 5 Fehlerteilen irrtümlich anzunehmen?

Lösung:
Hier sind die "Treffer" die fehlerhaften Teile und die "Nieten" die funktionierenden Teile!
5 Treffer    |   95 i.O.
0 aus 5      |   10 aus 95
Insgesamt: 10 aus 100.


loes

Die Prüfung ist also unzureichend. Man muss mehr Teile in die Stichprobe einschliessen. Wenn man 45 Teile prüft, beträgt die Irrtumswahrscheinlichkeit bei obiger Lieferung noch 4.6%.

 

Schätzung der Grösse der Fischpopulation in einem See
Aus: William Feller: An Introduction to Probability Theory and Its Applications, Vol.I, 2nd edition, Wiley&Sons, New York, London, Sydney, 1965.

Man fängt aus einem See 1000 Fische, markiert sie mit einem roten Punkt und lässt sie wieder frei. Nach einer Weile -die Population muss sich wieder gut durchmischen- fängt man erneut 1000 Fische. Man findet in diesem zweiten Fang 100 Fische mit roten Punkten. Gesucht ist ein Rückschluss auf die Populationsgrösse n.

Lösung:
Die Wahrscheinlichkeit, dass man genau 100 rotgepunktete Fische fängt, beträgt

p100
(n = ?, m = 1000, a = 1000, x = 100).

Diese Formel ist ein Ausdruck, der noch die Unbekannte n enthält, also eine Funktion in n. Man kann nun mit verschiedenen n-Werten experimentieren und erhält jedesmal einen Wahrscheinlichkeitswert für p(100). In der folgenden Grafik sind für angenommene n-Werte von 8000 bis 14000 die Wahrscheinlichkeiten, dass man beim zweiten Fang genau 100 rotgepunktete Fische fängt aufgezeichnet (x-Achse: angenommene Populationszahl n, y-Achse: Wahrscheinlichkeit p(100)).
Bei ca. n = 10'000 nimmt diese Wahrscheinlichkeit ein Maximum an (4.43%). Es darf also vermutet werden, dass die Fischpopulation im See etwa n = 10'000 Fische beträgt.

fischformel

Natürlich könnte das Resultat verfälscht werden, wenn die Fische sich nicht überall gleich verteilen (wenn z.B. geschützte Buchten existieren). Das Beispiel zeigt trotzdem, wie man mit Hilfe der hypergeometrischen Verteilung durch Feldversuche auf die Gesamtpopulation zurückschliessen kann.
Dies ist die Methode der Maximum Likelihood. Man nimmt an, dass die effektiv gezogene Stichprobe auch diejenige mit der maximalen Wahrscheinlichkeit ist. Leider ist dies nicht sicher; die gezogene Stichprobe könnte auch eine mit geringerer Auftretenswahrscheinlichkeit sein. Die Methode liefert einen einzigen "Schätzpunkt" für die Populationsgrösse (hier 10'000); es ist eine Punktschätzungs-Methode. Man weiss hier nicht genau, in welcher Bandbreite die geschätzte Population mit welcher Wahrscheinlichkeit gilt. Um die Populationsgrösse zuverlässiger abschätzen zu können, müssten mehrere solche Stichproben gezogen werden.

 
 
 
 
 

Zwei Aufgaben

  1. In einer Schale befinden sich 30 Smarties, darunter 12 rote. David schnappt sich blind 10 Smarties. Wie gross ist die Wahrscheinlichkeit, dass er genau 6 rote dabei hat?

  2. In einer Klasse mit 14 Lernenden bereiten sich 6 jeweils vorbildlich, 5 flüchtig und 3 überhaupt nicht vor. Die Lehrperson prüft rein zufällig 3 Lernende. Mit welcher Wahrscheinlichkeit erwischt sie genau 2 vorbildlich Vorbereitete?
 

smarties

Lösungen

  1. 9.41%
  2. 32.97%
 
 
 
 
  7. Das Bernoulli-Modell
(Binomialverteilung)
     
 

Im Bernoulli-Modell wird ein Zufallsexperiment (z.B. Würfeln) mehrfach hintereinander ausgeführt, wobei jede Stufe identisch abläuft (es ist also ein Spiel mit Zurücklegen, d.h. mit Wiederholung). Jeder Würfelvorgang hat genau zwei mögliche Ausgänge: Treffer (mit Wahrscheinlichkeit p) oder Niete (mit Wahrscheinlichkeit 1 - p). Jeder neue Wurf verläuft unabhängig vom vorhergehenden Wurf. Man nennt eine solche Serie eine Bernoulli-Kette.

Beispiel:
Man würfelt 10-mal hintereinander mit einem gewöhnlichen Spielwürfel. Die Zahl Eins gelte als Glückszeichen ("Treffer"), die übrigen Zahlen seien die "Nieten". Es ist also p = 1/6 und (1 - p) = 5/6.

Eine mögliche Frage ist z.B.: Wie gross ist die Wahrscheinlichkeit, dass man in den 10 Würfen genau 4 Treffer (Einsen) erzielt?

Wahrscheinlichkeit, in einer Bernoulli-Kette von n Versuchen genau x-mal einen Treffer zu erzielen:


                           binvert02



 

Lösung
Hier einen Baum zu zeichnen wäre viel zu umständlich. Man überlegt wie folgt:

1 1 1 1 0 0 0 0 0 0 ist ein möglicher Ausgang mit vier Einsen.
0 1 0 0 1 1 0 0 0 1 ist ein anderer möglicher Ausgang mit vier Einsen.

Man überlegt leicht, dass die Wahrscheinlichkeit für jede solche Zeile dieselbe ist, nämlich (1/6)4 ⋅ (5/6)6 .
Wieviele solche Zeilen existieren, d.h. auf wieviele Arten kann ich vier (rote) Einsen auf 10 Plätze verteilen? Auf "10 tief 4" Arten.
Die Wahrscheinlichkeit in 10 Würfen genau vier Einsen zu erhalten, beträgt somit
binvert01
histogramm
x-Achse: Anzahl Einsen beim 10-maligen Würfeln. y-Achse: Wahrscheinlichkeit für genau x Einsen beim 10-maligen Würfeln. Am wahrscheinlichsten sind die Werte x = 1 oder x = 2.

 
 
 
 
 

Beispiel: Man wirft eine Münze 5-mal bzw. man wirft 5 Münzen gleichzeitig. Wie gross sind die Wahrscheinlichkeiten für 0-mal Kopf, 1-mal Kopf, ... , 5-mal Kopf?

Lösung:
p und (1 - p) haben je die Wahrscheinlichkeit 1/2. Wir erhalten folgende Wahrscheinlichkeit für genau x-mal "Kopf":

loes

 

histogramm
Diese Wahrscheinlichkeitsverteilung ist die sogenannte Binomialverteilung.

 
 
 
 
 

Einschub: Die Multinomialverteilung

Ein Spielwürfel trage anstelle der Augenzahlen folgende Buchstaben:
M I I S S P. Beim Würfeln sind also hier 4 Ausgänge möglich: M, I, S, P.
Wir haben folgende Wahrscheinlichkeiten:
p("M") = 1/6, p("P") = 1/6, p("I") = 1/3, p("S") = 1/3.

Man würfle nun 11-mal hintereinander. Wie gross ist die Wahrscheinlichkeit, dass genau 1-mal ein M, 4-mal ein I, 4-mal ein S und 2-mal ein P gewürfelt wurde?

Lösung:

Eine solche Möglichkeit wäre:

 M    I    I    I    I    S    S    S    S    P    P

(1/6)1⋅    (1/3)4 ⋅          (1/3)4 ⋅          (1/6)2

Unterhalb der Buchstaben findet sich die Berechnung der Wahrscheinlichkeit für diese Anordnung.
Nun ergibt die MISSISSIPPI-Formel die Anzahl unterscheidbarer, verschiedener Anordnungen dieser Möglichkeit (Anzahl Anagramme): 11! / (1! 4! 4! 2!).
Die gesuchte Wahrscheinlichkeit für das Ereignis ("1-mal M, 4-mal I, 4-mal S, 2-mal P") beträgt somit

P("(1,4,4,2)") = [11! / (1! 4! 4! 2!)] ⋅ (1/6)1⋅(1/3)4 ⋅(1/3)4 ⋅ (1/6)2  .

Der fettgedruckte, rotbraune Term wird Multinomialkoeffizient genannt.

Dem Vektor (1,4,4,2) [er bedeutet: 1-mal M, 4-mal I, 4-mal S, 2-mal P] wird die Wahrscheinlichkeit zugeordnet, dass bei elfmaligem Würfeln die Buchstaben M, I, S, P in der angegebenen Anzahl und in beliebiger Anordnung vorkommen.
Analog können andere Vektorkomponenten berechnet werden (die Summe der Komponenten muss hier jedoch immer 11 ergeben).
Die Verteilung, die jedem Vektor (hier mit Komponentensumme 11) die entsprechende Wahrscheinlichkeit zuordnet, heisst Multinomialverteilung.

 

kugeln

 

Weiteres Beispiel:

In einem Gefäss befinden sich 6 rote, 4 schwarze, 5 grüne und 5 blaue Kugeln. Man zieht 7-mal je eine Kugel mit Zurücklegen. Wie gross ist die Wahrscheinlichkeit, dass man 2 rote, 2 schwarze, 2 grüne und 1 blaue Kugel (in beliebiger Anordnung) gezogen hat?
Kurzschreibweise: P("(2,2,2,1)") = ?

 

Lösung:

P("(2,2,2,1)") = [7! / (2! 2! 2! 1!)] ⋅ (6/20)2 ⋅(4/20)2⋅(5/20)2 ⋅ (5/20)1 ≈ 0.0354 ≈ 3.54%

 
 
 
 
  8. Bedingte Wahrscheinlichkeiten p(A | B)      
  8.1. "False positive": Problematik bei seltenen Krankheiten      
  Von einer seltenen Krankheit K seien ungefähr 0.5% der Bevölkerung betroffen; es ist also p("K") = 0.005. Ein Test zum Erkennen dieser Krankheit zeige bei Gesunden in 95% aller Fälle ein negatives Resultat; in 5% der Fälle wird somit fälschlicherweise ein positives Resultat angezeigt ("false positive"). Bei Kranken zeigt der Test in 95% der Fälle (zu Recht) ein positives Resultat und in 5% der Fälle ein negatives (Nicht-Erkennen der Krankheit). Wir bezeichnen die positive Reaktion des Tests mit +.
Man berechne die bedingte Wahrscheinlichkeit P(K | +), d.h. die Wahrscheinlichkeit, dass eine Person wirklich krank ist, wenn der Test positiv verläuft.
  falsepos01  
 

Lösung: Man beachte die Darstellung oben rechts.
Es ist p(+) = 0.005⋅0.95 +0.995⋅0.05 = 0.0545 (auf 100'000 Personen 5450-mal +).
p(K UND +) = 0.005⋅0.95 = 0.00475 (auf 100'000 Personen 475-mal zu Recht +).

Von 5450 insgesamt positiven Reaktionen sind also nur 475 zu Recht positiv! Das Verhältnis der zu Recht Positiven zu allen Positiven ist p(K | +) = 0.00475 / 0.0545 ≈ 0.087 ≈ 8.7%. Mit p(K | +) bezeichnet man die Wahrscheinlichkeit, dass man die Krankheit hat unter der Bedingung eines positiven Testresultats (bedingte Wahrscheinlichkeit).

 

Trotz positivem Testresultat beträgt die Wahrscheinlichkeit, dass man die Krankheit wirklich hat, nur 8.7%. Das heisst auch, dass der Anteil "false positive" 91.3% beträgt.

Dies ist ein Problem bei der Massenerfassung seltener Krankheiten: Die Testfehler schlagen stärker durch als die Krankheit selber. In der Praxis wird man somit von solchen Massentests absehen und auf andere Indikatoren setzen.

 

 
 
 
 
 

Lösung des Problems bedingter Wahrscheinlichkeiten mit Hilfe einer Vierfelder-Tafel

Die blauen Felder stellen die eigentliche "Vierfelder-Tafel" dar. Die Randfelder beinhalten die Summen der blauen Felder.

Spalte 1: Anzahl erkrankte Personen, Spalte 2: Anzahl gesunde Personen

Zeile 1:   Anzahl Personen mit positivem Testbefund, Zeile 2: Anzahl Personen mit
               negativem Testbefund.

 

Wir betrachten eine repräsentative Auswahl von 100'000 Personen und tragen in die Felder die Zahlen gemäss obiger Aufgabe ein:

krank
nicht krank
Test positiv
475
4'975
5'450
Test negativ
25
94'525
94'550
500
99'500
100'000

#falsch Positive / # Positive = 4975 / 5450 ≈ 91.3%.
Wer somit ein positives Testresultat erhielt, ist mit einer Wahrscheinlichkeit von 91.3% nicht von der Krankheit betroffen.

 
 
 
 
  8.2. Morbus Crohn - Private Gentests kritisch betrachtet      
  (Quelle: Tages Anzeiger vom 11.1.2011, 119. JG., Nr. 8, p. 38: Th. Messner: Fluch und Segen moderner Diagnostik)
Private Institutionen bieten einen Gentest für Morbus Crohn an, einer nicht heilbaren chronischen Entzündung des Darms. Die Krankheit ist sehr selten: Von 10'000 Personen haben 20 Morbus Crohn. Eine bestimmte Genveränderung ist bei den Erkrankten deutlich häufiger feststellbar: 40% der Erkrankten haben diese Veränderung; aber auch 10% der gesunden Personen besitzen diese Genveränderung.
Wie alarmierend ist nun ein positives Gentest-Resultat?
  Lösung: Wir betrachten einen repräsentativen "Ideal-Querschnitt" von 10'000 Personen.
Davon sind 20 von der Krankheit betroffen (das sind 0.2%), 9980 nicht.
40% der Erkrankten, also 8 Personen, haben die Genveränderung, jedoch auch 10% der Gesunden, also 998 Personen.
Das Verhältnis "true-positive" zu "positive" beträgt somit 8 : (8 + 998) ≈ 0.8%.
Falls der Gentest positiv ausfällt, beträgt die Wahrscheinlichkeit, an Morbus Crohn zu erkranken also ca. 0.8% (gegenüber dem "ungetesteten Normalrisiko" von 0.2%). Das ist immer noch nicht alarmierend und macht die Aussagekraft eines solchen Gentests mehr als fraglich. Die Wahrscheinlichkeit, dass ein positives Testresultat "false positive" ist, beträgt also satte 99.2%.
 
 
 
 
 

bedingte_w


     
 
 
 
  9. Von der Binomial- zur Normalverteilung      
 

wuerfel

Abb. oben: 36 Würfel. Mit welcher Wahrscheinlichkeit treten in einem natürlichen Wurf wie oben gezeigt genau sechs Einsen auf? Gemäss Formel unten mit p = 17.6%.

Man würfelt mit n Würfeln gleichzeitig. "1" sei der "Glückstreffer". Die Bildfolge rechts zeigt die Wahrscheinlichkeit für x Glückstreffer ("Einsen") beim Würfeln mit n Würfeln und zwar für n = 5, n = 10, n = 20 und n = 50.
Es gilt p(x) =
binvert02

Man erkennt folgendes: Die zunächst asymmetrische Binomialverteilung wird mit wachsendem n zunehmend symmetrischer und die Stelle, an der das Maximum angenommen wird, rückt nach rechts. Gleichzeitig sieht man, dass die Darstellung in y-Richtung immer flacher wird.

Erwartungswert μ und Standardabweichung σ der Binomialverteilung:
Würfelt man mehrfach hintereinander, ist im Durchschnitt jeder 6. Wurf eine Eins. Man erwartet also im Durchschnitt auf n Würfe ca. n/6 oder n ⋅ ⅙   Einsen.  Allgemein:
Erwartungswert μ = n ⋅ p.
Für die Standardabweichung σ gilt: σ =[n⋅p⋅(1-p)]½ . Diese Beziehung sei hier nicht hergeleitet.

Lassen wir n wachsen, verschiebt sich der Erwartungswert μ nach rechts, die Verteilung wird breiter und immer flacher. Irgendwann ist sie so flach, dass alle Säulenhöhen beinahe null sind. Wählen wir die Breite aller Säulen gleich 1, wird die gesamte Säulenfläche in jedem Diagramm gleich 1 (= Summe aller Teilwahrscheinlichkeiten). Deshalb muss die Darstellung, wenn sie immer breiter wird, auch immer flacher werden. Wollen wir auch bei sehr grossen Werten von n die Form der Verteilung studieren, müssen wir drei Dinge tun:

  • Wir müssen mit dem Erwartungswert "mitreisen", uns also nach rechts verschieben.
  • Wir müssen unsere Darstellung horizontal zusammenstauchen, damit wir sie gut überblicken können.
  • Wir müssen die Säulenhöhen vertikal aufzoomen.

Die letzten beiden Punkte erledigen wir am besten so, dass die Gesamtfläche aller Säulen immer noch 1 bleibt.
Anstelle der Zufallsvariablen X ("Anzahl Einsen" bei n Würfen") betrachten wir eine neue Zufallsvariable Z, die wir aus X folgendermassen ableiten:

  • Wir betrachten nicht mehr die "Anzahl Einsen", sondern die Abweichung der aufgetretenen Einsen vom Erwartungswert μ, also nicht mehr X, sondern X - μ.
  • Zusätzlich interessieren wir uns aber nun nicht für die absolute Abweichung vom Erwartungswert, sondern wollen wissen, welchen Bruchteil gemessen an der Standardabweichung σ die Abweichung x  - μ ausmacht, d.h. wir betrachten die Zufallsvariable (X - μ) / σ. Diese neue Zufallsvariable nennen wir Z. Es ist die an der Standardabweichung relativierte Abweichung der aufgetretenen Anzahl Einsen vom Erwartungswert.
    Oder noch einfacher gesagt: Die Zufallsvariable Z sagt, um wieviele Standardabweichungen die in n Würfen gewürfelte Anzahl Einsen vom Erwartungswert abweicht.

Die hier beschriebene Transformation der Zufallsvariablen X in die Zufallsvariable Z nennt man Z-Transformation:

Z = (X - μ) / σ

Wir können dies so auffassen, dass wir das alte Koordinatensystem (x, y) durch ein neues Koordinatensystem (z, y) ersetzen. Die alte x-Achse wird also ersetzt durch eine neue, horizontale z-Achse. Wir fragen: Wo sind z = 0 und z = 1 zu finden?

z = 0: Der neue Koordinatennullpunkt sitzt an der alten Stelle x  = μ.
z = 1: Der neue Einheitspunkt sitzt an der alten Stelle x = μ + σ, d.h. eine neue z-Skaleneinheit entspricht σ alten x-Skaleneinheiten. Das bedeutet auch, dass die alte Streifenbreite 1 neu gleich 1/σ wird.
Nun zoomen wir die Streifenhöhe neu noch mit Faktor σ auf, wodurch die Streifenfläche gleich bleibt wie im alten System.

Sei p(x) die alte Funktion und p*(z) die neue Funktion. Es ist
p*(z) = σ⋅p(x), wobei x = x(z) eine Funktion von z ist, nämlich: x = σ⋅z + μ.
⇒ p*(z) =  σ⋅p(σ⋅z + μ). Es wird p*(0) = σ⋅p(μ) und p*(1) = σ⋅p(μ + σ).
Man vergleiche die beiden Säulendiagramme im grauen Kasten rechts miteinander. Die untere Darstellung entstand durch Z-Transformation aus der oberen Darstellung.


Im neuen System (z-Achse statt x-Achse) erhalten wir auf diese Weise eine Darstellung mit Erwartungswert 0 und Standardabeichung 1. Die Gesamtfläche der Streifen ist gleich 1 (Summe aller Teilwahrscheinlichkeiten).

 

bv_nv

Die Säulendiagramme zeigen die Wahrscheinlichkeiten p(x), beim Würfeln mit n Würfeln x-mal eine Eins zu würfeln. Mit wachsendem n verschiebt sich der Erwartungswert μ nach rechts und die Verteilung wird zunehmend breiter und flacher. Dies liegt daran, dass bei gleich bleibender Streifenbreite die Diagrammfläche konstant bleibt. Wählt man die Streifenbreite = 1, so ist die gesamte Fläche aller Streifen zusammen gleich 1 (Summe aller Teilwahrscheinlichkeiten = 1).
Man erkennt die zunehmende Symmetrisierung der Verteilung.

Geogebra-Modell der Binomialverteilung mit verschieden wählbaren Parametern n und p.

Beispiel: n = 10. Transformation der Zufallsvariablen X in die Zufallsvariable Z.
μ = 10/6 ≈ 1.67,    σ = [50/36]½ ≈ 1.18.

x-Wert z-Wert p(x) σ⋅p(x)
  0 -1.41 0.16 0.19
  1 -0.57 0.32 0.38
  2  0.28 0.29 0.34
  3  1.13 0.16 0.18
  4  1.98 0.05 0.06
  5  2.83 0.01 0.01
  6  3.68 0.00 0.00
  7  4.53 0.00 0.00
  8  5.37 0.00 0.00
  9  6.22 0.00 0.00
10  7.07 0.00 0.00
Summe   1  

Erwartungswert und Varianz der z-transformierten Verteilung:

Erwartungswert: ∑zi⋅pi = 0
Varianz:              ∑(zi - 0)2 ⋅pi = 1

Die gesamte (rote) Balkenfläche ist vor und nach der Transformation = 1.

normierte_bv

 

 

 

Tabelle oben: Man würfelt 10-mal. Tritt dabei genau einmal eine Eins auf, besagt der z-Wert -0.57, dass dieses Resultat 0.57 Standardabweichungen unter dem Erwartungswert (1.67) liegt. Tritt genau 3-mal eine Eins auf, besagt der z-Wert 1.13, dass dieses Resultat 1.13 Standardabweichungen über dem Erwartungswert 1.67 liegt.

Der Erwartungswert selber (1.67) sagt, dass im Durchschnitt bei 10-maligem Würfeln 1.67-mal eine Eins auftritt.

In der z-transformierten Darstellung sind die Balken in der Breite mit Faktor 1/ σ und in der Höhe mit Faktor σ gezoomt worden. Dadurch ist die Fläche jedes Balkens - und damit auch die Gesamtfläche 1 aller Balken zusammen - unverändert geblieben. Die Wahrscheinlichkeit, dass 0-mal, 1-mal, 2-mal, usw. die Eins gewürfelt wurde, lässt sich beim entsprechenden Balken der z-transformierten Darstellung nicht mehr an der Balkenhöhe ablesen, sondern an der Balkenfläche.

Die gesamte Balkenfläche 1 aufgefasst als Gesamtwahrscheinlichkeit 1 teilt sich auf in die Fläche der einzelnen Balken.


Die Wahrscheinlichkeiten werden nun durch die Flächen der Balken dargestellt.

 


 

 
 
 
 
 

Hier nochmals eine Bildreihe zur z-Transformation.
Man würfelt mit n Würfeln zugleich. Die Zufallsvariable X sei die Anzahl gewürfelter Einsen. Es ist also p = 1/6.

Links, grüne Darstellung: x-Achse: Anzahl gewürfelter Einsen. Säulenhöhe: p(X=x).
Rechts, rote Darstellung: z-Achse:  z = (x - μ) / σ, d.h. die Zufallsvariable Z bedeutet die Abweichung der gewürfelten Anzahl Einsen vom Erwartungswert relativiert an der Standardabweichung. z sagt also aus, um wieviele Standardabweichungen die gewürfelte Anzahl Einsen vom Erwartungswert abweicht.

bv-nv-reihe

Man sieht, dass der Mittelwert der grünen Verteilung nach rechts davonläuft, die Verteilung flacher und breiter wird. Die Gesamtfläche der Histogrammstreifen ist gleich 1 (jeder Streifen hat Breite 1).

 

 

Die z-transformierte, rote Verteilung nähert sich grenzwertartig einer Endform an, die Erwartungswert 0 und Standardabweichung 1 hat. Natürlich kann nun die Wahrscheinlichkeit nicht mehr als Streifenhöhe abgelesen werden. Dafür ist die Fläche jedes Streifens bei der Transformation gleich geblieben. Die Wahrscheinlichkeit, dass die Zufallsgrösse Z zwischen z1 und z2 liegt, ist gegeben durch das Flächenstück unter der Kurve zwischen z1 und z2.

Für n → ∞ entsteht nun eine stetige Verteilung, die Standard-Normalverteilung.

Die Formel für die Standard-Normalverteilung ( μ = 0, σ = 1) lautet:
formelnv
Die Fläche unter dieser Glockenkurve ist gleich 1. Die Standardabweichung ist die Distanz vom Koordinatennullpunkt bis zum z-Wert des Wendepunktes, im Fall der Standardglockenkurve also bis zu z = 1:

 

nv
         Standardnormalverteilung

 

Die Wahrscheinlichkeit, dass die Zufallsgrösse Z zwischen z1 und z2 liegt, ist gegeben durch den Flächeninhalt zwischen der Kurve und der x-Achse zwischen z1 und z2 (rot markiertes Flächenstück).