Mathematik für Biologiestudierende¶

Wintersemester 2025/26

12.11.2025

Wiederholung (interaktiv)¶

Gehen Sie auf die Website

https://pingo.coactum.de

und geben Sie folgende Zugangsnummer ein

670719

oder scannen Sie den QR-Code

QR-Code

Themen heute¶

Stochastische Unabhängigkeit
Bedingte Wahrscheinlichkeit
Satz von der totalen Wahrscheinlichkeit
Bayessche Formel

In [1]:

import numpy as np
np.set_printoptions(legacy='1.21')
import seaborn as sns
sns.set_theme()
sns.set_context('talk')
import pandas as pd

Stochastische Unabhängigkeit¶

Zwei diskrete Zufallsvariable $X$ und $Y$ sind stochastisch unabhängig, wenn für alle möglichen Werte $k$ und $m$

$$ P(X=k, Y=m) = P(X=k) \cdot P(Y=m) $$

Es folgt ein Beispiel, wo die Unabhängigkeit auf eine subtile Weise nicht gegeben war

Beispiel: Lotterie¶

Eine Lotterie wurde nach den folgenden Regeln gespielt:
In einer Trommel befinden sich 70 Kugeln, und zwar für jede Ziffer je sieben
Es werden nacheinander sieben Kugeln gezogen
Dadurch entsteht eine siebenstellige Zahl
Den Hauptgewinn erhält, wer diese Zahl auf seinem Los hat

Das ist kein faires Spiel

Lotterie: Kritik¶

Die Wahrscheinlichkeit, gezogen zu werden, ist für alle Kugeln gleich

aber nicht für alle Losnummern
Es gibt $$ 7^7 = 823\,543 $$ Möglichkeiten, Einzelkugeln so auszuwählen, dass die Losnummer 1234567 herauskommt

Es gibt aber nur $$ 7! = 5040 $$ Möglichkeiten, Einzelkugeln so auszuwählen, dass die Losnummer 1111111 herauskommt

In [2]:

anzahl_gesamt = 70*69*68*67*66*65*64
anzahl_gesamt

Out[2]:

6041824588800

In [3]:

anzahl1234567 = 7**7
anzahl1234567

Out[3]:

In [4]:

from scipy import special

In [5]:

anzahl1111111 = special.factorial(7)
anzahl1111111

Out[5]:

5040.0

In [6]:

P1234567 = anzahl1234567 / anzahl_gesamt
P1234567

Out[6]:

1.363070026108733e-07

In [7]:

P1111111 = anzahl1111111 / anzahl_gesamt
P1111111

Out[7]:

8.341850919245278e-10

In [8]:

P1234567 / P1111111

Out[8]:

163.4013888888889

Die Gewinnwahrscheinlichkeit des Loses mit der Nummer 1234567 ist mehr als 160 mal so groß wie die des Loses mit der Nummer 1111111

Die Zufallsvariablen

$X_1$: Ziffer auf der ersten Kugel
$X_2$: Ziffer auf der zweiten Kugel

sind stochastisch nicht unabhängig

Wenn die erste Kugel eine 1 zeigt, dann ist die Wahrscheinlichkeit, dass die zweite das auch tut, kleiner als die Wahrscheinlichkeit, dass die zweite eine 2 zeigt.

Bedingte Wahrscheinlichkeit¶

$$ P(A|B) = \frac{P(A \cap B)}{P(B)} $$

bezeichnet man als bedingte Wahrscheinlichkeit von $A$ unter der Hypothese $B$

man sagt auch "Wahrscheinlichkeit von $A$ gegeben $B$"

Die Hypothese $B$ ist also vorausgesetzt (im Beispiel ist jemand bereits 50 Jahre alt geworden)
Das Ereignis $A$ ist das Ereignis, dessen Wahrscheinlichkeit interessiert (im Beispiel ist $A$ das Ereignis, älter als 80 zu werden)

Man bezeichnet $P(A)$ auch als totale Wahrscheinlichkeit, wenn man den Unterschied zu einer bedingten Wahrscheinlichkeit verdeutlichen will

Beispiel zur bedingten Wahrscheinlichkeit¶

Sei $E_{m50}$ das Ereignis, dass ein männliches Neugeborenes ein Alter von mindestens 50 Jahren erreichen wird; laut Sterbetafel ist $P(E_{m50}) = 0.919$
für 80 Jahre $P(E_{m80}) = 0.365$

dann wegen $E_{m50} \cap E_{m80} = E_{m80}$ $$ P(E_{m80} | E_{m50}) = \frac{P(E_{m80} \cap E_{m50})}{P(E_{m50})} = \frac{0.365}{0.919} = 0.397 $$

für weibliche Neugeborene $P(E_{w50}) = 0.958$ und $P(E_{w80}) = 0.566$
$$ P(E_{w80} | E_{w50}) = \frac{P(E_{w80} \cap E_{w50})}{P(E_{w50})} = \frac{0.566}{0.958} = 0.591 $$

Beispiele für Hypothesen¶

Frage: Wie groß ist die Wahrscheinlichkeit für eine Frau an ihrem hundertsten Geburtstag, dass sie ihren nächsten Geburtstag erlebt?

Hypothese: Eine Frau erreicht ihren hundersten Geburtstag

Frage: Wie groß ist die Wahrscheinlichkeit auf Darmkrebs, wenn Spuren von Blut im Stuhl gefunden wurden?

Hypothese: Es wurden Spuren von Blut im Stuhl gefunden

Frage: Wie groß ist die Wahrscheinlichkeit, dass ein TB-Test die Krankheit anzeigt?

Hypothese: Patient ist krank

Frage: Wie groß ist die Wahrscheinlichkeit, dass ein positiv getesteter Proband tatsächlich an TB erkrankt ist?

Hypothese: Patient wurde positiv getestet

Frage: Wie hoch ist die Wahrscheinlichkeit einer geimpften Person für einen schweren Krankheitsverlauf?

Hypothese: Person ist geimpft

Beispiel aus dem Wahlkampf 2017¶

Richtige Aussage: 40% der befristet Beschäftigten sind zwischen 25 und 35 Jahren alt
Falsche Aussage eines Spitzenpolitikers: 40% der Beschäftigten zwischen 25 und 35 Jahren sind befristet beschäftigt

Heuristische Begründung der Formel¶

$$ P(A|B) = \frac{P(A\cap B)}{P(B)} $$

unter der Hypothese $B$ ist $B$ sicher, also $P(B|B) = 1$; daher wird durch $P(B)$ geteilt
unter der Hypothese $B$ sind diejenigen Elementarereignisse von $A$, die nicht in $B$ liegen, irrelevant; daher steht im Zähler $P(A \cap B)$ und nicht $P(A)$

Rechenregeln¶

$P(A|B)$ ist eine Wahrscheinlichkeit für $A$, erfüllt also die Rechenregeln für Wahrscheinlichkeiten
die wichtigste ist die Regel für die Wahrscheinlichkeit des Komplementärereignisses $$ P(A^c|B) = 1 - P(A|B) $$

Produktformel¶

$$ P(A \cap B) = P(A|B) \cdot P(B) $$

Für unabhängige $ A $ und $ B $ lautet die Produktformel $$ P(A \cap B) = P(A) \cdot P(B) $$

Also sind $ A $ und $ B $ genau dann unabhängig, wenn $$ P(A|B) = P(A) $$

Satz von der totalen Wahrscheinlichkeit¶

Bekannt:

totale Wahrscheinlichkeit $P(B)$ und damit auch $P(B^c)$
bedingte Wahrscheinlichkeiten $P(A|B)$ und $P(A|B^c)$

Gesucht: totale Wahrscheinlichkeit $P(A)$

\begin{align*} P(A) &= P(A \cap B) + P(A \cap B^c) \\ &= P(A | B) \cdot P(B) + P(A | B^c) \cdot P(B^c) \\ &= P(A | B) \cdot P(B) + P(A | B^c) \cdot (1-P(B)) \end{align*}

Bayessche Formel¶

Bekannt:

totale Wahrscheinlichkeit $P(B)$
bedingte Wahrscheinlichkeiten $P(A|B)$ und $P(A|B^c)$
totale Wahrscheinlichkeit $P(A)$ aus dem Satz von der totalen Wahrscheinlichkeit

Gesucht: bedingte Wahrscheinlichkeit $P(B|A)$ $$ P(B|A) = \frac{P(A|B) \cdot P(B)}{P(A)} $$

Beispiel Röntgenreihenuntersuchung¶

In den 1960-er Jahren wurden Röntgenreihenuntersuchungen durchgeführt. Beispielhafte Daten:

bei 94% aller Erkrankten schlägt der Test an
bei 1% der Gesunden schlägt der Test an
99.8% aller Probanden sind gesund

Zufällig herausgegriffener Proband

$A$: "Verdacht auf TB"
$B$: "an TB erkrankt"

$P(B) = 0.002$ (totale Wahrscheinlichkeit)
$P(A|B) = 0.94$ (bedingte Wahrscheinlichkeit)
$P(A|B^c) = 0.01$ (bedingte Wahrscheinlichkeit)

Satz von der totalen Wahrscheinlichkeit¶

\begin{align*} P(A) &= P(A|B) \cdot P(B) + P(A|B^c) \cdot P(B^c) \\ &= 0.94 \cdot 0.002 + 0.01 \cdot 0.998 \\ &= 0.00188 + 0.00998 \\ &= 0.01186 \end{align*}

1.186% aller Probanden verlassen die Untersuchung mit einem Verdacht,

aber nur 0.2% aller Probanden sind krank

Fragen zur Röntgenreihenuntersuchung¶

Mit welcher Wahrscheinlichkeit wird ein Kranker nicht endeckt?
Mit welcher Wahrscheinlichkeit ist eine Verdachtsdiagnose falsch?
Mit welcher Wahrscheinlichkeit wird eine falsche Diagnose gestellt?

erste Frage¶

Mit welcher Wahrscheinlichkeit wird ein Kranker nicht endeckt?

"Falsch negativer Befund": Krankheit übersehen $$ P(A^c|B) = 1 - P(A|B) = 1 - 0.94 = 0.06 $$ Die Wahrscheinlichkeit, dass ein Kranker für gesund gehalten wird, beträgt 6%

zweite Frage¶

Mit welcher Wahrscheinlichkeit ist eine Verdachtsdiagnose falsch?

"Falsch positiver Befund": Krankheit zu Unrecht diagnostiziert \begin{align*} P(B^c | A) &= 1 - P(B|A) \\ &= 1 - \frac{P(A|B) \cdot P(B)}{P(A)} \\ &= 1 - \frac{0.94 \cdot 0.002}{0.01186} \\ &= 1 - 0.1585 \\ &= 0.8415 \end{align*} Wer mit Verdachtsdiagnose aus der Röntgenreihenuntersuchung kam, war mit nahezu 85% Wahrscheinlichkeit gesund

dritte Frage¶

Mit welcher Wahrscheinlichkeit kommt es zu einer Fehldiagnose?

Das ist eine totale Wahrscheinlichkeit, nämlich \begin{align*} P(A \cap B^c) + P(A^c \cap B) &= P(A|B^c) \cdot P(B^c) + P(A^c|B) \cdot P(B) \\ &= 0.06 \cdot 0.002 + 0.01 \cdot 0.998 \\ &= 0.0101 \end{align*} Die Wahrscheinlichkeit einer Fehldiagnose beträgt 1.01%