Mathematik für Biologiestudierende¶

Wintersemester 2025/26

12.11.2025

© 2025 Prof. Dr. Rüdiger W. Braun

Wiederholung (interaktiv)¶

Gehen Sie auf die Website

  • https://pingo.coactum.de

und geben Sie folgende Zugangsnummer ein

  • 670719

oder scannen Sie den QR-Code

QR-Code

Themen heute¶

  • Stochastische Unabhängigkeit
  • Bedingte Wahrscheinlichkeit
  • Satz von der totalen Wahrscheinlichkeit
  • Bayessche Formel
In [1]:
import numpy as np
np.set_printoptions(legacy='1.21')
import seaborn as sns
sns.set_theme()
sns.set_context('talk')
import pandas as pd

Stochastische Unabhängigkeit¶

Zwei diskrete Zufallsvariable $X$ und $Y$ sind stochastisch unabhängig, wenn für alle möglichen Werte $k$ und $m$

$$ P(X=k, Y=m) = P(X=k) \cdot P(Y=m) $$

Es folgt ein Beispiel, wo die Unabhängigkeit auf eine subtile Weise nicht gegeben war

Beispiel: Lotterie¶

  • Eine Lotterie wurde nach den folgenden Regeln gespielt:
  • In einer Trommel befinden sich 70 Kugeln, und zwar für jede Ziffer je sieben
  • Es werden nacheinander sieben Kugeln gezogen
  • Dadurch entsteht eine siebenstellige Zahl
  • Den Hauptgewinn erhält, wer diese Zahl auf seinem Los hat
  • Das ist kein faires Spiel

Lotterie: Kritik¶

  • Die Wahrscheinlichkeit, gezogen zu werden, ist für alle Kugeln gleich
  • aber nicht für alle Losnummern
  • Es gibt $$ 7^7 = 823\,543 $$ Möglichkeiten, Einzelkugeln so auszuwählen, dass die Losnummer 1234567 herauskommt
  • Es gibt aber nur $$ 7! = 5040 $$ Möglichkeiten, Einzelkugeln so auszuwählen, dass die Losnummer 1111111 herauskommt
In [2]:
anzahl_gesamt = 70*69*68*67*66*65*64
anzahl_gesamt
Out[2]:
6041824588800
In [3]:
anzahl1234567 = 7**7
anzahl1234567
Out[3]:
823543
In [4]:
from scipy import special
In [5]:
anzahl1111111 = special.factorial(7)
anzahl1111111
Out[5]:
5040.0
In [6]:
P1234567 = anzahl1234567 / anzahl_gesamt
P1234567
Out[6]:
1.363070026108733e-07
In [7]:
P1111111 = anzahl1111111 / anzahl_gesamt
P1111111
Out[7]:
8.341850919245278e-10
In [8]:
P1234567 / P1111111
Out[8]:
163.4013888888889

Die Gewinnwahrscheinlichkeit des Loses mit der Nummer 1234567 ist mehr als 160 mal so groß wie die des Loses mit der Nummer 1111111

Die Zufallsvariablen

  • $X_1$: Ziffer auf der ersten Kugel
  • $X_2$: Ziffer auf der zweiten Kugel

sind stochastisch nicht unabhängig

Wenn die erste Kugel eine 1 zeigt, dann ist die Wahrscheinlichkeit, dass die zweite das auch tut, kleiner als die Wahrscheinlichkeit, dass die zweite eine 2 zeigt.

Bedingte Wahrscheinlichkeit¶

$$ P(A|B) = \frac{P(A \cap B)}{P(B)} $$

bezeichnet man als bedingte Wahrscheinlichkeit von $A$ unter der Hypothese $B$

man sagt auch "Wahrscheinlichkeit von $A$ gegeben $B$"

  • Die Hypothese $B$ ist also vorausgesetzt (im Beispiel ist jemand bereits 50 Jahre alt geworden)
  • Das Ereignis $A$ ist das Ereignis, dessen Wahrscheinlichkeit interessiert (im Beispiel ist $A$ das Ereignis, älter als 80 zu werden)
  • Man bezeichnet $P(A)$ auch als totale Wahrscheinlichkeit, wenn man den Unterschied zu einer bedingten Wahrscheinlichkeit verdeutlichen will

Beispiel zur bedingten Wahrscheinlichkeit¶

  • Sei $E_{m50}$ das Ereignis, dass ein männliches Neugeborenes ein Alter von mindestens 50 Jahren erreichen wird; laut Sterbetafel ist $P(E_{m50}) = 0.919$
  • für 80 Jahre $P(E_{m80}) = 0.365$
  • dann wegen $E_{m50} \cap E_{m80} = E_{m80}$ $$ P(E_{m80} | E_{m50}) = \frac{P(E_{m80} \cap E_{m50})}{P(E_{m50})} = \frac{0.365}{0.919} = 0.397 $$
  • für weibliche Neugeborene $P(E_{w50}) = 0.958$ und $P(E_{w80}) = 0.566$
    $$ P(E_{w80} | E_{w50}) = \frac{P(E_{w80} \cap E_{w50})}{P(E_{w50})} = \frac{0.566}{0.958} = 0.591 $$

Beispiele für Hypothesen¶

  • Frage: Wie groß ist die Wahrscheinlichkeit für eine Frau an ihrem hundertsten Geburtstag, dass sie ihren nächsten Geburtstag erlebt?

Hypothese: Eine Frau erreicht ihren hundersten Geburtstag

  • Frage: Wie groß ist die Wahrscheinlichkeit auf Darmkrebs, wenn Spuren von Blut im Stuhl gefunden wurden?

Hypothese: Es wurden Spuren von Blut im Stuhl gefunden

  • Frage: Wie groß ist die Wahrscheinlichkeit, dass ein TB-Test die Krankheit anzeigt?

Hypothese: Patient ist krank

  • Frage: Wie groß ist die Wahrscheinlichkeit, dass ein positiv getesteter Proband tatsächlich an TB erkrankt ist?

Hypothese: Patient wurde positiv getestet

  • Frage: Wie hoch ist die Wahrscheinlichkeit einer geimpften Person für einen schweren Krankheitsverlauf?

Hypothese: Person ist geimpft

Beispiel aus dem Wahlkampf 2017¶

  • Richtige Aussage: 40% der befristet Beschäftigten sind zwischen 25 und 35 Jahren alt
  • Falsche Aussage eines Spitzenpolitikers: 40% der Beschäftigten zwischen 25 und 35 Jahren sind befristet beschäftigt

Heuristische Begründung der Formel¶

$$ P(A|B) = \frac{P(A\cap B)}{P(B)} $$

  • unter der Hypothese $B$ ist $B$ sicher, also $P(B|B) = 1$; daher wird durch $P(B)$ geteilt
  • unter der Hypothese $B$ sind diejenigen Elementarereignisse von $A$, die nicht in $B$ liegen, irrelevant; daher steht im Zähler $P(A \cap B)$ und nicht $P(A)$

Rechenregeln¶

  • $P(A|B)$ ist eine Wahrscheinlichkeit für $A$, erfüllt also die Rechenregeln für Wahrscheinlichkeiten
  • die wichtigste ist die Regel für die Wahrscheinlichkeit des Komplementärereignisses $$ P(A^c|B) = 1 - P(A|B) $$

Produktformel¶

$$ P(A \cap B) = P(A|B) \cdot P(B) $$

Für unabhängige $ A $ und $ B $ lautet die Produktformel $$ P(A \cap B) = P(A) \cdot P(B) $$

Also sind $ A $ und $ B $ genau dann unabhängig, wenn $$ P(A|B) = P(A) $$

Satz von der totalen Wahrscheinlichkeit¶

Bekannt:

  • totale Wahrscheinlichkeit $P(B)$ und damit auch $P(B^c)$
  • bedingte Wahrscheinlichkeiten $P(A|B)$ und $P(A|B^c)$

Gesucht: totale Wahrscheinlichkeit $P(A)$

\begin{align*} P(A) &= P(A \cap B) + P(A \cap B^c) \\ &= P(A | B) \cdot P(B) + P(A | B^c) \cdot P(B^c) \\ &= P(A | B) \cdot P(B) + P(A | B^c) \cdot (1-P(B)) \end{align*}

Bayessche Formel¶

Bekannt:

  • totale Wahrscheinlichkeit $P(B)$
  • bedingte Wahrscheinlichkeiten $P(A|B)$ und $P(A|B^c)$
  • totale Wahrscheinlichkeit $P(A)$ aus dem Satz von der totalen Wahrscheinlichkeit

Gesucht: bedingte Wahrscheinlichkeit $P(B|A)$ $$ P(B|A) = \frac{P(A|B) \cdot P(B)}{P(A)} $$

Beispiel Röntgenreihenuntersuchung¶

In den 1960-er Jahren wurden Röntgenreihenuntersuchungen durchgeführt. Beispielhafte Daten:

  • bei 94% aller Erkrankten schlägt der Test an
  • bei 1% der Gesunden schlägt der Test an
  • 99.8% aller Probanden sind gesund

Zufällig herausgegriffener Proband

  • $A$: "Verdacht auf TB"
  • $B$: "an TB erkrankt"
  • $P(B) = 0.002$ (totale Wahrscheinlichkeit)
  • $P(A|B) = 0.94$ (bedingte Wahrscheinlichkeit)
  • $P(A|B^c) = 0.01$ (bedingte Wahrscheinlichkeit)

Satz von der totalen Wahrscheinlichkeit¶

\begin{align*} P(A) &= P(A|B) \cdot P(B) + P(A|B^c) \cdot P(B^c) \\ &= 0.94 \cdot 0.002 + 0.01 \cdot 0.998 \\ &= 0.00188 + 0.00998 \\ &= 0.01186 \end{align*}

1.186% aller Probanden verlassen die Untersuchung mit einem Verdacht,

aber nur 0.2% aller Probanden sind krank

Fragen zur Röntgenreihenuntersuchung¶

  • Mit welcher Wahrscheinlichkeit wird ein Kranker nicht endeckt?
  • Mit welcher Wahrscheinlichkeit ist eine Verdachtsdiagnose falsch?
  • Mit welcher Wahrscheinlichkeit wird eine falsche Diagnose gestellt?

erste Frage¶

Mit welcher Wahrscheinlichkeit wird ein Kranker nicht endeckt?

"Falsch negativer Befund": Krankheit übersehen $$ P(A^c|B) = 1 - P(A|B) = 1 - 0.94 = 0.06 $$ Die Wahrscheinlichkeit, dass ein Kranker für gesund gehalten wird, beträgt 6%

zweite Frage¶

Mit welcher Wahrscheinlichkeit ist eine Verdachtsdiagnose falsch?

"Falsch positiver Befund": Krankheit zu Unrecht diagnostiziert \begin{align*} P(B^c | A) &= 1 - P(B|A) \\ &= 1 - \frac{P(A|B) \cdot P(B)}{P(A)} \\ &= 1 - \frac{0.94 \cdot 0.002}{0.01186} \\ &= 1 - 0.1585 \\ &= 0.8415 \end{align*} Wer mit Verdachtsdiagnose aus der Röntgenreihenuntersuchung kam, war mit nahezu 85% Wahrscheinlichkeit gesund

dritte Frage¶

  

Mit welcher Wahrscheinlichkeit kommt es zu einer Fehldiagnose?

Das ist eine totale Wahrscheinlichkeit, nämlich \begin{align*} P(A \cap B^c) + P(A^c \cap B) &= P(A|B^c) \cdot P(B^c) + P(A^c|B) \cdot P(B) \\ &= 0.06 \cdot 0.002 + 0.01 \cdot 0.998 \\ &= 0.0101 \end{align*} Die Wahrscheinlichkeit einer Fehldiagnose beträgt 1.01%