Mathematik für Biologiestudierende¶
Wintersemester 2025/26
19.11.2025
© 2025 Prof. Dr. Rüdiger W. Braun
Wiederholung (interaktiv)¶
Gehen Sie auf die Website
und geben Sie folgende Zugangsnummer ein
- 670719
oder scannen Sie den QR-Code

Themen heute¶
- Kochrezepte für Binomialtests
- Der p-Wert
- Power eines Tests
import numpy as np
np.set_printoptions(legacy='1.21')
import seaborn as sns
sns.set_theme()
sns.set_context('talk')
import pandas as pd
from scipy import stats # <-------------- neu hinzugekommen
Fehler erster und zweiter Art¶
- Der Fehler 1. Art ist die fälschliche Ablehnung der Nullhypothese.
- Der Fehler 2. Art ist die fälschliche Beibehaltung der Nullhypothese
Die Priorität liegt auf der Vermeidung des Fehlers 1. Art. Diese Asymmetrie ist ein entscheidendes Merkmal der Testtheorie.
| $H_0$ wird beibehalten | $H_0$ wird abgelehnt | |
|---|---|---|
| $H_0$ trifft zu | richtige Entscheidung | Fehler 1. Art |
| $H_1$ trifft zu | Fehler 2. Art | richtige Entscheidung |
- Fehlerwahrscheinlichkeit 1. Art soll kleiner sein als das Signifikanzniveau $\alpha$
- Die Komplementärwhrscheinlichkeit der Fehlerwahrscheinlichkeit 2. Art ist die Power
Kochrezepte für Binomialtests¶
Ein- und zweiseitige Tests¶
- Ein ja/nein-Experiment mit unbekannter Erfolgswahrscheinlichkeit $p$ wird $n$-mal wiederholt
- Ziel: Aussage über $p$ relativ zu einem Referenzwert $p_0$
- verschiedene Nullhypothesen sind denkbar
- $H_0 : p \ge p_0$: einseitiger unterer Test
- $H_0 : p \le p_0$: einseitiger oberer Test
- $H_0 : p = p_0$: zweiseitiger Test
- Die Nullhypothese $H_0 \colon p \ne p_0$ macht keinen Sinn
Einseitiger unterer Binomialtest zum Niveau $\alpha$¶
- Gegeben sind unabhängige $B(1, p)$-verteilte Zufallsvariable $X_1, \dots, X_n$ mit unbekanntem $p$ sowie ein Signifikanzniveau $\alpha$
- Verglichen werden soll mit einem Referenzwert $p_0$
- Getestet wird die Nullhypothese $H_0 = \{p \ge p_0\}$ gegen die Alternative $H_1 = \{p < p_0\}$
Pist die Binomialverteilung $B_{n,p_0}$- Der Wert $c$ ist so zu wählen, dass
P.cdf(c-1)$\le\alpha$ undP.cdf(c)$>\alpha$ - $c$ heißt kritischer Wert
Entscheidungsregel:¶
- Die Nullhypothese wird abgelehnt, falls die Anzahl der Erfolge echt kleiner als $c$ ist
- Die Nullhypothese wird beibehalten, falls die Anzahl der Erfolge mindestens $c$ ist
Beispiel zum unteren Binomialtest¶
- 20% der Fahrradfahrerinnen und Fahrradfahrer haben eine defekte Lichtanlage
- Die Polizei startet eine Aufklärungskampagne
- Nach Ablauf der Kampagne werden 100 Fahrräder kontrolliert, um die folgende Frage zum Signifikanzniveau $\alpha=0.02$ zu beantworten
Ist der Anteil der Fahrräder mit defekter Lichtanlage gefallen
- Referenzwahrscheinlichkeit $p_0 = 0.2$
- Nullhypothese $H_0 = \{p \ge p_0\}$
- Binomialverteilung
P = stats.binom(100, 0.2)
- kritischer Wert $c$ bestimmt durch
P.cdf(c-1)≤ 0.02 undP.cdf(c)> 0.02
c = P.ppf(0.02)
c
12.0
Probe:
P.cdf(11)
0.012574876348121796
P.cdf(12)
0.02532875322139711
Wenn 11 oder weniger Fahrräder eine defekte Lichtanlage haben, dann ist der Nachweis der Wirksamkeit der Aktion zum Signifikanzniveau $\alpha=0.02$ gelungen
Einseitiger oberer Binomialtest zum Niveau $\alpha$¶
- Gegeben sind unabhängige $B(1, p)$-verteilte Zufallsvariable $X_1, \dots, X_n$ mit unbekanntem $p$ sowie ein Signifikanzniveau $\alpha$
- Verglichen werden soll mit einem Referenzwert $p_0$
- Getestet wird die Nullhypothese $H_0 = \{p \le p_0\}$ gegen die Alternative $H_1 = \{p > p_0\}$
Pist die Binomialverteilung $B_{n,p_0}$- Der kritische Wert $c$ ist so zu wählen, dass
P.cdf(c-1)$<1-\alpha$ undP.cdf(c)$\ge1-\alpha$
Entscheidungsregel:¶
- Die Nullhypothese wird abgelehnt, falls die Anzahl der Erfolge echt größer als $c$ ist
- Die Nullhypothese wird beibehalten, falls die Anzahl der Erfolge höchstens $c$ ist
Beispiel: Mutationen¶
- In einer Population weist normalerweise jedes 250te Individuum eine gewisse Mutation auf.
- Bei einer Untersuchung von 2000 Individuen werden nun aber sogar 12 Träger der Mutation gefunden,
- $2000/250=8$, man hätte also 8 Träger von Mutationen erwartet
Zwei Interpretationen sind denkbar
- Eine Steigerung der Mutationshäufigkeit um 50% wurde entdeckt
- Unter 2000 Individuen wurden gerade mal vier Ausreißer entdeckt
Statistics to the rescue!¶
- Bevor wir diese Entdeckung an die Presse geben, wollen wir sicher sein, dass die Mutationsrate tatsächlich gestiegen ist
- Sicherheit ist relativ. Mit einem Irrtumsrisiko von 5% können wir leben
Binomialtest für das Beispiel¶
- Wir machen einen Binomialtest. Die Referenzwahrscheinlichkeit ist $p_0 = 0.004$
- Die Nullhypothese ist $H_0 = \{ p \le p_0 \}$
- Es handelt sich um einen einseitigen, oberen Binomialtest
- Das Signifikanzniveau beträgt $\alpha = 0.05$
- Der kritische Wert $c$ ist so zu wählen, dass
P.cdf(c-1)$<1-\alpha$ undP.cdf(c)$\ge1-\alpha$
- Entscheidungsregel:
- Die Nullhypothese wird abgelehnt, falls die Anzahl der Erfolge echt größer als $c$ ist
- Die Nullhypothese wird beibehalten, falls die Anzahl der Erfolge höchstens $c$ ist
P = stats.binom(2000, 0.004)
alpha = 0.05
c = P.ppf(1-alpha)
c
13.0
Probe:
P.cdf(c-1) # muss kleiner als 0.95 sein
0.9365883630330971
P.cdf(c) # muss größer als 0.95 sein
0.9661155504516327
Mutation: Entscheidung¶
- Die Rechnung ergibt $c = 13$
- Bei bis zu 13 Erfolgen (einschließlich) wird die Nullhypothese beibehalten
- Wir haben nur 12 Mutationen beobachtet: Nullhypothese wir beibehalten
- Keine signifikante Erhöhung beobachtet
Maschinelle Auswertung und der p-Wert¶
Der p-Wert¶
- Der $p$-Wert ist das kleinste Signifikanzniveau, zu dem die Daten den Test noch bestehen würden.
- Der $p$-Wert beantwortet die Frage
Wie knapp wurde das vorgeschriebene Signifikanzniveau eingehalten bzw. verfehlt?
- Wenn $\alpha$ das Signifikanzniveau ist
- $p \le \alpha$: Nullhypothese wird abgelehnt
- $p > \alpha$: Nullhypothese wird beibehalten
Software gibt immer den $p$-Wert aus
res = stats.binomtest(12, 2000, 0.004, alternative="greater")
res
BinomTestResult(k=12, n=2000, alternative='greater', statistic=0.006, pvalue=0.1114898591368222)
res.pvalue
0.1114898591368222
res.statistic
0.006
res.statistic == 12/2000
True
Der Begriff der Teststatistik spielt erst bei den später zu besprechenden Tests eine Rolle
stats.binomtest(k, n, p0, alternative)
kist die beobachtete Anzahlnist der Stichprobenumfangp0ist die Referenzwahrscheinlichkeitalternativelegt fest, ob ein oberer, unterer oder zweiseitiger Test gerechnet wirdalternative="greater"bedeutet: oberer Testalternative="less"bedeutet: unterer Testalternative="two-sided"bedeutet: zweiseitiger Test- keine Angabe: zweiseitiger Test
Alternative¶
alternative="greater"heißt: wir behaupten, dass die tatsächliche Erfolgswahrscheinlichkeit größer als die Referenzwahrscheinlichkeit ist
Power und Fehlerwahrscheinlichkeit zweiter Art¶
Wir fassen das Experiment mit den Mutationen noch einmal zusammen:
- 2000 Individuen
- Referenzwahrscheinlichkeit $p_0=0.004$
- Signifikanzniveau $\alpha=0.05$
- Nullhypothese $H_0=\{p \le p_0\}$
- $c=13$
- Die Nullhypothese wird abgelehnt bei 14 oder mehr Mutationen
- Wie groß ist bei diesem Test die Fehlerwahrscheinlichkeit zweiter Art?
- Das ist keine gute Frage
- Wenn die Wahrscheinlichkeit einer Mutation nur um ein Winziges steigt, dann ist das praktisch nicht nachzuweisen
- Sinnvoll ist folgende Frage
Angenommen, die Mutationswahrscheinlichkeit steigt von 0.4% auf 0.6%, mit welcher Wahrscheinlichkeit wird unser Test diese Änderung entdecken?
- Wenn $q$ die Fehlerwahrscheinlichkeit zweiter Art ist, dann bezeichnet man $ 1 - q $ als Power des Tests
- Die Power hängt also davon ab, welche Annahme man über den Abstand zwischen Nullhypothese und Alternative macht
Power des Tests¶
Wir wollen eine Erhöhung der Mutationsrate um 50%, also von $p_0=0.004$ auf $p=0.006$ entdecken
Was ist dann die Power des Tests?
Die Power ist die Wahrscheinlichtkeit für die richtige Entscheidung, wenn die Alternative tatsächlich zutrifft
$H_0$ wird abgelehnt bei mindestens 14 Erfolgen
Q = stats.binom(2000, 0.006) # W'keit unter der Alternative
- Wenn 13 oder weniger Erfolge beobachtet werden, mache ich den Fehler zweiter Art
- Also ist die Fehlerwahrscheinlichkeit zweiter Art gleich
Q.cdf(13)
0.6818540941767756
und die Power ist gleich
1 - Q.cdf(13)
0.31814590582322444
Poweranalyse¶
- Vor der Durchführung eines Experiments sollte man sich überzeugen, dass der Test ausreichende Power hat. Es besteht sonst die Gefahr, dass die Alternative nicht nachgewiesen werden kann, obwohl sie zutrifft
- Ein Test kann nie die Nullhypothese zeigen. Wenn die Power groß ist, dann ist die Beibehaltung der Nullhypothese aber ein Indiz ihrer Korrektheit