Mathematik für Biologiestudierende¶

Wintersemester 2025/26

19.11.2025

Wiederholung (interaktiv)¶

Gehen Sie auf die Website

https://pingo.coactum.de

und geben Sie folgende Zugangsnummer ein

670719

oder scannen Sie den QR-Code

QR-Code

Themen heute¶

Kochrezepte für Binomialtests
Der p-Wert
Power eines Tests

In [1]:

import numpy as np
np.set_printoptions(legacy='1.21')
import seaborn as sns
sns.set_theme()
sns.set_context('talk')
import pandas as pd
from scipy import stats  # <--------------  neu hinzugekommen

Fehler erster und zweiter Art¶

Der Fehler 1. Art ist die fälschliche Ablehnung der Nullhypothese.
Der Fehler 2. Art ist die fälschliche Beibehaltung der Nullhypothese

Die Priorität liegt auf der Vermeidung des Fehlers 1. Art. Diese Asymmetrie ist ein entscheidendes Merkmal der Testtheorie.

	$H_0$ wird beibehalten	$H_0$ wird abgelehnt
$H_0$ trifft zu	richtige Entscheidung	Fehler 1. Art
$H_1$ trifft zu	Fehler 2. Art	richtige Entscheidung

Fehlerwahrscheinlichkeit 1. Art soll kleiner sein als das Signifikanzniveau $\alpha$
Die Komplementärwhrscheinlichkeit der Fehlerwahrscheinlichkeit 2. Art ist die Power

Kochrezepte für Binomialtests¶

Ein- und zweiseitige Tests¶

Ein ja/nein-Experiment mit unbekannter Erfolgswahrscheinlichkeit $p$ wird $n$-mal wiederholt
Ziel: Aussage über $p$ relativ zu einem Referenzwert $p_0$
verschiedene Nullhypothesen sind denkbar
- $H_0 : p \ge p_0$: einseitiger unterer Test
- $H_0 : p \le p_0$: einseitiger oberer Test
- $H_0 : p = p_0$: zweiseitiger Test
Die Nullhypothese $H_0 \colon p \ne p_0$ macht keinen Sinn

Einseitiger unterer Binomialtest zum Niveau $\alpha$¶

Gegeben sind unabhängige $B(1, p)$-verteilte Zufallsvariable $X_1, \dots, X_n$ mit unbekanntem $p$ sowie ein Signifikanzniveau $\alpha$
Verglichen werden soll mit einem Referenzwert $p_0$
Getestet wird die Nullhypothese $H_0 = \{p \ge p_0\}$ gegen die Alternative $H_1 = \{p < p_0\}$
P ist die Binomialverteilung $B_{n,p_0}$
Der Wert $c$ ist so zu wählen, dass P.cdf(c-1)$\le\alpha$ und P.cdf(c)$>\alpha$
$c$ heißt kritischer Wert

Entscheidungsregel:¶

Die Nullhypothese wird abgelehnt, falls die Anzahl der Erfolge echt kleiner als $c$ ist
Die Nullhypothese wird beibehalten, falls die Anzahl der Erfolge mindestens $c$ ist

Beispiel zum unteren Binomialtest¶

20% der Fahrradfahrerinnen und Fahrradfahrer haben eine defekte Lichtanlage
Die Polizei startet eine Aufklärungskampagne
Nach Ablauf der Kampagne werden 100 Fahrräder kontrolliert, um die folgende Frage zum Signifikanzniveau $\alpha=0.02$ zu beantworten

Ist der Anteil der Fahrräder mit defekter Lichtanlage gefallen

Referenzwahrscheinlichkeit $p_0 = 0.2$
Nullhypothese $H_0 = \{p \ge p_0\}$
Binomialverteilung

In [2]:

P = stats.binom(100, 0.2)

kritischer Wert $c$ bestimmt durch P.cdf(c-1) ≤ 0.02 und P.cdf(c) > 0.02

In [3]:

c = P.ppf(0.02)
c

Out[3]:

12.0

Probe:

In [4]:

P.cdf(11)

Out[4]:

0.012574876348121796

In [5]:

P.cdf(12)

Out[5]:

0.02532875322139711

Wenn 11 oder weniger Fahrräder eine defekte Lichtanlage haben, dann ist der Nachweis der Wirksamkeit der Aktion zum Signifikanzniveau $\alpha=0.02$ gelungen

Einseitiger oberer Binomialtest zum Niveau $\alpha$¶

Gegeben sind unabhängige $B(1, p)$-verteilte Zufallsvariable $X_1, \dots, X_n$ mit unbekanntem $p$ sowie ein Signifikanzniveau $\alpha$
Verglichen werden soll mit einem Referenzwert $p_0$
Getestet wird die Nullhypothese $H_0 = \{p \le p_0\}$ gegen die Alternative $H_1 = \{p > p_0\}$
P ist die Binomialverteilung $B_{n,p_0}$
Der kritische Wert $c$ ist so zu wählen, dass P.cdf(c-1)$<1-\alpha$ und P.cdf(c)$\ge1-\alpha$

Entscheidungsregel:¶

Die Nullhypothese wird abgelehnt, falls die Anzahl der Erfolge echt größer als $c$ ist
Die Nullhypothese wird beibehalten, falls die Anzahl der Erfolge höchstens $c$ ist

Beispiel: Mutationen¶

In einer Population weist normalerweise jedes 250te Individuum eine gewisse Mutation auf.
Bei einer Untersuchung von 2000 Individuen werden nun aber sogar 12 Träger der Mutation gefunden,
$2000/250=8$, man hätte also 8 Träger von Mutationen erwartet

Zwei Interpretationen sind denkbar

Eine Steigerung der Mutationshäufigkeit um 50% wurde entdeckt
Unter 2000 Individuen wurden gerade mal vier Ausreißer entdeckt

Statistics to the rescue!¶

Bevor wir diese Entdeckung an die Presse geben, wollen wir sicher sein, dass die Mutationsrate tatsächlich gestiegen ist
Sicherheit ist relativ. Mit einem Irrtumsrisiko von 5% können wir leben

Binomialtest für das Beispiel¶

Wir machen einen Binomialtest. Die Referenzwahrscheinlichkeit ist $p_0 = 0.004$
Die Nullhypothese ist $H_0 = \{ p \le p_0 \}$
- Es handelt sich um einen einseitigen, oberen Binomialtest
- Das Signifikanzniveau beträgt $\alpha = 0.05$

Der kritische Wert $c$ ist so zu wählen, dass P.cdf(c-1)$<1-\alpha$ und P.cdf(c)$\ge1-\alpha$

Entscheidungsregel:
- Die Nullhypothese wird abgelehnt, falls die Anzahl der Erfolge echt größer als $c$ ist
- Die Nullhypothese wird beibehalten, falls die Anzahl der Erfolge höchstens $c$ ist

In [6]:

P = stats.binom(2000, 0.004)
alpha = 0.05

In [7]:

c = P.ppf(1-alpha)
c

Out[7]:

13.0

Probe:

In [8]:

P.cdf(c-1)   #  muss kleiner als 0.95 sein

Out[8]:

0.9365883630330971

In [9]:

P.cdf(c)   #  muss größer als 0.95 sein

Out[9]:

0.9661155504516327

Mutation: Entscheidung¶

Die Rechnung ergibt $c = 13$
Bei bis zu 13 Erfolgen (einschließlich) wird die Nullhypothese beibehalten
Wir haben nur 12 Mutationen beobachtet: Nullhypothese wir beibehalten
Keine signifikante Erhöhung beobachtet

Maschinelle Auswertung und der p-Wert¶

Der p-Wert¶

Der $p$-Wert ist das kleinste Signifikanzniveau, zu dem die Daten den Test noch bestehen würden.
Der $p$-Wert beantwortet die Frage

Wie knapp wurde das vorgeschriebene Signifikanzniveau eingehalten bzw. verfehlt?

Wenn $\alpha$ das Signifikanzniveau ist
- $p \le \alpha$: Nullhypothese wird abgelehnt
- $p > \alpha$: Nullhypothese wird beibehalten

Software gibt immer den $p$-Wert aus

In [10]:

res = stats.binomtest(12, 2000, 0.004, alternative="greater")
res

Out[10]:

BinomTestResult(k=12, n=2000, alternative='greater', statistic=0.006, pvalue=0.1114898591368222)

In [11]:

res.pvalue

Out[11]:

0.1114898591368222

In [12]:

res.statistic

Out[12]:

0.006

In [13]:

res.statistic == 12/2000

Out[13]:

True

Der Begriff der Teststatistik spielt erst bei den später zu besprechenden Tests eine Rolle

stats.binomtest(k, n, p0, alternative)

k ist die beobachtete Anzahl
n ist der Stichprobenumfang
p0 ist die Referenzwahrscheinlichkeit
alternative legt fest, ob ein oberer, unterer oder zweiseitiger Test gerechnet wird
- alternative="greater" bedeutet: oberer Test
- alternative="less" bedeutet: unterer Test
- alternative="two-sided" bedeutet: zweiseitiger Test
- keine Angabe: zweiseitiger Test

Alternative¶

alternative="greater" heißt: wir behaupten, dass die tatsächliche Erfolgswahrscheinlichkeit größer als die Referenzwahrscheinlichkeit ist

Power und Fehlerwahrscheinlichkeit zweiter Art¶

Wir fassen das Experiment mit den Mutationen noch einmal zusammen:

2000 Individuen
Referenzwahrscheinlichkeit $p_0=0.004$
Signifikanzniveau $\alpha=0.05$
Nullhypothese $H_0=\{p \le p_0\}$
$c=13$
Die Nullhypothese wird abgelehnt bei 14 oder mehr Mutationen

Wie groß ist bei diesem Test die Fehlerwahrscheinlichkeit zweiter Art?

Das ist keine gute Frage
Wenn die Wahrscheinlichkeit einer Mutation nur um ein Winziges steigt, dann ist das praktisch nicht nachzuweisen
Sinnvoll ist folgende Frage

Angenommen, die Mutationswahrscheinlichkeit steigt von 0.4% auf 0.6%, mit welcher Wahrscheinlichkeit wird unser Test diese Änderung entdecken?

Wenn $q$ die Fehlerwahrscheinlichkeit zweiter Art ist, dann bezeichnet man $ 1 - q $ als Power des Tests
Die Power hängt also davon ab, welche Annahme man über den Abstand zwischen Nullhypothese und Alternative macht

Power des Tests¶

Wir wollen eine Erhöhung der Mutationsrate um 50%, also von $p_0=0.004$ auf $p=0.006$ entdecken
Was ist dann die Power des Tests?
Die Power ist die Wahrscheinlichtkeit für die richtige Entscheidung, wenn die Alternative tatsächlich zutrifft
$H_0$ wird abgelehnt bei mindestens 14 Erfolgen

In [14]:

Q = stats.binom(2000, 0.006)  #  W'keit unter der Alternative

Wenn 13 oder weniger Erfolge beobachtet werden, mache ich den Fehler zweiter Art
Also ist die Fehlerwahrscheinlichkeit zweiter Art gleich

In [15]:

Q.cdf(13)

Out[15]:

0.6818540941767756

und die Power ist gleich

In [16]:

1 - Q.cdf(13)

Out[16]:

0.31814590582322444

Poweranalyse¶

Vor der Durchführung eines Experiments sollte man sich überzeugen, dass der Test ausreichende Power hat. Es besteht sonst die Gefahr, dass die Alternative nicht nachgewiesen werden kann, obwohl sie zutrifft

Ein Test kann nie die Nullhypothese zeigen. Wenn die Power groß ist, dann ist die Beibehaltung der Nullhypothese aber ein Indiz ihrer Korrektheit