Mathematik für Biologiestudierende¶

Wintersemester 2025/26

19.11.2025

© 2025 Prof. Dr. Rüdiger W. Braun

Wiederholung (interaktiv)¶

Gehen Sie auf die Website

  • https://pingo.coactum.de

und geben Sie folgende Zugangsnummer ein

  • 670719

oder scannen Sie den QR-Code

QR-Code

Themen heute¶

  • Kochrezepte für Binomialtests
  • Der p-Wert
  • Power eines Tests
In [1]:
import numpy as np
np.set_printoptions(legacy='1.21')
import seaborn as sns
sns.set_theme()
sns.set_context('talk')
import pandas as pd
from scipy import stats  # <--------------  neu hinzugekommen

Fehler erster und zweiter Art¶

  • Der Fehler 1. Art ist die fälschliche Ablehnung der Nullhypothese.
  • Der Fehler 2. Art ist die fälschliche Beibehaltung der Nullhypothese

Die Priorität liegt auf der Vermeidung des Fehlers 1. Art. Diese Asymmetrie ist ein entscheidendes Merkmal der Testtheorie.

$H_0$ wird beibehalten $H_0$ wird abgelehnt
$H_0$ trifft zu richtige Entscheidung Fehler 1. Art
$H_1$ trifft zu Fehler 2. Art richtige Entscheidung
  • Fehlerwahrscheinlichkeit 1. Art soll kleiner sein als das Signifikanzniveau $\alpha$
  • Die Komplementärwhrscheinlichkeit der Fehlerwahrscheinlichkeit 2. Art ist die Power

Kochrezepte für Binomialtests¶

Ein- und zweiseitige Tests¶

  • Ein ja/nein-Experiment mit unbekannter Erfolgswahrscheinlichkeit $p$ wird $n$-mal wiederholt
  • Ziel: Aussage über $p$ relativ zu einem Referenzwert $p_0$
  • verschiedene Nullhypothesen sind denkbar
    • $H_0 : p \ge p_0$: einseitiger unterer Test
    • $H_0 : p \le p_0$: einseitiger oberer Test
    • $H_0 : p = p_0$: zweiseitiger Test
  • Die Nullhypothese $H_0 \colon p \ne p_0$ macht keinen Sinn

Einseitiger unterer Binomialtest zum Niveau $\alpha$¶

  • Gegeben sind unabhängige $B(1, p)$-verteilte Zufallsvariable $X_1, \dots, X_n$ mit unbekanntem $p$ sowie ein Signifikanzniveau $\alpha$
  • Verglichen werden soll mit einem Referenzwert $p_0$
  • Getestet wird die Nullhypothese $H_0 = \{p \ge p_0\}$ gegen die Alternative $H_1 = \{p < p_0\}$
  • P ist die Binomialverteilung $B_{n,p_0}$
  • Der Wert $c$ ist so zu wählen, dass P.cdf(c-1)$\le\alpha$ und P.cdf(c)$>\alpha$
  • $c$ heißt kritischer Wert

Entscheidungsregel:¶

  • Die Nullhypothese wird abgelehnt, falls die Anzahl der Erfolge echt kleiner als $c$ ist
  • Die Nullhypothese wird beibehalten, falls die Anzahl der Erfolge mindestens $c$ ist

Beispiel zum unteren Binomialtest¶

  • 20% der Fahrradfahrerinnen und Fahrradfahrer haben eine defekte Lichtanlage
  • Die Polizei startet eine Aufklärungskampagne
  • Nach Ablauf der Kampagne werden 100 Fahrräder kontrolliert, um die folgende Frage zum Signifikanzniveau $\alpha=0.02$ zu beantworten

Ist der Anteil der Fahrräder mit defekter Lichtanlage gefallen

  • Referenzwahrscheinlichkeit $p_0 = 0.2$
  • Nullhypothese $H_0 = \{p \ge p_0\}$
  • Binomialverteilung
In [2]:
P = stats.binom(100, 0.2)
  • kritischer Wert $c$ bestimmt durch P.cdf(c-1) ≤ 0.02 und P.cdf(c) > 0.02
In [3]:
c = P.ppf(0.02)
c
Out[3]:
12.0

Probe:

In [4]:
P.cdf(11)
Out[4]:
0.012574876348121796
In [5]:
P.cdf(12)
Out[5]:
0.02532875322139711

Wenn 11 oder weniger Fahrräder eine defekte Lichtanlage haben, dann ist der Nachweis der Wirksamkeit der Aktion zum Signifikanzniveau $\alpha=0.02$ gelungen

Einseitiger oberer Binomialtest zum Niveau $\alpha$¶

  • Gegeben sind unabhängige $B(1, p)$-verteilte Zufallsvariable $X_1, \dots, X_n$ mit unbekanntem $p$ sowie ein Signifikanzniveau $\alpha$
  • Verglichen werden soll mit einem Referenzwert $p_0$
  • Getestet wird die Nullhypothese $H_0 = \{p \le p_0\}$ gegen die Alternative $H_1 = \{p > p_0\}$
  • P ist die Binomialverteilung $B_{n,p_0}$
  • Der kritische Wert $c$ ist so zu wählen, dass P.cdf(c-1)$<1-\alpha$ und P.cdf(c)$\ge1-\alpha$

Entscheidungsregel:¶

  • Die Nullhypothese wird abgelehnt, falls die Anzahl der Erfolge echt größer als $c$ ist
  • Die Nullhypothese wird beibehalten, falls die Anzahl der Erfolge höchstens $c$ ist

Beispiel: Mutationen¶

  • In einer Population weist normalerweise jedes 250te Individuum eine gewisse Mutation auf.
  • Bei einer Untersuchung von 2000 Individuen werden nun aber sogar 12 Träger der Mutation gefunden,
  • $2000/250=8$, man hätte also 8 Träger von Mutationen erwartet

Zwei Interpretationen sind denkbar

  • Eine Steigerung der Mutationshäufigkeit um 50% wurde entdeckt
  • Unter 2000 Individuen wurden gerade mal vier Ausreißer entdeckt

Statistics to the rescue!¶

  • Bevor wir diese Entdeckung an die Presse geben, wollen wir sicher sein, dass die Mutationsrate tatsächlich gestiegen ist
  • Sicherheit ist relativ. Mit einem Irrtumsrisiko von 5% können wir leben

Binomialtest für das Beispiel¶

  • Wir machen einen Binomialtest. Die Referenzwahrscheinlichkeit ist $p_0 = 0.004$
  • Die Nullhypothese ist $H_0 = \{ p \le p_0 \}$
    • Es handelt sich um einen einseitigen, oberen Binomialtest
    • Das Signifikanzniveau beträgt $\alpha = 0.05$
  • Der kritische Wert $c$ ist so zu wählen, dass P.cdf(c-1)$<1-\alpha$ und P.cdf(c)$\ge1-\alpha$
  • Entscheidungsregel:
    • Die Nullhypothese wird abgelehnt, falls die Anzahl der Erfolge echt größer als $c$ ist
    • Die Nullhypothese wird beibehalten, falls die Anzahl der Erfolge höchstens $c$ ist
In [6]:
P = stats.binom(2000, 0.004)
alpha = 0.05
In [7]:
c = P.ppf(1-alpha)
c
Out[7]:
13.0

Probe:

In [8]:
P.cdf(c-1)   #  muss kleiner als 0.95 sein
Out[8]:
0.9365883630330971
In [9]:
P.cdf(c)   #  muss größer als 0.95 sein
Out[9]:
0.9661155504516327

Mutation: Entscheidung¶

  • Die Rechnung ergibt $c = 13$
  • Bei bis zu 13 Erfolgen (einschließlich) wird die Nullhypothese beibehalten
  • Wir haben nur 12 Mutationen beobachtet: Nullhypothese wir beibehalten
  • Keine signifikante Erhöhung beobachtet

Maschinelle Auswertung und der p-Wert¶

Der p-Wert¶

  • Der $p$-Wert ist das kleinste Signifikanzniveau, zu dem die Daten den Test noch bestehen würden.
  • Der $p$-Wert beantwortet die Frage

Wie knapp wurde das vorgeschriebene Signifikanzniveau eingehalten bzw. verfehlt?

  • Wenn $\alpha$ das Signifikanzniveau ist
    • $p \le \alpha$: Nullhypothese wird abgelehnt
    • $p > \alpha$: Nullhypothese wird beibehalten

Software gibt immer den $p$-Wert aus

In [10]:
res = stats.binomtest(12, 2000, 0.004, alternative="greater")
res
Out[10]:
BinomTestResult(k=12, n=2000, alternative='greater', statistic=0.006, pvalue=0.1114898591368222)
In [11]:
res.pvalue
Out[11]:
0.1114898591368222
In [12]:
res.statistic
Out[12]:
0.006
In [13]:
res.statistic == 12/2000
Out[13]:
True

Der Begriff der Teststatistik spielt erst bei den später zu besprechenden Tests eine Rolle

stats.binomtest(k, n, p0, alternative)

  • k ist die beobachtete Anzahl
  • n ist der Stichprobenumfang
  • p0 ist die Referenzwahrscheinlichkeit
  • alternative legt fest, ob ein oberer, unterer oder zweiseitiger Test gerechnet wird
    • alternative="greater" bedeutet: oberer Test
    • alternative="less" bedeutet: unterer Test
    • alternative="two-sided" bedeutet: zweiseitiger Test
    • keine Angabe: zweiseitiger Test

Alternative¶

  • alternative="greater" heißt: wir behaupten, dass die tatsächliche Erfolgswahrscheinlichkeit größer als die Referenzwahrscheinlichkeit ist

Power und Fehlerwahrscheinlichkeit zweiter Art¶

Wir fassen das Experiment mit den Mutationen noch einmal zusammen:

  • 2000 Individuen
  • Referenzwahrscheinlichkeit $p_0=0.004$
  • Signifikanzniveau $\alpha=0.05$
  • Nullhypothese $H_0=\{p \le p_0\}$
  • $c=13$
  • Die Nullhypothese wird abgelehnt bei 14 oder mehr Mutationen
  • Wie groß ist bei diesem Test die Fehlerwahrscheinlichkeit zweiter Art?
  • Das ist keine gute Frage
  • Wenn die Wahrscheinlichkeit einer Mutation nur um ein Winziges steigt, dann ist das praktisch nicht nachzuweisen
  • Sinnvoll ist folgende Frage

Angenommen, die Mutationswahrscheinlichkeit steigt von 0.4% auf 0.6%, mit welcher Wahrscheinlichkeit wird unser Test diese Änderung entdecken?

  • Wenn $q$ die Fehlerwahrscheinlichkeit zweiter Art ist, dann bezeichnet man $ 1 - q $ als Power des Tests
  • Die Power hängt also davon ab, welche Annahme man über den Abstand zwischen Nullhypothese und Alternative macht

Power des Tests¶

  • Wir wollen eine Erhöhung der Mutationsrate um 50%, also von $p_0=0.004$ auf $p=0.006$ entdecken

  • Was ist dann die Power des Tests?

  • Die Power ist die Wahrscheinlichtkeit für die richtige Entscheidung, wenn die Alternative tatsächlich zutrifft

  • $H_0$ wird abgelehnt bei mindestens 14 Erfolgen

In [14]:
Q = stats.binom(2000, 0.006)  #  W'keit unter der Alternative
  • Wenn 13 oder weniger Erfolge beobachtet werden, mache ich den Fehler zweiter Art
  • Also ist die Fehlerwahrscheinlichkeit zweiter Art gleich
In [15]:
Q.cdf(13)
Out[15]:
0.6818540941767756

und die Power ist gleich

In [16]:
1 - Q.cdf(13)
Out[16]:
0.31814590582322444

Poweranalyse¶

  • Vor der Durchführung eines Experiments sollte man sich überzeugen, dass der Test ausreichende Power hat. Es besteht sonst die Gefahr, dass die Alternative nicht nachgewiesen werden kann, obwohl sie zutrifft
  • Ein Test kann nie die Nullhypothese zeigen. Wenn die Power groß ist, dann ist die Beibehaltung der Nullhypothese aber ein Indiz ihrer Korrektheit