Mathematik für Biologiestudierende II¶

Sommersemester 2025

08.04.2025

© 2025 Prof. Dr. Rüdiger W. Braun

In [1]:
import numpy as np
np.set_printoptions(legacy='1.21')
from scipy import stats
import pandas as pd
import seaborn as sns
sns.set_theme()

Themen¶

  • Diversitätsindex nach Simpson
  • Data Snooping
  • Multiples Testen

Diversitätsindex nach Simpson¶

Wahrscheinlichkeit¶

  • Wahrscheinlichkeitsverteilungen sind Modellannahmen
  • Beispielsweise wollen wir in der Statistik die Wahrscheinlichkeit einer falschen Antwort minimieren

Diversitätsindex¶

Beispiel: Wir haben zwei Bienenpopulationen aus je 1000 Individuen

  • Population 1 umfasst 900 Honigbienen, 80 rote Mauerbienen und 20 Löcherbienen
  • Population 2 umfasst 600 rote und 400 gehörnte Mauerbienen

Welche von beiden Artengemeinschaften hat die größere Artenvielfalt?

  • Der Diversitätsindex nach Simpson ist die Wahrscheinlichkeit, dass zwei aus einer Artengemeinschaft zufällig ausgewählte Individuen derselben Art angehören.

  • Je kleiner er ist, umso größer ist die Diversität.

  • Es gibt auch noch andere Definitionen des Diversitätsindex. Wir verwenden immer die von Simpson.

Beispiel Population 1¶

Es gibt

In [2]:
gesamt = 1000 * 999
gesamt
Out[2]:
999000

Paare verschiedener Bienen

Es gibt

In [3]:
honig = 900*899
honig
Out[3]:
809100

Paare von Honigbienen

Es gibt

In [4]:
mauer = 80*79
mauer
Out[4]:
6320

Paare von Mauerbienen

Es gibt

In [5]:
loecher = 20*19
loecher
Out[5]:
380

Paare von Löcherbienen

Das bedeutet, dass es

In [6]:
paare_gleich_pop1 = honig + mauer + loecher
paare_gleich_pop1
Out[6]:
815800

Paare gibt, bei denen beide Bienen der selben Art angehören

Der Diversitätsindex ist

In [7]:
d1 = paare_gleich_pop1 / gesamt
d1
Out[7]:
0.8166166166166167

Jetzt dasselbe für die andere Population¶

Es gibt

In [8]:
rot = 600*599
rot
Out[8]:
359400

Paare von roten Mauerbienen

Es gibt

In [9]:
gehoernt = 400*399
gehoernt
Out[9]:
159600

Paare von gehörnten Mauerbienen

Also gibt es

In [10]:
paare_gleich_pop2 = rot + gehoernt
paare_gleich_pop2
Out[10]:
519000

Paare, bei denen beide Bienen der selben Art angehören

Der Diversitätsindex der zweiten Population beträgt

In [11]:
d2 = paare_gleich_pop2 / gesamt
d2
Out[11]:
0.5195195195195195

Nach Simpson ist die zweite Artengemeinschaft diverser als die erste.

Data Snooping¶

Wir kommen zurück zur schließenden Statistik

  • "Snooping" = "Schnüffeln"
  • Data Snooping bedeutet, dass man den Test für dieselben Daten rechnet, die man auch für die Formulierung der Hypothese benutzt hat
  • Jemand stellt fest, dass in einer Stadt von 50 Neugeborenen 35 weiblich sind.
  • Wir machen den entsprechenden Binomialtest
In [12]:
stats.binomtest?
In [13]:
stats.binomtest(35, 50)
Out[13]:
BinomTestResult(k=35, n=50, alternative='two-sided', statistic=0.7, pvalue=0.006600447966810918)
  • Die Nullhypothese, dass die Wahrscheinlichkeiten von Jungs- und Mädchengeburten gleich sind, kann abgelehnt werden. Der $p$-Wert beträgt $0.0066$
  • Was bedeutet das?

Szenario 1¶

  • Theorie: Bekanntlich werden die Babies von den Weißstörchen gebracht. Eine neue Theorie besagt, dass Schwarzstörche das zwar auch tun, aber nicht im korrekten Geschlechterverhältnis.
  • Vorgehen: Die Forscher wählen daher einen Ort mit einer großen Population an Schwarzstörchen aus und untersuchen dort das Verhältnis von Mädchen- zu Jungsgeburten.
  • Bewertung: Wenn dort das Zahlenverhältnis 35:15 beträgt, ist die Theorie zum Signifikanzniveau $p = 0.0066$ bestätigt.

Szenario 2¶

  • Theorie: Keine. Man will bloss mal gucken.
  • Vorgehen: In 100 Gemeinden mit mehr als 50 Geburten wird das Verhältnis zwischen Mädchen- und Jungsgeburten untersucht. Tatsächlich findet sich eine Gemeinde mit dem Zahlenverhältnis 35:15
  • Bewertung: Das ist Data Snooping, weil die Hypothese aus denselben Daten generiert worden ist, mit denen anschließend der Test gerechnet wird.

Warum ist Data Snooping schlecht?¶

  • Wir haben ein Experiment, welches nur mit einer Wahrscheinlichkeit $ p = 0.0066 $ gelingt.
  • Wir wiederholen dieses Experiment 100 mal.

Mit welcher Wahrscheinlichkeit gelingt das Experiment in mindestens einem dieser Fälle?

Das ist eine Wiederholung eines ja/nein-Experiments mit folgenden Daten

  • Erfolgswahrscheinlichkeit im Einzelfall $p=0.0066$
  • Stichpropenumfang $n=100$

Zugehörige Binomialverteilung

In [14]:
P = stats.binom(100, 0.0066)

Wahrscheinlichkeit, dass es keinen einzigen Erfolg gibt

In [15]:
p0 = P.pmf(0)
p0
Out[15]:
0.5157218904013275

Wahrscheinlichkeit, dass es mindestens einen Erfolg gibt

In [16]:
1 - p0
Out[16]:
0.48427810959867246

Fazit¶

Wenn ein Test, der nur mit Wahrscheinlichkeit 0.0066 ein überraschendes Ergebnis bringt, 100 mal wiederholt wird, dann ist die Wahrscheinlichkeit mindestens eines überraschendenen Ergebnisses fast gleich 50%

Multiple Vergleiche¶

Möglichkeiten für korrektes Vorgehen

  • Versuchsplanung
    • Pilotversuch
  • statistische Verfahren
    • Bonferroni-Korrektur
    • Bonferroni-Holm-Korrektur
    • False Discovery Rate

Bonferroni-Korrektur¶

  • Wenn man simultan $n$ Vergleiche durchführt, dann schreibt die Bonferroni-Korrektur vor, dass man jeden einzelnen Vergleich zum Signifikanzniveau $\frac\alpha n$ durchführt, um insgesamt das Signifikanzniveau $\alpha$ zu erreichen
  • Im Beispiel der Schwarzstörche hätte für jeden Einzeltest das Signifikanzniveau $\frac{0.05}{100} = 0.0005$ gewählt werden müssen

Bonferroni-Holm-Korrektur¶

erkläre ich, nachdem ich die Bonferroni-Korrektur für die ANOVA vorgemacht habe

False Discovery Rate¶

  • Beispiel Bilddaten: 20 Magnetresonanztomographie-Aufnahmen (MRT) von gesunden Gehirnen und 20 MRT-Aufnahmen von erkrankten Gehirnen, wobei die Gehirne auf einen Standardatlas normalisiert werden
  • In dem Standardatlas werden alle Voxel (3D-Pixel) markiert, bei denen der Eisengehalt der Gruppe der Erkrankten signifikant über dem der Gruppe der Gesunden liegt
  • Wenn der Bildausschnit $100 mm \times 100mm \times 100mm$ beträgt und die Auflösung des MRT bei 1.5mm liegt, dann haben wir
In [17]:
100/1.5
Out[17]:
66.66666666666667

Voxel für eine Seitenlänge, also insgesamt

In [18]:
66 * 66 * 66
Out[18]:
287496

d.h. knapp 290000 Voxel. Damit ist eine Bonferroni-Korrektur undenkbar.

  • Alternative: False Discovery Rate
  • FDR von 1% sagt: im Schnitt sind nur 1% aller markierten Voxel falsch
  • Zum Vergleich: Ein multipler Test zum Signifikanzniveau 5% sagt: Die Wahrscheinlichkeit, dass auch nur ein einziges Voxel zu Unrecht markiert ist, beträgt höchstens 5%

Gruppenvergleiche¶

  • An fünf verschiedenen Messstellen wurde die Konzentration eines Schadstoffs gemessen
  • Hat die Messstelle einen Einfluss auf die Konzentration?
  • Wir könnten die Konzentrationen an je zwei Messstellen vergleichen
  • Das sind $\begin{pmatrix} 5 \\ 2 \end{pmatrix} = 10$ Vergleiche
  • Wir müssen dann entsprechend Bonferroni korrigieren
  • nicht optimal
  • Solche Gruppenvergleichesind das Einsatzgebiet der ANOVA
  • ANOVA = Analysis of Variance