Mathematik für Biologiestudierende II¶
Sommersemester 2025
08.04.2025
© 2025 Prof. Dr. Rüdiger W. Braun
import numpy as np
np.set_printoptions(legacy='1.21')
from scipy import stats
import pandas as pd
import seaborn as sns
sns.set_theme()
Themen¶
- Diversitätsindex nach Simpson
- Data Snooping
- Multiples Testen
Diversitätsindex nach Simpson¶
Wahrscheinlichkeit¶
- Wahrscheinlichkeitsverteilungen sind Modellannahmen
- Beispielsweise wollen wir in der Statistik die Wahrscheinlichkeit einer falschen Antwort minimieren
Diversitätsindex¶
Beispiel: Wir haben zwei Bienenpopulationen aus je 1000 Individuen
- Population 1 umfasst 900 Honigbienen, 80 rote Mauerbienen und 20 Löcherbienen
- Population 2 umfasst 600 rote und 400 gehörnte Mauerbienen
Welche von beiden Artengemeinschaften hat die größere Artenvielfalt?
Der Diversitätsindex nach Simpson ist die Wahrscheinlichkeit, dass zwei aus einer Artengemeinschaft zufällig ausgewählte Individuen derselben Art angehören.
Je kleiner er ist, umso größer ist die Diversität.
- Es gibt auch noch andere Definitionen des Diversitätsindex. Wir verwenden immer die von Simpson.
Beispiel Population 1¶
Es gibt
gesamt = 1000 * 999
gesamt
999000
Paare verschiedener Bienen
Es gibt
honig = 900*899
honig
809100
Paare von Honigbienen
Es gibt
mauer = 80*79
mauer
6320
Paare von Mauerbienen
Es gibt
loecher = 20*19
loecher
380
Paare von Löcherbienen
Das bedeutet, dass es
paare_gleich_pop1 = honig + mauer + loecher
paare_gleich_pop1
815800
Paare gibt, bei denen beide Bienen der selben Art angehören
Der Diversitätsindex ist
d1 = paare_gleich_pop1 / gesamt
d1
0.8166166166166167
Jetzt dasselbe für die andere Population¶
Es gibt
rot = 600*599
rot
359400
Paare von roten Mauerbienen
Es gibt
gehoernt = 400*399
gehoernt
159600
Paare von gehörnten Mauerbienen
Also gibt es
paare_gleich_pop2 = rot + gehoernt
paare_gleich_pop2
519000
Paare, bei denen beide Bienen der selben Art angehören
Der Diversitätsindex der zweiten Population beträgt
d2 = paare_gleich_pop2 / gesamt
d2
0.5195195195195195
Nach Simpson ist die zweite Artengemeinschaft diverser als die erste.
Data Snooping¶
Wir kommen zurück zur schließenden Statistik
- "Snooping" = "Schnüffeln"
- Data Snooping bedeutet, dass man den Test für dieselben Daten rechnet, die man auch für die Formulierung der Hypothese benutzt hat
- Jemand stellt fest, dass in einer Stadt von 50 Neugeborenen 35 weiblich sind.
- Wir machen den entsprechenden Binomialtest
stats.binomtest?
stats.binomtest(35, 50)
BinomTestResult(k=35, n=50, alternative='two-sided', statistic=0.7, pvalue=0.006600447966810918)
- Die Nullhypothese, dass die Wahrscheinlichkeiten von Jungs- und Mädchengeburten gleich sind, kann abgelehnt werden. Der $p$-Wert beträgt $0.0066$
- Was bedeutet das?
Szenario 1¶
- Theorie: Bekanntlich werden die Babies von den Weißstörchen gebracht. Eine neue Theorie besagt, dass Schwarzstörche das zwar auch tun, aber nicht im korrekten Geschlechterverhältnis.
- Vorgehen: Die Forscher wählen daher einen Ort mit einer großen Population an Schwarzstörchen aus und untersuchen dort das Verhältnis von Mädchen- zu Jungsgeburten.
- Bewertung: Wenn dort das Zahlenverhältnis 35:15 beträgt, ist die Theorie zum Signifikanzniveau $p = 0.0066$ bestätigt.
Szenario 2¶
- Theorie: Keine. Man will bloss mal gucken.
- Vorgehen: In 100 Gemeinden mit mehr als 50 Geburten wird das Verhältnis zwischen Mädchen- und Jungsgeburten untersucht. Tatsächlich findet sich eine Gemeinde mit dem Zahlenverhältnis 35:15
- Bewertung: Das ist Data Snooping, weil die Hypothese aus denselben Daten generiert worden ist, mit denen anschließend der Test gerechnet wird.
Warum ist Data Snooping schlecht?¶
- Wir haben ein Experiment, welches nur mit einer Wahrscheinlichkeit $ p = 0.0066 $ gelingt.
- Wir wiederholen dieses Experiment 100 mal.
Mit welcher Wahrscheinlichkeit gelingt das Experiment in mindestens einem dieser Fälle?
Das ist eine Wiederholung eines ja/nein-Experiments mit folgenden Daten
- Erfolgswahrscheinlichkeit im Einzelfall $p=0.0066$
- Stichpropenumfang $n=100$
Zugehörige Binomialverteilung
P = stats.binom(100, 0.0066)
Wahrscheinlichkeit, dass es keinen einzigen Erfolg gibt
p0 = P.pmf(0)
p0
0.5157218904013275
Wahrscheinlichkeit, dass es mindestens einen Erfolg gibt
1 - p0
0.48427810959867246
Fazit¶
Wenn ein Test, der nur mit Wahrscheinlichkeit 0.0066 ein überraschendes Ergebnis bringt, 100 mal wiederholt wird, dann ist die Wahrscheinlichkeit mindestens eines überraschendenen Ergebnisses fast gleich 50%
Multiple Vergleiche¶
Möglichkeiten für korrektes Vorgehen
- Versuchsplanung
- Pilotversuch
- statistische Verfahren
- Bonferroni-Korrektur
- Bonferroni-Holm-Korrektur
- False Discovery Rate
Bonferroni-Korrektur¶
- Wenn man simultan $n$ Vergleiche durchführt, dann schreibt die Bonferroni-Korrektur vor, dass man jeden einzelnen Vergleich zum Signifikanzniveau $\frac\alpha n$ durchführt, um insgesamt das Signifikanzniveau $\alpha$ zu erreichen
- Im Beispiel der Schwarzstörche hätte für jeden Einzeltest das Signifikanzniveau $\frac{0.05}{100} = 0.0005$ gewählt werden müssen
Bonferroni-Holm-Korrektur¶
erkläre ich, nachdem ich die Bonferroni-Korrektur für die ANOVA vorgemacht habe
False Discovery Rate¶
- Beispiel Bilddaten: 20 Magnetresonanztomographie-Aufnahmen (MRT) von gesunden Gehirnen und 20 MRT-Aufnahmen von erkrankten Gehirnen, wobei die Gehirne auf einen Standardatlas normalisiert werden
- In dem Standardatlas werden alle Voxel (3D-Pixel) markiert, bei denen der Eisengehalt der Gruppe der Erkrankten signifikant über dem der Gruppe der Gesunden liegt
- Wenn der Bildausschnit $100 mm \times 100mm \times 100mm$ beträgt und die Auflösung des MRT bei 1.5mm liegt, dann haben wir
100/1.5
66.66666666666667
Voxel für eine Seitenlänge, also insgesamt
66 * 66 * 66
287496
d.h. knapp 290000 Voxel. Damit ist eine Bonferroni-Korrektur undenkbar.
- Alternative: False Discovery Rate
- FDR von 1% sagt: im Schnitt sind nur 1% aller markierten Voxel falsch
- Zum Vergleich: Ein multipler Test zum Signifikanzniveau 5% sagt: Die Wahrscheinlichkeit, dass auch nur ein einziges Voxel zu Unrecht markiert ist, beträgt höchstens 5%
Gruppenvergleiche¶
- An fünf verschiedenen Messstellen wurde die Konzentration eines Schadstoffs gemessen
- Hat die Messstelle einen Einfluss auf die Konzentration?
- Wir könnten die Konzentrationen an je zwei Messstellen vergleichen
- Das sind $\begin{pmatrix} 5 \\ 2 \end{pmatrix} = 10$ Vergleiche
- Wir müssen dann entsprechend Bonferroni korrigieren
- nicht optimal
- Solche Gruppenvergleichesind das Einsatzgebiet der ANOVA
- ANOVA = Analysis of Variance