import numpy as np
np.set_printoptions(legacy='1.21')
import seaborn as sns
sns.set_theme()
sns.set_context('talk')
import pandas as pd
from scipy import stats

barsche = pd.read_csv('barsche.csv')
barsche.head()

ds = barsche[barsche.Art=='gestreift'].Länge
dl = barsche[barsche.Art=='gefleckt'].Länge
db = barsche[barsche.Art=='blau'].Länge
dr = barsche[barsche.Art=='braun'].Länge

stats.ttest_ind(db, dr, equal_var=False)

TtestResult(statistic=9.647287139857793, pvalue=1.2289650206522807e-13, df=57.645418945809595)

db.var()

0.21532008593268628

dr.var()

0.18400176708645483

stats.ttest_ind(db, dr)    #   t-Test

TtestResult(statistic=9.647287139857793, pvalue=1.154425306617111e-13, df=58.0)

stats.ttest_ind(db, dr, equal_var=False)    #  Welch-Test

TtestResult(statistic=9.647287139857793, pvalue=1.2289650206522807e-13, df=57.645418945809595)

from statsmodels.sandbox.stats.multicomp import MultiComparison

muc = MultiComparison(barsche.Länge, barsche.Art)

def quadrat(x):
    return x*x

quadrat(5)

25

def welch_test(a, b):
    return stats.ttest_ind(a, b, equal_var=False)

res = muc.allpairtest(welch_test)[0]
res

import statsmodels.api as sm
pp = sm.ProbPlot(db)
pp.qqplot();

libellen = pd.read_csv('libellen.csv')
libellen.head()

sns.boxplot(libellen, x="Art", y="Länge");

dg = libellen[libellen.Art=='graue'].Länge
du = libellen[libellen.Art=='grüne'].Länge
da = libellen[libellen.Art=='ägyptische'].Länge
dB = libellen[libellen.Art=='Bilker'].Länge

pp = sm.ProbPlot(dB)
pp.qqplot();

stats.kruskal(dg, du, da, dB)

KruskalResult(statistic=16.028153526970982, pvalue=0.0011190121329907562)

muc = MultiComparison(libellen.Länge, libellen.Art)

res = muc.allpairtest(stats.mannwhitneyu, method='holm')
res[0]

group1	group2	stat	pval	pval_corr	reject
Bilker	graue	2360.0	0.0033	0.0199	True
Bilker	grüne	2167.0	0.0544	0.1088	False
Bilker	ägyptische	2217.0	0.0288	0.0864	False
graue	grüne	1260.0	0.0046	0.0228	True
graue	ägyptische	1259.0	0.0046	0.0228	True
grüne	ägyptische	1561.0	0.2106	0.2106	False

Verteilungsannahmen	Test in `scipy.stats`	Post-hoc-Test	in `scipy.stats`
normalverteilt, homoskedastisch	`f_oneway`	unverbundener t-Test	`ttest_ind`
normalverteilt, heteroskedastisch	`alexandergovern`	Welch-Test	`ttest_ind` mit`equal_var=False`
nicht normalverteilt	`kruskal`	Mann-Whitney-Test	`mannwhitneyu`

Test	Art
t-Test	parametrisch
Welch-Test	parametrisch
Mann-Whitney-Test	nichtparametrisch
ANOVA	parametrisch
Alexander-Govern-Test	parametrisch
Kruskal-Wallis-Test	nichtparametrisch

Mathematik für Biologiestudierende¶

Wiederholung (interaktiv)¶

Themen heute¶

Posthoc-Analyse beim Alexander-Govern-Test¶

Der Welch-Test¶

Beispiel Barsche¶

Vergleich von t-Test und Welch-Test¶

Python-Funktionen¶

Post-hoc Analyse des Alexander-Govern-Tests¶

Normalverteilungsannahmen¶

Beispiel Libellen¶

Kruskal-Wallis-Test¶

Post-hoc Analyse¶

Gruppenvergleiche¶

	Art	Länge
0	gestreift	9.890006
1	gestreift	9.343944
2	gestreift	9.867069
3	gestreift	10.302781
4	gestreift	10.066964

group1	group2	stat	pval	pval_corr	reject
blau	braun	9.6473	0.0	0.0	True
blau	gefleckt	5.8735	0.0	0.0	True
blau	gestreift	18.752	0.0	0.0	True
braun	gefleckt	0.7068	0.484	1.0	False
braun	gestreift	8.4956	0.0	0.0	True
gefleckt	gestreift	3.3453	0.002	0.012	True

	Art	Länge
0	graue	4.908840
1	graue	5.016692
2	graue	4.382700
3	graue	4.847548
4	graue	5.523503