import numpy as np
import pandas as pd
from scipy import stats
import seaborn as sns
sns.set_theme()

small_dose = np.array([
    4.2, 11.5, 7.3, 5.8, 6.4, 10, 11.2, 11.2, 5.2, 7,
    15.2, 21.5, 17.6, 9.7, 14.5, 10, 8.2, 9.4, 16.5, 9.7
])

medium_dose = np.array([
    16.5, 16.5, 15.2, 17.3, 22.5, 17.3, 13.6, 14.5, 18.8, 15.5,
    19.7, 23.3, 23.6, 26.4, 20, 25.2, 25.8, 21.2, 14.5, 27.3
])

large_dose = np.array([
    23.6, 18.5, 33.9, 25.5, 26.4, 32.5, 26.7, 21.5, 23.3, 29.5,
    25.5, 26.4, 22.4, 24.5, 24.8, 30.9, 26.4, 27.3, 29.4, 23
])

stats.levene(small_dose, medium_dose, large_dose)

LeveneResult(statistic=0.6457341109631506, pvalue=0.5280694573759905)

stats.f_oneway(small_dose, medium_dose, large_dose)

F_onewayResult(statistic=67.41573785674247, pvalue=9.532727011699946e-16)

df = pd.read_csv('barsche.csv')
df.head()

sns.boxplot(data=df, x="Art", y="Länge");

ds = df[df.Art=='gestreift'].Länge
dl = df[df.Art=='gefleckt'].Länge
db = df[df.Art=='blau'].Länge
dr = df[df.Art=='braun'].Länge

stats.levene(ds, dl, dr, db)

LeveneResult(statistic=13.459492972830807, pvalue=1.3472893996510424e-07)

stats.alexandergovern(ds, dl, dr, db)

AlexanderGovernResult(statistic=113.40810114676775, pvalue=2.02668339537414e-24)

stats.alexandergovern(small_dose, medium_dose, large_dose)

AlexanderGovernResult(statistic=56.82538049315831, pvalue=4.57641509985116e-13)

stats.f_oneway(small_dose, medium_dose, large_dose)

F_onewayResult(statistic=67.41573785674247, pvalue=9.532727011699946e-16)

stats.ttest_ind(db, dr, equal_var=False)

TtestResult(statistic=9.647287139857793, pvalue=1.2289650206522807e-13, df=57.645418945809595)

# ganz kleines Programm

def welch(x, y):
    return stats.ttest_ind(x, y, equal_var=False)

from statsmodels.sandbox.stats.multicomp import MultiComparison

muc = MultiComparison(df.Länge, df.Art)

muc.allpairtest(welch, method='holm')[0]

import statsmodels.api as sm
pp = sm.ProbPlot(db)
pp.qqplot();

df = pd.read_csv('libellen.csv')
df.head()

df.Art.value_counts()

Art
graue         60
grüne         60
ägyptische    60
Bilker        60
Name: count, dtype: int64

dg = df[df.Art=='graue'].Länge
du = df[df.Art=='grüne'].Länge
da = df[df.Art=='ägyptische'].Länge
dB = df[df.Art=='Bilker'].Länge

pp = sm.ProbPlot(dB)
pp.qqplot();

stats.kruskal(dg, du, da, dB)

KruskalResult(statistic=16.028153526970982, pvalue=0.0011190121329907562)

muc = MultiComparison(df.Länge, df.Art)

muc.allpairtest(stats.mannwhitneyu, method='holm')[0]

sns.boxplot(data=df, x='Art', y='Länge');

group1	group2	stat	pval	pval_corr	reject
Bilker	graue	2360.0	0.0033	0.0199	True
Bilker	grüne	2167.0	0.0544	0.1088	False
Bilker	ägyptische	2217.0	0.0288	0.0864	False
graue	grüne	1260.0	0.0046	0.0228	True
graue	ägyptische	1259.0	0.0046	0.0228	True
grüne	ägyptische	1561.0	0.2106	0.2106	False

Mathematik für Biologiestudierende II¶

Heteroskedastizität¶

Der Levene-Test¶

Beispiel: Barsche¶

Probleme beim Test auf Heteroskedastizität¶

Alexander-Govern-Test¶

Post-hoc Analyse¶

Normalverteilungsannahmen¶

Kruskal-Wallis-Test¶

Post-hoc Analyse¶

	Art	Länge
0	gestreift	9.890006
1	gestreift	9.343944
2	gestreift	9.867069
3	gestreift	10.302781
4	gestreift	10.066964

group1	group2	stat	pval	pval_corr	reject
blau	braun	9.6473	0.0	0.0	True
blau	gefleckt	5.8735	0.0	0.0	True
blau	gestreift	18.752	0.0	0.0	True
braun	gefleckt	0.7068	0.484	0.484	False
braun	gestreift	8.4956	0.0	0.0	True
gefleckt	gestreift	3.3453	0.002	0.004	True

	Art	Länge
0	graue	4.908840
1	graue	5.016692
2	graue	4.382700
3	graue	4.847548
4	graue	5.523503