import numpy as np
np.set_printoptions(legacy='1.21')
import pandas as pd
from scipy import stats
import seaborn as sns
sns.set_theme()

P = stats.binom(22, 0.34)

P.pmf(7)

0.17593323858999418

from scipy import special
special.binom(22, 7) * 0.34**7 * (1-0.34)**15

0.17593323858999396

0.17593323858999418 / 0.17593323858999396

1.0000000000000013

P.cdf(7)

0.5133586582890823

P.pmf(0) + P.pmf(1) + P.pmf(2) + P.pmf(3) + P.pmf(4) + P.pmf(5) + P.pmf(6) + P.pmf(7)

0.513358658289081

P = stats.norm(22.4, 7.2)

P.cdf(22.9)

0.5276820736327322

u_schad = "https://www.math.uni-duesseldorf.de/~braun/bio2324/data/schadstoffe.csv"
df = pd.read_csv(u_schad, index_col=0)
df.head()

g1 = df[df.Messstelle==1].Konzentration
g2 = df[df.Messstelle==2].Konzentration
g3 = df[df.Messstelle==3].Konzentration
g4 = df[df.Messstelle==4].Konzentration
g5 = df[df.Messstelle==5].Konzentration

df.Konzentration.std()

0.00034083567416156316

g1.std()

0.0003088278193577403

g2.std()

0.0004360906113112883

g3.std()

0.00033459177573784817

g4.std()

0.00032047637643428304

g5.std()

0.0003095504974203532

sns.scatterplot(df, y='Konzentration', x='Messstelle', hue='Messstelle', legend=False);

df = sns.load_dataset("penguins")

gA = df[df.species=='Adelie'].bill_length_mm.dropna()
gG = df[df.species=='Gentoo'].bill_length_mm.dropna()
gC = df[df.species=='Chinstrap'].bill_length_mm.dropna()

df.bill_length_mm.std()

5.4595837139265315

gA.std()

2.663404848368619

gG.std()

3.081857372114287

gC.std()

3.3392558959358865

sns.scatterplot(df, y='bill_length_mm', x='species', hue='species', legend=False);

dfa = pd.DataFrame()
dfb = pd.DataFrame()
dfc = pd.DataFrame()

dfa['A'] = [42, 115, 73, 58, 64, 100, 112, 112, 52, 70,
    152, 215, 176, 97, 145, 100, 82, 94, 165, 97]

dfb['B'] = [165, 165, 152, 173, 225, 173, 136, 145, 188, 155,
    197, 233, 236, 264, 200, 252, 258, 212, 145, 273]

dfc['C'] = [236, 185, 339, 255, 264, 325, 267, 215, 233, 295,
    255, 264, 224, 245, 248, 309, 264, 273, 294, 230]

stats.levene(dfa.A, dfb.B, dfc.C)

LeveneResult(statistic=0.6457341109631508, pvalue=0.5280694573759905)

stats.f_oneway(dfa.A, dfb.B, dfc.C)

F_onewayResult(statistic=67.41573785674242, pvalue=9.532727011700098e-16)

df = pd.read_csv('barsche.csv')
df.head()

sns.boxplot(data=df, x="Art", y="Länge");

ds = df[df.Art=='gestreift'].Länge
dl = df[df.Art=='gefleckt'].Länge
db = df[df.Art=='blau'].Länge
dr = df[df.Art=='braun'].Länge

stats.levene(ds, dl, dr, db)

LeveneResult(statistic=13.459492972830807, pvalue=1.3472893996510424e-07)

stats.alexandergovern(ds, dl, dr, db)

AlexanderGovernResult(statistic=113.40810114676775, pvalue=2.02668339537414e-24)

stats.alexandergovern(dfa.A, dfb.B, dfc.C)

AlexanderGovernResult(statistic=56.825380493158306, pvalue=4.576415099851176e-13)

stats.f_oneway(dfa.A, dfb.B, dfc.C)

F_onewayResult(statistic=67.41573785674242, pvalue=9.532727011700098e-16)

	Messstelle	Konzentration
0	5	0.000867
1	3	0.000490
2	1	0.000589
3	1	0.000950
4	4	0.001152

Mathematik für Biologiestudierende II¶

Themen¶

Wiederholung: Verteilung und Verteilungsfunktion¶

diskrete Verteilungen¶

kontinuierliche Verteilungen¶

Was hat ANOVA mit Varianzen bzw. Stichprobenstreuungen zu tun?¶

Heteroskedastizität¶

Der Levene-Test¶

Beispiel: Barsche¶

Probleme beim Test auf Heteroskedastizität¶

Alexander-Govern-Test¶

	Art	Länge
0	gestreift	9.890006
1	gestreift	9.343944
2	gestreift	9.867069
3	gestreift	10.302781
4	gestreift	10.066964