_Statistik
TH Deggendorf
28.02.2024
Verfahren für Häufigkeitsdaten (meist auf nominalem Skalenniveau)
Forschungshypothese H1: Die beiden Variablen sind abhängig (= nicht unabhängig).
Teststatistik:
mit
n\(_{ij}\): Tatsächliche Anzahl Fälle in Kategorie ij
E\(_{ij}\): Erwartete Fälle in Kategorie ij
\(k, m\): Anzahl Zeilen bzw. Spalten
n: Gesamte Anzahl
Berechnung der Erwartungen E\(_{ij}\)
mit
n\(_{•j}\): Summe Anzahl über alle Zeilen
n\(_{i•}\): Summe Anzahl über alle Spalten
\(\chi²\)-Verteilung
Beispiel Kreuztabelle
NR | R | ||
---|---|---|---|
w | 90 | 10 | 100 |
m | 80 | 20 | 100 |
170 | 30 | 200 |
Freiheitsgrade: \(\textit{df} = (m - 1)(k - 1)\)
Vierfeldertest: \(\textit{df} = (2-1)(2-1) = 1\)
Entscheidung:
Effektstärke: Cramer’s V
\(V = \sqrt{\frac{\chi²}{n(k - 1)}}\),
mit k = min(Kategorienzahl)
\(\chi²\)-Verteilung
df | Kritische_Werte |
---|---|
1 | 3.841459 |
2 | 5.991465 |
3 | 7.814728 |
4 | 9.487729 |
5 | 11.070498 |
6 | 12.591587 |
7 | 14.067140 |
8 | 15.507313 |
9 | 16.918978 |
10 | 18.307038 |
11 | 19.675138 |
12 | 21.026070 |
13 | 22.362033 |
14 | 23.684791 |
15 | 24.995790 |
16 | 26.296228 |
17 | 27.587112 |
18 | 28.869299 |
19 | 30.143527 |
20 | 31.410433 |
21 | 32.670573 |
22 | 33.924439 |
23 | 35.172462 |
24 | 36.415028 |
25 | 37.652484 |
26 | 38.885139 |
27 | 40.113272 |
28 | 41.337138 |
29 | 42.556968 |
30 | 43.772972 |
Pearson's Chi-squared test
data: vierfelder
X-squared = 2.6667, df = 1, p-value = 0.1025
Cramer V
0.1155