Aufgaben zum Thema Konfidenzintervalle

Author

Prof. Dr. Armin Eichinger

Aufgabe 1

Kontext

Ein großer Online-Händler möchte die durchschnittliche Zufriedenheit seiner Kundschaft messen. Dafür wird ein Zufriedenheits-Score (Skala 1–10) herangezogen.

Angenommen, wir haben folgende Daten einer Umfrage (n = 50), in der Teilnehmende zufällig ausgewählt wurden. Die folgende Liste zeigt den Zufriedenheits-Score der 50 Befragten.

# Beispielhafte Zufriedenheits-Scores (n=50)
zufriedenheit <- c(
  7.0, 6.5, 8.2, 5.9, 6.8, 7.1, 7.8, 6.4, 7.3, 7.0,
  6.8, 7.2, 6.9, 7.3, 8.0, 5.9, 6.5, 7.2, 7.1, 6.4,
  7.9, 8.1, 7.5, 6.7, 7.0, 7.6, 6.9, 7.8, 6.1, 6.2,
  7.4, 7.7, 6.8, 7.1, 7.2, 8.3, 6.3, 7.0, 7.5, 7.1,
  6.7, 6.9, 7.3, 7.1, 6.4, 7.0, 7.6, 8.0, 7.4, 6.2
)

sd(zufriedenheit)
[1] 0.5971668

Aufgabe

Bestimmen Sie ein 95%-Konfidenzintervall für den wahren Mittelwert in der Grundgesamtheit. Verwenden Sie dazu die statistischen Grundfunktionen von R (also keine Funktion, die das 95%-KI ausgibt).

Lösungsvorschlag

# 1) Stichprobenmittelwert berechnen
mean_zufriedenheit <- mean(zufriedenheit)
mean_zufriedenheit
[1] 7.082
sd_zufriedenheit <- sd(zufriedenheit)
sd_zufriedenheit
[1] 0.5971668
# 2) 95%-Konfidenzintervall mit z-Statistik
alpha <- 0.05
z_crit <- qnorm(1 - alpha/2)  # speziell hier: z-Wert für 95%-KI = 1.96
sigma <- sd_zufriedenheit     # bekannte Standardabweichung
n <- length(zufriedenheit)

# Standardfehler des Mittelwerts
se <- sigma / sqrt(n)

# Konfidenzintervall
ci_lower <- mean_zufriedenheit - z_crit * se
ci_upper <- mean_zufriedenheit + z_crit * se

c(ci_lower, ci_upper)
[1] 6.916477 7.247523

Interpretation (Beispiel):
Das berechnete 95%-Konfidenzintervall gibt einen Bereich an, in dem der wahre mittlere Zufriedenheits-Score mit 95%iger Wahrscheinlichkeit liegt.


Aufgabe 2

Kontext

Ein Beratungsunternehmen möchte die Wirkung eines neuen Schulungsformats für Führungskräfte testen. Ein Pilotversuch wurde mit lediglich 4 Personen durchgeführt (aufgrund logistischer Einschränkungen). Die Variable, die gemessen wird, ist der zeitliche Aufwand (in Stunden), den die Teilnehmenden durchschnittlich für die Bearbeitung zusätzlicher Übungsaufgaben aufbringen.

Die folgende Stichprobe (n = 4) zeigt die Werte in Stunden.

[1] 5.2 4.8 6.1 5.5

Aufgabe

Bestimmen Sie ein 95%-Konfidenzintervall für den wahren Mittelwert. Lösen Sie die Aufgabe mit dem Taschenrechner.

Lösungshinweise – wichtige Kennwerte

Stichprobenmittelwert:  5.4
Standardabweichung:  0.548
Freiheitsgrade (df):  3
t-Wert:  3.182
Standardfehler:  0.274
95%-KI (von, bis):  4.528 6.272

Interpretation (Beispiel):
Bei nur 4 Personen ist das Intervall in der Regel recht breit, weil die Schätzung des Mittelwerts mit größerer Unsicherheit verbunden ist.