A continuación se presentan 10 valores de contenido de sodio (en mg Na/ 100g de producto comercial) en productos panificados (pan sin salvado “mignon”) de establecimientos habilitados para la elaboración de estos productos que se comercializan en San Salvador de Jujuy. El contenido de sodio se cuantificó por fotometría de emisión de llama.

Na = {471,483,712,436,512,439,523,601,505,456}

Se desea probar la hipótesis de que la mediana en el contenido de sodio es significativamente mayor a 476.

CAA-IX

CAA-725 (Página 83)

CAA

Na = c(471,393,712,315,412,419,423,701,301,456)
datos = data.frame(Na)
Na
471
393
712
315
412
419
423
701
301
456

shapiro.test(datos$Na)
Estadístico p.valor
W 0.8335993 0.0369701
median(datos$Na)
Mediana.m
421
421>476
[1] FALSE

1-Hipótesis 2-Nivel de significación

H0: Los productos panificados tienen una mediana de contenido de sodio menor o igual a 476 mg Na/ 100g

H1: Los productos panificados tienen una mediana de contenido de sodio mayor a 476 mg Na/ 100g

\[ P(e_1)=\alpha=0.05 \]

3-Estadístico 4-Regla de decisión
\[V=min(V_+,V_-)\] Se rechaza H0 si y solo si p-valor<0.05

5-Cálculos
library(dplyr)
data = datos |> 
  mutate(Mediana = rep(476,10),
         Diferencias.d = Na-476,
         Signo = ifelse(Diferencias.d >0,
                        "Positivo", "Negativo"),
         d_a = abs(Diferencias.d),
         Rango = rank(d_a)) |> 
  arrange(Rango)
Na Mediana Diferencias.d Signo d_a Rango
471 476 -5 Negativo 5 1
456 476 -20 Negativo 20 2
423 476 -53 Negativo 53 3
419 476 -57 Negativo 57 4
412 476 -64 Negativo 64 5
393 476 -83 Negativo 83 6
315 476 -161 Negativo 161 7
301 476 -175 Negativo 175 8
701 476 225 Positivo 225 9
712 476 236 Positivo 236 10

data |>
  group_by(Signo) |>
  summarize(V = sum(Rango))
Signo V
Negativo 36
Positivo 19

VECTORES NUMÉRICOS

r = wilcox.test(Na, mu = 476, alternative = "g")

DATA.FRAME

r = wilcox.test(datos$Na, mu = 476, alternative = "g")
r$statistic
r$p.value
Estadístico p.valor
V 19 0.8125

6-Decisión

7-Conclusión

Como el p-valor (0.8125) es mayor que el nivel de significación (0.05), no hay evidencia para rechazar H0. Los productos panificados tienen una mediana de contenido de sodio menor o igual a 476 mg Na/ 100g.

  • Dos muestras independientes y aleatorias

  • No existe el requisito de que las dos poblaciones tengan una distribución normal o cualquier otra distribución particular

Los datos presentados a continuación son medidas morfológicas de dos muestras de frutos de Passiflora edulis (maracuyá). La variante medida es la longitud de pelos tectores en micrómetros (µm), y el tipo de distribución en ambas muestras no se conoce.

F1 = {71,62,62,76,60,63,78,66,55,75}

F2 = {67,73,73,80,54,71,78,80,82,80,74,82,82,69,64,76}

¿Existe una diferencia significativa entre las longitudes en ambas muestras?

Artículo científico

F1 = c(71, 62, 62, 76, 60, 63, 78, 66, 55, 75)
F2 = c(67, 73, 73, 80, 54, 84, 78, 80, 82, 80, 74, 82, 82, 69, 64, 76)
Muestras = c(rep("F1", 10), rep("F2", 16))
micrometros = c(F1, F2)
datos = data.frame(Muestras, micrometros)
Muestras micrometros
F1 71
F1 62
F1 62
F1 76
F1 60
F1 63
F1 78
F1 66
F1 55
F1 75
F2 67
F2 73
F2 73
F2 80
F2 54
F2 84
F2 78
F2 80
F2 82
F2 80
F2 74
F2 82
F2 82
F2 69
F2 64
F2 76

shapiro.test(datos$micrometros[datos$Muestras == "F1"])
F1 p.valor
W 0.9323123 0.4710181
shapiro.test(datos$micrometros[datos$Muestras == "F2"])
F2 p.valor
W 0.8848769 0.0462535
datos |> 
  group_by(Muestras) |> 
  summarise(Mediana = median(micrometros))
Muestras Mediana
F1 64.5
F2 77.0

1-Hipótesis 2-Nivel de significación

H0: No existen diferencias entre las medianas de longitud de pelos tectores en ambas muestras de frutos de Passiflora edulis

H1: Existen diferencias entre las medianas de longitud de pelos tectores en ambas muestras de frutos de Passiflora edulis

\[ P(e_1)=\alpha=0.05 \]

3-Estadístico 4-Regla de decisión
\[U_i=n_1n_2+\frac{n_i(n_i+1)}{2}-\sum R_i\] Se rechaza H0 si y solo si p-valor<0.05

5-Cálculos

Combinar las dos muestras en una muestra grande y reemplazar cada valor muestral por su rango

data = datos |> 
  mutate(Rango = rank(micrometros)) |> 
  arrange(Rango) 
Muestras micrometros Rango
F2 54 1.0
F1 55 2.0
F1 60 3.0
F1 62 4.5
F1 62 4.5
F1 63 6.0
F2 64 7.0
F1 66 8.0
F2 67 9.0
F2 69 10.0
F1 71 11.0
F2 73 12.5
F2 73 12.5
F2 74 14.0
F1 75 15.0
F1 76 16.5
F2 76 16.5
F1 78 18.5
F2 78 18.5
F2 80 21.0
F2 80 21.0
F2 80 21.0
F2 82 24.0
F2 82 24.0
F2 82 24.0
F2 84 26.0

Calcular la suma de los rangos de las dos muestras

data |> 
  group_by(Muestras) |> 
  summarise(R = sum(Rango),
            n = n())
Muestras R n
F1 89 10
F2 262 16

Muestras n R
F1 10 89
F2 16 262

\[U_1=n_1n_2+\frac{n_1(n_1+1)}{2}-\sum R_1\] \[U_2=n_1n_2+\frac{n_2(n_2+1)}{2}-\sum R_2\]

Calcular Ui

n1 = length(F1)
n2 = length(F2)
R1 = 89
R2 = 262
U1 = (n1*n2)+(n1*(n1+1)/2-R1)
U2 = (n1*n2)+(n2*(n2+1)/2-R2)

Estadístico

U = min(U1, U2)

data |> 
  group_by(Muestras) |> 
  summarise(n = n(),
            R = sum(Rango)) |> 
  mutate(U = c(U1,U2))
Muestras n R U
F1 10 89 126
F2 16 262 34

r = wilcox.test(F1,F2)
r$statistic
r$p.value
Estadístico P_valor
W 34 0.0162614

6-Decisión

7-Conclusión

Como el p-valor (0.01626) es menor que el nivel de significación (0.05), hay evidencia para rechazar H0. La mediana de la longitud de la muestra F1 es significativamente diferente a la mediana de la longitud de la muestra F2.

Se pretende evaluar si la implementación de acciones de asesoramiento y acompañamiento contribuye al cumplimiento de los requisitos de etiquetado establecidos en el Código Alimentario Argentino (CAA) en productos derivados artesanales. Se aplicó una escala que clasifica al producto en si cumple con el CAA o no, antes y después del asesoramiento. Fueron evaluados 54 productos artesanales y los datos se presentan en la siguiente tabla, donde 1 corresponde a cumple CAA y 0 a no cumple CAA:

Artículo científico

DESPUES
Cumple con CAA (1) No cumple con CAA (0)
ANTES Cumple con CAA (1) 14 2
No cumple con CAA (0) 8 30

1-Hipótesis 2-Nivel de significación

H0: No hay un efecto significativo de antes y después del tratamiento

H1: Hay un efecto significativo de antes y después del tratamiento

\[ P(e_1)=\alpha=0.05 \]

3-Estadístico 4-Regla de decisión
\[\chi_{c}^{2} = \frac{(|b-c|-1)^2}{b+c}\] Se rechaza H0 si y solo si p-valor<0.05

5-Cálculos
datos = matrix(c(14, 8, 2, 30),
                nrow = 2,
                dimnames = list("ANTES" = c("1", "0"),
                                "DESPUES" = c("1", "0")))
1 0
1 14 2
0 8 30

CON CORRECCION

mcnemar.test(datos, correct = T)

    McNemar's Chi-squared test with continuity correction

data:  datos
McNemar's chi-squared = 2.5, df = 1, p-value = 0.1138

\[\chi_{c}^{2} = \frac{(|b-c|-1)^2}{b+c}\]

SIN CORRECCION

mcnemar.test(datos, correct = F)

    McNemar's Chi-squared test

data:  datos
McNemar's chi-squared = 3.6, df = 1, p-value = 0.05778

\[\chi_{c}^{2}=\frac{(b-c)^2}{b+c}\]

6-Decisión

7-Conclusión

b = datos[1,2]
c = datos[2,1]
Estadistico_TRUE = ((abs(b - c)-1)^2) / (b + c)
p_valor_T = pchisq(Estadistico_TRUE, df = 1, lower.tail = FALSE)
Estadistico_FALSE = ((b - c)^2) / (b + c)
p_valor_F = pchisq(Estadistico_FALSE, df = 1, lower.tail = FALSE)
Prueba Estadístico p_valor
Con corrección 2.5 0.1138463
Sin corrección 3.6 0.0577796

Como el p-valor (0.1138) es mayor que el nivel de significación (0.05), no hay evidencia para rechazar H0. No hay un efecto significativo de antes y después del tratamiento.

GRACIAS POR SU ATENCIÓN

Glosario