Pruebas de hipótesis para la de dos medias dependientes o pareadas

Pérez-Guerrero Edsaúl Emilio

Instituto de Investigación en Ciencias Biomédicas

2024-11-03

Antes de comenzar

Tamaño del efecto

El tamaño del efecto nos permite conocer la magnitud de una diferencia o de una asociación. Entre más grande sea el tamaño del efecto más importancia clínica podría tener.

Debe tomar en cuenta al tamaño del efecto junto con la significancia estadística al interpretar los resultados de un estudio. Es común que los resultados sean estadísticamente significativos, pero se observe un tamaño del efecto apenas relevante Un tamaño de efecto pequeño puede indicar que la relación o diferencia encontrada no tiene relevancia práctica.

Tamaño del efecto

Aunque existen una grande cantidad de medidas para el tamaño del efecto en este libro nos enfocaremos en los siguientes: - Cohen’s d: Usado para comparar las diferencias entre las medias de dos grupos. - Hedges’g: Correción para Cohen’s d - r (correlación de Pearson): A menudo transformado para evaluar tamaños de efecto en contextos de correlación. - \(ω^2\): Comúnmente utilizado en ANOVA

Hedge’s g

La interpretación para la g de Hedges es la siguiente: - Menor que 0.2: Un efecto pequeño - Entre 0.2 y 0.5: Un efecto moderado - Entre 0.5 y 0.8: Un efecto grande

Prueba t para dos medias dependientes

Introducción

Un método que se utiliza con frecuencia para averiguar la eficacia de un tratamiento o procedimiento experimental es aquel que hace uso de observaciones relacionadas que resultan de muestras no independientes.

  • Mediciones a través del tiempo
  • Dos mediciones en el mismo sujeto
  • Diseño cruzados

Prueba t para grupos dependientes

El estadístico de prueba para una prueba t por grupos pareados es el siguiente:

\[t= \frac{\bar{d}-\mu_{d0}}{s_{\bar{d}}}\] Donde:

  • \(\bar{d}\) es la diferencia de media muestral
  • \(\mu_{d0}\) es la diferencia de la media poblacional supuesta
  • \(s_{\bar{d}}=s_d/\sqrt{n}\) es la desviación estándar de las diferencias dividida entre la raíz de n
  • Cuando \(H_0\) es verdadera sigue una distribución \(t\) con \(n-1\) grados de libertad.

Prueba t para grupos dependientes

¿Es necesario evaluar las varianzas?

Dado que se trabaja con la diferencia de las medias, no es necesario realizar prueba de homogeneidad de varianzas !Es la misma muestra!

Se siguen los mismos pasos que los revisados en las otras prueba de hipótesis

Ejemplo 1.

Nancy Stearns Burgess condujo un estudio para determinar la perdida de peso, en individuos obesos antes y después de 12 semanas de tratamiento con dieta muy baja en calorías (DMBC). Los 17 individuos (nueve mujeres y ocho hombres) que participaron en el estudio eran pacientes externos de un programa de tratamiento con base hospitalaria para la obesidad. Los pesos de las mujeres antes y después del tratamiento de 12 semanas de DMBC se muestran en dos objetos. Se pretende saber si estos datos ofrecen suficiente evidencia que permita concluir que el tratamiento es eficaz para reducir el peso en mujeres obesas.

Ejercicio adaptado de Bioestadistica: Base para el análisis de las ciencias de la salud

Ejemplo 1

Para resolver este ejercicio se crearon dos objetos:

# Peso de los pacientes antes del DMBC
antes<-c(117.3, 111.4,98.6,104.3,105.4,100.4, 81.7,89.5,78.2)
# Peso de los pacientes después del DMBC
despues<-c(83.3,85.9,75.8,82.9,82.3,77.7,62.7,69.0,63.9)

Ejemplo 1

  • Lo que se busca es saber si existe la suficiente evidencia para concluir que el programa de dietas es eficaz (disminución del peso).
  • Si es posible rechazar la hipótesis nula que indica que el cambio en la media de la población \(\mu_d\) es cero o positivo.

Ejemplo 1

  • En la prueba t pareada se pueden obtener dos tipos de diferencias
    • Peso antes-Peso después
    • Peso después-Peso antes
  • Se puede seleccionar cualquiera pero tiene que ser de acuerdo al tipo de hipótesis

Ejemplo 1

Las hipótesis nula y alternativa deben establecerse de acuerdo con la manera de efectuar la resta de las mediciones para obtener las diferencias. En este ejemplo, se pretende saber si es posible concluir que el programa DMBC es eficaz para reducir el peso.

Ejemplo 1

  • Si selecciona:
    • Peso después-Peso antes

\[H_0: \mu_d>=0\] \[H_A: \mu_d<0\]

Ejemplo 1

  • Si selecciona:
    • Peso antes-Peso después

\[H_0: \mu_d<=0\] \[H_A: \mu_d>0\]

Ejemplo 1

  • Si lo que se busca es solo saber si hay diferencias:
    • Hipótesis bilateral

\[H_0: \mu_d=0\] \[H_A: \mu_d \ne 0\]

Ejemplo 1. Cálculo del estadístico de prueba

  • Utilizando la formula: \[t= \frac{\bar{d}-\mu_{d0}}{s_{\bar{d}}}\] Donde:
  • \(\bar{d}\) es la diferencia de media muestral,
  • \(\mu_{d0}\) es la diferencia de la media poblacional supuesta,
  • \(s_{\bar{d}}=s_d/\sqrt{n}\) es la desviación estándar de las diferencias dividida entre la raíz de \(n\)

Ejemplo 1. Cálculo del estadístico de prueba

\[t= \frac{\bar{d}-\mu_{d0}}{s_{\bar{d}/\sqrt{n}}}\] Sustituyendo \[t= \frac{-22.59-0}{5.31/\sqrt{9}}= -12.74\]

Ejemplo 1. Determinar el valor crítico de t

Para una hipótesis unilateral en el que se espera un valor negativo

qt(0.05, df=8, lower.tail = T)
[1] -1.859548

¿Cuando se esperaría una diferencia negativa?

Ejemplo 1. Determinar el valor crítico de t

Para una hipótesis unilateral en el que se espera un valor positivo

qt(0.05, df=8, lower.tail = F)
[1] 1.859548

¿Cuando se esperaría una diferencia positiva?

Ejemplo 1. Determinar el valor crítico de t

Para una hipótesis bilateral

qt(c(0.025,0.975), df=8, lower.tail = F)
[1]  2.306004 -2.306004

Zona aceptación diferencia negativa

Zona aceptación diferencia negativa

Estimación del valor de p

pt(-12.74, df=8, lower.tail = T)
[1] 6.785466e-07

¿Cómo concluirían?

Como hacerlo en R

Hipótesis unilateral en la que se busca una diferencia positiva

t.test(x=antes, y=despues, alternative = "greater", 
       paired = T, var.equal = T)

    Paired t-test

data:  antes and despues
t = 12.74, df = 8, p-value = 6.787e-07
alternative hypothesis: true mean difference is greater than 0
95 percent confidence interval:
 19.29166      Inf
sample estimates:
mean difference 
       22.58889 

Hipótesis unilateral en la que se busca una diferencia negativa

t.test(x=antes, y=despues, alternative = "less", 
       paired=T, var.equal = T)

    Paired t-test

data:  antes and despues
t = 12.74, df = 8, p-value = 1
alternative hypothesis: true mean difference is less than 0
95 percent confidence interval:
     -Inf 25.88612
sample estimates:
mean difference 
       22.58889 

Hipótesis unilateral en la que se busca una diferencia bilateral

t.test(x=antes, y=despues, alternative = "two.sided", 
       paired=T, var.equal = T)

    Paired t-test

data:  antes and despues
t = 12.74, df = 8, p-value = 1.357e-06
alternative hypothesis: true mean difference is not equal to 0
95 percent confidence interval:
 18.50003 26.67775
sample estimates:
mean difference 
       22.58889 

Ejemplo 1. Desde una base datos

Utilizando los objetos antes y después cree una base de datos para comprobar si hay diferencias entre el paso antes y el peso después. Pista, puede utilizar la función rep

05:00

Ejemplo 1. Desde una base datos

Tiempo <- rep(x = c("Antes", "Despues"), each=9)
Peso <- c(antes, despues)
Datos <- data.frame(Tiempo, Peso)

Ejemplo 1. Desde una base datos

t.test(Peso~Tiempo, data = Datos, paired=T)
  • La función t.test() no permite realizar una prueba pareada utilizando formula, pero si ggstatsplot con la función ggwithinstats().

  • Además se puede utilizar la función t_test() de la librería rstatix.

Ejemplo 1. Desde una base datos

library(rstatix)
t_test(data = Datos, formula = Peso~Tiempo, paired = T)
# A tibble: 1 × 8
  .y.   group1 group2     n1    n2 statistic    df          p
* <chr> <chr>  <chr>   <int> <int>     <dbl> <dbl>      <dbl>
1 Peso  Antes  Despues     9     9      12.7     8 0.00000136

Ejercicio de práctica

Un grupo de investigadores desea conocer que tan efectivo es un programa de autocuidado en un grupo de padres. Para evaluar la percepción del autocuidado utilizaron un índice, en el que un puntaje alto, índica una mayor percepción del autocuidado. Los puntajes de este índice antes y después de la instlación del programa fueron:

  • Antes: 7,6,10,16,8,13,8,14,16,11,12,13,9,10,8,5
  • Después: 11,14,16,17,15,9,17,20,12,14,15,18,15,9

¿Es posible concluir, con base en estos datos, que el programa de capacitación aumenta el conocimiento respecto a los principios de modificación del comportamiento? Sea \(\alpha\)= 0.01.

Resolución Ejercicio de práctica

antes2<-c(7,6,10,16,8,13,8,14,16,
          11,12,13,9,10,17,8,5) # Nuevo objeto
despues2<-c(11,14,16,17,9,15,9,17,
            20,12,14,15,14,18,15,9,12) # Nuevo objeto

Resolución desde una base datos Ejercicio de práctica

Genere una base de datos y resuelva este ejercicio utilizando ggstatsplot, ggplot2 para generar sus gráficos y rstatix

10:00

Resolución desde una base datos Ejercicio de práctica

Tiempo2 <- as.factor(rep(x = c("Puntaje antes", 
                               "Puntaje después"), 
                         each= 17))
Puntajes <- c(antes2, despues2)

Datos2 <- data.frame(Tiempo2, Puntajes)

Resolución desde una base datos Ejercicio de práctica

library(ggplot2)
Datos2|>
  ggplot(aes(x=Tiempo2, y=Puntajes, fill = Tiempo2))+
  geom_boxplot(alpha=0.5)+
  geom_jitter(width = 0.2)+ # añadir puntos
  theme_minimal()+
  labs(title = "Puntajes antes y después del programa de autocuidado",
       x = "Tiempo",
       y = "Puntajes")

Resolución desde una base datos Ejercicio de práctica

Resolución desde una base datos Ejercicio de práctica

Datos2|>
  ggstatsplot::ggwithinstats(
    x=Tiempo2,
    y= Puntajes,
    type="parametric",
    title="Puntajes antes y después del programa de autocuidado", 
    conf.level = 0.99
  )

Resolución desde una base datos Ejercicio de práctica

Resolución desde una base datos Ejercicio de práctica

Datos2|>
  t_test(formula = Puntajes~Tiempo2, paired = T, 
         conf.level = 0.99)
# A tibble: 1 × 8
  .y.      group1        group2             n1    n2 statistic    df        p
* <chr>    <chr>         <chr>           <int> <int>     <dbl> <dbl>    <dbl>
1 Puntajes Puntaje antes Puntaje después    17    17     -4.62    16 0.000283

Otro ejemplo

Generando la base de datos

set.seed(123)  # Para reproducibilidad

# Número de pacientes
n_pacientes <- 30

# Datos de presión arterial antes del tratamiento (Placebo)
PA_pre_placebo <- rnorm(n_pacientes, mean = 120, sd = 15)

# Datos de presión arterial después del placebo
PA_post_placebo <- PA_pre_placebo - rnorm(n_pacientes, mean = 0, sd = 5)

# Datos de presión arterial antes del tratamiento (Medicamento)
PA_pre_medicamento <- PA_pre_placebo + rnorm(n_pacientes, mean = 0, sd = 5)  # pequeñas variaciones

# Datos de presión arterial después del medicamento
PA_post_medicamento <- PA_pre_medicamento - rnorm(n_pacientes, mean = 10, sd = 5)  # mayor reducción

# Crear el data frame
datos <- data.frame(
  ID = 1:n_pacientes,
  PA_pre_placebo = PA_pre_placebo,
  PA_post_placebo = PA_post_placebo,
  PA_pre_medicamento = PA_pre_medicamento,
  PA_post_medicamento = PA_post_medicamento
)

Cambios de la PA del tratamiento

t.test(datos$PA_pre_medicamento, datos$PA_post_medicamento,
       paired = T)

    Paired t-test

data:  datos$PA_pre_medicamento and datos$PA_post_medicamento
t = 11.512, df = 29, p-value = 2.466e-12
alternative hypothesis: true mean difference is not equal to 0
95 percent confidence interval:
  7.837397 11.223714
sample estimates:
mean difference 
       9.530555 

Utilizanod ggstatplot

library(ggstatsplot)
Tiempo <- rep(x=c("Antes", "Despues"),
              times=1, each=30)

PA <- c(datos$PA_pre_medicamento, datos$PA_post_medicamento)

datos2 <- data.frame(Tiempo, PA)

datos2|>
  ggwithinstats(
    x=Tiempo,
    y= PA,
    type="parametric"
  )

Utilizano ggstatplot