Distribuciones de probabilidad

Pérez-Guerrero Edsaúl Emilio

Instituto de Investigación en Ciencias Biomédicas

2024-09-18

Distribuciones de probabibilidad

Distribuciones de probabilidad

  • La distribución de probabilidad de una variable es una tabla, gráfica, fórmula o cualquier otro medio que se use para especificar todos los valores posibles de una variable aleatoria junto con sus probabilidades respectivas1.

\[f(x)=P(X=x)\]

  • Las distribuciones de probabilidad son poderosas herramientas matemáticas que nos permiten modelar la incertidumbre en los datos y tomar decisiones informadas.

Tallas de un grupo de 100 niños

Intervalo de clase Frecuencia absoluta f(x) función de probabilidad F(B) Función acumulada
107 a 112 2 0.02 0.02
113 a 118 7 0.07 0.09
119 a 124 21 0.21 0.3
125 a 130 22 0.22 0.52
131 a 136 22 0.22 0.74
137 a 142 14 0.14 0.88
143 a 148 9 0.09 0.97
149 a 154 2 0.02 0.99
155 a 160 1 0.01 1
Total 100 1

Otro ejemplo

Otra distribución de normalidad

Otra más

Distribucion de probabilidad

“Se denomina distribución de probabilidad a aquella que presenta el conjunto de todos los valores que teóricamente podría tomar una variable, junto con sus correspondientes probabilidades calculadas ordinariamente siguiendo los principios de la ley de Laplace u otros análogos.”

Fragmento de Bioestadística amigable (Spanish Edition) Miguel Ángel Martínez González

Distribución de probabilidad

Recordando

  • Parámetro: Estimado con base a la población y se utilizan letras griegas (\(\mu, \ \sigma\), etc)
  • Estimador: Función de valores de la muestra que permite obtener un valor aproximado de alguna característica de la población.
  • Inferencia estadística: Trasladar los resultados de una muestra a una población

Distribución de probabilidad

¿Para qué?

¿Qué aplicaciones puediera tener?

Distribución de probabilidad

Distribución de probabilidad

Distribuciones de probabilidad

Se encuentran definidas por parámetros:

  • Media
  • Varianza
  • Forma funcional
  • Número de eventos
  • Tiempo
  • Éxito
  • Otros parámetros

Distribuciones de probabilidad

Distribuciones de probabilidad

Distribuciones de probabilidad

Tipos de distribuciones de probabilidad

Distribuciones de probabilidad 1

Distribuciones discretas Función en R Parámetros
Binomial binom n = número de experimentos; p = Probabilidad de éxito en cada experimento
Geométrica geom p = Probabilidad de éxito en cada experimento
Poisson pois lambda = media

Distribuciones de probabilidad 1

Distribución continua Nombre en R Parámetros
Beta beta shape1; shape2
Chi-cuadrado chisq df = grados de libertad
F f df1 y df2 = grados de libertad
Normal norm media; sd = desviación estándar
t de Student t df = grados de libertad

Funciones de distribuciones de probabilidad en R

  • dname: Calcula la densidad de x
  • pname: Calcula la probabilidad de x dado un quantil q
  • qname: Devuelve el valor de un quantil q dada una probabilidad p
  • rname: Genera datos aleatorios de la distribución

Sustituya name por el nombre de la distribución

Funciones de distribuciones de probabilidad en R

Calcule el valor de Z para una distribución normal con media de 0,desviación estándar de 1 y una probabilidad de 0.05

qnorm(p=0.05, mean = 0, sd = 1)
[1] -1.644854

Funciones de distribuciones de probabilidad en R

Calcule el valor de p para un valor de Z de -1.64 de una distribución normal con media de 0, desviación estándar de 1 y una probabilidad de 0.975

pnorm(q=-1.64, mean = 0, sd = 1)
[1] 0.05050258

Funciones de distribuciones de probabilidad en R

Nombre Probabilidad de densidad Distribución acumulada Quantile
Normal dnorm(Z,mean,sd) pnorm(Z,mean,sd) qnorm(Q,mean,sd)
Poisson dpois(N,lambda) ppois(N,lambda) qpois(Q,lambda)
Binomial dbinom(N,size,prob) pbinom(N,size,prob) qbinom(Q,size,prob)
Exponencial dexp(N,rate) pexp(N,rate) qexp(Q,rate)
\(\chi^2\) dchisq(X,df) pchisq(X,df) qchisq(Q,df)

Funciones de distribuciones de probabilidad en R

Tarea

  1. Distribución uniforme discreta
  2. Distribución binomial
  3. Distribución Poisson
  4. Distribución normal
  5. Distribución ji-cuadrado
  6. Distribución t de Student
  7. Distribución F de Snedeco ¿Qué es?¿Qué parámetros la definen? ¿Para que se utiliza? ¿Qué función puedo utlizar en R?

Distribución muestral

Distribución muestral o empírica

Una distribución muestral es una distribución de probabilidad que se construye con los estadísticos muestrales calculados a partir de las muestras de tamaño \(n\) obtenidas de una población.

Se pueden construir a partir de:

  • Media
  • Varianza
  • Forma funcional
  • Otros parámetros

Distribución muestral

  • Las distribuciones muestrales son la clave para comprender la inferencia estadística
  • En palabras sencillas distribución muestral es una medida descriptiva, como la media, la mediana, la variancia o la desviación estándar que se calcula a partir de los datos de la muestral

Distribución muestral

De acuerdo con Daniels:

La distribución de todos los valores posibles que puede asumir una estadística, calculados a partir de muestras del mismo tamaño, seleccionadas aleatoriamente de la misma población, se llama distribución muestral de esa estadística

¿Cómo calcularla?

  1. De una población finita de tamaño \(N\), se extraen de manera aleatoria todas las muestras posibles de tamaño \(n\). Dada por \(Nn\)

  2. Se calcula la estadística de interés para cada muestra media, varianza y forma.

  3. Se ordenan en una columna los distintos valores observados de la estadística y, en otra columna, las frecuencias de ocurrencia correspondientes de cada valor observado.

Distrubución muestral de la media

Distribución muestral de la media. Ejemplo

Considere una población de tamaño \(N = 5\), la cual se compone de las edades de cinco niños que son pacientes externos de una clínica de salud mental. Las edades son las siguientes: 6, 8, 10, 12, 14

Edad <- c(6, 8, 10, 12, 14)
mean(Edad)
[1] 10
var(Edad)
[1] 10

Distribución muestral de la media. Ejemplo

Determinar la media muestral para \(n = 2\) de una población de tamaño \(N = 5\) dado:

Edad <- c(6, 8, 10, 12, 14)
mean(Edad)
[1] 10
var(Edad)
[1] 10

Distribución muestral de la media. Ejemplo

Distrbución muestral de media. Ejemplo

Combinaciones

Distribucion<-c(6,7,7,8,8,8,9,9,9,9,10,10,10,10,10, 11,11,11,11,12,12,12, 13,13,14)
mean(Distribucion)
[1] 10
var(Distribucion)
[1] 4.166667

Histograma de las combinaciones

hist(Distribucion)

Histograma de las combinaciones

hist(Distribucion)
abline(v=mean(Distribucion), col="red", lw=5)

Puntos importantes

  • La media de la distribución muestral para \(x\) tiene el mismo valor que la media de la población original

  • La variancia no es igual, pero si se divide entre \(n\) es igual

var(Distribucion)*2
[1] 8.333333

Distrubución de la media muestral de una población normal

  1. La distribución de \(\bar{x}\) será normal

  2. La media de la distribución será igual a la media de la población

  3. La varianza de la distribución a la varianza de la población dividida entre \(n\)

Distribución de la media muestral de una población sin distribución normal

  • Cuando se hace el muestreo a partir de una población que no exhibe una distribución normal y la muestra es grande
  • Cuando se hace el muestreo a partir de una población cuya forma funcional se desconoce, siempre que el tamaño de la muestra sea grande

Teórema del límite central

Dada una población de cualquier forma funcional no normal con una media \(\mu\) y variancia finita \(\sigma^2\). La distribución muestral de \(\bar{x}\), calculada a partir de muestras de tamaño \(n\) de dicha población, sera casi normal con media \(\mu\) y variancia \(\sigma^2/n\) cuando la muestra es muy grande (mayor a 30)

Teórema del límit central