Um modelo probabilístico discreto é caracterizado pela sua função de probabilidade (ou pela sua função de distribuição acumulada, FDA).
Aqui, trataremos dos modelos probabilísticos:
No entanto, existem outros modelos discretos, indicados para resolver muitos problemas práticos como: o modelo geométrico, o modelo binomial negativo, entre outros.
Vimos que algumas variáveis são definidas a partir de resultados de experimento dicotômicos.
Escolher uma semente ao acaso e verificar se ela germina ou não:
\[Y=\begin{cases}1 &\mbox{ se a semente não germina;}\\ 0 &\mbox{se a semente germina.} \\ \end{cases}\]
Escolher um pacote contendo 15 sementes e verificar se o mesmo será idenizado: \[X=\begin{cases}1 &\mbox{ se o pacot. é idenizado}\\ 0 &\mbox{se o pacot. não é idenizado. } \\ \end{cases}\]
Considere que um experimento aleatório pode apresentar apenas dois resulados (sucesso e fracasso).
Vamos dizer que ocorre o “sucesso”, se o evento investigado ocorre.
Vamos dizer que ocorre o “fracasso” quando ocorre o evento complementar ao “sucesso”.
Esse tipo de experimento é chamada do “Ensaios de Bernoulli”.
Uma peça é classificada como defeituosa ou não defeituosa,
O resultado de um exame médico para detecção de uma doença é positivo ou negativo,
Uma imagem representa ou não um dado objeto,
Um entrevistado concorda ou não com uma afirmação feita,
Seja X uma v.a. vinda de um ensaio de Bernoulli, tal que
\(\begin{align*}\label{} X&= \left\{ \begin{array}{lllllll} 0,~~ & \text{se corre fracasso (F),}\\ 1, ~~ &\text{se ocorre sucesso (S).} \end{array} \right.\\ \end{align*}\)
Considerando: \(P(X=1)=p\) e \(P(X=0)=(1-p)\), a f.p. de X pode ser escrita como:
\(\begin{align*} p(x)&= \left\{ \begin{array}{lllllll} p^xq^{1-x},~~ & \text{se}~~ x=0,1; \ \ \ \mbox{com } q=(1-p) \ \ \ \mbox{ e } \ \ \ 0\leq p \leq 1\\ 0, ~~ &\text{se}~~ x\neq 0,1. \end{array} \right.\\ \end{align*}\)
Notação: \(X \sim Bernoulli(p)\).
A esperança e a variância de \(X \sim Bernoulli(p)\) são:
\(\begin{array}{rcl} \mu_X&=&1 \times p + 0 \times (1-p) \mbox{ } \Longrightarrow \boxed{\mu_X = p} \\ &&\\ E[X^2]&=& 1^2 \times p + 0^2 \times (1-p) \mbox{ } \Longrightarrow \mbox{ } \boxed{E[X^2] = p}\\ &&\\ \sigma^2_{X}&=&E[X^2] - \mu_X^2\\ & & \\ \sigma^2_{X}&=& p - p^2 \mbox{ } \Longrightarrow \mbox{ } \boxed{\sigma^2_{X}= p(1-p)}\\ \end{array}\)
Suponha que seja observada a produção de itens por uma máquina, e que cada item tem a probabilidade \(0,05\) de ser defeituoso. Suponha ainda que sejam selecionados ao acaso 4 itens, e que defeitos e não defeitos ocorram de forma independente. Nessas condições, qual a probabilidade de que se tenha exatamente 0, 1, 2, 3 e 4 itens defeituosos na amostra de tamanho 4?
Considere,
S: defeito;
F: não defeito.
\(N^o\) | Pontos Amostrais | Possibilidades | Probabilidade de cada sequência | Probabiliade |
---|---|---|---|---|
0 | FFFF | \({4 \choose 0}=1\) | \((0,95)(0,95)(0,95)(0,95)\) | \({4 \choose 0}(0,95)^4\) |
1 | FFFS; FFSF; FSFF; SFFF; | \({4 \choose 1}=4\) | \((0,95)(0,95)(0,95)(0,05)\) | \({4 \choose 1}(0,95)^3(0,05)\) |
2 | FFSS; SSFF; FSSF; SFFS; SFSF; FSFS; | \({4 \choose 2}=6\) | \((0,95)(0,95)(0,05)(0,05)\) | \({4 \choose 2}(0,95)^2(0,05)^2\) |
3 | SSSF; SSFS; SFSS; FSSS; | \({4 \choose 3}=4\) | \((0,95)(0,05)(0,05)(0,05)\) | \({4 \choose 3}(0,95)(0,05)^3\) |
4 | SSSS | \({4 \choose 4}=1\) | \((0,05)(0,05)(0,05)(0,05)\) | \({4 \choose 4}(0,05)^4\) |
- Seja a variável aleatória definida como:
Y: “Nº de sucessos em n ensaios de Bernoulli, independentes”
Logo: \(Y \in \Lambda=\left\lbrace0,1,2,\cdots,n \right\rbrace\)
Além disso: \(Y = X_1 + X_2 \cdots + X_n\),
em que \(X_i \sim Bernoulli(p)\), para \(i=1,2, \cdots,n\)
\(\begin{align*}\label{} p(y)&= \left\{ \begin{array}{lllllll} \binom{n}{y} p^yq^{n-y},~ & \text{se}~ y \in S; \ \ \ \ \ \ \ \ q=(1-p) \ \ \ \mbox{ e } \ \ \ 0\leq p \leq 1,\\ 0, ~ &\text{se}~ y \notin S. \end{array} \right.\\ \end{align*}\)
Notação: \(Y \sim Binomial(n,p)\).
A esperança e a variância de \(Y \sim Binomial(n,p)\) são obtidas a seguir.
\(\begin{array}{rcl} \mu_Y&=& E[X_1 + X_2 + \cdots + X_n] \\ &=& E[X_1] + E[X_2] + \cdots + E[X_n]\\ &&p + p \cdots + p \mbox{ } \Longrightarrow \mbox{ } \boxed{\mu_Y = np}\\ &&\\ \sigma^2_{Y}&=&Var(X_1 + X_2 + \cdots + X_n) \mbox{ (como os ensaios são independentes)}\\ &=&Var(X_1) + Var(X_2) + \cdots + Var(X_n) \\ &=& \sigma^2_{X} + \sigma^2_{X} + \cdots + \sigma^2_{X}\\ &=& n\sigma^2_{X} \mbox{ } \Longrightarrow \mbox{ } \boxed{\sigma^2_{Y}= np(1-p)}\\ \end{array}\)
Amostras de 20 peças de um processo de um corte metálico são selecionadas a cada 1 hora. É sabido que 1% das peças requerem retrabalho. Seja Y a v.a. que representa o número de peças, em uma amostra de tamanho 20, que requerem retrabalho, selecionadas ao acaso. Se um valor observado de Y excede a sua média em mais de três desvios-padrões, é levantada a suspeita de um problema no processo.
a) Caso seja mantida a porcentagem de 1% de peças que requerem retrabalho, qual é a probabilidade de Y exceder a sua média em mais de três desvios-padrões?
b) Qual a probabilidade de Y exceder 1 em pelo menos uma das próximas cinco horas de amostragem?
c) Se a porcentagem aumentar para 4%, qual a probabilidade de Y exceder 1?
d) Se a porcentagem aumentar para 4%, qual a probabilidade de Y exceder a sua média em mais de três desvios-padrões?
Suponha que se tenha uma quantidade grande de ensaios independentes de Bernouli.
Denotando a média por \(np = \lambda\) então \(p=\frac{\lambda}{n}\), tendo a ser pequeno.
Neste caso, pode-se pensar numa aproximação para a distribuição Binomial.
\(\begin{array}{cll} P(Y=y)&=&lim_{n\rightarrow \infty} \binom{n}{y} p^y(1-p)^{n-y}\\ &=& lim_{n\rightarrow \infty} \frac{n!}{(n-y)!y!} \left(\frac{\lambda}{n}\right)^y\left(1-\frac{\lambda}{n}\right)^{n-y}\\ &=& lim_{n\rightarrow \infty} \frac{n!}{(n-y)!y!} \frac{\lambda^y}{n^y}\frac{\left(1-\frac{\lambda}{n}\right)^{n}}{\left(\frac{n-\lambda}{n}\right)^{y}}\\ &=& lim_{n\rightarrow \infty} \frac{n}{n}.\frac{(n-1)}{n}.\frac{(n-2)}{n}\cdots \frac{n-(y-1)}{n} .\frac{\left(1+\frac{(-\lambda)}{n}\right)^{n}}{\left(\frac{n-\lambda}{n}\right)^{y}}.\frac{\lambda^y}{y!}\\ &=& \frac{e^{-\lambda}\lambda^{y}}{y!}. \\ \end{array}\)
Assim tem-se uma f.p. dada por:
\(P(Y=y)=\frac{e^{\lambda}\lambda^y}{y!}\)
que é a função de probabiliade do modelo de Poisson.
O limite anterior é válido pois, se \(n\) cresce, a quantidade \(\left(1+\frac{(-\lambda)}{n}\right)^{n}\) se aproxima do número de Euler \(e^{-\lambda}\).
A prova deste resultado pode ser realizada pela expansão binomial e a série de Taylor.
Os demais termos que dependem de \(n\) convergem para 1 quando \(n\) tende a infinito.
O parâmetro \(\lambda\) deste expressão representa a taxa de ocorrência de sucessos de Bernoulli em um espaço qualquer (tempo, comprimento, área, volume etc).
Uma v.a. \(Y\) segue uma distribuição de Poisson com parâmetro \(\lambda >0\) se sua f.p. é dada por:
\(\begin{align*} p(y)&= \left\{ \begin{array}{lllllll} \frac{e^{-\lambda}\lambda^{y}}{y!},~~ & \text{se}~~ y=0,1,2,\cdots \\ 0, ~~ &\text{se}~~ y\neq 0,1,2,\cdots. \end{array} \right.\\ \end{align*}\)
Temos ainda que:
\(E(Y) = Var(Y) = \lambda\).
Notação: \(Y \sim Poisson(\lambda)\).
Note que, diferentemente da distribuição binomial, a v.a. de Poisson assume valores em um conjunto infinito enumerável,
ou seja \(Y \in \left\{ 0,1,2, \cdots \right\}\).
Número de ligações que chegam em uma central telefonica em 1 hora.
Quantidade de erros de gramática em uma página da internet.
Número de pessoas afetadas por uma determinada doença em um território ou país.
Quantidade de camarões doentes em um berçario com doze mil litros de água.
Quantidade de pessoas que chegam por hora em uma fila de supermercado.
Um posto policial recebe em média 6 solicitações por hora. Qual a probabilidade de ocorrer menos de duas solicitações em meia hora?
Um investigador está interessado no número de ovos depositados por uma espécie de pássaro. Numa dada estação, são encontrados 80 ninhos, que apresentou número médio de 4,1 ovos por ninho e variância de 3,9. Como a variância foi aproximadamente igual á média, o investigador assumiu que o número de ovos por ninho pode ser descrito por uma distribuição de Poisson com média 3,8.
Se realmente a distribuição populacional segue um modelo de Poisson, qual seria a probabilidade de encontrar um ninho com mais do que 5 ovos?
Qual seria a probabilidade de não encontrar nenhum ovo num ninho?
A maior concentração da distribuição está em torno de que valor?
Resolva o seguinte problema, usando a distribuição de Poisson.
Suponha que 2% dos adultos que tomam um determinado medicamento apresentam efeitos colaterais negativos. Considere um grupo de 30 pacientes adultos. Qual a probabilidade de mais de 3 apresentarem efeitos colaterais negativos?
Suponha \(n\) objetos extraídos de forma aleatória de uma população de tamanho \(N\), em que \(r\) objetos são do tipo 1 e \(N-r\) objetos são do tipo 2.
\(Y\): Nº de objetos do tipo 1 na amostra”
\[Y\sim\mbox{ Binomial}(n,p=r/N).\]
\(Y\) tem distribuição hipergeométrica com parâmetro \((N,n,r)\), cuja f.p. é dada a seguir.
\(\begin{align*}\label{} p(y)&= \left\{ \begin{array}{lllllll} \frac{\binom{r}{y} \binom{N-r}{n-y}}{\binom{N}{n}} ,~~ & \text{se}~~ y=1,2,\cdots,k,\\ 0, ~~ &\text{se}~~ y\neq 1,2,\cdots,k, \end{array} \right.\\ \end{align*}\)
\(k=\min\{r,n\}\), em que:
Notação: \(Y\sim\mbox{hipergeométrica}(N,n,r)\).
\(E[Y]=n(r/N)\)
\(\sigma^2=n\frac{r}{N}\frac{(n-r)}{N}\frac{(N-n)}{(N-1)}\)
Em problemas de controle de qualidade, suponha que num lote de \(N\) = 100 peças, \(r\) = 15 sejam defeituosas.
-Escolhendo-se \(n\) = 10 peças, sem reposição, responda.