Estatística Descritiva
28-03-2023
1 Medidas de Resumo
Muitas vezes é útil descrever numericamente as características dos dados observados a partir de variáveis quantitativas (resumos numéricos). Pois sua natureza permite o cálculo de algumas medidas que podem ser úteis, uma vez que podem dar uma ideia do comportamento da variável em termos de sua frequência de ocorrência.
Dentre as medidas de resumo mais utilizadas, destacam-se:
as medidas de posição: média, moda e separatrizes;
as medidas de dispersão: variância e/ou desvio-padrão, distância interquartílica e coeficiente de variação.
As medidas de posição localizam a distribuição de frequência da variável no eixo das abcissas, enquanto as medidas de dispersão fornecem informações sobre o “espalhamento” dessa distribuição.
As medidas de posição que serão vistas nesse estudo são:
- as medidas de tendência central, assim denominadas devido aos valores observados da variável se agruparem em torno dessas medidas, que são denominadas:
- média,
- moda
- e mediana;
- as separatrizes, assim chamadas porque separam, dividem um conjunto de dados ordenado em partes percentuais iguais (quartil, decil e percentil, genericamente quantís), que são denominadas:
- mediana (uma única medida num conjunto de dados),
- quartís (três medidas)
- decís (nove medidas)
- e percentís (noventa e nove medidas).
As mediadas que fornecem informação sobre a tendência central dos dados, embora muito importantes, não são capazes de fornecer uma visão global do comportamento de uma variável em termos de sua frequência, assim é importante que sejam utilizadas, em conjunto com a medida de tendência central adotada, uma medida da dispersão dos valores observados da variável em torno dessa medida.
- Se a medida de tendência central adotada é a média, pode-se fazer uso das seguintes medidas de dispersão:
- variância ou desvio-padrão
- e coeficiente de variação.
- Se a medida de tendência central adotada é a mediana, a medida de dispersão mais usada é a
- distância interquartílica.
Maiores detalhes sobre os resumos numéricos citados acima serão vistos nas seções seguintes.
Observações
Em geral, os quantís fornecem uma boa ideia sobre a dispersão dos dados em torno do centro da distribuição.
Existem outras medidas de dispersão que podem ser usadas para medir a dispersão dos dados, tais como: amplitude total e desvio médio absoluto.
Se a variável é qualitativa, pode-se usar o moda como medida de posição.