7 Overfitting e Underfitting
Quando se deseja trabalhar com aprendizado de máquina supervisionado, alguns cuidados devem ser tomados ao ajustar modelos, pois modelos podem se tornar subajustados ou sobreajustados demais ao dados.
7.1 Overfitting
O Overfitting é quando o modelo sobreajusta demais ao dados de treinamento, ou seja, o modelo tem um desempenho excelente nos dados de teino porém tem o desempenho ruim nos dados de teste. É como se o modelo tivesse decorado o processo a ser aplicado a partir dos dados de treino e não consegue generalizar para os dados de teste.
7.2 Underfitting
O Underfitting ocorre quando o modelo se subajusta aos dados, é o contrário do que ocorre no Overfitting. No subajuste o desempenho do modelo já é ruim nos dados de treinamento e consequentemente é ruim nos dados de teste, este nem precisa acontecer visto que o modelo não conseguiu realizar a associação entre as variáveis já nos dados de treino. A Figura 7.1 mostra um exmplo de Overfitting e Underfitting.

Figure 7.1: Exemplo de Underfitting e Overfitting.
Fonte: https://didatica.tech/
Para a situação acima, o modelo bem ajustado seria algo próximo ao que é mostrado na Figura 7.2, onde a linha azul representa o ajuste adequado para os dados.

Figure 7.2: Exemplo de Underfitting e Overfitting e uma ajuste adequado.
Fonte: https://didatica.tech/