5.1 Métricas
5.1.1 Matriz de confusión
También conocida como matriz de errores, es una tabla que ayuda a visualizar el rendimiento de un algoritmo de clasificación.

Figura 5.1: Matriz de confusión
Para diferenciar los cuatro términos lo mejor es un ejemplo:
![Cuatro imágenes valen más que cuatro mil palabras [@udemy]](imagenes/matriz.confusion.2.png)
Figura 5.2: Cuatro imágenes valen más que cuatro mil palabras (Portilla 2018)
Cuidadín, que las matrices de confusión que vamos a obtener nosotros están en otro orden:

Figura 5.3: Otra posible representación de la matriz de confusión
5.1.2 Exactitud, sensibilidad y precisión (Accuracy, recall & precision)
![[@udemy]](imagenes/matriz.confusion.3.png)
Figura 5.4: (Portilla 2018)
- La Exactitud (accuracy) responde a la pregunta ¿Cuál es la proporción de predicciones correctas?
- La Sensibilidad (recall) responde a la pregunta ¿Qué proporción de positivos reales se han predicho correctamente?
- La Precisión (precision) responde a la pregunta ¿Qué proporción de predicciones positivas es correcta?
Nótese que la sensibilidad y la precisión se definen aquí como proporción de positivos reales y proporción de predicciones positivas.
References
Portilla, Jose. 2018. Data Science and Machine Learning Bootcamp with R. https://www.udemy.com/data-science-and-machine-learning-bootcamp-with-r/.