Capítulo 5 Anexo {-}
La Figura 4.8 fue realizada con el siguiente código.
# Calculamos la supervivencia segun el factor Survived
sobrev <- titanic_train %>%
group_by(Survived) %>%
count()
# Supervivencia
# Cuál es el número de sobrevivientes?
g1 <- ggplot(titanic_train, aes(Survived)) +
geom_bar()+
# Agregamos la cuenta de sobrevivientes
# Notar que debemos utilizar otro data.frame en data
# vamos a utilizar y=20 para posicionar los n cerca del eje x
geom_text(data = sobrev,
aes(Survived, y=25, label=n),
color="white")+
xlab("Supervivencia")+
ylab("Frecuencia")
# Clase
# Cuál es la cantidad de pasajeros en cada clase?
g2 <- ggplot(titanic_train,
aes(Pclass))+
geom_bar()+
xlab("Clase")+
ylab("Frecuencia")
# Sexo
# cuántos hombres y mujeres a bordo?
g3 <- ggplot(titanic_train,
aes(Sex))+
geom_bar()+
xlab("Sexo")+
ylab("Frecuencia")
# Lugar de embarque
# dónde (en qué puerto) subió la gente al barco?
g4 <- ggplot(titanic_train,
aes(Embarked))+
geom_bar()+
xlab("Lugar embarque")+
ylab("Frecuencia")
# Edad de los pasajeros
# Cuál es la distribución de edades de los pasajeros?
g5 <- ggplot(titanic_train,
aes(Age))+
geom_histogram(binwidth = 5, color="white")+
xlab("Edad")+
ylab("Frecuencia")
# Precio del ticket
# Cuánto costaba subir al Titanic?
g6 <- ggplot(titanic_train,
aes(Fare))+
geom_density(fill="gray50")+
xlab("Precio Ticket")+
ylab("Frecuencia")
# Graficar todo junto!
cowplot::plot_grid(g1,g2,g3,g4,g5,g6,
labels="AUTO")