Capítulo 5 Anexo {-}

La Figura 4.8 fue realizada con el siguiente código.

# Calculamos la supervivencia segun el factor Survived
sobrev <- titanic_train %>%
          group_by(Survived) %>%
          count()

# Supervivencia
# Cuál es el número de sobrevivientes?
g1 <- ggplot(titanic_train, aes(Survived)) +
  geom_bar()+
  # Agregamos la cuenta de sobrevivientes
  # Notar que debemos utilizar otro data.frame en data
  # vamos a utilizar y=20 para posicionar los n cerca del eje x
  geom_text(data = sobrev,
            aes(Survived, y=25, label=n),
            color="white")+
  xlab("Supervivencia")+
  ylab("Frecuencia")

# Clase
# Cuál es la cantidad de pasajeros en cada clase?
g2 <- ggplot(titanic_train,
             aes(Pclass))+
  geom_bar()+
  xlab("Clase")+
  ylab("Frecuencia")


# Sexo
# cuántos hombres y mujeres a bordo?
g3 <- ggplot(titanic_train,
             aes(Sex))+
  geom_bar()+
  xlab("Sexo")+
  ylab("Frecuencia")

# Lugar de embarque
# dónde (en qué puerto) subió la gente al barco?
g4 <- ggplot(titanic_train,
             aes(Embarked))+
  geom_bar()+
  xlab("Lugar embarque")+
  ylab("Frecuencia")

# Edad de los pasajeros
# Cuál es la distribución de edades de los pasajeros?
g5 <- ggplot(titanic_train,
             aes(Age))+
  geom_histogram(binwidth = 5, color="white")+
  xlab("Edad")+
  ylab("Frecuencia")


# Precio del ticket
# Cuánto costaba subir al Titanic?
g6 <- ggplot(titanic_train,
             aes(Fare))+
  geom_density(fill="gray50")+
  xlab("Precio Ticket")+
  ylab("Frecuencia")


# Graficar todo junto!
cowplot::plot_grid(g1,g2,g3,g4,g5,g6,
                   labels="AUTO")