4 Vraag4: Sars-cov-19 virus

(A1) Virussen introduceren nieuwe mutaties na iedere replicatie ronde. Het HIV virus heeft een kans op mutatie van 1 * 10-4 per nucleotide per replicatie cyclus. Dit betekent dat op 30.000 nucleotiden er per replicatie cyclus er 30.000 * 1 * 10-4 = 3 mutaties plaat vinden. Maak een histogram waarin de kans wordt weergegeven dat het virus 0 t/m 10 muaties heeft na 1 replicatie cyclus. Gebruik hiervoor de binominale distributie voor de berekening en ggplot voor het maken van een complete figuur

kans <- 0.0001
mutaties <- seq(0, 10, by = 1)
nucleotiden <- 50000
binomal <- dbinom(mutaties, nucleotiden, kans)
probabilities <- tibble(mutaties = mutaties, 
                        kans = binomal*100 
                        )

probabilities %>% ggplot(aes(x = factor(mutaties), y = kans )) +
  geom_col(fill = 'blue') +
  labs(title = "Kansverdeling mutaties",
       subtitle = "mutaties per 50.000 nucleotiden",
       x = "nr_mutaties",y = "kans op mutatie (%)") + 
  theme_classic()