Dans la lignée de la semaine 1, ce devoir porte sur l’étude évaluant la qualité de relation et la quantité d’information reçue par des patients lors d’un séjour à l’hôpital. 534 patients ont été recrutés sur plusieurs hôpitaux de la région parisienne.
Pour effectuer des calculs quels qu’ils soient, il faut tout d’abord charger le fichier de données pour obtenir un dataframe utilisable par R
Transformez la variable « recommander » en une variable binaire « recommander.b » : « recommander.b » vaut 0 si « recommander » vaut 0 ou 1 ; « recommander.b » vaut 1 si « recommander » vaut 2.
satpatient$recommander.b<-ifelse(satpatient$recommander==2,1,0)
table(satpatient$recommander,satpatient$recommander.b, useNA = "always")
##
## 0 1 <NA>
## 0 16 0 0
## 1 120 0 0
## 2 0 269 0
## <NA> 0 0 129
A l’aide d’un odds-ratio, estimez la force de l’association entre « recommander.b » et « sexe ». Estimez un intervalle de confiance de cet odds-ratio
##
## Fisher's Exact Test for Count Data
##
## data: satpatient$recommander.b and satpatient$sexe
## p-value = 0.7523
## alternative hypothesis: true odds ratio is not equal to 1
## 95 percent confidence interval:
## 0.7020996 1.6745388
## sample estimates:
## odds ratio
## 1.083487
L’oddsratio vaut 1.083487
Calculez la corrélation (de Pearson) entre « score.relation » et « age ». Testez statistiquement cette corrélation (le script doit inclure la vérification éventuelle des conditions de validité de la méthode utilisée). L’age suit à peu près une loi normale
Donc on peux utiliser le test de Pearson et on constate que la corrélation est faible mais le p est fort donc on rejete l’hypothèse: Il n’y a donc aucun rapport entre l’age et le score.relation
##
## Pearson's product-moment correlation
##
## data: satpatient$score.relation and satpatient$age
## t = 1.796, df = 347, p-value = 0.07336
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.009102243 0.198945290
## sample estimates:
## cor
## 0.09596955
La moyenne du score de relation est-il significativement différent chez les hommes et chez les femmes ? (le script doit inclure la vérification éventuelle des conditions de validité de la méthode utilisée) On calcul la moyenne par sexe et on émet l’hypothèse que la différence n’est pas significative (H0)
## 0 1
## 35.48087 34.92771
Pour valider l’hypothèse, on réalise un test de student
##
## Two Sample t-test
##
## data: satpatient$score.relation by satpatient$sexe
## t = 1.1166, df = 347, p-value = 0.2649
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -0.4212101 1.5275370
## sample estimates:
## mean in group 0 mean in group 1
## 35.48087 34.92771
le p est de 26% ce qui nous amène à accepter H0
#Pour effectuer des calculs quels qu'ils soient, il faut tout d'abord charger le fichier de données pour obtenir un dataframe utilisable par R
read.csv2("satisfaction_hopital.csv")->satpatient
####Q1####
satpatient$recommander.b<-ifelse(satpatient$recommander==2,1,0)
table(satpatient$recommander,satpatient$recommander.b, useNA = "always")
##
## 0 1 <NA>
## 0 16 0 0
## 1 120 0 0
## 2 0 269 0
## <NA> 0 0 129
##
## Fisher's Exact Test for Count Data
##
## data: satpatient$recommander.b and satpatient$sexe
## p-value = 0.7523
## alternative hypothesis: true odds ratio is not equal to 1
## 95 percent confidence interval:
## 0.7020996 1.6745388
## sample estimates:
## odds ratio
## 1.083487
#L'oddsratio vaut 1.083487
#L'intervalle de confiance à 95% est [0.70 ; 1.67]
####Q3####
#Avant de réaliser un test de Pearson, on vérifie que la distribution de la variable age suit une loi normale
hist(satpatient$age)
#Visuellement, on constate que c'est bien le cas. On peut donc exécuter un test de corrélation de Pearson
cor.test(satpatient$score.relation,satpatient$age)
##
## Pearson's product-moment correlation
##
## data: satpatient$score.relation and satpatient$age
## t = 1.796, df = 347, p-value = 0.07336
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.009102243 0.198945290
## sample estimates:
## cor
## 0.09596955
#Ce test expose 2 hypothèses: H0: il n'y a pas de corrélation / H1: il y a une corrélation
#Le test de Pearson doit permettre de rejeter ou non l'hypothèse H0 en fonction de la p-value.
#p-value = 7,3%, donc on ne peut pas rejeter H0: la corrélation n'est pas avérée.
####Q4####
#On calcul la moyenne par sexe
tab<-tapply(satpatient$score.relation, satpatient$sexe, mean, na.rm=TRUE)
tab
## 0 1
## 35.48087 34.92771
#On souhaite savoir si il y a 1 différence significative de moyenne de score.relation entre les 2 groupes H et F. Pour cela on efectue un test de Student dont les conditions de validité sont : (au moins 30 sujets par groupe OU la variable suit une loi normale) ET (la variance de la variable est identique dans chaque groupe)
hist(satpatient$score.relation) #la distribution n'est pas normale
#Pour mieux vérifier la normalité, on peux faire une diagramme de normalité
qqnorm(satpatient$score.relation);qqline(satpatient$score.relation)
##
## 0 1
## 268 266
#On a au moins 30 sujets par groupe (268 pour les H et 266 pour les F)
#Pour vérifier l'égalité de la variance () ou l'écart type (sd), on utilise by
by(satpatient$score.relation, satpatient$sexe, sd, na.rm = TRUE)
## satpatient$sexe: 0
## [1] 4.552311
## --------------------------------------------------------
## satpatient$sexe: 1
## [1] 4.697603
#Les deux valeurs sont proches
#Les conditions de validité du test étant avérées, on réalise un test Student
t.test(satpatient$score.relation~satpatient$sexe, var.equal = TRUE)
##
## Two Sample t-test
##
## data: satpatient$score.relation by satpatient$sexe
## t = 1.1166, df = 347, p-value = 0.2649
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -0.4212101 1.5275370
## sample estimates:
## mean in group 0 mean in group 1
## 35.48087 34.92771