Devoir d’analyse de données Cours dirigé par : M NIAMSI EMALIO Yannick Rédigée

Devoir d’analyse de données Cours dirigé par : M NIAMSI EMALIO Yannick Rédigée par : TIMAMO Viorika Shany Marion ETUDIANTE EN 4EME ANNÉE option ISI (Informatique et système d’information) 1 Table des matières I. Comparaison de deux moyennes .................................................................... 2 a) Analyse de la variable TAS ......................................................................... 2 b) Analyse de sous-groupes ............................................................................. 2 c) Hypothèses ................................................................................................... 3 d) Prédictions .................................................................................................... 3 e) Confrontation : test de Student .................................................................... 3 f) Interprétation ................................................................................................ 3 II. Comparaison de deux pourcentages observés ................................................ 4 a) Hypothèses ................................................................................................... 4 b) Prédictions .................................................................................................... 4 c) Confrontation ............................................................................................... 4 d) Interprétation ................................................................................................ 4 III. Corrélation ................................................................................................... 5 a) Hypothèses ................................................................................................... 5 b) Prédictions .................................................................................................... 5 c) Confrontation ............................................................................................... 5 d) Interprétation ................................................................................................ 5 IV. Comparaison de plusieurs pourcentages observés ....................................... 6 a) Hypothèses ................................................................................................... 6 b) Prédictions .................................................................................................... 6 c) Confrontation ............................................................................................... 6 d) Interprétation ................................................................................................ 6 2 I. Comparaison de deux moyennes a) Analyse de la variable TAS setwd("C:/Users/timam/Documents/Inge 4/Analyse de données") tabac = read.csv2("TABAC.csv", header = T) attach(tabac)  Moyenne globale de la TAS mean(TAS)  Variance globale de la TAS var(TAS)  Graphiques hist(TAS) boxplot(TAS, horizontal = T) b) Analyse de sous-groupes Femme VS Homme mean(TAS[SEXE == 0]) var(TAS[SEXE == 0]) hist(TAS[SEXE == 0]) boxplot(TAS[SEXE == 0]) mean(TAS[SEXE == 1]) var(TAS[SEXE == 1]) 3 hist(TAS[SEXE == 1]) boxplot(TAS[SEXE == 1]) c) Hypothèses H0 : Il n’y a pas de différence en moyenne. H1 : Il existe une différence de TAS moyenne entre les hommes et les femmes. d) Prédictions o Normalité qqnorm(TAS[SEXE == 0]) qqnorm(TAS[SEXE == 1]) o Indépendance des individus o Egalité des variances var.test(TAS[SEXE == 0], TAS[SEXE == 1]) e) Confrontation : test de Student t.test(TAS[SEXE == 0], TAS[SEXE == 1],var.equal = TRUE) f) Interprétation o P<0.05 o Test significatif o Non rejette H0 o Il y a une différence entre les deux groupes 4 II. Comparaison de deux pourcentages observés a) Hypothèses H0 : Pas de différence entre les hommes et les femmes H1 : Différence entre le pourcentage de cancer des hommes et des femmes b) Prédictions Sous H0 et si les conditions d’applications sont respectées table(SEXE, K) NK K Totaux Pourcentages F 8 8,5 8 7,5 16 50% H 9 8,5 7 7,5 16 50% Totaux 17 15 32 Pourcentages 53% 47% 100% Conditions o Cij>5 o Indépendance des individus c) Confrontation chisq.test(SEXE, K, correct=FALSE) d) Interprétation o p>0.05 5 o Test non significatif o Non rejet de H0 o Pas de mise en évidence de la différence entre les deux pourcentages de cancer. III. Corrélation a) Hypothèses H0 : ρ=0, pas de lien entre TAS et DOSAGE H1 : ρ != 0, lien entre TAS et DOSAGE b) Prédictions Conditions d’applications o Relation linéaire entre X et Y o Loi conditionnelle normale o Variance conditionnelle constante o Independence des individus c) Confrontation cor.test(TAS, DOSAGE) d) Interprétation o p<0.05 o Test significatif o Rejet de H0 o Lien entre le TAS et le DOSAGE 6 o Lorsque le DOSAGE augmente, le TAS augmente (r=0.83 [0.67 ; 0.91]) IV. Comparaison de plusieurs pourcentages observés a) Hypothèses H0 : Il n’y a pas de différence entre les pourcentages. H1 : Il y a au moins une différence entre les pourcentages. b) Prédictions Sous H0 et si les conditions d’application sont respectées table(SEXE, ATCD) ATCD 0 ATCD 1 ATCD 2 Totaux F 6 6 4 16 H 4 4 8 16 Totaux 10 10 12 32 Conditions o Cij>5 o Indépendance des individus c) Confrontation chisq.test(SEXE,ATCD,correct = FALSE) d) Interprétation o p>0.05 o Test non significatif o Non rejet de H0 7 o Pas de différence entre les trois pourcentages uploads/Management/ devoir-d-x27-analyse-de-donnees-de-timamo-marion.pdf

  • 24
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Mar 20, 2022
  • Catégorie Management
  • Langue French
  • Taille du fichier 0.4006MB