Analyse en Composantes Principales Enoncé du TD EHTP : Analyse de données 2ème

Analyse en Composantes Principales Enoncé du TD EHTP : Analyse de données 2ème année Analyse de l’intelligence chez 40 étudiants 1. Problématique à étudier et Données utilisées (Source : Willerman, L., Schultz, R., Rutledge, J. N., and Bigler, E. (1991),“In Vivo Brain Size and Intelligence”, Intelligence, 15, 223-228.) Ce TD représente une étude sur les différents quotients intellectuels (total, verbal et performance) et leur relation avec la taille du cerveau et le sexe de l’individu caractérisé aussi par un poids et une taille. Cette base de données a été collectée à partir d’une étude faite par Willerman et al. (1991) dans une grande université (Southwestern University). Il a utilisé l’IRM pour déterminer la taille du cerveau de l’individu. Dans cette étude, les chercheurs ont sélectionné un échantillon de 40 droitiers anglophones qui ne présentent pas d’antécédents d’alcoolisme, d’inconscience, de dommage au cerveau, d’épilepsie, ou de maladie cardiaque. Analyser l’intelligence de ces 40 étudiants ? On dispose des informations suivantes sur 40 étudiants : Variable Détails Sexe Genre (Femelle F ou masculin M) FSIQ Score global du quotient intellectuel basé sur des tests de Wechsler VIQ Score verbal du quotient intellectuel basé sur des tests de Wechsler PIQ Score de performance du quotient intellectuel basé sur des tests de Wechsler Weight Poids de l’étudiant Height Taille de l’étudiant MRI Taille du cerveau (Magnetic Resonance Imaging) Le tableau des données ressemble à : ## FSIQ VIQ PIQ Weight Height MRI ## 1F 133 132 124 118 65 816932 ## 2M 140 150 124 118 73 1001121 ## 3M 139 123 150 143 74 1038437 ## 4M 133 129 128 172 69 965353 ## 5F 137 132 134 147 65 951545 ## 6F 99 90 110 146 69 928799 Résumé des variables ## FSIQ VIQ PIQ Weight Height MRI ## minimum 77.000 71.000 72.000 106.000 62.000 7.906190e+05 ## moyenne 113.450 112.350 111.025 150.950 68.825 9.087550e+05 ## maximum 144.000 150.000 150.000 192.000 77.000 1.079549e+06 ## variance 579.946 557.721 504.948 572.459 15.840 5.224695e+09 ## ecarttype 24.082 23.616 22.471 23.926 3.980 7.228205e+04 1 2. Les sorties de l’ACP 2.1 La matrice de corrélation correlmatrix=round(cor(data),3) correlmatrix ## FSIQ VIQ PIQ Weight Height MRI ## FSIQ 1.000 0.947 0.934 -0.126 -0.083 0.358 ## VIQ 0.947 1.000 0.778 -0.164 -0.068 0.337 ## PIQ 0.934 0.778 1.000 -0.053 -0.076 0.387 ## Weight -0.126 -0.164 -0.053 1.000 0.619 0.428 ## Height -0.083 -0.068 -0.076 0.619 1.000 0.595 ## MRI 0.358 0.337 0.387 0.428 0.595 1.000 2.2 Indice de KMO library(REdaS) ## Loading required package: grid KMOS(data) ## ## Kaiser-Meyer-Olkin Statistics ## ## Call: KMOS(x = data) ## ## Measures of Sampling Adequacy (MSA): ## FSIQ VIQ PIQ Weight Height MRI ## 0.4720980 0.4430278 0.4356506 0.7444658 0.5255177 0.5042543 ## ## KMO-Criterion: 0.4794199 2.3 Test de Sphéricité de Bartlett bart_spher(correlmatrix) ## Bartlett's Test of Sphericity ## ## Call: bart_spher(x = correlmatrix) ## ## X2 = 107.356 ## df = 15 ## p-value < 2.22e-16 2.4 Les valeurs propres library(FactoMineR) res.pca = PCA(data, scale.unit=TRUE, ncp=6, graph=F) res.pca$eig ## eigenvalue percentage of variance cumulative percentage of variance ## comp 1 2.974857911 49.58096519 49.58097 ## comp 2 2.076420855 34.60701425 84.18798 ## comp 3 0.457259208 7.62098681 91.80897 ## comp 4 0.297793866 4.96323110 96.77220 ## comp 5 0.191102700 3.18504500 99.95724 ## comp 6 0.002565459 0.04275765 100.00000 2 2.5 Le diagramme de Cattel - critère de Coude - Scree plot library(factoextra) ## Loading required package: ggplot2 ## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa fviz_eig(res.pca, addlabels = TRUE) 49.6% 34.6% 7.6% 5% 3.2% 0% 0 10 20 30 40 50 1 2 3 4 5 6 Dimensions Percentage of explained variances Scree plot 2.6 Projection des variables plot.PCA(res.pca, axes=c(1, 2), choix="var", new.plot=TRUE, title="Cercle de corrélation") FSIQ VIQ PIQ Weight Height MRI −1.0 −0.5 0.0 0.5 1.0 −1.0 −0.5 0.0 0.5 1.0 Dim 1 (49.58%) Dim 2 (34.61%) Cercle de corrélation 3 2.7 Projection des individus plot.PCA(res.pca, axes=c(1, 2), choix="ind", new.plot=TRUE, title="Graphe des individus") 1F 2M 3M 4M 5F 6F 7F 8F 9M 10M 11F 12M 13M 14F 15F 16F 17F 18M 19F 20M 21M 22M 23F 24M 25F 26M 27F 28M 29F 30F 31F 32M 33M 34M 35F 36F 37M 38F 39M 40M −2 0 2 4 −2 0 2 Dim 1 (49.58%) Dim 2 (34.61%) Graphe des individus 2.8 Les individus et variables : cos2, contribution, et coordonnées summary(res.pca, ncp=2, nb.dec=2, nbelements=Inf) ## ## Call: ## PCA(X = data, scale.unit = TRUE, ncp = 6, graph = F) ## ## ## Eigenvalues ## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6 ## Variance 2.97 2.08 0.46 0.30 0.19 0.00 ## % of var. 49.58 34.61 7.62 4.96 3.19 0.04 ## Cumulative % of var. 49.58 84.19 91.81 96.77 99.96 100.00 ## ## Individuals ## Dist Dim.1 ctr cos2 Dim.2 ctr cos2 ## 1F | 2.51 | 0.86 0.63 0.12 | -2.26 6.17 0.82 | ## 2M | 2.99 | 2.27 4.32 0.58 | 0.16 0.03 0.00 | ## 3M | 3.10 | 2.39 4.81 0.60 | 1.26 1.90 0.16 | ## 4M | 1.79 | 1.49 1.86 0.69 | 0.73 0.65 0.17 | ## 5F | 2.02 | 1.74 2.56 0.74 | -0.66 0.53 0.11 | ## 6F | 1.19 | -0.80 0.53 0.45 | 0.21 0.05 0.03 | ## 7F | 2.34 | 1.96 3.24 0.70 | -0.63 0.48 0.07 | ## 8F | 2.05 | -1.62 2.20 0.62 | 0.00 0.00 0.00 | ## 9M | 1.99 | -1.70 2.43 0.73 | -0.47 0.27 0.06 | ## 10M | 2.13 | 1.56 2.05 0.54 | 0.68 0.56 0.10 | ## 11F | 2.34 | 0.84 0.60 0.13 | -2.13 5.46 0.83 | ## 12M | 3.22 | 2.67 6.01 0.69 | 1.03 1.27 0.10 | ## 13M | 1.32 | 1.28 1.37 0.93 | 0.03 0.00 0.00 | 4 ## 14F | 2.20 | 1.48 1.83 0.45 | -0.16 0.03 0.01 | ## 15F | 1.57 | -1.35 1.54 0.75 | -0.59 0.42 0.14 | ## 16F | 2.47 | -2.22 4.16 0.81 | -0.47 0.26 0.04 | ## 17F | 1.77 | 0.90 0.69 0.26 | -1.15 1.58 0.42 | ## 18M | 2.07 | -0.77 0.49 0.14 | 1.90 4.35 0.84 | ## 19F | 2.09 | -1.39 1.61 0.44 | -1.23 1.81 0.34 | ## 20M | 2.69 | -2.33 4.58 0.75 | 1.14 1.57 0.18 | ## 21M | 2.48 | -2.11 3.74 0.72 | 1.12 1.52 0.21 | ## 22M | 2.92 | -1.18 1.17 0.16 | 2.32 6.47 0.63 | ## 23F | 3.11 | 0.95 0.77 0.09 | -2.85 9.75 0.84 | ## 24M | 2.19 | 1.99 3.33 0.82 | -0.59 0.41 0.07 | ## 25F | 2.85 | -1.69 2.39 0.35 | -2.13 5.48 0.56 | ## 26M | 2.37 | 2.01 3.40 0.72 | 0.87 0.91 0.13 | ## 27F | 2.54 | -2.32 4.51 0.83 | -0.86 0.90 0.12 | ## 28M | 3.46 | 0.00 0.00 0.00 | 3.37 13.70 0.95 | ## 29F | 3.93 | -2.98 7.44 0.57 | -2.44 7.17 0.39 | ## 30F | 1.36 | 0.83 0.58 0.38 | -0.55 0.36 0.16 | ## 31F | 2.38 | 1.07 0.97 0.20 | -2.07 5.17 0.76 | ## 32M | 2.90 | 2.24 4.23 0.60 | 0.63 0.48 0.05 | ## 33M | 2.93 | -0.28 0.07 0.01 | 2.89 10.08 0.97 | ## 34M | 2.13 | -1.70 2.43 0.64 | 0.82 0.80 0.15 | ## 35F | 2.41 | -2.29 4.42 0.91 | -0.69 0.57 0.08 | ## 36F | 1.52 | 1.42 1.70 0.88 | -0.17 0.04 0.01 | ## 37M | 2.22 | 2.01 3.41 0.82 | 0.13 0.02 0.00 | ## 38F | 2.06 | -1.70 2.44 0.68 | -0.73 0.65 0.13 | ## 39M | 2.72 | -2.08 3.63 0.58 | 1.24 1.84 0.21 | ## 40M | 2.79 | -1.49 1.87 0.29 | 2.28 6.28 0.67 | ## ## Variables ## Dim.1 ctr cos2 Dim.2 ctr cos2 ## FSIQ | 0.98 32.45 0.97 | -0.14 0.99 0.02 | ## VIQ | 0.93 29.06 0.86 | -0.15 1.13 0.02 | ## PIQ | 0.93 29.26 0.87 | -0.09 0.37 0.01 | ## Weight | -0.04 0.06 0.00 | 0.84 34.28 0.71 | ## Height | 0.03 0.04 0.00 | 0.90 39.20 0.81 | ## MRI | 0.52 9.13 0.27 | 0.71 24.02 0.50 | 5 3. Analysez les résultats ci-hauts et répondez aux questions suivantes : 3.1 Les données sont elles homogènes ? Fallait il diagonaliser la matrice de variance covariance P ou la matrice de corrélation Ω? Quels risques aurions nous couru si nous avons opté pour l’autre choix ? 3.2 Justifier, a posteriori et d’après le tableau des valeurs propres, le choix de la matrice de variance covariance ou la matrice de corrélation Ω? 3.3 Considérant le nuage de points à traiter, quelle est la coordonnée de l’étudiant 2M sur l’axe « MRI »? 3.4 Quelle est la valeur numérique de l’inertie du nuage des points traité ? 3.5 Les données sont-elles factorisables ? 3.6 Combien de CP retiendrez-vous (critère uploads/Management/ acp-intelligence-enonce-r.pdf

  • 30
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Jui 29, 2022
  • Catégorie Management
  • Langue French
  • Taille du fichier 0.2373MB