Module: SPSS : Analyse de données Responsable de cours et de TD: Mme Hentati Ka
Module: SPSS : Analyse de données Responsable de cours et de TD: Mme Hentati Kanoun Ines Université de Sfax Institut des Hautes Etudes Commerciales Niveau : 1ère année Filière :MP-Marketing digital Année Universitaire : 2021-2022 Série N°1 (Analyse en Composantes Principales) Etude de cas Le tableau de données suivant regroupe 10 étudiants sur lesquels on a observé la note sur 20 de quatre modules : le module de Probabilité, le module d’Informatique, le module de Mathématiques et le module de langue. Individus Probabilité Informatique Mathématiques Langue 1 14.97 12.4 11.55 8.24 2 13.15 12.55 11.4 13.64 3 12,7 9,75 16,95 10,94 4 14,48 7,45 16,35 8,58 5 11,76 13,5 8,55 11,88 6 7,88 9,25 15,05 10,8 7 15,56 11 11,9 7,76 8 12,33 9,3 10,65 9,32 9 13,9 12,1 10,9 9,08 10 10,15 10,85 11,55 8,76 On souhaite réaliser une Analyse en Composantes Principales Normée (ACP) sur ce tableau de données afin d’enextraire une information. 1) Compléter le tableau suivant : Variables Moyennes Ecarts-types Probabilité …. 2,2113 Informatique 10,815 1,7782 Mathématiques 12,485 …. Langue …. …. 2) Le tableau des données centrées réduites regroupant les 10 étudiants est présenté comme suit : Individus Probabilité Informatique Mathématiques Langue 1 …. 0,8913 -0,3637 -0.9400 2 0,2089 …. -0,4221 2,1178 3 0,0054 -0.5989 …. 0,5889 4 0,8104 -1,8924 1.5035 …. 5 -0,42 1,5099 -1,5307 1,1212 6 -2,1743 -0,8801 0,9978 0,5096 7 1,2988 0,10404 -0,2276 -1,2118 8 -0,1619 -0,85198 -0,7138 -0,3284 9 0,5481 0,72264 -0,6166 -0,4643 Page 1 sur 5 10 -1,1478 0,01968 -0,3637 -0,6455 Compléter le tableau des données centrées réduites (en justifiant le calcul de chaque valeur trouvée). 3) Dans le cadre de l’ACP normée, il convient de diagonaliser une matrice. Laquelle ? Justifier à l’aide d’un produit matriciel votre réponse (pas de valeurs numériques). 4) L’utilisation d’un logiciel a permis d’obtenir la matrice des corrélations suivantes : Commenter brièvement les coefficients 0,1513 et -0,7679. 5) Quels sont les variables les plus fortement corrélées entre eux ? 6) Quelle est la propriété qui permet sans calcul de déterminer l’inertie totale ? Combien vaut-elle dans le cas présent ? 7) La réalisation de l’ACP a donné les valeurs propres suivantes : Calculer la dernière valeur propre. 8) Calculer l’inertie associée à chacun des axes. 9) Selon le critère de la moyenne (critère de Kaiser) combien d’axes doit-on conserver ? Justifier votre réponse. 10) Les composantes principales issues de l’analyse sont les suivantes : Identifiant Comp.1 Comp.2 Comp.3 Comp.4 1 -0,625 -1,4957 0,0011 -0,4976 2 -1,61 1,0861 1,3466 0,2721 3 1,3616 0,7184 1,0829 -0,4238 4 2,4754 -0,695 0,5518 0,3769 5 -2,3618 0,6727 -0,1164 0,1093 6 1,2207 2,1638 -0,7192 -0,261 7 0,0798 -1,7913 -0,0071 -0,0514 8 0,24 -0,1581 -0,701 0,8919 9 -0,7903 -0,8614 -0,1427 -0,1775 10 0,0097 0,3605 -1,296 -0,2389 Comment peut-on identifier les individus qui contribuentfortement à la formation de chacun des axes ? Justifier votre réponse. 11) On souhaite déterminer la contribution des individus à la formation de chacun des axes. Dans ce but, rappeler la formule qui permet de réaliser ces calculs, puis compléter le tableau suivant : Page 2 sur 5 Individus CTA1(i) (%) CTA2(i) (%) 1 2,09 ….. 2 13,85 8,64 3 9,9 3,78 4 32,73 3,54 5 ….. 3.31 6 ….. ….. 7 0,03 23,5 8 0,31 0,18 9 3,34 5,43 10 0 0,95 12) Déterminer explicitement les individus qui contribuent significativement à la formation des deux premiers axes. 13) On souhaite maintenant déterminer les qualités de représentation des individus sur chacun des axes puis sur le plan principal. Dans ce but, rappeler les formules permettant de réaliser ces calculs, puis compléter le tableau suivant : Individu s Quali (1) (%) Quali (2) (%) Quali (1 × 2) (%) 1 13,59 77,8 ….. 2 ….. 20,84 ….. 3 49,81 13,87 ….. 4 86,83 6,84 ….. 5 92,11 7,47 ….. 6 22,05 69,29 ….. 7 0.197 ….. ….. 8 4,21 1,82 ….. 9 ….. 52,31 ….. 10 0 6,96 ….. 14) Quels sont les individus qui sont bien représentés et les individus mal représentés dans le plan principal ? 15) Les coordonnées des variables sur les deux premiers axes (corrélation entre la variable j et la composante k) sont présentées par le tableau suivant : Page 3 sur 5 Identifier les variables corrélées avec chacun des axes (on précisera si la corrélation est positive ou négative). 16) La représentation graphique des variables montre qu'elles sont toutes très bien représentées dans le plan (Facteur 1, Facteur 2). Justifier cette affirmation. 17) Quelles sont les variables qui jouent un rôle dominant dans la formation du premier et du deuxième axe. Page 4 sur 5 Corr(j,1) Corr(j,2) Probabilité -0,07 -0,85 Informatique -0,95 -0,08 Mathématique s 0,88 0,20 Langue -0,41 0,76 5 uploads/Management/ serie-1-ad.pdf
Documents similaires
-
14
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Fev 17, 2022
- Catégorie Management
- Langue French
- Taille du fichier 0.1385MB