1 L’Analyse en Composantes Principales: A.C.P. ou carte perceptuelle ou mapping

1 L’Analyse en Composantes Principales: A.C.P. ou carte perceptuelle ou mapping. 2 Réaliser une analyse en composantes principales c’est représenter dans un espace de dimension faible par exemple 2 une information dont on dispose dans un espace de dimension élevée n ou p avec l’objectif de restituer dans cette opération une quantité d’information maximale par rapport à l’information disponible dans le fichier de base. 3 Individus Poids Taille Age Note 1 45 150 13 14 2 50 160 13 15 3 50 165 13 16 4 60 175 15 9 5 60 170 14 10 6 60 170 14 7 7 70 160 14 8 8 65 160 13 13 9 60 155 15 17 10 65 170 14 11 Individus Axe 1? Axe 2? 1 -1,62 -0,20 2 -1,09 -0,52 3 -0,98 -0,72 4 1,27 0,09 5 0,67 -0,46 6 0,90 -0,90 7 0,81 0,35 8 -0,26 -0,16 9 -0,34 2,63 10 0,71 -0,10 Par exemple, du fichier disponible ( tableau 1), on déduira les coordonnées des individus dans un espace de dimension deux (tableau 2) Tableau1 Tableau2 Quantité d’information? 4 Individus Axe 1 Axe 2 1 -1,62 -0,20 2 -1,09 -0,52 3 -0,98 -0,72 4 1,27 0,09 5 0,67 -0,46 6 0,90 -0,90 7 0,81 0,35 8 -0,26 -0,16 9 -0,34 2,63 10 0,71 -0,10 1 2 3 8 10 5 6 4 7 9 Tableau2 Graphe 1 Quantité d’information restituée? 5 Individus Axe 1 Axe 2 Axe 3 1 -1,62 -0,20 -0,17 2 -1,09 -0,52 0,30 3 -0,98 -0,72 0,86 4 1,27 0,09 1,48 5 0,67 -0,46 0,37 6 0,90 -0,90 0,07 7 0,81 0,35 -1,81 8 -0,26 -0,16 -1,51 9 -0,34 2,63 0,46 10 0,71 -0,10 -0,06 Axe 2 Peut-on améliorer l’image? 3 2 1 9 4 5 8 6 10 7 Axe 1 Axe 3 Axe 2 1 2 3 8 10 5 6 4 7 9 Axe 1 Axe 2 1 6 3 6 5 2 4 9 7 8 1 10 3 2 1 9 4 5 8 6 10 7 Axe 1 Axe 3 Axe 2 1 2 3 8 10 5 6 4 7 9 Axe 1 Axe 2 Axe 2 Axe 3 6 7 . 1 . 2 . 3 . 9 . 8 . 7 . 6 . 10 . 5 . 4 Axe 1 Axe 3 Axe 2 8 p j j n np nj n i ip ij i p j i p j N N N N M x x x n M x x x i M x x x M X X X                     1 1 1 1 1 1 11 1 1   n à de ie i où m M i i 1 var ,   N f où j iede à p j j , var 1 11. Du tableau de base on déduit l’un des deux nuages possibles, individus ou variables. 12. On détermine ensuite l’inertie I, c’est-à-dire la dispersion du nuage par rapport à son centre de gravité. 1. Le schéma de travail: 9 Individus Axe 1 Axe 2 M’1 … M’i … M’n Ceci constitue un nouveau nuage de points pour lequel on détermine l’inertie I’. On compare I’ avec I. Si le ratio est bon, on peut conserver l’image.   m à de ie i où m M i i 1 var , ' . M’1 . M’i . M’n 13. Réaliser une A.C.P. c’est déterminer un espace de dimension faible dans lequel le nuage choisi sera projeté orthogonalement. . M’1 . M’i 10 Fichier de base: individus i de poids respectifs mi Espace de dimension élevée dans lequel les individus sont représentés par des points Mi. axe factoriel 1 Inertie I' Inertie I A. C.P réalisée de telle sorte que le ratio I'/I soit le plus élevé possible. Analyse et retour sur étude. 11 2. L’inertie La forme mathématique de l’inertie est la suivante: Lorsque les variables sont centrées, c’est-à-dire lorsqu’à chaque valeur on a enlevé la valeur moyenne, l’inertie est égale à la somme des variances des variables que l’on soumet à l’analyse. A ce titre l’inertie est une généralisation de la notion de variance. Lorsque les points représentant les individus sont proches du centre de gravité, l’inertie est faible. Lorsque l’inertie est faible, les points sont proches du centre de gravité et il n’y a pas lieu de stratifier. 2 1 i n i i i GM m I           p j j j X V I 1 12 Lorsque les variables sont centrées et réduites, c’est-à-dire lorsque on a divisé chacune des valeurs centrées par l’écart type, l’inertie est égale au nombre de variables que l’on soumet à l’étude soit p. 13 3. Matrice d’inertie La réalisation d’une ACP est construite sur les qualités d’une matrice qui porte le nom de matrice d’inertie. Celle-ci est définie de la manière suivante: ' 1 i i n i i i GM GM m M     Chaque produit s’exprime par la relation: ' i i GM GM                  2 1 2 2 2 1 2 1 2 1 2 1 ' ip i ip ip i i i i ip i i i i i i x x x x x x x x x x x x x GM GM        et la matrice d’inertie par la relation: 14                                                                                                              p i ip n i i i ip i n i i i i i n i i i ip i n i i i i i n i i i ip n i i i i ip n i i i ip i n i i i i n i i i i i n i i i ip i n i i i i i n i i i i n i i i ip i ip ip i i i i ip i i i i n i i i i i n i i i X V x x m x x m X V x x m x x m x x m X V x m x x m x x m x m x x m x x m x x m x m x x x x x x x x x x x x x m GM GM m                         1 1 2 1 2 1 2 1 1 1 2 1 1 1 2 1 1 1 2 1 2 2 1 1 2 1 1 1 2 1 1 2 1 1 2 1 2 2 2 1 2 1 2 1 2 1 1 ' 1 15 31. Nous constatons que la trace de cette matrice, c’est-à-dire la somme de ses éléments diagonaux est égale à l’inertie de système. Ainsi, avons-nous la possibilité de caractériser la dispersion du nuage par les valeurs propres d’une matrice. En effet la trace est un invariant égal à la somme des valeurs propres.                  p j j p j j ij p j j n i i i I X V x m M Tr 1 1 2 1 1  Parce que l’inertie est identifiée aux valeurs propres d’une matrice, il est normal de sélectionner les plus importantes pour conserver au mieux l’information. Rangeons celles-ci par ordre décroissant et sélectionnons les plus fortes. p        2 1 Le taux de restitution de l’information dans un plan est donné par: 100 2 1    j     16 32. Lorsque l’analyste juge que ce taux est correct, il peut représenter son nuage en dimension 2. Le plan de projection est engendré par deux vecteurs propres associés aux deux plus grandes valeurs propres. Soit à résoudre les équations:        j j j j u Mu u  0 j uploads/Management/ cours-acp-un-exemple.pdf

  • 29
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Jan 08, 2021
  • Catégorie Management
  • Langue French
  • Taille du fichier 0.6594MB