Chapitre 2 l x27 analyse en composantes principales acp 1
Module d ? Analyse des Données ème année Economie et Prospective Chapitre L ? Analyse en Composantes Principales ACP Introduction L ? Analyse en Composantes Principales ACP est sans doute la méthode d ? analyse de données la plus connue et la plus utilisée Proposée dès les années par HOTELLING mais nécessitant d ? importants calculs numériques L ? ACP n ? est devenue une technique opérationnelle qu ? à partir des années avec le développement des moyens de calculs informatique Elle est la méthode de base en statistique exploratoire multidimensionnelle ou analyse des données - Multidimensionnelle l ? analyse porte sur plusieurs variables - Exploratoire descriptive par opposition à inférentielle Il s ? agit de résumer l ? information portant sur plusieurs variables en - faisant émerger des liaisons entre variables - formant des groupes d ? individus se ressemblant L ? analyse en composantes principales présente de nombreuses variantes selon les transformations apportées au tableau de données le nuage de points des individus peut être centré ou non parmi ces variantes l ? analyse en composantes principales normée nuage centréréduit certainement la plus utilisée Les données en ACP En ACP les données se présentent dans un tableau X à n lignes et p colonnes o? Chaque ligne représente un individu - Chaque colonne représente une variable Les variables sont quantitatives la matrice X est constituée de valeurs numériques Analyse des données CModule d ? Analyse des Données ème année Economie et Prospective X est une matrice n ? p de valeurs numériques Un individu est un élément de Le ième individu Une variable est un élément de La jème variable Analyse des données CModule d ? Analyse des Données ème année Economie et Prospective Principe de l ? ACP Le principe de l ? ACP est d ? obtenir une représentation approchée du nuage des individus N I dans un sous espace de faible dimension k inférieur ou égale à p et pour cela on projette les individus sur un sous espace de dimension faible le choix de sous espace de projection s ? e ?ectue suivant le critère les distances en projection doivent être déformées le plus possible ? ce qui veut dire l ? inertie du nuage projetée sur le sous espace F doit être maximale On dispose des observations de p variables quantitatives sur n individus on associe à chaque individu poids Pi Les valeurs sont rangées dans un tableau à n lignes et p colonnes On note X la matrice associée à ce tableau O? est la valeur prise par la variable j sur l ? individu i on peut écrire aussi Une variable j sera identi ?é au vecteur et un individu i sera identi ?é au Vecteur Les Poids a ?ectés aux Individus Données Centrées Réduites A La Matrice des Poids A ?n de calculer la distance entre deux variables il est parfois nécessaire d ? attribuer des poids aux individus selon l ? importance que l ? on souhaite leur donner
Documents similaires










-
26
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise- Détails
- Publié le Apv 09, 2021
- Catégorie Management
- Langue French
- Taille du fichier 54.8kB