Plan: Introduction Définition et notions de bases Analyse Multivariée: - ANALYS
Plan: Introduction Définition et notions de bases Analyse Multivariée: - ANALYSE EN COMPOSANTES PRINCIPALES (ACP) - ANALYSE FACTORIELLE DES CORRESPONDANCES (AFC) ANALYSE DESCRIMINANTE Introduction: Dans une enquête de terrain, une fois les questionnaires sont remplis, on passe par un ensemble des étapes : 1- La saisie des données. 2- Le contrôle des 29/12/2020 1 PROFESSEUR: Mr. HICHAM GOUMRHAR ANALYSE DES DONNEES TRE D’ETUDE ET DE FORMATION –EL OUATIA- UNIVERSITE IBN-ZOHR- AGADIR EN C BIBLIOGRAPHIE: ALALOUF. S. 1990, « INTRODUCTION A LA STATISTIQUE APPLIQUEE », WESLEY. CLAUSTIAUX J.J, 1994, « L’ANALYSE DE LA VARIANCE », BIOMETRIE-PRAXIMETRIE. LAFORGE . H . 1989, « ANALYSE MULTIVARIEE », ÉDITION ÉTUDES VIVANTES. MONTRÉAL. PIERRE DAGNELIE, 1981, « ANALYSE STATISTIQUE à PLUSIEURS VARIABLES », LES PRESSES AGRONOMIQUES DE GEMBLOUX. PALM. R, 1994, « LES METHODES D’ANALYSE FACTORIELLE: PRINCIPES ET APPLICATIONS », UER DE STATISTIQUE ET INFORMATIQUE, FACULTES DES SCIENCES AGRONOMIQUES B- 5030, GEMBLOUX. 3.1 Analyse unidimensionnelle (ou univariée): consiste l’étude d’ une seule variable. 3.2 Analyse bidimensionnelle (ou analyse bivariée): c’est l’étude de la relation entre deux variables. La saisie des données : Consiste à reporter les codes qui existent sur le questionnaire sur une plateforme informatique sous forme d’une matrice de données (variables/individus ou entreprise) en utilisant un program Le contrôle des données : Cette étape consiste à détecter parmi les données saisies celles qui sont erronées pour les corriger ou les supprimer. Cette opération est nommée « épuration des données », elle comporte de le contrôle de validité. le contrôle de cohérence. 29/12/2020 2 3. Analyse des données: L’analyse des données peut faire l’objet : D’une variable (on De deux variables De plusieurs variables parle d’une analyse (on parle d’une (on parle ici d’une unidimensionnelle) analyse analyse bidimensionnelle) multidimensionnelles) I. L’ANALYSE EN COMPOSANTES PRINCIPALES (ACP) 29/12/2020 3 3.3. Analyse multidimensionnelle Analyse multidimensionnelle (ou plurivariée ou multivariée) : consiste à étudier la relation entre deux ou plusieurs variables. Ce type d’analyse recouvre un ensemble de méthodes statistiques multidimensionnelles. Ces méthodes permettent une étude globale des individus et des variables. Le choix d’une méthode d’analyse des données multidimensionnelle dépend essentiellement de deux critères: 1. Objectifs de l’analyse : on peut distinguer deux groupes de méthodes: Méthodes explicatives; méthodes descriptives. 2. La nature de la variable: quantitative ou qualitative (ordinale ou nominale). Les méthodes explicatives: dans ce cas la matrice des données présente deux ou plusieurs groupes distincts de variables, une ou plusieurs variables dépendantes et une ou plusieurs variables explicatives, et un seul groupe d’individus. Ces méthodes tentent d’expliquer une variable dépendante au moyen (en fonction) d’une ou plusieurs variables explicatives… …Selon la nature de la variable à expliquer et des variables explicatives, on distingue plusieurs méthodes (la régression linéaire, l’analyse de la variance, l’analyse discriminante et l’analyse conjointe). Les méthodes descriptives : dans ce cas la matrice des données concerne un seul groupe de variables et deux ou plusieurs groupes distincts d’individus. Ces méthodes tentent de fournir une information synthétisée….Selon la nature des variables, on distingue plusieurs méthodes. L’analyse en composantes principales, l’analyse factorielle des correspondances, l’analyse typologique ou classification. L’Analyse en composantes principales effectue une simple rotation (rotation rigide) des axes X1 et X2 pour obtenir de nouveaux axes Y1 et Y2 appelés « composantes » qui sont non corrélées entre elles et à variance ordonnée comme l’indique la figure ci-dessous (figure 2). 1.1. Principes et définition: L’analyse en composantes principales créée par (Hotelling en 1933) est une méthode descriptive qui a pour but l’analyse des tableaux de données/observations ne comportant à priori aucune L’objectif de l’ACP est de résumer l’information contenue dans un tableau, constitué souvent d’un nombre élevé de lignes et de colonnes, en quelques représentations graphiques à deux dim Illustration: Soit le cas d’un nuage de points pour deux variables X1 et X2 normales centrées réduites c-à-dire moyenne=0 et Ecart-type = 1). 29/12/2020 4 L’ACP est utilisée dans le cas de plusieurs individus (n individus) mesurés par rapport à un grand nombre de variables (X1….Xp). Or, ces variables sont souvent corrélées entre elles et représentent des parts à peu près égales d’explication des variations observées dans les données (à variance égale). Graphiquement, le nuage de points, représentant les données, s’inscrit dans un espace à (P) dimensions puisque chaque point représente un individu mesuré par rapport à X1 , X2 , ,Xp, ce qui est pratiquement impossible à représenter. En plus la dispersion du nuage de points sur les différentes dimensions est à peu près égale. Pour résoudre ce problème, l’ACP effectue une simple rotation des axes pour obtenir de nouveaux axes appelés composantes A partir des variables initiales, l’ACP consiste à calculer des nouvelles variables, appelées composantes et qui sont des combinaisons linéaires des variables initiales. Telle que : C1 = a11X’1 + a21X’2+…..+ap1X’p telle que la variance de C1 soit maximale parmi toutes les autres combinaisons linéaires (C2,C3…..Cn) . C2 = a12X’1 + a22X’2+…..+ap2X’p telle que C2 est non corrélée avec C1 corrélation (C1,C2)=0, et C2 possède la variance maximale parmi toutes les combinaisons linéaires qui ne sont pas corrélées avec C1. C3 = a13X’1 + a23X’2+…..+ap3X’p telle que C3 est non corrélée avec C1 et C2 corrélation (C2,C3)=0 et (C1,C3)=0, et C3 possède la variance maximale parmi toutes les combinaisons linéaires qui ne sont pas corrélées Figure 1 : nuage de points dans un espace à 2 dimensions ACP L’analyse en composantes principales (ACP) permet d’obtenir de nouvelles variables, appelées « composantes », qui seront non corrélées entre elles et à variance o 1.2. Calculs et interprétation des composantes: On dispose de (n) individus caractérisés par (p) variables quantitatives. Les données se représentent sous la forme d’un tableau appelé matrice des données de dimensions (n x p). Les « P » variables sont le plus souvent de nature différente, c’est la raison pour laquelle les variables seront centrées et réduites pour homogénéiser les unités Xp’=. On remplace les variable 29/12/2020 5 La matrice de corrélation, et d’autre part, l’indice de KMO (Kaiser-Meyer-Olkin) et le test de sphéricité de Bartlett. La matrice de corrélation doit montrer une forte liaison entre la majorité de nos variables (>0,6). De même pour notre indice KMO qui doit tendre vers 1 (>0,7) avec une signification du test de Bartlett qui doit tend vers 0 (<0,05), confirmant ainsi la possibilité de factorisation dans notre cas. Remarque: Les composantes sont toujours de moyennes nulles et de variances égales aux valeurs propres ordonnés : λ1 >λ2 >... λp > 0 . 1.3. Les propriétés des composantes: Les composantes calculées, à partir de l’ACP, possèdent un certain nombre de propriétés : Var (Ci) = λi Corrélation (Ci ; Cj) = 0 = p ; la somme des valeurs propres correspondent au nombre de variables initiales. La valeur propre (ou la variance de la composante) exprimée en pourcentage représente le pourcentage de la variance totale expliquée par la composante Ci. Les variances cumulées exprimées en pourcentage indiquent respectivement le pourcentage de la variance totale expliquée par la première composante, les deux premières composantes, les tro Interprétation des résultats de l’analyse à composantes principales (ACP): L’ACP passe par plusieurs étapes : Repérage des observations aberrantes: éliminer les données manquantes ou aberrantes (ou extrêm L’analyse de la matrice de corrélation des variables initiales: l’analyse de la matrice de corrélat 29/12/2020 6 4. Interprétation des axes factoriels: Dans cette étape, on interprète les axes factoriels en se basant sur le niveau et le sens de corrélation entre les composantes principales et les variables initiales. Ces corrélations sont représentées sur un graphique appelé « cercle de corrélation ». On cherche les variables initiales qui sont fortement corrélées avec les axes, ce qui permet de donner une interprétation aux axes. Exemple: cercle de corrélation : jeu des données des cours: 29/12/2020 7 3. Choix des composantes principales: Dans la littérature statistique , on trouve plusieurs règles : la règle empirique proposée par le statisticien Kaiser en 1960 consiste à retenir les composantes principales dont la valeur propre correspondante est supérieure à 1 (λi > 1). Selon la règle empirique proposée par Cattell (1966) appelée « test de Talus » (scree test), on retient les composantes dont les valeurs propres correspondantes sont au-dessus de la droite joignant les dernières valeurs propres. Cette règle se base sur le graphique des valeurs propres de la matrice de corrélation R en fonction de leur rang. Exemple: cercle de corrélation : jeu des données des cours: 5. Représentation des individus: Les scores des individus (donnés par l’exercice c’est l’ordre des individus) sur les composantes principales, appelés aussi les coordonnées en composantes « factor scores », peuvent être représ Étant donné que l’étape précédente détermine le positionnement des variables d’origine par rapport aux axes principaux, cette étape permet de savoir le positionnement des individus par rapport EXEMPLE : DIAGRAMME DE DISPERSION 29/12/2020 8 PROCÉDURES DE L’ACP (SPSS) Procédures (ACP) sur SPSS (1/2): Analyse Factorisation (ou réduction des dimensions) Analyse factorielle Dans Variables, sélectionner toutes les variables métriques à factoriser. Dans Caractéristiques, cocher caractéristiques uni variées et coefficients de corrélation. Dans Extraction, cocher Graphique des valeurs propres et dans nombre de uploads/Management/ l-x27-analyse-des-donnees-alouatia-2020-1partie-acp-afc-1.pdf
Documents similaires
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/1KrSJp5yR1kuWxmZ8zqym6Skkf6K802r0BrhM4AOfeZKh19TlMNsoxQk4vl0m1r1z3OZ0AIMNGtJ295pzrUscSCI.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/l94ouwYvQZtA9bdauMSc8oCW2RILghIvJPPyb9ampkG6wluPEJkLSq2Kfm0cggBfyHRWgWIitnwg4gUwPw3V5uwx.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/fpg8Y8oULvqQy7hU0bRw4Q91IjK5yRRFsolMerE9fBVLQgcB56Ja46PxP1Y198frHce1IzLTzJyrjQcj0l2EY3a6.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/TSGNAPPg1eUqYCf9XhIXpp09qnY6Ue8HZfQ4L8r9GWbY5rre1hdw9tM0oxf0gzqnHsNYS9rs4DiMyHFSMKeqpGB5.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/k3uF9dFfe5CAtfScKPPKK7XtT8qvNvj8GLF33xePBhs41Ikm4S3Z1UuDmr2scHB5d4hiOysC5RU340Q1AgxvyjaH.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/OH6CqlrfyYZkZwtTyBcsLAN8jMJQr24OFOp46CUV9w6nzlXhRYDcw2EkB3zXWVay3XeKe06oZdnYzfbYlKRiOVue.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/JIzoL4kNNpaJiL03WYZxOYoFEW9InXugBkQg8kxaS4XICaqZW2LQn0jBg8rFVoz54fXHGYaaJcnZGExQXaJL2c5w.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/DCGCc9t2nWlFIeyLFLE3rDWtN39J2Ys3QYaxa1hKFgd3YBWtyjJsTFOWYBtdi3ONgAqriqTqUrzK666EwDzLipP9.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/Ow88a0cSRNAQ7AMPC6EKswDJy4lUFzPtMXtLzBxbIDxDlOu1lut9Mak05N2H78YJZw9LRPM6zKm2rMlVSBoBYt7J.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/JuhU5dT9kF1sZAjS1SsOmqbr6Tr64PWcyrplzW84pJxnnXZhFb7guPfmWcaJjzHELtLHVFLmsuWPHCvKY7cbyqNQ.png)
-
22
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Sep 13, 2021
- Catégorie Management
- Langue French
- Taille du fichier 0.9913MB