Cours Analyse des Données Mr Kamel HELALI 1 Chapitre III : Analyse Factorielle
Cours Analyse des Données Mr Kamel HELALI 1 Chapitre III : Analyse Factorielle des Correspondances (AFC) Introduction AFC est une analyse factorielle qui s’applique au tableau de contingence (c’est le tableau de comptage), elle est basée sur une métrique de « Chi Deux » ( 2 ). Elle considère d’une façon symétrique les lignes et les colonnes de la matrice. Il y a une dualité entre l’espace des colonnes et l’espace des lignes. Sa finalité, comme toutes les méthodes d’ordinations est de trouver le meilleur résumé possible dans un espace de dimensions réduite. Ce meilleur résumé est constitué d’un petit nombre d’axes qui maximisent l’inertie projetée. Elle va permettre une représentation simultanée des lignes et des colonnes dans l’espace de dimensions réduites cherchées. L’AFC est une représentation graphique des modalités de deux variables nominales permettant une perception et une analyse visuelle de leur interaction. La base de cette représentation est assez semblable de l’ACP et fait appel à la définition de « facteur » permettant une représentation plane aussi fidèle de la répartition des modalités. Par exemple, on peut représenter par des points dans un plan ou plusieurs plans factoriels de façon à ce que leur distance mutuelle soit interprétable en termes « d’attraction » ou « répulsion » de modalité. 1 - Analyse théorique de l’AFC L’AFC traite des tableaux de contingences (tableau de dépendance) dans les quels un couple (i, j) correspond à un nombre positif « nij » qui est en générale le résultat d’un dénombrement. Les données de base sont habituellement regroupées dans un tableau. On étudie simultanément, sur une population, deux variables qualitatives I et J pouvant prendre respectivement « m » et « p » valeurs. On note « nij » le nombre d’individus appartenant simultanément aux catégories i et j des variables I et J. Au tableau nij sont associés deux tableaux à une dimension chacun : le tableau des marges en ligne « ni. » et le tableau des marges en colonne « n.j », avec m i p j ij n n 1 1 . Formulaire de tableau de comptage : j=1 j=2 . . . j=p ni. i=1 n11 n12 n1p n1. i=2 n21 n22 n2p n2. . . . i=m nm1 nm2 nmp nm. n.j n.1 n.2 n.p n m modalités en ligne : V1 p modalités en colonne : V2 Cours Analyse des Données Mr Kamel HELALI 2 Passage à la fréquence : j=1 j=2 . . . j=p fi. i=1 f11 f12 f1p f1. i=2 f21 f22 f2p f2. . . . i=m fm1 fm2 fmp fm. f.j f.1 f.2 f.p f.. n n f ij ij ; p j ij i i f n n f 1 . . ; m i ij j f n j n f 1 . . . Expression de la distance de 2 : p j i j i i ij j f f f f f i i d 1 2 '. ' . . 2 1 ' , et m i j ij j ij i f f f f f j j d 1 2 ' . ' . . 2 1 ' , Notation : Effectif total dans le tableau m i p j ij n n 1 1 Fréquences relatives n n f ij ij Fréquences relatives marginales lignes p j ij i i f n n f 1 . . Fréquences relatives marginales colonnes m i ij j j f n n f 1 . . Exemple 1 : Une Entreprise vend 5 produits dans 4 régions. A la fin de chaque exercice ces ventes exprimées en millier d’unités peuvent ce résumé dans un tableau comme celui - ci : P1 P2 P3 P4 P5 ni. R1 28 14 45 33 12 132 R2 36 21 25 64 23 169 R3 21 64 38 11 7 141 R4 79 42 67 9 41 238 ni. 164 141 175 117 83 680 Les tableaux de contingences ont une grande importance pratique. Ils sont le point de départ de l’analyse des interactions entre 2 variables nominales. Dans l’exemple ci–dessus nous avons deux telles variables : - Régions (V1) qui a 4 modalités. - Produits (V2) qui a 5 modalités. Ici « interactions » veut dire « écart à la condition d’indépendance ». Quel sens faut-il attribuer à une phase comme : les 2 variables « Région » et « Produit » sont-elles indépendantes ? V2 : Produits j=1,…, p=5 m modalités en ligne : V1 V1 : Régions i=1,…, m=4 Cours Analyse des Données Mr Kamel HELALI 3 Ceci voudrait dire que deux régions quelconques vendent tous les produits exactement dans les mêmes proportions. Par exemple nous voyons que la région R1 vend deux fois plus de produit P1 (28) que de produit P2 (14). Si « Région » et « Produit » sont indépendants nous nous attendrions à ce qu’il en soit de même pour la région R2 mais nous constatons que R2 a vendue 36 de P1 et 21 de P2 et non les 18=36/2 attendus. Un simple examen visuel nous montre que « Région » et « Produit » ne sont pas indépendants. De façon complètement équivalente nous aurions pu examiner les colonnes au lieu des lignes. Nous aurions alors dit que les deux variables sont indépendantes si deux produits quelconques sont vendus exactement dans les mêmes proportions dans toutes les régions. L’analyse des écarts à l’indépendance a des implications importantes, ainsi l’examen visuel d’un tableau de contingence atteint rapidement ces limites et l’analyse des tableaux de grande dimension requiert des méthodes spécifiques. Exemple 2 : Soit le tableau 10 x 8 ci-dessous croisent 10 catégories socioprofessionnelles avec 8 modes d’hébergement en vacances. Tableau 1 I \ J hôtel locat propri parent amis tente villag divers Total Agriculteur 160 28 0 321 36 141 45 65 796 Salariés 35 34 1 178 8 0 4 0 260 Patrons 700 354 229 959 185 292 119 140 2978 Cadre sup 961 471 633 1580 305 360 162 148 4620 Cadre moy 572 537 279 1689 206 748 155 112 4298 Employés 441 404 166 1079 178 434 178 92 2972 Ouvriers 783 1114 387 4052 497 1464 525 387 9209 Personnels 65 43 21 294 79 57 18 6 580 Autres actif 77 60 189 839 53 124 28 53 1423 Non actifs 741 332 327 1789 311 236 102 102 3940 Total 4535 3377 2232 12780 1858 3856 1336 1105 31079 Dans ce tableau lignes et colonnes jouent des rôles analogues : ce sont deux partitions d’une même population. Pour que les distances entre points-lignes et points-colonnes aient un sens, il faudra faire intervenir les profils des lignes et des colonnes, c.à.d. les répartitions en % à l’intérieur d’une ligne et d’une colonne. En effet, deux observations i et i’ seront considérées comme identiques si les lignes correspondantes sont proportionnelles. Cours Analyse des Données Mr Kamel HELALI 4 En effet, la distance entre, par exemple, le point « ouvrier » et le point « personnels de service », calculée a partir des effectifs bruts (tableau 1), ne ferait que traduire les différences d’effectifs, considérables entre ces 2 catégories. Par contre, calculée sur les profils lignes (tableau 2), elle traduira les différences de comportement vis-à-vis du mode d’hébergement en vacances, en comparant les % de chacun de ces modes sans tenir compte des 2 catégories. De la même façon, pour comparer 2 modes d’hébergement, on consultera les profils socioprofessionnels (tableau 3). On définira donc les tableaux des profils de I sur J en posant : . i ij ij n n p On crée ainsi des profils d’hébergement (profils colonnes) Tableau 2 : (100 x pij) I \ J hôtel locat propri paren amis tente villag divers Total Agricult 20,1 3,5 0,0 40,4 4,5 17,7 5,7 8,1 100,00 Salariés 13,4 13,1 0,4 68,5 3,1 0,0 1,5 0,0 100,00 Patrons 23,5 11,9 7,7 32,2 6,2 9,8 4,0 4,7 100,00 Cadre s 20,8 10,2 13,7 34,2 6,6 7,8 3,5 3,2 100,00 Cadre m 13,3 12,5 6,5 39,3 4,8 17,4 3,6 2,6 100,00 Employés 14,8 13,6 5,6 36,3 6,0 14,6 6,0 3,1 100,00 Ouvrier 8,5 12,1 4,2 44,0 5,4 15,9 5,7 4,2 100,00 Personnel 11,1 7,4 3,6 50,4 13,6 9,8 3,1 1,0 100,00 Autres actif 5,4 4,2 13,3 59,0 3,7 8,7 3,0 3,7 100,00 Non actifs 18,8 8,4 8,3 45,4 7,9 6,0 2,6 2,6 100,00 Profil marginal de J 14,6 10,9 7,2 41,0 6,0 12,4 4,3 3,6 100,00 On définira les tableaux des profils de J sur I en posant : j ij ij n n p . * Ce sont les tableaux 2 et 3 qui définiront les coordonnées dans uploads/Management/ chapitre-iii-analyse-des-donnees 1 .pdf
Documents similaires
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/MemQkYE6qfI7Pmx9noWn4tPd7pmgBhNn1JhFlAYCe1e3blUUq9TBwFiiu8X4TuHtIGaXvK8s1PNCWl9sAIWVGEPk.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/OXIGlZn0eNhvq8wJey2CuGEMQzWsR6OnwiGr0Uaq27Om9D2kpvHVlqUpZs9kPj2OIP6pNsYdJWrjjiGZ4WySLu9n.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/tKOjL4AgF7rbneeX7XmWzqBe0ApW1lhrYcBhF6hpRBLkN557dtMUPFfiRvr789o20GpisNPZ4AlU8ed0vE7vBXjV.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/sLQrGBbNUVqekUdj0UBqmhcylkk24oGtLIrkjhKLG9xfbYeSciqEOdv0qfWoQbyUpOgkYDKRlyFOmN2Kov4jwmNz.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/EkXdT14wmBHikOa7ID8XAsNWIavSrTYXTIiDu8vhhrzNU05HGEA5fTM156yuwYwrCQMIqIzWvQ7hJZYmSiR33tyC.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/khI5d0k72REw7hA8zRWUFHiOHttgpfWaNXHApF2gPcnRFZVtAtaU4Lfo0QNX6PWlg1kR9nCNug2PkZvgNXHevwOv.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/VHpjiVMritkLF6HREt09UdjMMaLkHMRJlznAcTLcQDJhNgib2bQiArV39nplH7FIyZIVygwPdfjYJkmlkHXM8qWP.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/hCCXnJ3SjgqEZw7yaU1yZsVMREeokwDGl0FPm866vDi8kckPsTMBbc7rkd6BlolWMWq6EwTX9IbIu9KLCmy145PM.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/Jp5wV1qiaoVkMHFt8AlR8UoW7dWMAnH6E5nyeNEJkVs0qUQmDy2BqXSibUbG2iAaSBQwaZFF3Eb2qWQjUPyvENSd.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/7FxJlLOvGaIdvVhBgdUkXzMtQZSTOdiWGtMJujeyNEbQ6hpUkU8JZisNL8bDf8XfFZvAvCU7km4TySCYtQZ7xhHq.png)
-
21
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Jul 01, 2022
- Catégorie Management
- Langue French
- Taille du fichier 0.9129MB