PSR83B - Introduction aux analyses multidimensionnelles 2005/2006 4 Analyse des

PSR83B - Introduction aux analyses multidimensionnelles 2005/2006 4 Analyse des Correspondances Multiples 4.1 Introduction L'analyse factorielle des correspondances, vue dans le paragraphe précédent, s'applique à des situations où les individus statistiques sont décrits par deux variables nominales. Mais il est fréquent que l'on dispose d'individus décrits par plusieurs (deux ou plus) variables nominales ou ordinales. C'est notamment le cas lorsque nos données sont les résultats d'une enquête basée sur des questions fermées à choix multiples. Une extension de l'AFC à ces situations a donc été proposée. Elle est généralement appelée Analyse des Correspondances Multiples ou ACM. Nous nous plaçons donc dans la situation où nous disposons de N individus statistiques, décrits par Q variables nominales ou ordinales X1, X2, ..., XQ . L'ACM vise à mettre en évidence : - les relations entre les modalités des différentes variables ; - éventuellement, les relations entre individus statistiques ; - les relations entre les variables, telles qu'elles apparaissent à partir des relations entre modalités. On note Q l'ensemble des variables (appelées "questions"). On désigne par Kq l'ensemble des modalités de la variable Xq et K l'ensemble de toutes les modalités de réponses. 4.2 Exemple 4.2.1 Enoncé L'exemple qui suit est extrait de [Crucianu]. Il s'agit d'une partie des données issues de l'enquête "Les étudiants et la ville" effectuée en 2001 par des étudiants de sociologie sous la direction de S. Denèfle à l'Université François Rabelais de Tours. L'analyse porte sur cinq questions en rapport avec le logement étudiant. L'ensemble des individus statistiques est ici un échantillon de 383 étudiants. Les questions sont les suivantes : Question N° Réponses possibles Poids (%) Abréviation Habitez-vous (variable "mode d'occupation") 1 seul 48,30% Seul 2 colocataires 13,84% Coloc 3 en couple 13,05% Couple 4 avec les parents 23,50% Parents 5 non réponse 1,31% NR1 Quel type d'habitation occupez-vous ? (variable "type d'habitation") 6 cité universitaire 10,70% Cité 7 studio 28,20% Studio 8 appartement 30,29% Appart 9 chambre chez un particulier 5,22% Chambre 10 autre 19,84% Autre F.-G. Carpentier - 2006 59 PSR83B - Introduction aux analyses multidimensionnelles 2005/2006 11 non réponse 5,74% NR2 Si vous vivez en dehors du foyer familial, depuis combien de temps ? (variable "ancienneté") 12 moins de 1 an 20,89% < 1 an 13 1 à 3 ans 24,80% 1-3 ans 14 plus de 3 ans 28,72% > 3 ans 15 non applicable 24,80% NA 16 non réponse 0,78% NR3 A quelle distance approximative de la Fac vivez-vous ? (variable "éloignement") 17 moins de 1 km 26,89% < 1 km 18 1 à 5 km 49,87% 1 à 5 km 19 plus de 5 km 20,89% > 5 km 20 non réponse 2,35% NR4 Quelle est la superficie de votre logement ? (variable "superficie") 21 moins de 10 m2 9,14% < 10 m2 22 10 à 20 m2 17,75% 10 à 20 m2 23 20 à 30 m2 24,80% 20 à 30 m2 24 plus de 30 m2 39,16% > 30 m2 25 non réponse 9,14% NR5 4.2.2 Différentes représentations des données recueillies Nous verrons ultérieurement qu'il est préférable de regrouper les modalités dont la fréquence est trop faible (inférieure à 5% par exemple) avec d'autres modalités. Aussi, dans les données qui suivent, les modalités "Parents" et "NR1" ont été regroupées pour la variable "mode", de même que "NA" et "NR3" pour la variable "ancienneté" et ">5km" et "NR4" pour la variable "éloignement". Il reste donc 22 modalités distinctes. Les données recueillies peuvent être représentées, de façon classique, à l'aide d'un tableau protocole ou d'un tableau d'effectifs. Cependant, deux autres représentations sont également utilisées : le tableau disjonctif complet (TDC) et le tableau de Burt (TdB). 4.2.2.1 Tableau protocole et tableau d'effectifs Les données recueillies peuvent être représentées, de façon classique, à l'aide d'un tableau protocole ou d'un tableau d'effectifs : Tableau protocole Sujet Mode d'occupation Type d'habitation Ancienneté Eloignement Superficie S1 seul cité < 1 an < 1 km < 10 m2 S2 coloc appart 1 à 3 ans 1 à 5 km 20 à 30 m2 ... ... Tableau d'effectifs Mode Type Ancienneté Eloignement Superficie Effectif F.-G. Carpentier - 2006 60 PSR83B - Introduction aux analyses multidimensionnelles 2005/2006 d'occupation d'habitation seul cité < 1 an < 1 km < 10 m2 7 seul cité < 1 an < 1 km 10 à 20 m2 2 ... 4.2.2.2 Tableau disjonctif complet (TDC) Le tableau disjonctif complet comporte une colonne pour chaque modalité des variables étudiées, et une ligne pour chaque individu statistique. Les cellules du tableau contiennent 1 ou 0 selon que l'individu considéré présente la modalité correspondante ou non : Mode d'occupation Type habitation Ancienneté Eloignement Superficie Seu l Col oc Cou ple Par ents et NR 1 Cité Stu dio Ap part Cha mbr e Aut re NR 2 <= 1 an 1-3 ans > 3 ans NA et NR 3 - de 1k m 1 à 5 km + 5 km et NR 4 - de 10 m2 10 à 20 m2 20 à 30 m2 + de 30 m2 NR 5 i 1 1 0 0 0 1 0 0 0 0 0 1 0 0 0 1 0 0 1 0 0 0 0 i 2 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 1 0 0 0 i 3 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1 0 0 0 1 0 0 0 i 4 0 1 0 0 0 0 1 0 0 0 1 0 0 0 0 0 1 0 0 0 0 1 i 5 0 0 0 1 0 0 1 0 0 0 0 0 0 1 0 0 1 0 0 0 1 0 ... ... ... 4.2.2.3 Tableau disjonctif des patrons Un patron de réponse, c'est une combinaison de modalités susceptible d'être choisie par un sujet. Ici, le nombre de patrons possible est très élevé : € 4 × 6 × 4 × 3 × 5 = 1 4 4 0 . Autrement dit, la plupart d'entre eux ne sont pas présents dans les réponses observées. En regroupant les lignes identiques dans le tableau disjonctif complet ou en convertissant en tableau disjonctif le tableau d'effectifs, on obtient le tableau disjonctif des patrons de réponses. Par exemple : Mode d'occupation Type habitation Ancienneté Eloignement Superficie Seu l Col oc Cou ple Par ents et NR 1 Cité Stu dio Ap part Cha mbr e Aut re NR 2 <= 1 an 1-3 ans > 3 ans NA et NR 3 - de 1k m 1 à 5 km + 5 km et NR 4 - de 10 m2 10 à 20 m2 20 à 30 m2 + de 30 m2 NR 5 p1 12 0 0 0 12 0 0 0 0 0 12 0 0 0 12 0 0 12 0 0 0 0 p2 6 0 0 0 0 6 0 0 0 0 6 0 0 0 0 6 0 0 6 0 0 0 ... ... ... 4.2.2.4 Tableau de Burt (TdB) Le tableau de Burt comporte une ligne et une colonne pour chaque modalité des variables étudiées. Chaque cellule du tableau indique le nombre d'individus statistiques qui possèdent en même temps la F.-G. Carpentier - 2006 61 PSR83B - Introduction aux analyses multidimensionnelles 2005/2006 modalité ligne et la modalité colonne correspondantes. Pour l'exemple étudié, le tableau de Burt est le suivant : Seu l Col oc Co upl e Par ents & NR Cit é Stu dio Ap part Cha mbr e Aut re NR 2 <= 1 an 1-3 ans > 3 ans NA & NR - de 1k m 1 à 5 km +5 km & NR - de 10 m2 10 à 20 m2 20 à 30 m2 + de 30 m2 NR 5 Seul 185 0 0 0 34 90 40 13 3 5 61 60 59 5 70 101 14 32 61 71 21 0 Colo 0 53 0 0 5 6 32 2 3 5 13 18 21 1 13 33 7 1 4 8 40 0 Coup 0 0 50 0 2 10 34 0 3 1 5 14 28 3 15 23 12 2 2 14 32 0 Par / NR 0 0 0 95 0 2 10 5 67 11 1 3 2 89 5 34 56 0 1 2 57 35 Cité 34 5 2 0 41 0 0 0 0 0 17 13 9 2 15 23 3 27 9 1 4 0 Stud 90 6 10 2 0 108 0 0 0 0 29 33 45 1 41 61 6 1 33 57 17 0 App 40 32 34 10 0 0 116 0 0 0 23 35 47 11 37 62 17 1 10 29 74 2 Cha 13 2 0 5 0 0 0 20 0 0 6 6 3 5 6 10 4 4 7 5 4 0 Autr 3 3 3 67 0 0 0 0 76 0 2 uploads/Management/ ana-mult-3-2006.pdf

  • 27
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Fev 15, 2021
  • Catégorie Management
  • Langue French
  • Taille du fichier 0.5244MB