Analyse de données Introduction Analyse en Composantes Principales (ACP) Analys

Analyse de données Introduction Analyse en Composantes Principales (ACP) Analyse Factorielle des Correspon- dances (AFC) Analyse des Cor- respondances Multiples (ACM) Analyse de données Notes de cours W. El Hannoun Master M2SI. 2022-2023 1/93 Analyse de données Introduction Analyse en Composantes Principales (ACP) Analyse Factorielle des Correspon- dances (AFC) Analyse des Cor- respondances Multiples (ACM) Table des matières 1. Introduction 2. Analyse en Composantes Principales (ACP) 2.1 Données - Exemples 2.2 Etude des individus 2.3 Etude des variables 2.4 Aide à l’interprétation 3. Analyse Factorielle des Correspondances (AFC) 3.1 Données 3.2 Modèle d’indépendance 3.3 Les nuages et leur ajustement 3.4 Pourcentages d’inertie et inertie en AFC 3.5 Représentation simultanée des lignes et des colonnes 3.6 Aides à l’interprétation 4. Analyse des Correspondances Multiples (ACM) 2/93 Analyse de données Introduction Analyse en Composantes Principales (ACP) Analyse Factorielle des Correspon- dances (AFC) Analyse des Cor- respondances Multiples (ACM) Introduction 3/93 Analyse de données Introduction Analyse en Composantes Principales (ACP) Analyse Factorielle des Correspon- dances (AFC) Analyse des Cor- respondances Multiples (ACM) Exemples 1 Analyse des pays (individus) suivant leurs niveaux de développement humain (variables quantitatives). Exemple : "Rapport sur les perspectives du Maroc à l’horizon 2025 : Pour un développement humain élevé", IRES, 2006. https ://www.ires.ma/images/modele-de- developpement/perspectives.pdf 2 Analyse du lien entre le mode de consommation (variable qualitative) et la CSP (variable qualitative). 3 Analyse des ménages (individus) selon leurs caractéristiques socioéconomiques (variables qualitatives). Exemple : "Enquête nationale sur la consommation et les dépenses des ménages 2014", HCP , 2019. https ://www.hcp.ma/file/212376/ 4/93 Analyse de données Introduction Analyse en Composantes Principales (ACP) Analyse Factorielle des Correspon- dances (AFC) Analyse des Cor- respondances Multiples (ACM) Analyse des données : Objectifs communs • Dégager et synthétiser les principales caractéristiques d’un grand nombre de données. • Relever le lien entre plusieurs variables (quantitatives ou qualitatives). • Détecter des profils particuliers des individus suivant certaines caractéristiques (quantitatives ou qualitatives). • Et plus : Discrimination, score, labellisation, classification, prédiction, . . . . ⇒L ’analyse de données (ou analyse multivariée ou analyse fac- torielle) : méthodes qui mettent en évidence les structures perti- nentes d’une masse volumineuse de données. 5/93 Analyse de données Introduction Analyse en Composantes Principales (ACP) Analyse Factorielle des Correspon- dances (AFC) Analyse des Cor- respondances Multiples (ACM) Analyse des données : Spécifités et couplages potentiels 6/93 Analyse de données Introduction Analyse en Composantes Principales (ACP) Analyse Factorielle des Correspon- dances (AFC) Analyse des Cor- respondances Multiples (ACM) Analyse des données : Domaines d’utilisation 7/93 Analyse de données Introduction Analyse en Composantes Principales (ACP) Analyse Factorielle des Correspon- dances (AFC) Analyse des Cor- respondances Multiples (ACM) Analyse des données : Evolution 8/93 Analyse de données Introduction Analyse en Composantes Principales (ACP) Analyse Factorielle des Correspon- dances (AFC) Analyse des Cor- respondances Multiples (ACM) Plan 9/93 Analyse de données Introduction Analyse en Composantes Principales (ACP) Données - Exemples Etude des individus Etude des variables Aide à l’interprétation Analyse Factorielle des Correspon- dances (AFC) Analyse des Cor- respondances Multiples (ACM) Analyse en Composantes Principales (ACP) 10/93 Analyse de données Introduction Analyse en Composantes Principales (ACP) Données - Exemples Etude des individus Etude des variables Aide à l’interprétation Analyse Factorielle des Correspon- dances (AFC) Analyse des Cor- respondances Multiples (ACM) Table of Contents 1. Introduction 2. Analyse en Composantes Principales (ACP) 2.1 Données - Exemples 2.2 Etude des individus 2.3 Etude des variables 2.4 Aide à l’interprétation 3. Analyse Factorielle des Correspondances (AFC) 3.1 Données 3.2 Modèle d’indépendance 3.3 Les nuages et leur ajustement 3.4 Pourcentages d’inertie et inertie en AFC 3.5 Représentation simultanée des lignes et des colonnes 3.6 Aides à l’interprétation 4. Analyse des Correspondances Multiples (ACM) 11/93 Analyse de données Introduction Analyse en Composantes Principales (ACP) Données - Exemples Etude des individus Etude des variables Aide à l’interprétation Analyse Factorielle des Correspon- dances (AFC) Analyse des Cor- respondances Multiples (ACM) Quel type de données? L ’ACP s’intéresse à des tableaux de données rectangulaires avec des individus en lignes et des variables quantitatives en colonnes. Pour la variable k, on note : la moyenne : xk = 1 I I P i=1 xik l’écart-type : sk = s 1 I I P i=1 (xik −xk)2 Figure – Tableau de données en ACP . 12/93 Analyse de données Introduction Analyse en Composantes Principales (ACP) Données - Exemples Etude des individus Etude des variables Aide à l’interprétation Analyse Factorielle des Correspon- dances (AFC) Analyse des Cor- respondances Multiples (ACM) Exemples • Analyse sensorielle : note du descripteur k pour le produit i • Ecologie : concentration du polluant k dans la rivière i • Economie : valeur de l’indicateur k pour l’année i • Génétique : expression du gène k pour le patient i • Biologie : mesure k pour l’animal i • Marketing : valeur d’indice de satisfaction k pour la marque i • Sociologie : temps passé à l’activité k par les individus de la CSP i • etc. 13/93 Analyse de données Introduction Analyse en Composantes Principales (ACP) Données - Exemples Etude des individus Etude des variables Aide à l’interprétation Analyse Factorielle des Correspon- dances (AFC) Analyse des Cor- respondances Multiples (ACM) Les données température • 15 individus (lignes) : villes de France • 14 variables (colonnes) : • 12 températures mensuelles moyennes (sur 30 ans) • 2 variables géographiques (latitude, longitude) 14/93 Analyse de données Introduction Analyse en Composantes Principales (ACP) Données - Exemples Etude des individus Etude des variables Aide à l’interprétation Analyse Factorielle des Correspon- dances (AFC) Analyse des Cor- respondances Multiples (ACM) Problèmes-objectifs Le tableau peut être vu comme un ensemble de lignes ou un en- semble de colonnes. Etude des individus • Quand dit-on que 2 individus se ressemblent du point de vue de l’ensemble des variables? • Si beaucoup d’individus, peut-on faire un bilan des ressemblances? ⇒construction de groupes d’individus, partition des individus 15/93 Analyse de données Introduction Analyse en Composantes Principales (ACP) Données - Exemples Etude des individus Etude des variables Aide à l’interprétation Analyse Factorielle des Correspon- dances (AFC) Analyse des Cor- respondances Multiples (ACM) Problèmes-objectifs Etude des variables • Recherche des ressemblances entre variables • Entre variables, on parle plutôt de liaisons • Liaisons linéaires sont simples, très fréquentes et résument de nombreuses liaisons ⇒coefficient de corrélation ⇒visualisation de la matrice des corrélations ⇒recherche d’un petit nombre d’indicateurs synthétiques pour résumer beaucoup de variables (ex. d’indicateur synthétique a priori : la moyenne, mais ici on recherche des indicateurs synthétiques a posteriori, à partir des données) 16/93 Analyse de données Introduction Analyse en Composantes Principales (ACP) Données - Exemples Etude des individus Etude des variables Aide à l’interprétation Analyse Factorielle des Correspon- dances (AFC) Analyse des Cor- respondances Multiples (ACM) Problèmes-objectifs Lien entre les deux études • Caractérisation des classes d’individus par les variables ⇒besoin de procédure automatique • Individus spécifiques pour comprendre les liaisons entre variables ⇒utilisation d’individus extrêmes (en terme de variables : langage abstrait mais puissant, revenir aux individus pour voir les choses plus simplement) Objectifs de l’ACP • Descriptif - exploratoire : visualisation de données par graphiques simples • Synthèse - résumé de grands tableaux individus × variables 17/93 Analyse de données Introduction Analyse en Composantes Principales (ACP) Données - Exemples Etude des individus Etude des variables Aide à l’interprétation Analyse Factorielle des Correspon- dances (AFC) Analyse des Cor- respondances Multiples (ACM) Deux nuages de points 18/93 Analyse de données Introduction Analyse en Composantes Principales (ACP) Données - Exemples Etude des individus Etude des variables Aide à l’interprétation Analyse Factorielle des Correspon- dances (AFC) Analyse des Cor- respondances Multiples (ACM) Table of Contents 1. Introduction 2. Analyse en Composantes Principales (ACP) 2.1 Données - Exemples 2.2 Etude des individus 2.3 Etude des variables 2.4 Aide à l’interprétation 3. Analyse Factorielle des Correspondances (AFC) 3.1 Données 3.2 Modèle d’indépendance 3.3 Les nuages et leur ajustement 3.4 Pourcentages d’inertie et inertie en AFC 3.5 Représentation simultanée des lignes et des colonnes 3.6 Aides à l’interprétation 4. Analyse des Correspondances Multiples (ACM) 19/93 Analyse de données Introduction Analyse en Composantes Principales (ACP) Données - Exemples Etude des individus Etude des variables Aide à l’interprétation Analyse Factorielle des Correspon- dances (AFC) Analyse des Cor- respondances Multiples (ACM) Le nuage des individus NI 1 individu = 1 ligne du tableau ⇒1 point dans un espace à K dim • Si K = 1 : Représentation axiale • Si K = 2 : Nuage de points • Si K = 3 : Représentation + difficile en 3D • Si K = 4 : Impossible à représenter MAIS le concept est simple Notion de ressemblance : distance (au carré) entre individus i et i′ : d2(i, i′) = K X k=1 (xik −xi′k)2 Etude des individus ⇔Etude de la forme du nuage NI 20/93 Analyse de données Introduction Analyse en Composantes Principales (ACP) Données - Exemples Etude des individus Etude des variables Aide à l’interprétation Analyse Factorielle des Correspon- dances (AFC) Analyse des Cor- respondances Multiples (ACM) Le nuage des individus NI • Etudier la structure, i.e. la forme du nuage des individus • Les individus vivent dans RK uploads/Management/cours-add.pdf

  • 36
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Sep 01, 2021
  • Catégorie Management
  • Langue French
  • Taille du fichier 5.1257MB