Introduction a l analyse des donnees

Introduction à l ? analyse des données Olivier Godechot CIntroduction ? Les données statistiques de très nombreuses variables ? Aucune n ? est parfaite ? La perception d ? un phénomène appréhendée comme la combinaison d ? un grand nombre de variables ? Comment faire pour tenir compte de l ? ensemble de l ? information CIntroduction Suite ? Faire des tableaux croisés variable x y ou calculer des coe ?cients de corrélation ? Problème si variables - tableaux croisés Si variables tableaux croisés ? Autre méthode les indices ? Exemple indice d ? in ation Indice de développement humain BIP ? I a X a X a X ? Problème arbitraire de la formule et des pondérations CIntroduction Fin ? Trouver des méthodes pour synthétiser les variables sans trop les déformer ? Trouver des axes qui sont alors des indices qui respectent la forme du nuage multidimensionnel c ? est-à-dire la forme de la relation entre les variables CLes di ?érentes méthodes ? Les méthodes factorielles de représentation ?? Analyse en composantes principales ACP Variables quantitatives ?? Analyse factorielle de correspondances AFC Analyse d ? un tableau croisé de deux variables qualitatives ?? Analyse des correspondances multiples ACM Plusieurs variables qualitatives ? Les méthodes de classi ?cation des individus ?? Classi ?cation ascendante hiérarchique CAH ?? Classi ?cation autour des centres mobiles ? La discrimination CL ? analyse en composantes principales ? Historiquement la plus ancienne Pearson ? Utilisation importante par les psychologues du QI ? Relativement peu utilisée en sociologie ? Plus facile à expliquer ? AFC et ACM sont des ACP particulières CUn exemple de mise en oeuvre Carole-Anne Rivière Le téléphone un facteur d ? intégration sociale ? Économie et Statistiques n C C C C C CACP L ? idée ? Représenter des données multidimensionnelles sur un nombre limité de dimensions en déformant au minimum les données ? La méthode un changement de repères ? Les axes du nouveau repère sont calculés à partir des axes originaux de l ? ancien repère ? Ces nouveaux axes sont hiérarchisés en fonction du degré de ?délité aux distances entre les points dans le nuage ? CQ les premiers axes donnent une assez bonne représentation des données CEx emploi salaire log ? ge et ? ge de ?n d ? étude C? ge de ?n d'études Exemple très simple en deux dimensions - - - - Logarithme du salaire - CLe plan factoriel issu de l ? ACP - - - - - - - Axe CC ? est le même graphe mais l ? axe horizontal du graphe de droite résume mieux l ? info ici ? ge de ?n d'études - - - - Logarithme du salaire - Axe - - - - - - - CEntrons un peu dans la méthode ? Inertie moyenne des carrés des écarts entre les points du nuage et le centre du nuage point moyen ? Comment dé ?nir une distance Distance euclidienne transformée d ? a b xb-xa ?

  • 22
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise
Partager
  • Détails
  • Publié le Fev 21, 2022
  • Catégorie Management
  • Langue French
  • Taille du fichier 42.3kB