Analyse de donnees p1 Cours d ? Analyse de Données Cobjectifs généraux de l'analyse des données Synthétiser structurer l'information contenue dans des données multidimensionnelles n individus p variables Les objectifs que se sont ?xés les chercheurs en an

Cours d ? Analyse de Données Cobjectifs généraux de l'analyse des données Synthétiser structurer l'information contenue dans des données multidimensionnelles n individus p variables Les objectifs que se sont ?xés les chercheurs en analyse de données sont donc de répondre aux problèmes posés par des tableaux de grandes dimensions Les objectifs sont souvent présentés en fonction du type de méthodes ainsi deux objectifs ressortent la visualisation des données dans le meilleur espace réduit et le regroupement dans tout l'espace Les méthodes de l'analyse de données doivent donc permettre de représenter synthétiquement de vastes ensembles numériques pour faciliter l'opérateur dans ses décisions En fait d'ensembles numériques les méthodes d'analyse de données se proposent également de traiter des données qualitatives ce qui en fait des méthodes capables de considérer un grand nombre de problèmes Les représentations recherchées sont bien souvent des représentations graphiques comme il est di ?cile de visualiser des points dans des espaces de dimensions supérieures à deux nous chercherons à représenter ces points dans des plans Ces méthodes ne se limitent pas à une représentation des données ou du moins pour la rendre plus aisée elles cherchent les ressemblances entre les individus et les liaisons entre les variables Ces proximités entre individus et variables vont permettre à l'opérateur déterminer une typologie des individus et des variables et ainsi il pourra interpréter ses données et fournir une synthèse des résultats des analyses Nous voyons donc que les deux objectifs précédemment cités sont très liés voir indissociables ce qui entra? ne souvent l'utilisation conjointe de plusieurs méthodes d'analyse de données CMéthodes Algèbre linéaire les données sont vues de manière abstraites comme un nuage de points dans un espace vectoriel On utilise ?? Des matrices qui permettent de manipuler un ensemble de variables comme un objet mathématique unique ?? Des valeurs et vecteurs propres qui permettent de décrire la structure d'une matrice ?? Des métriques permettent de dé ?nir la distance entre deux points de l'espace vectoriel on utilise aussi des produits scalaires Théorie des probabilités nécessaire en statistique inferentielle estimation tests modélisation et prévision CIndividus et variables Population groupe ou ensemble d'individus que l'on analyse Recensement étude de tous les individus d'une population donnée Sondage étude d'une partie seulement d'une population appelée échantillon Variables ensemble de caractéristiques d'une population ?? quantitatives nombres sur lesquels les opérations usuelles somme moyenne ont un sens elles peuvent être discrètes ex nombre d'éléments dans un ensemble ou continues ex prix taille ?? qualitatives appartenance a une catégorie donnée elles peuvent être nominales ex sexe CSP ou ordinales quand les catégories sont ordonnées ex très résistant assez résistant peu résistant CDescription de données quantitatives Dé ?nition On appelle variable un vecteur x de taille n Chaque coordonnée xi correspond a un individu On s'intéresse ici a des valeurs numériques Poids Chaque individu a éventuellement un poids pi tel que p pn On a souvent p n Représentation histogramme en découpant les valeurs de la variable en classes Résumes on dispose d'une série d'indicateurs qui ne donne

  • 38
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise
Partager
  • Détails
  • Publié le Fev 01, 2021
  • Catégorie Management
  • Langue French
  • Taille du fichier 54.8kB