Analyse de donnees Cours d ? Analyse de Données CBut Synthétiser structurer l'information contenue dans des données multidimensionnelles n individus p variables CMéthodes Algèbre linéaire les données sont vues de manière abstraites comme un nuage de point
Cours d ? Analyse de Données CBut Synthétiser structurer l'information contenue dans des données multidimensionnelles n individus p variables CMéthodes Algèbre linéaire les données sont vues de manière abstraites comme un nuage de points dans un espace vectoriel On utilise ?? Des matrices qui permettent de manipuler un ensemble de variables comme un objet mathématique unique ?? Des valeurs et vecteurs propres qui permettent de décrire la structure d'une matrice ?? Des métriques permettent de dé ?nir la distance entre deux points de l'espace vectoriel on utilise aussi des produits scalaires Théorie des probabilités nécessaire en statistique inferentielle estimation tests modélisation et prévision CIndividus et variables Population groupe ou ensemble d'individus que l'on analyse Recensement étude de tous les individus d'une population donnée Sondage étude d'une partie seulement d'une population appelée échantillon Variables ensemble de caractéristiques d'une population ?? quantitatives nombres sur lesquels les opérations usuelles somme moyenne ont un sens elles peuvent être discrètes ex nombre d'éléments dans un ensemble ou continues ex prix taille ?? qualitatives appartenance a une catégorie donnée elles peuvent être nominales ex sexe CSP ou ordinales quand les catégories sont ordonnées ex très résistant assez résistant peu résistant CDescription de données quantitatives Dé ?nition On appelle variable un vecteur x de taille n Chaque coordonnée xi correspond a un individu On s'intéresse ici a des valeurs numériques Poids Chaque individu a éventuellement un poids pi tel que p pn On a souvent p n Représentation histogramme en découpant les valeurs de la variable en classes Résumes on dispose d'une série d'indicateurs qui ne donne qu'une vue partielle des données e ?ectif moyenne médiane variance écart type minimum maximum étendue er quartile eme quartile Ces indicateurs mesurent principalement la tendance centrale et la dispersion On utilisera principalement la moyenne la variance et l'écart type CMoyenne arithmétique Dé ?nition On note ? x n n i xi ou pour des données pondérées n ? x pi xi i Propriétés la moyenne arithmétique est une mesure de tendance centrale qui dépend de toutes les observations et est sensible aux valeurs extrêmes Elle est très utilisée a cause de ses bonnes propriétés mathématiques CExemple d ? une moyenne statistique X altitude de avions en mètre CExemple d ? une moyenne statistique Exemple ou la moyenne nous ne donne pas beaucoup d ? information sur la position des avions La variance nous donne plus d ? information sur la distribution des avions par rapport a la moyenne d ? altitude CVariance et ecart-type Dé ?nition la variance de x est dé ?nie par ? s x n n i xi ?? x ou n ? sx pi xi ?? x i L'écart type sx est la racine carrée de la variance Propriétés La variance satisfait la formule suivante ? s x n n i pi x i ?? x La variance est la moyenne des carres moins le carre de la moyenne ? L'ecart-type qui a la même unité que x est une mesure de dispersion CMesure de liaison
Documents similaires
-
21
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise- Détails
- Publié le Apv 10, 2021
- Catégorie Geography / Geogra...
- Langue French
- Taille du fichier 62.3kB