Said El Hassani SPSS (Statistical Package for the Social Sciences) (Statistical

Said El Hassani SPSS (Statistical Package for the Social Sciences) (Statistical Product and Service Solutions) RAPPELS SUR LA STATISTIQUE DESCRIPTIVE Said El Hassani Différence entre : STATISTIQUES : les données fournies par la STATISTIQUE STATISTIQUE : Science et méthodes pour extraire des statistiques (Exemples) Said El Hassani Population Groupe ou ensemble d'individus que l'on analyse. Recensement Etude de tous les individus d'une population donnée. Sondage Etude d'une partie seulement d'une population appelée échantillon. Variables Ensemble de caractéristiques d'une population. Quantitatives: nombres sur lesquels les opérations usuelles (somme, moyenne,...) ont un sens ; elles peuvent être discrètes (ex : nombre d'éléments dans un ensemble) ou continues (ex: prix, taille) ; Qualitatives: appartenance a une catégorie donnée ; elles peuvent être nominales (ex : sexe, CSP) ou ordinales quand les catégories sont ordonnées (ex : très résistant, assez résistant, peu résistant). Individus et variables Said El Hassani Objectifs du rappel : Graphiques descriptifs adaptés aux variables Principaux indicateurs de la statistique descriptive Tendance centrale Dispersion Présenter les BoxPlot Centrage et Réduction Statistique bivariée Statistique multivariée Graphiques descriptifs adaptés aux variables Said El Hassani Comment choisir des graphiques descriptifs adaptés a nos variables Le type de variable influe sur le type de graphique que l’on peut utiliser : Variables Qualitatives : Diagramme en secteur Diagramme en Bâton Les graphiques sont corrélés aux modalités de nos variables (Chaque secteur ou bâton représente l’effectif observé pour une modalité) 0 2 4 6 Said El Hassani Comment choisir des graphiques descriptifs adaptés a nos variables Le type de variable influe sur le type de graphique que l’on peut utiliser : Variables Quantitatives : Histogramme On divise nos variables en classes de valeurs L’axe des X liste la classe des valeurs L’axe des Y compte les effectifs pour chaque variable Axe des X : Classes de valeurs Axe des Y Effectif pour chaque Said El Hassani Interprétation : L’interprétation des diagrammes en secteur/bâton : triviale L’interprétation des Histogrammes nécessite un vocabulaire adéquat : Regardons cette distribution normale : Possède des Caractéristiques importantes Unimodale Symétrique Ni trop plate Ni trop aigue au sommet Comment choisir des graphiques descriptifs adaptés a nos variables Said El Hassani Interprétation : On introduit le coefficient de Dissymétrie (SKEWNESS) Skewness < 0 Asymétrie Négative Skewness > 0 Asymétrie Positive Comment choisir des graphiques descriptifs adaptés a nos variables Said El Hassani Coefficient de Symétrie (Moment d’ordre 3) Interprétation : Comment choisir des graphiques descriptifs adaptés a nos variables Said El Hassani Interprétation : On introduit aussi le coefficient d’aplatissement (Kurtosis) Aplatissement = 0 : Distribution mésokurtique : La loi normale est un cas particulier de distribution mésokurtique Aplatissement > 0 : Distribution leptokurtique : courbe allongée vers le haut Aplatissement < 0 : Distribution platikurtique (Courbe aplatie vers le bas) Comment choisir des graphiques descriptifs adaptés a nos variables Coefficient d’aplatissement de PEARSON (Moment d’ordre 4) Said El Hassani Coefficient d’applatissement de PEARSON (Moment d’ordre 4) Principaux Indicateurs de statistique descriptive Said El Hassani Tendance centrale : Moyenne : Moyenne Pondérée : Avantage : Prend en considération la totalité de la population Facilement interprétable Inconvénient : Limité aux données quantitatives Très sensible aux scores extrêmes Exemple du village avec le milliardaire Principaux indicateurs       n i i i n i i x p x x n x 1 1 1 0 ) ( 1     x x n i i Said El Hassani Tendance centrale : Médiane : Les xi sont rangés par ordre croissant (on a n valeurs) Principaux indicateurs x x x x n n 2 / 2 / ) 1 ( ~ ~    Dans le cas ou n est impaire Dans le cas ou n est paire Exemple : xi dans { 10, 13, 11, 19, 19, 12, 1000 } Après rangement, on obtient : { 10, 11, 12, 13, 19, 19, 1000 } Palie au problème du village avec le milliardaire Said El Hassani Tendance centrale : Mode : C’est le Score le plus courant de la distribution Avantage : s’applique aux variables nominales Inconvénient : inutile avec les distributions multimodales parce qu'il ne donne pas beaucoup de sens quand il y’a plusieurs sommets Principaux indicateurs Said El Hassani Dispersion : Etendu: Les observations étant rangées dans un ordre croissant, l’étendu est : Elle donne une idée sur la dispersion de nos observations Principaux indicateurs x x Et n 1   Said El Hassani Dispersion : Quartiles: Principaux indicateurs     q q q q q x 75 . 0 25 . 0 3 2 1 , ~ , , ,  q0.25 q0.50 q0.75 25% de la population 25% de la population 25% de la population 25% de la population 50 % de la population Said El Hassani Dispersion : Ecart Absolu Moyen : Somme des valeurs absolues des écarts à la moyenne Ou encore Somme des valeurs absolues des écarts à la médiane Exemple : { -1 , 0 , 1 } Eam = 2/3 = 0.666 Principaux indicateurs     n i i x x Eam n 1 1     n i i x x Eam n 1 ~ 1 Said El Hassani Dispersion : Variance : Somme des carrées des écarts à la moyenne Exemple : { -1 , 0 , 1 } s2= 2/3 = 0.666, s = 0.816 Ecart type Principaux indicateurs   2 1 2 1    n i i x x n s 2 s sx  Said El Hassani Dispersion : Variance : Propriété de la variance Principaux indicateurs     2 1 1 2 2 1 2 1 2 2          n i n j j i n i i x x x x n n s Comparaison entre individus Cela veut dire que lorsqu’on utilise la variance, on regarde non seulement la dispersion autour de la moyenne, mais aussi la dispersion inter-individus Comparaison avec la moyenne Said El Hassani Dispersion : Variance : Propriété de la variance : Minimise Cela veut dire est globalement très proche des individus Principaux indicateurs   2 1    n i i a x x x Box Plot ou Boite à Moustache Said El Hassani La représentation en Box Plot donne un aperçu visuel sur la dispersion d’une variable Box Plot (Boite à moustache) Q0.75 Q0.25 x ~ La médiane   25 . 0 75 . 0 75 . 0 5 . 1 Q Q Q   Plus grande valeur inférieure à   25 . 0 75 . 0 25 . 0 5 . 1 Q Q Q   Plus petite valeur inférieure à 50% de la population Outliers (ou valeurs aberrantes) Outliers (ou valeurs aberrantes) Axe des valeurs Centrage et Réduction des variables Said El Hassani Définitions : Centrer les données revient à étudier Cela veut dire que l’on compte tout a partir du « centre de gravité » Réduire les données revient à étudier Centrer et réduire revient à étudier Quand on réduit, on compte en nombres d’écart type, on supprime la notion de mesure Centrage et Réduction x x z i i   x i i s x z /    x i i s x x z   Said El Hassani Définitions : Pour une z variable centrée réduite et Exemple : Centrage et Réduction 0  z 1  z s Matière Mathématique Philosophie Note 18 15 Moyenne des notes 10.64 8.99 Ecart à la moyenne 7.36 6.01 Ecart Type 2.85 2 Note Centrée réduite (18-10.64)/2.85=2.58 (15-8.99)/2=3.005 Statistique Bivariée Said El Hassani Univariée : Etude d’une seule variable Exemple : taille des individus, couleur des yeux, etc. Bivariée : Etude de deux variables en même temps Exemple : étude de la température et du nombre de malade de grippe dans les villes (pour chaque ville, on étudie la température et le nombre de malade de la grippe) Les indicateurs statistiques précédemment étudiés sont toujours valables pour les variables prises séparément (Moyenne, Variance, etc.) Statistique Bivariée Said El Hassani Bivariée: Il est judicieux de se poser la question : Y’a-t-il une relation entre mes deux variables Statistique Bivariée on parle de corrélation entre les deux variables Plusieurs indicateurs statistiques donnent des aperçus sur la corrélation de deux variables Said El Hassani Corrélation : Statistique Bivariée Définition de la covariance observée entre deux variables x et y : et le cœfficient de r de Bravais-Pearson ou coefficient de corrélation est donnée par : 2 1 2 1 1 1 1 ) ( ) ( ) ( ) ( ) ( ) ( y y p x x p y y x x p s s s r xy y x p y y x x p s i n i i n i i i i n i i i y x xy xy i i n i i i n i i i xy   uploads/Geographie/ 2-rappels-statistique.pdf

  • 20
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager