Chapitre 2 Statistique descriptive Sommaire 2.1 Description d’une série statist
Chapitre 2 Statistique descriptive Sommaire 2.1 Description d’une série statistique à une variable . . . . 11 2.1.1 Description d’une série quantitative . . . . . . . . . . . . 11 2.1.2 Description d’une série qualitative . . . . . . . . . . . . . 14 2.2 Représentations graphiques . . . . . . . . . . . . . . . . . 14 2.2.1 Variables quantitatives discrètes : diagramme en bâtons et polygone des effectifs (fréquences) . . . . . . . . . . . . 14 2.2.2 Variables quantitatives continues : histogramme . . . . . . 14 2.2.3 Variables qualitatives . . . . . . . . . . . . . . . . . . . . 16 2.3 Caractéristiques numériques d’une distribution . . . . . 17 2.3.1 Les caractéristiques de position . . . . . . . . . . . . . . . 17 2.3.2 Les caractéristiques de dispersion . . . . . . . . . . . . . . 23 Dans ce cours, nous nous limitons aux séries statistiques à une variable. Les séries statistiques à deux variables seront étudiées dans le chapitre sur la régression linéaire et l’analyse de variance. 2.1 Description d’une série statistique à une variable 2.1.1 Description d’une série quantitative Soit X une variable quantitative observée sur une population Ωde taille n. Si X est discrète, on note par {x1, . . . , xp} l’ensemble de ses modalités. Définition 2.1 Si X est continue, l’ensemble C des modalités peut être partagé en p intervalles ou classes C1, . . . , Cp, la classe Ci étant de la forme Ci = [ai−1, ai[ où ai−1 < ai. Les nombres ai−1 et ai sont appelés les bornes de la classe Ci, le réel ci = ai−1 + ai 2 est son centre et li = ai −ai−1 est son amplitude. Par convention, a0 (resp. ap) désigne la plus petite (resp. la plus grande) valeur prise par X. 11 12 Chapitre 2. Statistique descriptive Définition 2.2 Soit X une variable discrète (resp. continue) décrite par ses mo- dalités (resp. ses classes) x1, · · · , xp (resp. C1 = [a0, a1[, . . . , Cp = [ap−1, ap[). On appelle : 1) effectif de la valeur xi (resp. de la classe Ci) : le nombre ni d’individus pour lesquels {X = xi} (resp. {X ∈Ci} c’est-à-dire {ai−1 ⩽X < ai}) ; 2) fréquence de la valeur xi (resp. de la classe Ci) : le rapport fi = ni n ; 3) effectif cumulé croissant associé à xi (resp. à ai) : nic = n1 + · · · + ni = i X k=1 nk; en d’autres termes, nic est le nombre d’individus pour lesquels X prend les mo- dalités inférieures ou égales à xi (resp. ai) ; 4) effectif cumulé décroissant associé à xi (resp. à ai−1) : nid = ni + · · · + np = p X k=i nk; en d’autres termes, nid est le nombre d’individus pour lesquels X prend les mo- dalités supérieures ou égales à xi (resp. ai). 5) On définit les fréquences cumulées croissantes et les fréquences cumulées décroissantes en divisant les effectifs cumulés correspondants par n. Ainsi fic = nic n et fid = nid n , pour tout i = 1, . . . , p. 6) On appelle distribution statistique de la variable X, la suite de couples (xi, ni) (resp. (Ci, ni)), i = 1, . . . , p. Remarque 2.1 Il est souvent plus commode de définir la distribution statistique d’une variable par un tableau de données de la forme : Table 2.1 – Exemple de distribution statistique d’une variable Modalités x1 . . . xp Effectifs n1 . . . np Exemple 2.1 On a relevé le nombre d’enfants de 40 couples. Les résultats obtenus sont donnés dans le tableau suivant : Nous pouvons compléter ce tableau avec les fréquences et les effectifs cumulés. 2.1. Description d’une série statistique à une variable 13 Table 2.2 – Nombre d’enfants pour 40 couples. Nombre d’enfants xi 0 1 2 3 4 Nombre de couples ni 12 20 5 2 1 xi 0 1 2 3 4 ni 12 20 5 2 1 nic 12 32 37 39 40 nid 40 28 8 3 1 fi (%) 30 50 12.5 5 2.5 fic (%) 30 80 92.5 97.5 100 fid (%) 100 70 20 7.5 2.5 Quelle interprétation pouvons-nous donner aux valeurs en gras ? 12.5% des couples interrogés ont exactement 2 enfants, 92.5% de ces couples ont 2 enfants ou moins, 20% des couples ont 2 enfants ou plus. Exemple 2.2 On a noté l’âge (arrondi à l’année près) de 48 salariés d’une entre- prise. La série statistique brute (données obtenues pendant l’enquête) est donnée ci-dessous : 43 29 57 45 50 29 37 59 46 31 46 24 33 38 49 31 62 60 52 38 43 26 41 52 60 49 52 41 38 26 37 59 57 41 29 33 33 43 46 57 46 33 46 49 57 57 46 43 Le tableau de données ci-dessous donne la distribution statistique de l’âge des 48 salariés en considérant les classes d’âge [20, 30[, [30, 40[, [40, 45[, [45, 50[, [50, 55[, [55, 60[ et [60, 65[ : Table 2.3 – Distribution statistique de l’âge des salariés. Ci [20, 30[ [30, 35[ [35, 40[ [40, 45[ [45, 50[ [50, 55[ [55, 60[ [60, 65[ ni 6 6 5 7 10 4 7 3 Les effectifs cumulés sont donnés par : Ci [20, 30[ [30, 35[ [35, 40[ [40, 45[ [45, 50[ [50, 55[ [55, 60[ [60, 65[ ni 6 6 5 7 10 4 7 3 nic 6 12 17 24 34 38 45 48 nid 48 42 36 31 24 14 10 3 Quelle interprétation pouvons-nous donner aux valeurs en gras ? 25 salariés ont moins de 45 ans, 30 salariés ont 40 ans ou plus. 14 Chapitre 2. Statistique descriptive 2.1.2 Description d’une série qualitative Pour une variable qualitative, les notions d’effectif et de fréquence restent va- lables en considérant les différentes modalités dudit caractère. Néanmoins, le calcul des effectifs cumulés et des fréquences cumulées n’a de sens que pour les variables qualitatives ordinales. Exemple 2.3 Reprenons les données du tableau 1.1 (page 8). L’effectif total est n = 6 191 155. Le tableau des fréquences est le suivant : Table 2.4 – Tableau de fréquences associé aux données du RGPH 2010. Région Maritime* Plateaux Centrale Kara Savanes Nombre d’habitants 2 599 955 1 375 165 617 871 769 940 828 224 Fréquences 0.420 0.222 0.100 0.124 0.134 * Lomé - Commune inclus. On peut y lire notamment que la région maritime abrite à elle seule 42% de la population togolaise (en 2010). 2.2 Représentations graphiques Elles permettent d’avoir rapidement une vue d’ensemble d’un tableau de données et de mettre en évidence certains faits essentiels. 2.2.1 Variables quantitatives discrètes : diagramme en bâ- tons et polygone des effectifs (fréquences) Soit (xi, ni), i = 1, . . . , p une série statistique quantitative discrète et soient f1, . . . , fp les fréquences respectives de chaque modalité. Le diagramme en bâtons des effectifs (resp. des fréquences) de cette distribution statistique est constitué de p segments verticaux d’abscisses xi et de hauteur ni (resp. fi). Le polygone des effectifs (resp. des fréquences) est obtenu à partir du dia- gramme en bâtons en joignant par des segments les sommets des bâtons. Exemple 2.4 La figure 2.1 donne le diagramme à bâtons et le polygone des effectifs associés au tableau 2.2. 2.2.2 Variables quantitatives continues : histogramme Soit ([ai−1, ai[, ni), i = 1, . . . , p une série statistique quantitative continue et soient f1, . . . , fp les fréquences respectives associées à chaque classe. 2.2. Représentations graphiques 15 0 5 10 15 20 Nombre d'enfants Nombre de couples 0 1 2 3 4 (a) Diagramme à bâtons 0 5 10 15 20 Nombre d'enfants Nombre de couples 0 1 2 3 4 (b) Polygone des effectifs Figure 2.1 – Diagramme en bâtons et polygone des effectifs associés au tableau 2.2. L’histogramme est un graphique formé de p rectangles juxtaposés tels que le rectangle associé à la classe i (i = 1, . . . , p) a une largeur égale à l’amplitude de la classe [ai−1, ai[ et une hauteur égale à hi = fi li , i = 1, . . . , p. Ainsi, l’aire totale de l’histogramme est égale à 1. L’histogramme donne rapidement une image de l’allure globale de la distribu- tion ; il montre l’étalement des données et apporte ainsi des renseignements sur la dispersion et sur les valeurs extrêmes ; il permet de déceler, éventuellement, des valeurs aberrantes. Exemple 2.5 Reprenons le tableau 2.3 et complétons-le avec uploads/Geographie/ 2-statistique-descriptive.pdf
Documents similaires










-
41
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Mai 30, 2021
- Catégorie Geography / Geogra...
- Langue French
- Taille du fichier 0.3770MB