UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 201

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2019 – 2020 L1 Économie Cours de B. Desgraupes Statistiques Descriptives Séance 02: Représentations graphiques Table des matières 1 Introduction 1 2 Diagrammes à secteurs circulaires 1 3 Diagrammes en bâtons 3 4 Diagrammes d’effectifs cumulés 6 5 Histogrammes 7 6 Polygônes de fréquence 12 7 Diagrammes de dispersion 14 8 Courbes d’évolution 18 1 Introduction La statistique descriptive a deux approches pour décrire un jeu de données observées : 1. une approche graphique qui a pour objectif de fournir des représentations graphiques permettant de visualiser la distribution des données. 2. une approche quantitative qui a pour but de calculer des indices numériques caractérisant la répartition des données, les tendances, la dispersion, la concentration, etc. Le présent document passe en revue les principales représentations graphiques utilisées dans les analyses statistiques et économiques ainsi que dans les arti- cles. Selon le type de variable statistique étudié, on a recours à des graphiques différents. 1 2 Diagrammes à secteurs circulaires Les diagrammes à secteurs circulaires sont aussi appelés camemberts (ou pie en anglais). Ils conviennent pour représenter des variables qualitatives ou des variables quantitatives discrètes. Il est préférable qu’il y ait un nombre restreint de modalités pour que le graphique reste lisible. Ce sont des disques découpés en secteurs dont l’angle est proportionnel aux proportions (ou fréquences) de chaque modalité. Le secteur total étant de 360◦, si fi est la fréquence de la i-ième modalité, on la représente par un secteur d’angle αi défini comme ceci : αi = fi × 360 = ni N × 360 • Exemple On utilise les données suivantes : Taux de réussite au baccalauréat en 2013 dans l’académie de Lille Si on isole les trois grands types de baccalauréats, on obtient les résultats suivants : Type Total Proportions Angles Baccalauréat général 19 772 46.79% 168◦ Baccalauréat technologique 9 043 21.40% 77◦ Baccalauréat professionnel 13 439 31.81% 115◦ L’effectif total est 19 772 + 9 043 + 13 439 = 42 254. Bac général Bac techno Bac pro Ce diagramme représente les parts relatives de chacun des types de baccalau- réats. Exercice 1 2 Réaliser un diagramme à secteurs circulaires pour les sous-catégories du bac- calauréat général. • Corrigé Les données sont les suivantes : Type Effectifs Proportions Angles Littéraires 2 889 14.61% 54◦ Sc. économiques et sociales 5 971 30.20% 108◦ Sc. Ecologie Agronomie 178 0.90% 4◦ Scientifiques SVT 9 916 50.15% 180◦ Sciences de l’Ingénieur 818 4.14% 14◦ Ensemble 19 772 100% 360◦ Littéraires SES Agronomie SVT Ingénieurs Remarque : Les diagrammes à secteurs circulaires sont très populaires dans la presse mais sont considérés comme extrêmement imprécis et même trompeurs. En effet, l’oeil humain a du mal à apprécier les différences de taille angulaire et des expériences ont montré qu’on pouvait facilement être abusé par des effets d’optique dus à la position du diagramme ou aux couleurs utilisées... 3 Diagrammes en bâtons Les diagrammes en bâtons s’appellent aussi des diagrammes à bandes. Ils convi- ennent pour représenter des variables qualitatives ou des variables quantitatives 3 discrètes. Il est préférable qu’il y ait un nombre restreint de modalités pour que le graphique reste lisible. Les modalités sont représentées en abscisse et les effectifs correspondants sont représentés par des lignes ou des bandes verticales dont la hauteur est proportionnelle à la valeur. C’est donc la hauteur des lignes ou des bandes qui permet d’apprécier les tailles relatives des différentes modalités. Les diagrammes en bâtons sont plus faciles à lire que les diagrammes circulaires. Dans le cas d’une variable qualitative, la position des modalités en abscisse n’a pas de signification particulière. Si la variable est ordinale, on placera les modalités dans leur ordre naturel. • Exemple Reprenons l’exemple des catégories du baccalauréat. On obtient le dia- gramme suivant : général techno pro 0 5000 10000 15000 On peut aussi faire les diagrammes en proportions plutôt qu’en effectifs: 4 général techno pro 0.0 0.1 0.2 0.3 0.4 Fréquences et effectifs étant proportionnels (dans le rapport N), l’aspect vi- suel est rigoureusement identique. Seules changent les valeurs sur l’axe vertical. Un avantage des diagrammes en bâtons par rapport aux diagrammes circu- laires est qu’ils permettent de représenter plusieurs distributions en parallèle. Pour une même modalité, on peut placer côte à côte plusieurs lignes ou bandes verticales, correspondant à des sous-ensembles différents. Un autre mode de représentation consiste à empiler les valeurs verticalement en faisant plusieurs segments. • Exemple Le tableau suivant donne les proportions de réussite au baccalauréat dans l’académie de La Réunion pour les filles et les garçons de 2005 à 2011. Année 2005 2006 2007 2008 2009 2010 Filles 60,1 59,7 63,8 63,3 65,5 65,9 Garçons 42,8 44,2 43,5 47,1 48,4 49,4 Les valeurs sont exprimées en pourcentage. Dans le diagramme suivant les valeurs sont placées côte à côte. 5 2005 2006 2007 2008 2009 2010 Taux de réussite filles/garçons au bac Académie de La Réunion 0.0 0.1 0.2 0.3 0.4 0.5 0.6 Dans le diagramme suivant les valeurs sont empilées verticalement. 2005 2006 2007 2008 2009 2010 Taux de réussite filles/garçons au bac Académie de La Réunion 0.0 0.2 0.4 0.6 0.8 1.0 La ligne brisée qui joint les sommets des bâtons s’appelle polygône des ef- fectifs. Par exemple, en reprenant les taux de réussite au bac chez les filles, on obtient le diagramme suivant : 6 2005 2006 2007 2008 2009 2010 0.40 0.45 0.50 0.55 0.60 0.65 0.70 Taux de réussite des filles au bac Académie de La Réunion 4 Diagrammes d’effectifs cumulés Les diagrammes d’effectifs cumulés représentent la répartition de la distribution des effectifs. Pour chaque modalité, on place en ordonnées la valeurs des fréquences (ou parfois des effectifs) cumulées. On représente la progression par une fonction en escaliers. Les fréquences constituent les paliers. Ce type de graphique n’a de sens que si les modalités sont ordonnées. • Exemple Reprenons les données concernant le nombre de pièces des résidences prin- cipales. On avait les effectifs et proportions suivants : Nombre de pièces Effectifs Fréquences Fréq. cumulées 1 pièce 1 571 903 5,75% 5,75% 2 pièces 3 417 233 12,50% 18,25% 3 pièces 5 723 944 20,93% 39,18% 4 pièces 6 914 989 25,29% 64,47% 5 pièces 5 315 838 19,44% 83,91% ≥6 pièces 4 403 719 16,10% 100% 7 1 2 3 4 5 6 7 0 20 40 60 80 100 Diagramme de fréquences cumulées Nombre de pièces dans résidence principales Pourcentages 5 Histogrammes Les histogrammes sont des graphiques qui permettent de visualiser les propor- tions au moyen de rectangles verticaux. Ils concernent les variables quantita- tives discrètes ou les variables quantitatives continues qu’on regroupe en classes contiguës. Un histogramme peut être dessiné en effectifs ou en fréquences : comme ce sont des grandeurs proportionnelles, cela ne change pas l’allure du graphique mais seulement les valeurs portées sur l’axe vertical. Dans un contexte de recherche de densités, on préfèrera un histogramme en fréquences. Voici un histogramme correspondant à des notes obtenues à un examen par 1000 étudiants. 8 Histogramme en effectifs de 1000 notes Notes Effectifs 0 5 10 15 20 0 50 100 150 200 250 Histogramme en fréquences de 1000 notes Notes Effectifs 0 5 10 15 20 0.00 0.02 0.04 0.06 0.08 0.10 0.12 Le principe de construction d’un histogramme consiste à découper les don- nées en classes et à dessiner des rectangles dont la surface est proportionnelle aux effectifs (ou aux fréquences). La base des rectangles correspond à chaque intervalle [ei, ei+1[. La largeur de ces intervalles est l’amplitude ai = ei+1 −ei. Si on désigne la hauteur par hi, la surface du rectangle est alors Si = ai × hi Cette valeur doit correspondre à l’effectif ni (pour un histogramme en effec- tifs) ou à la fréquence fi (pour un histogramme en fréquences). 9 hi ai ei ei+1 ni ∝ai × hi La surface représente l’effectif On a relevé le loyer annuel de 500 domiciles d’une agglomération et obtenu le tableau d’effectifs suivant : Classes Effectifs [4,5[ 13 [5,6[ 56 [6,8[ 224 [8,10[ 115 [10,12[ 46 [12,14[ 29 [14,16[ 15 [16,18[ 2 Les loyers sont indiqués en milliers d’euros et répartis en classes. 10 4000 6000 8000 10000 12000 14000 16000 18000 0 50 100 150 200 250 Histogramme des loyers On remarque que les deux premières classes ont une amplitude de 1 (c’est- à-dire 1000 euros) tandis que les suivantes ont une amplitude de 2 (c’est-à-dire 2000 euros). Cela a pour conséquence que les deux premiers rectangles sont deux fois plus hauts et en particulier que le deuxième et le quatrième ont approximativement la même hauteur. En effet le deuxième correspond à la valeur n2 = 56 qui a été multipliée par 2, à savoir 112, tandis que le quatrième correspond à la valeur n4 = 115. Dans le cas d’un histogramme en fréquences (ou proportions), la surface Si s’interprète comme la fréquence fi c’est-à-dire la proportion des observations qui se trouvent dans l’intervalle [ei, ei+1[. On peut écrire : Si = P(ei ≤X < ei+1) L’intérêt uploads/Litterature/ stats-seance-02-doc.pdf

  • 22
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager