2 Statistique Descriptive Fabrice MAZEROLLE Notes de cours Dernière mise à jour

2 Statistique Descriptive Fabrice MAZEROLLE Notes de cours Dernière mise à jour le jeudi 12 février 2009 (Les liens vers les fichiers EXCEL ont été restaurés – s’il reste des liens cassés, merci de me le signaler à fabrice.mazerolle@univ-cezanne.fr ) 1ère année de Licence AES – Marseille & Aix 3 Résumé du cours Ce cours d’introduction à la statistique descriptive de niveau L1 a pour objet de donner les outils de bases permettant de décrire une population statistique. Une première section est consacrée à la définition des termes habituellement utilisés en statistique descriptive. Le chapitre 2 introduit l’outil de base d’analyse des chiffres : le tableau. Le chapitre 3 est consacré à la présentation des principales statistiques permettant de résumer une masse de chiffres. Le chapitre 4 traite des formules de base utilisées dans l’analyse des évolutions temporelles impliquant des grandeurs quantitatives. Le chapitre 5 complète les quatre chapitres précédents en décrivant l’éventail des graphiques statistiques. Le chapitre 6 peut être conçu comme une première étape vers la statistique mathématique, bien que restant rattaché à la statistique descriptive : il présente les outils de base de l’analyse des tendances et des corrélations. Enfin le chapitre 7 est essentiellement utile à l‘étudiant en économie : il traite de la courbe de LORENZ et du coefficient de GINI, deux outils complémentaires dont les principales applications sont l’analyse de la plus ou moins grande égalité de la répartition d’une masse (de revenu, de richesse, de ressources, etc.) au sein d’une population. Pour toute question ou suggestion relative à ce cours, merci de m’adresser un mail à fabrice.mazerolle@univ-cezanne.fr 4 Note sur les calculs et les arrondis : Dans le cours qui suit, pour limiter les erreurs déjà trop nombreuses, les calculs sont toujours effectués à la machine ou avec un logiciel (EXCEL le plus souvent). Les résultats finaux imprimés sont presque toujours arrondis pour faciliter la lecture. Cependant lorsqu’un résultat nécessite plusieurs calculs intermédiaires, les calculs intermédiaires sont évidemment effectués par la machine ou par le logiciel en conservant toutes les décimales (dans la limite des capacités de la machine ou du niveau de précision choisi ou fixé par défaut), seul le dernier résultat étant arrondi « au plus proche » (méthode de l’arrondi arithmétique). La méthode de l’arrondi arithmétique consiste à choisir, à la droite de la virgule, le dernier chiffre à conserver, puis à augmenter ce chiffre d'une unité si le chiffre suivant vaut au moins 5 (« arrondissage par excès ») et à conserver ce chiffre si le suivant est strictement inférieur à 5 (« arrondissage par défaut ») Par exemple, 3,046 arrondis aux centièmes valent 3,05 (le chiffre suivant (6) est supérieur à 5). Voici d'autres exemples en ne gardant qu'un seul chiffre significatif après la virgule : • 1,349 devient 1,3 (car le chiffre suivant 3 est strictement inférieur à 5) • 1,350 devient 1,4 (car le chiffre suivant 3 vaut au moins 5) Cette méthode est celle appliquée par défaut dans le logiciel « EXCEL » quand on choisit le nombre de décimales à partir des icônes ci-après : Voir l’article Wikipédia sur la notion d’arrondi pour un aperçu des autres méthodes d’arrondi : http://fr.wikipedia.org/wiki/Arrondi Les machines à calculer étant autorisées à l’examen, les étudiants sont invités à appliquer aussi cette méthode. 5 Sommaire Chapitre 1 : Vocabulaire de la statistique descriptive Chapitre 2 : Les tableaux statistiques Chapitre 3 : Statistiques permettant de résumer une série Chapitre 4 : Indices et progressions Chapitre 5 : Diagrammes et graphiques Chapitre 6 : Tendances et corrélations Chapitre 7 : Courbe de LORENZ et coefficient de GINI Bibliographie 6 Chapitre 1 Vocabulaire de la statistique descriptive 0 – Introduction 1 – Définition du champ de la statistique descriptive 2 – Terminologie A – Population et unités statistiques B – Echantillons et sous-ensembles d’une population 1) Echantillon et population 2) Répartition des unités statistiques selon différents critères C - Critères de classification 1) Critères quantitatifs 2) Critères qualitatifs 3 – Modes de regroupement des unités statistiques A - Série simple B - Distribution par valeurs ou par modalités 1) Distribution par valeurs 2) Distribution par modalités C - Regroupement par catégories 1) Catégories de valeurs 2) Catégories de modalités 4 – Résumé 0 – Introduction Ce chapitre présente le champ de la statistique descriptive et son vocabulaire de base. 1 – Définition du champ de la statistique descriptive On divise généralement l'étude de la statistique générale en deux parties : • La statistique descriptive, qui est un ensemble de méthodes permettant de décrire les unités statistiques (voir la section 2 pour une définition plus précise du terme "unité statistique") qui composent une population (voir la section 2 pour une définition plus précise du terme "population"). • La statistique mathématique dont l'objet est de formuler des lois à partir de l'observation d'échantillons, c'est-à-dire de tirages limités effectués au sein d’une population. La statistique mathématique intervient dans les enquêtes et les sondages. Elle s'appuie sur la statistique descriptive, mais aussi sur le calcul des probabilités. 7 La statistique, qu’elle soit descriptive ou mathématique, est employée dans toutes les sciences, ainsi que dans la vie quotidienne. Son utilisation très intensive dans le champ de l’économie a fait naître une nouvelle expression : L’économétrie. L’économétrie est l’application de la statistique (descriptive et mathématique) à la mesure et à l’étude chiffrée des grandeurs économiques. De la même façon, on emploie parfois l’expression (un peu vieillie) de « sociométrie », pour parler de l’application de la statistique (descriptive et mathématique) à la mesure et à l’étude chiffrée des grandeurs sociologiques 2 - Terminologie A – Population et unités statistiques En statistique, la population désigne un ensemble d'unités statistiques. Les unités statistiques sont les entités abstraites qui représentent des personnes, des populations d'animaux ou des objets. Les premières populations ayant fait l'objet d’un recensement ayant été des populations humaines (d'où le lien étroit entre statistique et démographie) le terme "individu" est parfois employé comme synonyme du terme "unité statistique". 8 La statistique sert à décrire l'ensemble des unités statistiques qui composent la population. On commence par compter ces unités. La première information statistique que l'on tire d'une population est en effet le nombre de ses unités. Exemple : Le tableau 1 ci-après qui contient des statistiques macroéconomiques relatives aux 27 pays de l’UE, plus huit de ses principaux partenaires commerciaux. L’unité statistique étant le pays, le tableau contient une population de 35 unités statistiques. Tableau 1 : Quelques statistiques macroéconomiques des pays de l’UE à 27 et de huit de ses partenaires commerciaux B – Echantillons et sous-ensembles d’une population 1) Echantillon et population Il est fréquent que l’on prélève un échantillon dans une population statistique. Le diagramme d’EULER ci-après décrit le lien entre l’échantillon et la population. Le lien entre l’échantillon et la population En général, on parle d’échantillon d’une population statistique quand les unités statistiques sont tirées au sort ou alors choisies par une méthode qui permet d’assurer la représentativité de l’échantillon par rapport à la population totale. Cependant, ces définitions ne concernent plus directement la statistique descriptive mais plutôt la statistique mathématique. 2) Répartition des unités statistiques selon différents critères Par ailleurs, il est fréquent aussi que l’on divise une population en sous-ensembles au moyen de certains critères (ou dimensions ou encore caractéristiques). Prenons pour exemple la population des 35 pays du tableau 1. Ces 35 pays sont les unités statistiques du tableau. Nous souhaitons par exemple « découper » cette population entre trois sous ensembles, suivant les critères de la monnaie utilisée et l’appartenance à l’UE 27. 10 On aura donc, comme l’illustre le schéma ci-après : • 16 pays membres de l’UE 27 qui font partie de la zone Euro au 1er janvier 2009, • 11 pays membres de l’UE à 27 qui ne font pas (encore) partie de la zone Euro au 1er janvier 2009 • 8 pays partenaires de l’UE 27 et qui utilisent d’autres monnaies. Les 35 pays du tableau 1 répartis selon deux critères C - Critères de classification Nous avons vu dans l’exemple précédent que les unités statistiques d’une population pouvaient être regroupées suivant des dimensions ou critères. Ces critères sont choisis en fonction de ce qui intéresse le statisticien. 11 On distingue deux sortes de critères : • Les critères quantitatifs • Les critères qualitatifs 1) Critères quantitatifs Les critères quantitatifs sont les critères qui sont représentés par des nombres et sur lesquels les opérations arithmétiques de base ont un sens. Les critères quantitatifs sont souvent appelés variables. Par exemple, dans le tableau 1 , on peut voir que la superficie est un critère de classification quantitatif. C’est une variable dont les différentes occurrences sont des valeurs. Chacune des 35 unités statistiques de notre population est caractérisée par une valeur différente. La superficie est donc, dans notre cas particulier, une variable qui prend 35 valeurs différentes. C’est un cas particulier dans lequel le nombre de valeurs de la variable est égal au nombre des unités statistiques de la population. Nous verrons que dans des cas de ce uploads/Geographie/ statistique-descriptive.pdf

  • 12
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager