ECO STAT CONSULTING Cours de statistique descriptive ESC Bardin BAHOUAYILA Pa
ECO STAT CONSULTING Cours de statistique descriptive ESC Bardin BAHOUAYILA Page 1 sur 16 Option: HDTS Année académique : 2015/2016 Rédigé par : BAHOUAYILA MILONGO Chancel Bardin1 1 E-mail : bardinbahouayila@yahoo.fr / bardin.bahouayila@facebook.com Tel : 05 075 33 71 / 06 837 81 85 REPUBLIQUE DU CONGO Institut Africain de la Statistique (IAS) ECO STAT CONSULTING Cours de statistique descriptive ESC Bardin BAHOUAYILA Page 2 sur 16 Sommaire INTRODUCTION ............................................................................................................................ 1 CHAPITRE 1 .................................................................................................................................... 2 I-1. LA POPULATION ....................................................................................................................... 2 I-2. L’UNITÉ STATTISTIQUE OU L’INDIVIDU ............................................................................ 2 I-3. L’ÉCHANTILLON ...................................................................................................................... 2 I-4. LE CARACTÈRE OU LA VARIABLE ...................................................................................... 2 I-5. LA MODALITÉ ........................................................................................................................... 3 I-6. LA DISCRÉTISATION ............................................................................................................... 3 CHAPITRE 2 .................................................................................................................................... 4 II-1. LES FREQUENCES ABSOLUE, RELATIVE ET CUMULEE ................................................ 4 II-2. LA MOYENNE ........................................................................................................................... 5 II-3. LE MODE ................................................................................................................................... 7 II-4. LA MEDIANE ............................................................................................................................ 8 II-5. LES FRACTILES ........................................................................................................................ 8 CHAPITRE 3 .................................................................................................................................... 9 III-1. L’ETENDU ET LE RAPPORT DE VARIATION .................................................................... 9 III-2. L’INTERVALLE INTERQUARTILE .................................................................................... 11 III-3. LA VARIANCE ET L’ECART-TYPE .................................................................................... 11 III-4. LE COEFFICIENT DE VARIATION ..................................................................................... 13 CHAPITRE 4 : ................................................................................................................................ 14 IV-1. LE CAS DES VARIABLES CONTINUES ............................................................................ 14 IV-2. LE CAS DES VARIABLES DISCRETES .............................................................................. 15 IV-3. LE CAS DES VARIABLES QUALITATIVES ...................................................................... 15 ECO STAT CONSULTING Cours de statistique descriptive ESC Bardin BAHOUAYILA Page 1 sur 16 INTRODUCTION En présence d’un ensemble de données chiffrées l’esprit a un besoin spontané de simplification. Selon les critères qui lui sont propre, il cherche d’une part à représenter et à classer ces données ; d’autre part, il souhaite résumer la multiplicité et la complexité des notations par des caractéristiques synthétiques. De ce fait, l’homme est conduit à déterminer les caractéristiques centrales (moyenne, médiane, etc.), à construire des graphiques (histogramme, camembert, etc.), à calculer des caractéristiques de dispersion (écart-type, rapport de variation, intervalle interquartile, etc.) et à comparer des « séries statistiques ». C’est en voulant tout cela qu'est née la notion de statistique descriptive. Le but de la statistique descriptive est donc de décrire des données en mettant de l'ordre et une certain régularité; c'est comme si l'on faisait le résumé du livre : le résumé à l'avantage d'être plus court, plus facile à lire et comporte les éléments essentiels, mais le résumé néglige certains aspects pour faciliter la lecture. Ceci dit, en dehors de la statistique descriptive, il existe la statistique inférentielle qui permet de savoir à quel point l'on peut résumer sans perdre des informations essentielles et quel est le meilleur résumé avec le moins d'erreur. Cette branche des statistiques s’intéresse davantage à extrapoler des résultats issus d’échantillons en vue de caractériser une population mère inconnue, de faire des prévisions de comportements basées sur le calcul de probabilités. Malheureusement, dans ce cours, nous ne nous focaliserons que sur la statistique descriptive. Ce cours est destiné en priorité à un public n’ayant aucune formation en statistique et cependant confronté de façon récurrente à la manipulation et à l’analyse de séries de données. Aucun pré-requis en mathématique n’est exigé si ce n’est la connaissance des opérations mathématiques de base. Volonté, curiosité et ténacité permettront de maîtriser sans encombre les notions abordées qui, malgré leur complexité apparente, demeurent relativement simples. Cette formation se présente davantage comme une initiation à la rigueur que nécessite la manipulation d’ensembles de données afin d’utiliser à bon escient les méthodes appropriées pour éviter de faire parler faussement les chiffres. Les concepts et méthodes statistiques seront abordés au travers de nombreux exemples. Au final, il s’agira de se familiariser avec les données et de connaitre la méthode statistique en général en vue de décrire, de résumer et d’analyser une population ou un ensemble de données. ECO STAT CONSULTING Cours de statistique descriptive ESC Bardin BAHOUAYILA Page 2 sur 16 CHAPITRE 1 PRÉSENTATION DES DONNÉES La statistique est une méthode scientifique qui consiste à réunir des données chiffrées sur des ensembles nombreux, puis à analyser, à commenter et à critiquer ces données. En d’autres termes, c’est une science qui a pour objectif : la planification du projet ; la collecte, la codification, la saisie, le traitement et l’analyse des données ; la publication des résultats. Il ne faut pas confondre la statistique qui est la science qui vient d’être définie et une statistique qui est un ensemble de données chiffrées sur un sujet précis. Les premières statistiques correctement élaborées ont été celles des recensements démographiques. Ainsi le vocabulaire statistique est essentiellement celui de la démographie. Les ensembles étudiés sont appelés population. Les éléments de la population sont appelés individus ou unités statistiques. La population est étudiée selon un ou plusieurs caractères. I-1. LA POPULATION C’est l’ensemble des individus (ou unités statistiques) présentant un caractère commun. Pour une thématique donnée, la population regroupe toujours la totalité des individus relatifs à cette thématique (notion d'exhaustivité). Exemples : la population congolaise, les pays de la CEMAC, les clients d’une entreprise. La population est en général notée P L'effectif total d'une population est noté N. I-2. L’UNITÉ STATTISTIQUE OU L’INDIVIDU C’est l’élément de base constitutif de la population à laquelle il appartient. Il est indivisible et peut être un pays, un végétal, un humain ou une entreprise. I-3. L’ÉCHANTILLON C’est un sous-ensemble construit et représentatif d'une population donnée. I-4. LE CARACTÈRE OU LA VARIABLE C’est la (les) caractéristique(s) de l'individu intégrant la population étudiée. Exemple : la couleur, le sexe, le poids, la taille, la marque, le modèle, l'espèce, le prix, la surface, etc. I-4.1 Variable qualitative Une variable statistique est dite de nature qualitative si ses modalités ne sont pas mesurables. Les modalités d’une variable qualitative sont les différentes catégories d’une nomenclature. Ces catégories doivent être exhaustives (chaque individu est affecté à une modalité) et incompatibles (un individu ne peut être affecté à plusieurs modalités) de façon à créer une partition. Le sexe, la profession, l’état matrimonial sont quelques exemples de variables qualitatives. Pour ses enquêtes auprès des ménages, l’Insee utilise la nomenclature des Professions et catégories socioprofessionnelles (PCS-2003). Les modalités d’une variable qualitative peuvent être classées sur deux types d’échelle : nominale ou ordinale. À ces deux types d’échelle correspondent deux types de variables qualitatives. ECO STAT CONSULTING Cours de statistique descriptive ESC Bardin BAHOUAYILA Page 3 sur 16 Variable qualitative nominale Une variable statistique qualitative est dite définie sur une échelle nominale si ses modalités ne sont pas naturellement ordonnées. Exemples : Situation d’activité, statut matrimonial. Variable qualitative ordinale Une variable statistique qualitative est dite ordinale si l’ensemble de ses modalités peut être doté d’une relation d’ordre. Exemple : Niveau d’instruction. I-4.2 Variable quantitative Toute variable qui n’est pas qualitative ne peut être que quantitative. Les différentes modalités d’une variable quantitative constituent l’ensemble des valeurs numériques que peut prendre la variable. Une variable statistique est dite de nature quantitative si ses modalités sont mesurables. Les modalités d’une variable quantitative sont des nombres liés à l’unité choisie, qui doit toujours être précisée. Il existe deux types de variables quantitatives : les variables discrètes et les variables continues. Ces variables ont en commun des modalités clairement ordonnées, pour lesquelles l’écart entre les valeurs possède une signification, et sur lesquelles il est possible de réaliser des opérations mathématiques telles que des calculs de moyennes, etc. Néanmoins, elles ont des propriétés et des traitements spécifiques qui nécessitent une étude séparée. Variable quantitative discrète Lorsque les modalités sont des valeurs numériques isolées, comme le nombre d’enfants par ménage, on parle de variable discrète. Exemples : Âge, salaire, nombre de lit dans un hôpital. Variable quantitative continue Lorsque la variable, par exemple la taille d’un individu, peut prendre toutes les valeurs d’un intervalle, ces valeurs peuvent alors être regroupées en classes, et on parle dans ce cas de variable continue. Exemples : Poids, taux du sucre, taille, taux du sel. I-5. LA MODALITÉ C’est la valeur qualitative ou quantitative que peut prendre le caractère précédemment défini. Exemple : sexe féminin ou masculin, poids 45 kg, couleur verte, etc. Attention, les modalités sont exhaustives et mutuellement exclusives. Chaque individu doit pouvoir être classé dans une et une seule modalité. I-6. LA DISCRÉTISATION Lorsque les modalités sont des valeurs numériques isolées, comme le nombre d’enfants par ménage, on parle de variable discrète. Ce découpage en classes pose de nombreuses questions : choix des amplitudes, amplitudes constantes ou variables, nombre de classes, etc. Nous ne rentrerons pas ici dans le détail de ces opérations. ECO STAT CONSULTING Cours de statistique descriptive ESC Bardin BAHOUAYILA Page 4 sur 16 CHAPITRE 2 CARACTÉRISTIQUES DE TENDANCE CENTRALE DES DONNÉES Les paramètres de tendance centrale ou « mesures de tendance centrale » sont des grandeurs susceptibles de représenter au mieux un ensemble de données. L'appellation «tendance centrale » vient du fait que ces paramètres donnent une idée de ce qui se passe au centre d'une distribution, d'un ensemble de données. On distingue trois mesures de tendance centrale : La moyenne ; Le mode ; La médiane. Tous trois ne décrivent par la même chose et sont, de ce fait, complémentaires dans la description et l'analyse d'une uploads/Geographie/ cours-statistique-descriptive.pdf
Documents similaires










-
27
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Aoû 29, 2021
- Catégorie Geography / Geogra...
- Langue French
- Taille du fichier 1.5070MB