STATISTIQUE DESCRIPTIVE §1 Introduction La statistique désigne l’ensemble des m

STATISTIQUE DESCRIPTIVE §1 Introduction La statistique désigne l’ensemble des méthodes mathématiques relatives à la collecte, à la présentation, à l’analyse et à l’utilisation de données numériques. Ces opérations permettent de tirer des conclusions et de prendre des décisions dans les situations d’incertitude qu’on rencontre dans le domaine économique, dans celui des a¤aires ou dans d’autres sciences sociales..... On distingue la statistique descriptive et la statistique inductive. La première résume, récapitule, analyse un ensemble de données . La seconde conclut sur le tout aprés examen d’une partie. Le tout est alors appelé population et une partie est appelée un échantillon . §2 Terminologie : - La population est l’ensemble de tous les individus concernés par une étude statistique Exemple 1: Si l’on veut étudier la qualité des allumettes fabriquées par une usine, la population sera l’ensemble de toutes les allumettes fabriquées par cette usine. - On appelle échantillon toute partie de la population. - On appelle individu chaque élément de la population. - La taille représente le nombre d’individus d’un échantillon ou d’une population. Elle est notée n dans le cas d’un échantillon et N dans le cas d’une population. - Le caractère est l’aspect particulier que l’on désire étudier. Exemple 2: Concernant un groupe de personnes, on peut s’intéresser au caractère âge, ou au caractère sexe ou encore à leur taille . 1 - On appelle modalités les di¤érentes possibilités que peut présenter un caractère. Exemple 3: - Le sexe est un caractère à deux modalités : féminin ou masculin - Le caractère nombre d’enfants par famille peut être égal à 0; 1; 2; ::: - On dira d’un caractère qu’il est qualitatif si ses modalités ne s’expriment pas par un nombre. Exemple 4 : La religion , la marque d’une lessive et la couleur des yeux sont des caractères qualitatifs. - On dit d’un caractère qu’il est quantitatif si ses modalités sont numériques. Exemple 5 : L’âge , le poids , le salaire , . . . sont des caractères quantitatifs. - On appelle série statistique l’ensemble des di¤érentes données associées aux individus d’un échantillon ou d’une population. Exemple 6: - La série suivante représente les notes (sur 20 ) obtenues par 10 étudiants en statistique : 10 15 9 7 6 5 8 13 11 19 - La série suivante représente le sexe de 10 étudiants de première année de l0ISIAM : F F M M F F F M M F 2 §3 Traitement des données - D’une façon générale , on distingue 3 étapes dans le traitement d’une série statistique : A) La synthèse des résultats à l’aide d’un tableau; B) La représentation graphique du phénomène étudié; C) Le calcul des mesures caractéristiques. Expliquons maintenant comment il faut procéder dans chaque étape. A) Tableaux statistiques 1) Cas d’un caractère qualitatif - La taille de l’échantillon est n - Les di¤érentes modalités sont x1; x2; :::; xk . - Chaque modalité constitue une classe . - Le nombre d’individus qui appartiennent à la classe xi s’appelle l’e¤ectif (ou la fréquence absolue ) de cette classe . Il est noté fi. On a toujours f1 + f2 + ::: + fk = n - La fréquence relative de la classe xi est fi n . - Souvent on préfère exprimer la fréquence relative en pourcentage ; pour cela, il su¢t de multiplier fi n par 100 . Exemple : La série statistique suivante représente l’état-civil d’un 3 groupe de 20 personnes . MCMV MMDV DMCV V V V CCCMM où M; D; C et V représentent respectivement marié(e), divorcé(e), céli- bataire et veuf(ve). R epartition d0un groupe de 20 personnes selon leur  etat civil Etat-civil e¤ectifs fréq.relatives fi n pourcentages fi n100 M 7 0; 35 35 C 5 0; 25 25 V 6 0; 30 30 D 2 0; 10 10 Total 20 1 100 2) Cas d’un caractère quantitatif discret : - Un caractère quantitatif est discret si l’ensemble des valeurs qu’il peut prendre est …ni. Exemple 1: - Le nombre d’enfants par famille et le nombre de téléviseurs fabriqués par une usine par jour sont des caractères quantitatifs discrets , par contre le caractère poids n’est pas discret . Pour l’élaboration du tableau , il faut voir si le caractère présente beau- coup de valeurs di¤erentes ou non . Dans le deuxième cas on procède comme dans le cas d’un caractère qualitatif et dans le premier cas on regroupe les données comme dans le cas d’un caractère continu qui sera traité ultérieurement . Exemple 2: La série suivante donne le nombre d’enfants à charge dans 16 familles . 0 1 0 0 2 1 3 0 1 2 0 1 2 2 2 4 4 R epartition de 16 familles selon le nombre d0enfants  a charge nb.d’enf e¤ fi freq.rel. fi n pourcentfi n  100 e¤. cumul Fi 0 5 0; 3125 31; 25 5 1 4 0; 25 25 9 2 5 0; 3125 31; 25 14 3 1 0; 0625 6; 25 15 4 1 0; 0625 6; 25 16 Total 16 1 100 /////////////////////////// - La colonne des e¤ectifs cumulés Fi s’obtient en additionnant à l’e¤ectif d’une classe l’e¤ectif de chacune des classes qui la pécède , ainsi on a : F1 = f1 , F2 = f1 + f2 , . . . , Fi = f1 + f2 + ::: + fi Fi correspond au nombre de données de la série dont la valeur est in- férieure à la classe xi. 2) Cas d’un caractère quantitatif continu : Un caractère quantitatif est continu s’il peut prendre théoriquement n’importe quelle valeur dans un intervalle donné . Exemple 1 :La taille des individus et leur poids sont des caractères quantitatifs continus . Dans ce cas (ou dans le cas d’un caractère discret avec beaucoup de valeurs di¤erentes) la construction du tableau passe par les étapes suiv- antes : Etape 1 : Déterminer l’étendu de la série Notée e, l’étendu de la série est la di¤érence entre la plus grande valeur et la plus petite valeur observée. Etape 2 : Déterminer le nombre de classes Noté k, le nombre de classe doit se situer entre 5 et 15 , et s’il n’a pas 5 été imposé on peut le déterminer à partir de la formule de Sturges : k = la valeur entière la plus rapprochée de 1 + 3; 322 log10(n) où n est le nombre de données de la série. Exemple 2 : - Pour n = 12 on a 1 + 3; 322log10(12) = 4; 585::: donc k = 5 classes - Pour n = 15 on a 1+3; 322log10(15) = 4; 906::: donc k = 5 classes - Pour n = 25 on a 1 + 3; 322log10(25) = 5; 643::: donc k = 6 classes - Pour n = 1000 on a 1 + 3; 322log10(1000) = 10; 966::. donc k = 11 classes. Etape 3 : Déterminer l’amplitude des classes Notée c, l’amplitude des classes ne doit pas contenir plus de chi¤res après la virgule que les données de la série . Ainsi après avoir calculé le quotient e k , il faut tronquer le résultat pour éliminer les décimales non utiles et additionner 1 au dernier chi¤re. Exemple 3: Si e k = 0; 9361 alors pour des données à 2 chi¤res après la virgule c = 0; 94 mais pour des données entières c = 1. Etape 4 : Construire les intervalles En procédant avec la même unité de mesure que les données de la série , on …xe tout d’abord la limite inférieure du premier intervalle . La valeur choisie peut être soit la plus petite mesure de la série , soit une valeur qui lui est assez voisine mais inférieure . En additionnant l’amplitude à cette valeur , on obtient la limite supérieure de la classe . Pour les classes suivantes , la limite inférieure coincide avec la limite supérieure de la classe précédente . L’addition à la limite inférieure de l’amplitude permet encore d’établir la limite supérieure . Par convention ,pour que toute donnée appartienne à une seule classe, 6 les intervalles seront fermés à gauche et ouverts à droite . Exemple (voir plus loin ) Etape 5 : Etablir la fréquence des classes Pour compléter le tableau, il reste à déterminer - le centre des classes mi = limite inférieure + limite supérieure 2 (Les centres des classes serviront dans le calcul des mesures caractéristiques ) - Les e¤ectifs fi . - Les e¤ectifs cumulés Fi . - Les fréquences relatives fi n . - Les fréquences relatives en pourcentages fi n  100. Exemple 4 : La série suivante représente le poids réel , en grammes , d’un échantillon de 23 boites de con…ture de marques di¤érentes : 271 516 414 242 510 uploads/Geographie/ cours-de-statistiques.pdf

  • 33
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager