1 Eléments de statistique Introduction Les statistiques, à quoi ça sert ? Que d
1 Eléments de statistique Introduction Les statistiques, à quoi ça sert ? Que dit le dictionnaire ? Statistiques : Branche des mathématiques appliquées qui a pour objet l’étude des phénomènes mettant en jeu un grand nombre d’éléments. En économie, les statistiques permettent d’appréhender, à tous les niveaux : mondial, européen, français, les données économiques. Les statistiques sont largement utilisées dans les Départements Commercial et Marketing des entreprises. Elles permettent d’évaluer les besoins du marché, de préparer les opérations de prospection, des sondages et d’en analyser les résultats. En France, l’INSEE est chargée de l’établissement des statistiques économiques. Les missions de l’INSEE sont au nombre de 5 : Produire - Analyser - Diffuser - Coordonner - Former - Coopérer L’Institut national de la statistique et des études économiques (Insee) collecte, produit et diffuse des informations sur l’économie et la société française afin que tous les acteurs intéressés (administration, entreprises, chercheurs, médias, enseignants, particuliers) puissent les utiliser pour effectuer des études, faire des prévisions et prendre des décisions. 2 Un peu de terminologie 1 - Population statistique Une population statistique est ensemble d’objets, d’unités sur lesquels portent des observations, ou donnant lieu à un classement statistique. 2 - Méthode d’étude d’une population Deux méthodes peuvent être utilisées pour connaître les caractéristiques d’une population : Le recensement Le sondage Recensement et sondage Le recensement, utilisable quand la population est peu nombreuse, ou par exemple dans la cas d’un recencement de la population d’un pays, consiste à relever les caractéristiques de chaque membre de la population. Il fournit en principe un résultat très proche de la réalité. On peut alors établir des statistiques sur les différentes caractéristiques relevées. Le sondage, utilisé quand le recensement est physiquement ou économiquement impossible, consiste à sélectionner une partie seulement de la population - appelée échantillon - et à réaliser un relevé des caractéristiques de chaque membre de l’échantillon. On réalise alors une étude statistique (extrapolation) pour tenter d’approcher la réalité de la population complète. 3 - Notion de variable statistique L’étude statistique passera par l’observation de l’une des caractéristiques des membres de la population appelée "variable statistique". La variables statistique peut être de différents types : Quantitative quand on peut lui attribuer une valeur numérique (par exemple la taille des Français), 3 Qualitative quand on ne peut la quantifier (par exemple la couleur des cheveux), Continue quand elle peut prendre toutes les valeurs incluses dans son intervalle de variation (exemple le poids des Français), Discrète lorqu’elle ne peut prendre que certaines valeurs (par exemple le nombre de points obtenus lorsqu’on jette un dé à jouer). 4 Notions de série statistique 1 - Présentation des séries statistiques Une série statistique est constituée par l’ensemble des valeurs relevées sur la variable statistique considérée. Le résultat se présentera le plus souvent sous la forme d’un tableau. Notion de classe Pour faciliter l’analyse statistique, dans le cas où la variable - de type continue - prend un grand nombre de valeurs, on regroupera les valeurs en classes, chaque classe correspondant à un intervalle de variation. Par exemple, pour réaliser une statistique sur la taille des français adultes qui varie de 1,30 à 2,10 m, on pourra regrouper les tailles par intervalle de 5 cm ce qui entraînera la limitation à 17 classes (Voir schéma ci-dessous). Distribution en classes Présentation des séries statistiques Soit un échantillon de 1177 personnes dont on veut caractériser la taille. La façon la plus simple de représenter les données collectées est le tableau : 5 Présentation en tableau On peut également présenter les données sous forme de diagramme à barres. On place en abscisse la valeur de la variable (ici les classes) et des barres verticales de hauteur proportionnelle au nombre d’éléments de la population associés à la valeur considérée. Répartition en classes Le graphique à secteurs (plus communément appelé "camembert") peut également être utilisé pour une représentation qui montre mieux la répartition relaive des données. 6 Graphique à secteurs (camembert) 2 - Caractéristiques globales des séries statistiques Il s’agit de caractériser la série statistique dans sa globalité suivant différents critères. On trouve des caractéristiques de tendances globales (mode, médiane, moyenne) et des caractéristiques de dispersion de la population (étendue de variation, écart type, etc ...) 1 - Caractéristiques globales Le Mode Le Mode est la valeur de la variable statistique rencontrée le plus fréquemment dans la série statistique. Dans l’exemple précédent le l’analyse statistique de la taille des français, c’est la classe 9 (1m70 à 1m75) qui recueille l’effectif le plus large (124). 7 Exemple de série unimodale Attention : certaines séries statistiques peuvent avoir plusieurs modes. On parle alors de série multimodale. Par exemple, si l’on fait une statistique sur la taille des chats, puis sur la taille des chiens, on obtient des séries à un seul mode. A l’inverse, si l’on regroupe les deux populations pour avoir une statistique sur la taille des animaux de compagnie, on obtient une série à deux modes comme le montre le schéma ci-dessous. Exemple de série multimodale La moyenne arithmétique La moyenne arithmétique d’une série statistique s’obtient en divisant la somme des valeurs observées par le nombre de valeurs. Formule de la moyenne arithmétique simple 8 Dans l’exemple précédent, la valeur moyenne (ici la taille moyenne) est obtenue en additionnant les tailles centrales des différentes classes : 1,325 + 1,375 + 1,425 + 1,475 + ... + 2,075 + 2,125 et en divisant le résultat par 17 le nombre de classes. On obtient une taille moyenne de 1,725 c’est à dire le milieu de la classe 9 (1,70 à 1,75. La moyenne arithmétique pondérée La moyenne arithmétique précédente (dite "simple") ne tient pas compte le la répartition de la population en fonction de la valeur de la variable. Elle se situe simplement au milieu de l’intervalle de variation de la variable. La moyenne arithmétique pondérée tient compte de l’effectif associé à chaque valeur en pondérant cette valeur par cet effectif. Ainsi la moyenne pondérée est égale à la somme des produits de chaque valeur par l’effectif associé divisée par le nombre de valeur selon la formule suivante : Formule de la moyenne arithmétique pondérée Le calcul de la moyenne pondérée est illustrée par le tableau suivant qui reprend l’exemple de la taille des Français : Calcul de la moyenne pondérée La Médiane La médiane d’une série statistique est la valeur de la variable pour laquelle les effectifs associés respectivement aux valeurs supérieures et inférieures sont égaux. 9 On peut déterminer graphiquement la valeur de la médiane en traçant les courbes des cumuls des effectifs respectivement en valeurs croissante et décroissante comme le montre le tableau et le graphique suivant : détermination graphique de la médiane 10 3 - Caractéristiques de dispersion des séries statistiques 2 - Caractéristiques de dispersion Intervalle de variation L’intervalle de variation appelé aussi "étendue" est la différence entre la valeur la plus élevée et la plus faible de la variable statistique. Par définition, la moyenne arithmétique simple se situe au milieu de l’intervalle de variation. Dans notre exemple, cette valeur vaut : 2,15 m - 1,30 m = 0,85 m. On peut ainsi caractériser des séries statistiques en terme de plus ou moins grande étendue de variation. Néanmoins, il s’agit d’une grandeur beaucoup moins significative que les caractéristiques qui expriment la dispersion des valeurs par rapport à la valeur moyenne. Cette dispersion fait l’objet de l’écart moyen et de l’écart type. Ecart moyen Pour chacune des valeurs, on évalue l’écart par rapport à la valeur moyenne. On considère la valeur absolue des écarts car on ne souhaite pas différentier les valeurs inférieures des valeurs supérieures à la moyenne. L’écart moyen est la moyenne des valeurs absolues des écarts de l’ensemble des valeurs par rapport à la moyenne (voir schéma ci-dessous). On peut évaluer l’écart moyen de la taille des français avec un résultat de 14,63 cm : 11 Exemple de calcul d’écart moyen Une seconde méthode permet de caractériser l’écart de dispersion. Au lieu d’utiliser des valeurs absolues, on procède à l’élévation au carré de chaque écart individuel ce qui permet de rendre positifs tous les écarts. La moyenne de ces écarts sera la variance dont la racine carré donnera l’écart-type. Variance et écart -type La variance d’une série statistique est donc la moyenne arithmétique des carrés des écarts des valeurs par rapport à la valeur moyenne. Physiquement, la variance correspond au "taux de variation" de la variable étudiée. L’utilisation du carré des écarts permet d’annuler la compensation due aux sugnes des écarts. L’écart-type est égal à la racine carré de la variance. Il s’exprime dans l’unité de la grandeur qu’il caractérise. La variance et l’écart-type sont donnés par les formules suivantes : Formules de la variance et de l’écart-type Le tableau suivant applique à l’exemple précédent le calcul de la variance et de l’écart-type : 12 Exemple de calcul d’écart-type L’écart-type caractérise la dispersion de la série statistique autour de la valeur moyenne. Plus l’écart-type est élevé plus la disportion est forte. Dans la pratique l’écart-type sous-estime légèrement l’écart des données par rapport à uploads/Geographie/ les-statistiques.pdf
Documents similaires
-
22
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Dec 06, 2021
- Catégorie Geography / Geogra...
- Langue French
- Taille du fichier 0.6860MB