Filière : SEG (S1) Licence fondamentale Module : Statistique descriptive Glossa
Filière : SEG (S1) Licence fondamentale Module : Statistique descriptive Glossaire Professeur : Ilham EL HARAOUI Année Universitaire 2016 - 2017 Université Ibn Tofail Faculté des Sciences Juridiques, Economiques et Sociales Kénitra Statistique Descriptive - Glossaire 1 Prof. I. EL HARAOUI La statistique : un ensemble des techniques ayant pour objet de décrire, numériquement et graphiquement des populations. La statistique descriptive : l’art et la science de collecter, analyser, présenter et interpréter des données. Les statistiques : des résumés d’un ensemble de données sous forme de tableaux, de graphiques, ou sous forme numérique. Une campagne de mesures : la période de recueil des données brutes. Les données brutes sont les données disponibles à la fin de la collecte des données. Traitement des données : consiste à analyser, résumer, comparer, mesurer, croiser et modéliser les données brutes pour créer de l’information. Population : un ensemble d’éléments (au sens mathématique) considéré dans une étude particulière. Individus ou unités statistiques : les éléments de la population. Taille de la population/Effectif total : le nombre d’individus ou d’unités statistiques appartenant à la population. Une variable statistique ou un caractère : une valeur numérique ou non qui s’associe à chaque individu de la population. Modalités : les valeurs que peut prendre une variable statistique. Effectif : nombre d’individus qui présentent une modalité de la variable statistique. Echantillon : un sous ensemble de la population. Statistique Descriptive - Glossaire 2 Prof. I. EL HARAOUI Un recensement : un processus de collecte de données relatives à la population entière. Une observation : un ensemble de mesures obtenues pour un élément. Enquêtes d’échantillonnage : des enquêtes visant à collecter des données relatives à un échantillon. Inférence statistique : un processus d’utilisation des données d’un échantillon pour estimer ou tester des hypothèses concernant les caractéristiques d’une population. Variable qualitative : si ses modalités ne sont pas des nombres et s'expriment de façon littérale ou par un codage sur lequel les opérations arithmétiques n'ont pas de sens. On distingue deux types : une variable nominale, s’il n’est pas possible de classer ses modalités suivant un ordre qui a du sens et une variable ordinale, s’il est possible de classer ses modalités suivant un ordre qui a du sens. Variable quantitative : si ses modalités sont des nombres et ses valeurs sont des nombres sur lesquels des opérations arithmétiques ont un sens. On distingue deux types : une variable discrète, si la valeur de ses modalités relève d’un comptage (si l’ensemble de ses modalités est dénombrable) et une variable continue, si la valeur de ses modalités relève d’une mesure (ne relève pas d’un comptage) et si l’ensemble de ses modalités est non dénombrable. Effectif : Le nombre d’individus représentant la modalité. L’effectif d’une modalité « i » est noté ni . S’il y a k modalités de la variable discrète, nominale ou ordinale, les effectifs sont donc notés : n1 , n2 ………………., nk Effectif total : La somme des effectifs ou le nombre total d’individus : Fréquence : La fréquence associée à une modalité (fi), ou à un ensemble de modalités regroupées en classes indique la proportion d’individus présentant cette modalité (ou cet ensemble de modalités) par rapport à l’ensemble des individus. n1 +n2 +…………….+ nk = k ∑ ni = i=1 n Statistique Descriptive - Glossaire 3 Prof. I. EL HARAOUI La fréquence en pourcentage = fréquence relative *10o. Classes : Pour une variable quantitative continue, toutes les valeurs des modalités peuvent appartenir à un intervalle réel. Ces valeurs sont regroupées dans des intervalles de valeurs numériques appelés classes. Les classes sont notées : [ ei ; ei+1 [ sachant que ei est la borne inférieure et ei+1 est la borne supérieure. Amplitude de la classe : ai = ei+1 - ei Histogramme : il est formé d’un ensemble de rectangles dont la base est déterminée par les extrémités de la classe et dont la surface doit être proportionnelle à l’effectif (ou à la fréquence) de la classe. Diagramme circulaire (ou à secteurs circulaires, ou en camembert) : diagramme permettant de représenter la distribution d'une variable qualitative : les modalités sont représentées par des portions de disque proportionnelles à leur effectif, ou à leur fréquence. Diagramme en barres (ou en tuyaux d'orgue) : Diagramme représentant la distribution d'une variable qualitative : les modalités sont placées en abscisse, formant des bases de rectangles égales et équidistantes, et les effectifs (ou fréquences) en ordonnée, suivant une échelle arithmétique. Diagramme en bâtons : Diagramme représentant la distribution d'une variable quantitative discrète : les valeurs sont placées en abscisse, les effectifs (ou fréquences) en ordonnée, au moyen de segments verticaux. Indicateurs : les nombres qui résument une base de données selon des règles et des pratiques. On les appelle aussi des « paramètres » ou des « caractéristiques ». La fréquence d’une modalité « i » : fi = ni n La somme des fréquences : k ∑ fi = i=1 1 Centre de la classe : xi = ei+1 + ei 2 Statistique Descriptive - Glossaire 4 Prof. I. EL HARAOUI Les indicateurs de tendance centrale et de position : Des indicateurs qui se situent au milieu, comme la moyenne, ou qui indiquent où se positionne une série de données. Des indicateurs qui représentent une valeur numérique, autour de laquelle les observations sont réparties. Ceux de la tendance centrale mesurent par exemple le centre de la distribution d’une série de données. Moyenne arithmétique : un indicateur de tendance centrale qui concerne uniquement les variables quantitatives. La moyenne d’une série statistique est définie par la somme des valeurs divisée par l’effectif total. Moyenne géométrique : la racine nième du produit des valeurs observées. Elle est principalement utilisée pour calculer les coefficients multiplicateurs moyens dont sont déduits les taux de variation. La moyenne harmonique : Elle est égale à l'inverse de la moyenne arithmétique des inverses des valeurs. Moyenne quadratique : Elle est égale à la racine carrée de la moyenne arithmétique des carrés des valeurs. Le mode : la valeur de la variable la plus fréquemment observée. C’est la valeur pour laquelle l’effectif est le plus élevé (ou la fréquence est la plus élevée). Le mode peut être aussi défini comme la valeur qui domine les autres et qui lui confère le statut d’indicateur de tendance centrale. La médiane : un centre de position lorsque les données sont rangées par ordre croissant. Sa détermination est réalisée de façon différenciée en fonction de la parité de la taille de l’échantillon (n) (pair ou impair). Quantiles (ou les percentiles) : des indicateurs de position. Si nous considérons une variable quantitative discrète ou continue, dont les modalités sont classées en ordre croissant, le quantile d'ordre α (0 ≤ α ≤ 1) noté qα est la valeur de la variable telle que α%, c’est-à-dire une proportion α Statistique Descriptive - Glossaire 5 Prof. I. EL HARAOUI des individus ait une valeur du caractère ou de la modalité inférieure ou égale à qα. En d’autres termes (100 - α)% des individus ont une valeur supérieure ou égale à qα. Quartiles : des indicateurs de position qui partagent les observations en 4 groupes d’effectifs égaux. Les quartiles sont les 3 valeurs q25, q50, q75. Ceci dit, 25%, 50%, 75% des individus ont une valeur de la variable inférieure à q25, q50, q75 respectivement. Les quartiles sont aussi notés : Q1, Q2, Q3 (Q pour Quartile). Notons que Q2 est la médiane, qui est aussi un indicateur de tendance centrale. Déciles : des indicateurs de position qui partagent les observations en 10 groupes d’effectifs égaux. Les déciles sont les 9 valeurs q10, q20,….. q90. Ceci dit, 10%, 20%,...90% des individus ont une valeur de la variable inférieure à q10, q20,...q90 respectivement. Les déciles sont aussi notés : D1, D2….D9 (D pour Décile). Centiles : des indicateurs de position qui partagent les observations en 100 groupes d’effectifs égaux. Les centiles sont les 99 valeurs q1, q2, q3….. q99. Ceci dit, 1%, 2%, 3% ….99%, des individus ont une valeur de la variable inférieure à q1, q2, q3….. q99 respectivement. Les centiles sont aussi notés : C1, C2….C99 (C pour Centile). Boîte-à-pattes (Box plots, Boîte de Tukey, Boîte à moustaches) : est utile pour visualiser la dispersion d’une série statistique, pour des comparaisons et pour détecter des valeurs aberrantes. En obtenant les quartiles Q1, Q2, Q3 et en y ajoutant le minimum et le maximum des observations, nous obtenons un résumé en 5 chiffres. Ces 5 chiffres (Q1, Q2, Q3, Min, Max) seront utiles pour illustrer la Boîte-à-pattes. Etendue : est la différence entre la plus grande valeur et la plus petite des valeurs observées. Sa formule est la suivante : Etendue = X (max)-X (min). Ecart inter-décile (D9-D1) : un indicateur qui écarte les 10% des observations les plus petites et les 10% les des observations les plus grandes des deux extrémités de la distribution. C’est un indicateur de dispersion qui concerne 80% des observations centrales. Un écart relatif peut aussi être calculé à partir de ces deux déciles, sous la uploads/Geographie/ glossaire.pdf
Documents similaires
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/2mh5C5eHVLSCqzflZda7C9MzfvrwIH24joRBWhGwEVLHbFANB5HEnkxxMN6Iis698nT6n2nyTD5psLvPCoIpE9d2.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/Y8ubTZBhsVXMNiSqwAreVTdk21v50jPE8Uf17jbHmoVFCZrwwny9fvtRLs9ORsY3n5zS9CnGVNknWfnOwZfxpIj5.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/aZG4m5SbYIBE0IZyqyY2SqSDtlAjL5Jp0ISU6vLrobZV3qh3HIZMkxsQ54IUjfxWrI4CTGcyn0hXD103lX2J2TW0.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/XKHz7yGxSu6pXJcI2gDlcB4WFGfCOas6kfJQqhgfA1DMLttS0D3TDLAIMgXL9N2uvKJVRVvrokrMJfVpbS4d9jhB.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/daj52Eo1d2xfU5nEVGXwMeXAal93ruTi4YIqAhCmCPTh1eXT16yPfReglqglnzxRvqnUh7GjkfJOmZm7x4aa4LVx.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/2ktwa3YRmZhCqRpRLqUH8xfIl0gd1knJFjd37WYC00kSjSkCvxqVNqfk6hAXwY17qSmbXkHeAujtjNhAgw86iWxR.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/8ZfK6T87314Q5W6x1Blc84Rv1y6MAD9uCc4XklvZw0xYUDFj4wbfYSXGOgM0qhnJa09L7Tyb83pYKvZ2KCzyynX6.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/sVTnWjoKjudzO8RJuTl890MDgFOy9S2eZmvBQIxjzHjuHbmdxWmgGtc5tJDQLKNHQJ0ImwKcRcna4Dx1OAm0eAgJ.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/EEBmaDduwfYlBs6qdX7abSnLKPTo89UlppOs04STBDuN1ReT3bm64HfNQZMZbZ7JR9fXZGf78gsL7JSMqBlUrYpJ.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/1n1GI0mekf5BzPs1UUdyG0lsFL4ZH7fydAgFciMykHXnYX5Ek7oQsm25t6hgEWh3PLPI5eSVcJsI6f7HZNy3Ei02.png)
-
18
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Oct 13, 2022
- Catégorie Geography / Geogra...
- Langue French
- Taille du fichier 1.3304MB