Michel Zerbato LA MEDIANE : DEFINITION ET CALCUL Soit une population dont on co
Michel Zerbato LA MEDIANE : DEFINITION ET CALCUL Soit une population dont on connaît la distribution suivant un caractère : à chaque individu correspond une mesure du caractère qui définit la valeur de cet individu ; les valeurs possibles du caractère (ou de l’individu) en sont les modalités (rappel : une modalité est un réel dans le cas d’un caractère discret, un intervalle de réels fermé à gauche et ouvert à droite dans le cas d’un caractère continu). La médiane est alors une valeur centrale de cette population, au sens où on peut résumer l'ensemble des individus par cette valeur. (On ne discutera pas de savoir si c'est la valeur normale des individus, les écarts à cette valeur étant accidentels, ou si cette valeur est une tendance pour des individus normalement différents.) La détermination pratique de la médiane est généralement affaire de recettes plus ou moins approximatives. Quand on a bien compris ce qu'est la médiane, on peut les oublier et définir une démarche générale facilement adaptable à chaque cas particulier (nous en donnerons des exemples). Nous devrons d'abord reprendre les notions d'effectifs cumulés et de fonction de répartition. I. Effectifs cumulés et fonction de répartition A Définitions 1. La fonction de répartition est la fonction qui associe à tout nombre réel le nombre d’individus de la population étudiée qui ont une valeur inférieure audit réel. Par inférieure, on entend en France strictement inférieur, alors que dans les pays anglosaxons on entend inférieure ou égale. Dans ce qui suit, donc, si F est la fonction de répartition, pour tout x de , l’image F(x) est l’effectif de la souspopulation formée par les individus dont la valeur est strictement inférieure à x. 2. Cumuler les effectifs c’est indiquer pour chaque valeur affichée du caractère le nombre d’individus qui présentent une valeur de caractère " strictement inférieure " ou " inférieure ou égale " à ladite valeur. De même qu’il y a deux manières de définir la fonction de répartition, il y a donc deux manières de cumuler les effectifs : " à la française " et " à l'anglosaxonne " (ou " américaine "). a. Cumul " à la française " : on inscrit en face d'une modalité le nombre d'individus qui ont une valeur strictement inférieure à ladite modalité (on lit " moins de "), et on note ce nombre . Cette manière de cumuler correspond à la définition française de F. b. Cumul " à l'anglosaxonne " : on inscrit en face d'une modalité le nombre d'individus dont la valeur est inférieure ou égale à cette modalité (on lit " au plus " ou " jusqu'à "). On note ce nombre . Cette manière de cumuler correspond à la définition anglosaxonne de F. 3. La " fréquence " d’une modalité est l’effectif de la modalité rapporté à l’effectif total : . De même la " fréquence cumulée " est : . Nous distinguerons donc, suivant le mode de cumul : et . Sauf indication contraire, on peut partout raisonner sur ou en lieu et place de ou . B Le tableau des effectifs cumulés Il faut distinguer deux cas, suivant que la variable est discrète (les modalités sont des nombres) ou continue (les modalités sont des intervalles de valeurs). 1. Variable discrète Il n’y a pas de difficulté particulière, comme on le voit sur l’exemple suivant. 1 2 3 4 5 6 10 15 18 12 8 7 0 10 25 43 55 63 10 25 43 55 63 70 Les effectifs sont décalés d’une colonne vers la droite par rapport aux effectifs (ou d'une ligne vers le bas dans le tableau transposé). On a, de façon générale, . On peut déduire de ce qui précède que est le nombre d'individus qui ont une valeur du caractère supérieure ou égale à , tandis que le nombre de ceux qui ont une valeur du caractère supérieure (strictement) à . Ainsi, cumuler les effectifs c’est, pour chaque valeur affichée du caractère, répartir la population totale en deux souspopulations situées de part et d’autre de cette valeur. 2. Variable continue Rappel : par définition, (ou ) est le nombre total d’individus ayant une valeur prise dans l’ensemble des i — 1 (ou i) premières modalités, la ième modalité étant notée . Dans un cumul à la française (ou à l’anglosaxonne), on inscrit donc à la ligne i, en face de , le nombre (ou ), c’estàdire le nombre d’individus dont la valeur est inférieure à (ou à ). Insistons sur la manière de lire le tableau pour en extraire l’information disponible. Puisque à la ligne i, est le nombre d’individus qui ont une valeur prise dans les i 1 premiers intervalles, la plus grande valeur possible d’un individu pris dans ces individus est donc au plus égale à la plus grande valeur du (i — 1)ème intervalle, donc inférieure à sa borne droite, . Ainsi, la plus grande valeur possible des premiers individus (ligne i d'un cumul à la française) est donc inférieure à , qui est la borne droite de la (i — 1)ème modalité mais aussi la borne gauche de la ième. De même est le nombre de ceux dont la valeur est au plus égale à la plus grande valeur du ième intervalle de valeurs, donc inférieure à sa borne droite, , qui est aussi la borne gauche du i +1ème. Au total, les effectifs sont décalés comme précédemment, vers le bas ou vers la droite. Exemple : soit le tableau de la distribution des DEFM femmes en Aquitaine au 31 août 1994 suivant leur ancienneté de demandeuses. Ancienneté (mois) Effectif [0 ; 3[ 21 463 [3 ; 12[ 34 937 [12 ; 24[ 20 199 [24 ; …[ 13 437 Total 90 036 On construit ainsi le tableau des effectifs cumulés : [0 ; 3[ 21 463 21 463 0 [3 ; 12[ 34 937 56 400 21 463 [12 ; 24[ 20 199 76 599 56 400 [24 ; …[ 13 437 90 036 76 599 Total 90 036 La lecture de la colonne nous indique à la 3ème ligne qu’il y a 56 400 chômeuses dont l’ancienneté dans l’état est inférieure ou égale à la valeur maximale de l’intervalle [3, 12[, c’estàdire qu’elles sont chômeuses depuis moins de 12 mois. La lecture de la colonne nous indique à la 2ème ligne qu’il y a 56 400 chômeuses dont l’ancienneté dans l’état est inférieure (strictement) à la valeur minimale de l’intervalle [12, 24[, c’estàdire qu’elles sont chômeuses depuis moins de 12 mois. Les deux manières de cumuler donnent bien exactement la même information. C Des effectifs cumulés au diagramme intégral (fonction de répartition) De la définition des effectifs cumulés, il résulte que les effectifs cumulés permettent de passer à la fonction de répartition. Avec une définition " française " de la répartition et la notation précédente, on a : • dans le cas discret • ou dans le cas continu. Mais attention : F est définie sur tout entier, tandis que les effectifs cumulés ne donnent les couples que pour les valeurs affichées des modalités du caractère. Cependant, on déduit de ces couples toute la fonction de répartition : la fonction exacte dans le cas discret ; une approximation dans le cas continu (sous l’hypothèse déjà vue d’homogénéité de répartition au sein des classes). 1. Si la variable est discrète, toutes les valeurs possibles du caractère sont affichées avec les effectifs correspondants et on peut calculer l’effectif cumulé exact pour toutes les valeurs possibles du caractère. La représentation graphique (diagramme intégral) est alors un escalier, chaque marche étant ouverte à gauche et fermée à droite, la première étant de longueur infinie de à et la dernière de longueur infinie de à . Dans la ligne i, en face de la modalité , on inscrit , la somme des effectifs des i 1 premières modalités (cumul français), ou , la somme des effectifs des i premières modalités (cumul anglo saxon). Les couples sont des points de la fonction de répartition. Hors de ces points, on sait aussi quelle est l’image de tout x de , puisque l’image de x par F est le nombre d’individus qui ont une valeur inférieure à : ce nombre c’est . On a donc tout le diagramme intégral : . 2. Si la variable est continue (ou traitée comme telle), on ne connaît les effectifs qu’aux bornes des intervalles de valeurs, pas pour chaque valeur possible. À la différence du cas discret l’information contenue dans l’effectif d’une classe est limitée au nombre d’individus qui ont une valeur supérieure ou égale à la borne de gauche de la classe et inférieure (strictement) à la borne de gauche de la classe suivante ; on ne sait pas quelle est la valeur précise de chaque individu de la classe. Ainsi, si les couples ou ou sont les points de la fonction de répartition aux bornes des intervalles, on doit faire une hypothèse pour les valeurs dans l’intervalle pour tracer toute la fonction : on fait l'hypothèse uploads/Geographie/ statistique-mediane.pdf
Documents similaires










-
34
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Jul 23, 2022
- Catégorie Geography / Geogra...
- Langue French
- Taille du fichier 0.3501MB