27 M O Y E N N E , M E D I A N E , ECART-TYPE Quelques regards sur l’histoire p

27 M O Y E N N E , M E D I A N E , ECART-TYPE Quelques regards sur l’histoire pour éclairer l’enseignement des statistiques Anne BOYÉ Marie-Céline COMAIRAS Irem des Pays de la Loire REPERES - IREM. N° 48 - juillet 2002 Introduction Si l’on mesure l’importance d’un ensei- gnement au nombre de pages qu’il occupe dans les programmes et commentaires, les sta- tistiques occupent une place de choix dans ceux qui se mettent en place dans nos lycées, trop envahissante, penseront certains. Mais en examinant les choses avec un peu de recul, il apparaît que cette importance est à relativi- ser. Ce n’est sans doute pas l’apparition des statistiques dans les programmes qui va bou- leverser l’enseignement des mathématiques dans nos collèges et lycées, mais peut-être plutôt la sollicitation quotidienne à l’usage des outils informatiques, dans tous les domaines, et pas seulement dans celui qui nous préoc- cupe ici. Ces questions, essentielles, ne seront pas l’objet de nos réflexions. Cependant, tout ce qui entoure l’introduction des statistiques contribue à faire émerger des questions de fond : l’enseignement des statistiques est-il vrai- ment l’affaire des mathématiciens ? Si c’est le cas, s’est-on suffisamment penché sur les difficultés des élèves à appréhender ces nou- veaux concepts ? Comment passer des sta- tistiques au modèle mathématique, c’est-à-dire quels sont les liens entre statistiques et pro- babilités ?… Nous avons pensé que l’histoire, une fois de plus, pouvait apporter quelques réponses et permettre d’approfondir la réflexion. Nous avons fait le choix, ici, de nous pencher sur l’his- toire de quelques mots : quand, pourquoi et comment les mathématiciens ont été ame- nés à privilégier certains paramètres comme moyenne, médiane, écart-type ; ces choix REPERES - IREM. N° 48 - jullet 2002 MOYENNE, MEDIANE, ECART-TYPE … furent-ils vraiment justifiés par les mathé- matiques ? L’histoire donne du sens, permet de comprendre certains obstacles, et de ne pas se contenter d’apprendre à bien utiliser des formules. L’histoire des mots mathématiques est souvent éclairante, elle l’est très particu- lièrement dans le domaine des statistiques. Elle permettra de mettre en lumière qu’il n’est pas tout à fait équivalent d’évaluer sta- tistiquement la distance entre deux étoiles, qui fera intervenir un certain nombre de mesures d’une même grandeur, ou de vou- loir connaître la taille moyenne d’un enfant de quatre ans, qui fait intervenir des don- nées sur plusieurs individus. Le premier pro- blème a fait naître la théorie des erreurs, qui fut un moteur essentiel dans le déve- loppement des statistiques. Nous avons choisi de rester dans le cadre des programmes de lycée, et nous aborde- rons très peu l’histoire des lois, elles seront cependant évoquées, puisque ce sont les lois des erreurs qui ont fait émerger les mots que nous utilisons. Après avoir rappelé les définitions actuelles et « officielles » des différentes notions évoquées (et nous verrons que ce n’est pas toujours limpide), nous montrerons pourquoi la moyenne, la médiane et l’écart- type ont sans doute été privilégiés pour résumer une série statistique. Les définitions : Voici quelques définitions des mots que nous avons retenus, trouvées au fil de manuels, ou dans les programmes et commentaires officiels 1 . Mode : Ce mot n’est défini ni dans les pro- grammes de seconde, ni dans les commentaires Il semble que l’on attache peu d’importance à ce paramètre, en dépit, ou à cause de sa sim- plicité, et qui, pour cela, est un des plus anciens. On peut trouver cependant des défi- nitions dans les manuels, comme, par exemple, celles qui suivent : Le mode, pour un caractère discret, noté M0 , est la valeur qui correspond au plus grand effectif. (Fractale 2°, 2000, Bordas) On appelle mode toute valeur du caractère dont la fréquence est la plus grande. Une popu- lation n’a pas toujours un mode unique. (Point math 2°, 2000, Hatier). Moyenne arithmétique : ce mot n’est pas non plus précisé dans les programmes et com- mentaires. Il peut sembler bien sûr qu’il va de soi. L’histoire nous apprendra qu’il n’est ni si évident, ni si simple. La difficulté provient essentiellement de l’usage qui en sera fait. C’est évidemment le problème essentiel. Notons cependant qu’il n’est plus fait mention dans nos classes d’une certaine sorte de moyenne, le « midrange », moyenne arithmétique des valeurs extrêmes, alors même que c’est elle qui vient souvent le plus naturellement à l’esprit de nos élèves. La moyenne arithmétique pondérée, notée , est définie par : , x n x n x n x n x n k k = + + + + 1 1 2 2 3 3 ... x 28 1 Sauf mentions contraires, les textes officiels auxquels nous nous référerons sont les programmes applicables en secon- de à la rentrée 2000, en premières S et ES à la rentrée 2001, et en terminales S et ES à la rentrée 2002, ainsi que les commentaires de ces programmes. Ces textes sont dis- ponibles sur le site eduscol, et celui du cndp. REPERES - IREM. N° 48 - jullet 2002 29 MOYENNE, MEDIANE, ECART-TYPE … ce qui s’écrit : (Fractale 2°, 2000, Bordas) La moyenne arithmétique d’une série sta- tistique, dans une population de N indivi- dus, est le nombre réel quotient de la somme des N valeurs observées du caractère par le nombre d’individus de la population. Si on note x1 , x2 , x3 , … , xN les valeurs obser- vées du caractère pour les N individus de la série, la moyenne arithmétique de la série est le nombre noté défini par l’égalité : (Point math 2°, 2000, Hatier) Les termes suivants sont définis dans les commentaires des programmes. Il semble que l’on veuille les préciser, même si la diffi- culté de l’entreprise apparaît assez vite, en ce qui concerne la médiane. Le sens de certains termes peut être modulé légèrement, pour marquer de façon appuyée la différence entre le contexte probabiliste, celui du modèle mathématique, et le contexte statistique, celui de l’expérience. Nous trouverons ainsi la définition de la médiane empirique, de la variance empi- rique… Peut-être, paradoxalement, vou- lant rapprocher les mathématiques du réel, sommes nous en train d’assister à l’élabo- ration d’une « statistique scolaire », comme ce fut le cas pour d’autres domaines des mathématiques. Nous ne discuterons pas ici du bien fondé de cette évolution, mais cela nous conforte dans notre entreprise d’éclai- rer l’enseignement par l’histoire, ses tâton- nements, ses incertitudes. X x x x x N N = + + + + 1 2 3 ... X x n n x i i i k i = × = = ∑ 1 1 Médiane : ce paramètre n’est pas des plus simples, et l’ambiguïté des commentaires à son sujet souligne cette difficulté. Son apparition plus tardive et l’usage ou le non usage qui en auront été faits au XIXème siècle, comme nous le verrons dans la suite, offrent un inté- rêt très particulier pour le pédagogue, donc pour l’élève. Médiane (empirique) : on ordonne la série des observations par ordre croissant ; si la série est de taille 2n + 1, la médiane est la valeur du terme de rang n + 1 dans cette série ordonnée ; si la série est de taille 2n, la médiane est la demi-somme des valeurs des termes de rang n et n + 1 dans cette série ordon- née. La définition de la médiane n’est pas figée : certains logiciels et certains ouvrages défi- nissent la médiane comme étant le deuxiè- me quartile ou le cinquième décile ; dans la pratique de la statistique, les différences entre ces deux définitions sont sans impor- tance. Au lycée, on évitera tout développement à ce sujet qui ne serait pas une réponse indi- viduelle à une question d’un élève. (Commentaires des programmes de pre- mières). Chacun appréciera la dernière partie de ce commentaire. Pour illustrer les difficultés devant les- quelles se trouveront à coup sûr les enseignants, voici quelques extraits (cf. encadré de la page suivante) du livre de la collection Dimathè- me 1°S 2 . Donnant l’exemple d’un calcul avec tableur, les auteurs font remarquer que la valeur obtenue pour la médiane est le deuxième quartile (la définition « officielle » des quar- 2 Mathématiques, 1°S, collection Dimathème, 2001, Didier REPERES - IREM. N° 48 - jullet 2002 30 MOYENNE, MEDIANE, ECART-TYPE … tiles est donnée ci-dessous), et proposent de comparer cette valeur à celle que la définition du cours aurait donnée. C’est un des seuls manuels parmi ceux que nous avons parcourus qui pointe bien le pro- blème. Premier quartile (empirique) : c’est le plus petit élément q des valeurs des termes de la série, tel qu’au moins 25% des données soient inférieures ou égales à q. Troisième quartile (empirique) : c’est le plus petit élément q’ des valeurs des termes de la série, tel qu’au moins 75% des données soient inférieures ou égales à q’. (Commentaires des programmes de pre- mières.) La définition du deuxième quartile n’appa- raît pas dans le lexique des commentaires. Variance, écart-type : uploads/Geographie/ 48-boye.pdf

  • 34
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager