STATISTIQUE À 2 VARIABLES 59 3EC – JtJ 2020 Thème 14: Statistique à 2 variables
STATISTIQUE À 2 VARIABLES 59 3EC – JtJ 2020 Thème 14: Statistique à 2 variables 14.1 Introduction et quelques définitions Introduction : Dans le chapitre 10 de statistique, nous nous sommes intéressés à des questions du type: Quelle est la taille moyenne de 50 professeurs du gymnase de Morges ? Quel est l'écart type du salaire annuel des employés d'une grande compagnie ? Lors d'une évaluation effectuée dans deux classes, laquelle semble être la plus homogène ? Dans toutes ces questions, nous étudions le comportement statistique d'une seule variable: taille, salaire, note lors d'une évaluation. Il existe cependant toute une gamme de problèmes statistiques où l'on s'intéresse à la relation entre plusieurs variables. Par exemple: • entre l'épaisseur d'un mur et sa résistance thermique; • entre la consommation de carburant et la vitesse d'une voiture; • entre le temps de fonctionnement d'un appareil et la fréquence des pannes. Pour étudier d'éventuelles corrélations1, on est amené à s'intéresser simultanément à deux caractères X et Y d'une même population. On définit alors une série statistique à deux variables statistiques X et Y prenant des valeurs: x1, x2, …, xn et y1, y2, …, yn. 14.2 Nuage de points Pour étudier les relations ou corrélations entre deux variables statistiques, on peut associer au couple (xi ; yi) de la série statistique double le point Mi de coordonnées (xi ; yi). L'ensemble des points Mi ainsi obtenu est appelé nuage de points représentant la série statistique. 1 En statistiques, étudier la corrélation entre deux ou plusieurs variables statistiques numériques, c’est étudier l'intensité de la liaison qui peut exister entre ces variables. 60 THÈME 14 3EC – JtJ 2020 Modèle 1 : Étudions la relation entre le poids (en kg) et la taille (en cm) dans un échantillon de 20 individus: Taille 155 158 158 159 163 163 165 168 170 172 Poids 67,1 60,7 54,9 58,8 64,7 60,4 63 62,5 71,5 70,8 Taille 173 175 176 178 178 180 182 186 189 196 Poids 63,1 74,8 71,1 73,1 63,5 69,4 70 82 76,5 84,6 On représente alors le nuage de points: Le nuage étant dessiné, on peut, par la pensée ou réellement, tracer une droite (appelée droite d'ajustement) qui passe au mieux par ces points, ou plutôt dans une position que l'on qualifierait "d'au milieu du nuage de points". 3 cas de figure : • Si cette droite "monte", on dira qu'il y a corrélation positive entre les deux variables. • Si elle "descend", il s'agira d'une corrélation négative. • Si elle est "horizontale", ou si on ne peut pas décider d'une orientation, on dira qu'il y a une absence de corrélation. Corrélation positive Corrélation négative Absence de corrélation taille [cm] 150 160 170 180 190 200 poids [kg] 50 60 70 80 90 x y x y x y x y STATISTIQUE À 2 VARIABLES 61 3EC – JtJ 2020 Remarques : La qualité de la corrélation entre deux variables peut se mesurer par la dispersion des points autour de la droite d'ajustement: Corrélation parfaite Bonne corrélation (corrélation forte) Mauvaise corrélation (corrélation faible) Modèle 1 : Afin de comparer la taille des gymnasiens avec l'étendue de leurs bras, on a effectué les mesures sur 32 élèves qui a permis d'effectuer la représentation graphique du nuage de points suivant: a) Représenter une droite d'ajustement "à la règle". b) Proposer une équation de cette droite d'ajustement. c) Proposer quelques constats. x y x y x y 100 120 140 160 180 200 taille [cm] 100 120 140 160 180 200 Étendue des bras [cm] 62 THÈME 14 3EC – JtJ 2020 Exercice 14.1: Afin de faire un bilan sur la réussite des étudiants qui s'inscrivent dans les établissements d'enseignement pour adultes, les membres de la direction s'intéressent à la corrélation entre l'absentéisme aux différents cours (en heures) et la moyenne générale (en %) à la fin de l'année scolaire. Pour bien analyser le tout, ils ont regroupé les données dans le nuage de points suivant: a) Représenter une droite d'ajustement "à la règle". b) Proposer une équation de cette droite d'ajustement. c) Proposer quelques constats. Exercice 14.2: À propos des élèves (garçons puis filles) de 4 classes de ECGC d'un gymnase lausannois, on désire comparer une éventuelle corrélation entre leur taille et leur poids. Utiliser les 2 représentations graphiques des nuages de points: Que pouvez-vous constater à propos de la corrélation taille – poids pour les garçons (à gauche) et les filles (à droite) ? 0 2 4 6 8 résultat final (%) 20 40 60 80 100 Nbre d’heures d’absence taille [cm] 150 160 170 180 190 200 poids [kg] 40 50 60 70 80 90 taille [cm] 150 160 170 180 190 200 poids [kg] 40 50 60 70 80 90 STATISTIQUE À 2 VARIABLES 63 3EC – JtJ 2020 14.2 Ajustements affines 3 démarches différentes vous seront proposées pour déterminer au mieux une droite d'ajustement sur un nuage de points. 14.2.1 Ajustements à la règle Ajustement à la règle : On commence par représenter le nuage de points, puis on trace au jugé une droite d passant le plus près possible des points du nuage. Pour ce faire, on utilise une règle transparente et on la dispose suivant la direction constatée, en s'efforçant d'équilibrer les nombres de points situés de part et d'autre suivant les abscisses croissantes. À l'aide des coordonnées de 2 points choisis sur cette droite, on détermine alors une équation approximative de la droite d'ajustement. C'est cette démarche qui vous a été suggérée dans le paragraphe précédent. 14.2.2 Méthode de Mayer Point moyen : Lorsque l'on pense pouvoir réaliser un ajustement affine d'un nuage, il peut sembler intéressant, avant de tracer la droite, de placer le point dont l'abscisse est la moyenne des abscisses xi et dont l'ordonnée est la moyenne des ordonnées yi. On appelle point moyen d'un nuage de n points Mi(xi ; yi) le point G de coordonnées: xG = x = 1 n xi i=1 n ∑ et yG = y = 1 n yi i=1 n ∑ Méthode de Mayer : On commence par trier les points selon leurs abscisses croissantes, puis on détermine la médiane des xi afin de partager le nuage en deux parties ayant le même nombre de points. On détermine ensuite G1 et G2, les points moyens respectifs de chacune de ces parties. La droite G1G2 est appelée droite de Mayer de la série statistique. Il est à noter que la droite de Mayer d'un nuage passe toujours par le point moyen, de ce nuage. x y G1 G2 64 THÈME 14 3EC – JtJ 2020 Modèle 2 : Le tableau suivant recense par clinique le nombre de postes du personnel non médical yi en fonction du nombre de lits xi de la clinique: Clinique C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 xi 122 177 77 135 109 88 185 128 120 146 yi 185 221 114 164 125 118 193 160 151 172 a) Représenter le nuage de points sur le système d'axes proposé. b) L’ajustement affine vous parait-il justifié ? c) Faire un ajustement affine du nombre de postes en fonction du nombre de lits par la méthode de Mayer. x 80 90 100 110 120 130 140 150 160 170 180 190 200 y 150 200 STATISTIQUE À 2 VARIABLES 65 3EC – JtJ 2020 d) Vérifier que le point moyen est sur la droite d’ajustement. e) Si une clinique contient 200 lits, estimer le nombre de postes nécessaires pour le personnel non médical. 66 THÈME 14 3EC – JtJ 2020 Exercice 14.3: Dans une maternité on a relevé le poids et le taille de 10 nouveau-nés. Les résultats sont consignés dans le tableau suivant : Enfant 1 2 3 4 5 6 7 8 9 10 Masse en kg 2,5 2,6 2,7 3 3,2 3,3 3,4 3,6 3,8 3,9 Taille en cm 45 46 48 50 51 52 53 54 54 57 On veut savoir si connaissant le poids d’un nouveau-né on peut avoir une idée de sa taille. a) Représenter le nuage de points sur un graphique. b) L’ajustement affine vous parait-il justifié ? c) Faire un ajustement affine de la taille en fonction du poids par la méthode de Mayer. d) Vérifier que le point moyen est sur la droite d’ajustement. e) Si un bébé pèse 4,2 kg quelle sera sa taille probable ? Exercice 14.4: On a relevé dans le tableau ci-dessous les poids (en kg) respectifs de 12 pères xi et de leur fils aîné yi. xi 65 63 66 64 68 62 70 68 67 69 70 72 yi 63 62 66 60 67 60 69 67 67 68 67 70 On veut savoir si connaissant le poids du père d'un enfant, on pourrait tenter d'estimer le poids de son fils aîné. a) Représenter le nuage de points sur un graphique. b) Déterminer un ajustement affine par la méthode de Mayer. c) Montrer que la droite passe bien par le uploads/S4/ 3ec-theme-14.pdf
Documents similaires










-
28
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Nov 11, 2021
- Catégorie Law / Droit
- Langue French
- Taille du fichier 1.6656MB