Série statistique double __________________ I Introduction, nuage de points 1.I

Série statistique double __________________ I Introduction, nuage de points 1.Introduction On se donne une population Ω d’effectif total N ; on numérote les individus de 1 à N : Pour tout entier i de [1 ; N], soit ωi l’individu n°i.  On se donne 2 caractères quantitatifs X et Y sur Ω : Pour tout entier i de [1 ; N], soit xi=X(ωi) et yi=Y(ωi). En associant à l’individu ωi n°i de Ω le couple de réels (xi, yi) pour n’importe quel entier i compris entre 1 et N (au sens large), on a défini une série statistique double. En pratique, on la présente sous forme de tableau de la manière suivante : n° des individus 1 2 … i … N X x1 x2 … xi … xN Y y1 y2 … yi … yN On omet souvent la première ligne du tableau.  On recherche une relation mathématique entre les deux variables statistiques X et Y , pouvant fournir un outil de travail pour analyser par exemple : - l’influence de la température sur le comportement d’un composant électronique, ou sur une réaction chimique - l’influence des temps de fonctionnements d’un appareil sur les avaries. 2. Nuage de points L’ensemble des points de coordonnées (xi, yi), où l’entier i varie de 1 à N, constitue le nuage de points de la série statistique double X, Y. C’est l’ensemble de tous les points de coordonnées X(ω) et Y(ω) où ω est un individu. Le point moyen M de ce nuage de points est le point M de coordonnées Y X et . La forme du nage de points peut suggérer une relation mathématique entre X et Y. y × ×M × × (D) x La droite (D) a pour équation y=ax+b L’ajustement linéaire consiste à chercher s’il existe une droite (D) passant « très près » des points nuage. Si on est dans le cas de la figure ci-contre, on peut considérer qu’approximativement : Y=aX+b . II. Recherche d’un ajustement linéaire par la méthode graphique Exemple étudié Une série de dix mesures simultanées de deux grandeurs X et Y a donné la série statistique double suivante : n° de la mesure 1 2 3 4 5 6 7 8 9 10 X 62 63 65 68 60 68 70 66 63 66 Y 28 27 27,5 24 30,5 25,5 23,5 25 28,5 26,5 1°) Représenter le nuage de points. 2°) Rechercher graphiquement un ajustement linéaire. Résolution 1°) Voir la figure ci-dessous. 2°) La recherche peut se faire - directement, par pure estimation - en faisant intervenir le point moyen du nuage M( ) ,Y X . On essaie alors de choisir une droite passant par M. Ici on a X =65,1 et Y =26,6. - par la méthode de Mayer à connaître : On partage l’ensemble des points rangés par abscisses croissantes en 2 sous-ensembles de même effectif à une unité près. On détermine les points moyens M1 et M2 des deux sous- ensembles, et on choisit pour droite d’ajustement la droite (M1M2). Cette droite (M1M2) contient toujours le point M. Dans notre exemple, on a les deux regroupements : X1 60 62 63 63 65 1 X = 62,6 Y1 30,5 28 27 28,5 27,5 1 Y = 28,3 X2 66 66 68 68 70 2 X = 67,6 Y2 25 26,5 24 25,5 23,5 2 Y = 24,9 On prend les deux points M1( 1 X , 1 Y ) et M2 ( 2 X , 2 Y ) : La droite d’ajustement est la droite (M1M2). On va déterminer l’équation de cette droite. Le coefficient directeur de (M1M2) est a= 68 , 0 5 4 , 3 1 2 1 2 − = − = − − X X Y Y . L’équation de (M1M2) est y=ax+b ainsi 1 Y = a 1 X +b d’où b= 1 Y –a 1 X =28,3+0,48×62,6 soit b=70,868. Finalement la droite (M1M2) a pour équation y= -0,68x+70,868 . On considère que tous les points du nuage de points, de coordonnées X et Y, sont proches de la droite (M1M2) ainsi approximativement Y= -0,68X+70,868 . M1 M M2 III Méthode des moindres carrés On a encore la population Ω d’effectif total N et la série statistique double X,Y donnée par le tableau : X x1 x2 … xi … xN Y y1 y2 … yi … yN On considère le nuage de points de la série statistique double X,Y dans le repère R= ) , , ( j i O r r du plan. 1. Covariance de X et Y cov(X, Y), la covariance de X et Y, est définie par : cov(X, Y)= ∑ − − ) ) ( )( ) ( ( 1 Y Y X X N ω ω , soit : cov(X,Y)= ∑ = − − N i i i Y y X x N 1 ) )( ( 1 . Après développement et regroupement, on obtient : cov(X, Y)= ∑ ∑ = − = − N i i i Y X y x N Y X Y X N 1 1 ) ( ) ( 1 ω ω . Dans les formulaires on écrit aussi σX,Y à la place de cov(X,Y). Pour la suite, on suppose que ni X, ni Y ne sont constantes : V(X) et V(Y) sont des réels strictement positifs . 2. Droite de régression (ou d’ajustement) linéaire de Y par rapport à X Avec a et b réels constants, on se donne la droite (D), non parallèle à l’axe des ordonnées d’équation y=ax+b. Soit ŷ1=ax1+b, ŷ2=ax2+b, … , ŷN = axN+b . Pour i entier variant de 1 à N : Soit Mi le point de coordonnées (xi, yi), soit Pi le point de coordonnées (xi, ŷi). Pi est le point de (D) d’abscisse xi. L’unité de longueur étant celle du vecteur j r , la longueur du vecteur i iM P est PiMi=|yi–ŷi| . On considère alors la somme Sor= ∑ ∑ = = − = N i i i N i i i y y M P 1 2 1 2 ) ˆ ( . On peut montrer que Sor est minimale pour a et b vérifiant les égalités suivantes : a= ) ( V ) , ( cov X Y X et b X a Y + = . DY/X , la droite d’ajustement de Y par rapport à X est cette droite (D) pour laquelle Sor est minimale. DY/X constient le point moyen du nuage de points. Figure du paragraphe 2 yi Mi ŷi Pi (D) xi 3. Droite de régression (ou d’ajustement) linéaire de X par rapport à Y Avec a et b réels constants, on se donne la droite (D), non parallèle à l’axe des abscisses, d’équation x=αy+β. Soit x ˆ 1 = αy1+β , x ˆ 2 = αy2+β , … , x ˆ N = αyN+β . Pour i entier variant de 1 à N : Soit Mi le point de coordonnées (xi, yi), soit Qi le point de coordonnées ( x ˆ i, yi). Qi est le point de (D) d’ordonnée yi. L’unité de longueur étant celle du vecteur i r , la longueur du vecteur i M Q1 est QiMi=|xi– x ˆ i | . On considère alors la somme Sab= ∑ ∑ = = − = N i i i N i i i x x M Q 1 2 1 2 ) ˆ ( . On peut montrer que Sab est minimale pour α et β vérifiant les égalités suivantes : α= β α + = Y X Y V Y X et ) ( ) , cov( . DX/Y , la droite de régression de X par rapport à Y, est cette droite (D) pour laquelle Sab est minimale. DX/Y contient le point moyen du nuage de points. Figure du paragraphe 3 (D) yi Qi Mi x ˆ i xi Complément dans le cas où cov(X, Y) ≠ 0 : DX/Y a pour équation x=αy+β avec α= β α + = Y X Y V Y X et ) ( ) , cov( . α ≠0 d’où DX/Y a aussi pour équation : α β α α β α − = + = x y y x 1 encore soit 1 . Finalement : ) cov( ) ( V 1 X,Y Y = α est le coefficient directeur de DX/Y . 4. Validité de l’ajustement linéaire On juge l’ajustement linéaire (par la méthode des moindres carrés) valable si les droites DY/X et DX/Y, passant par M( X , Y ) , sont voisines. a) Cas où cov(X,Y) =0 DY/X est horizontale et DX/Y est verticale. L’ajustement linéaire n’est pas valable, on dit que X et Y sont linéairement indépendantes. b) On se place dans le cas où cov(X,Y)≠ 0 DY/X a pour pente a= ) ( V ) , ( cov X Y X et DX/Y a pour pente α 1 où α= ) V( ) , cov( Y Y X . L’ajustement linéaire est valable si uploads/S4/ 3-series-statistiques-doubles.pdf

  • 27
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Aoû 08, 2022
  • Catégorie Law / Droit
  • Langue French
  • Taille du fichier 0.1662MB