S3 Maths et Info-MIAGE 2011-2012 Statistique et Probabilités Estimation, interv

S3 Maths et Info-MIAGE 2011-2012 Statistique et Probabilités Estimation, intervalle de confiance, tests - Moyenne Université de Picardie Jules Verne 2011-2012 UFR des Sciences Licence mention Mathématiques et mention Informatique parcours MIAGE - Semestre 3 Statistique et Probabilités Estimation, intervalle de confiance, test statistique (suite) Cas d’une ou de deux moyennes, d’une ou de deux variances 1. Introduction On s’intéresse à l’étude d’un caractère (quantitatif ou qualitatif) des N individus d’une population. Pour chacun des individus de la population, le caractère peut a priori prendre des valeurs aléatoirement différentes. Ainsi, le caractère peut être représenter par une variable aléatoire X. Lorsque le caractère est quantitatif (taille des individus,...), X sera une variable aléatoire égale aux valeurs du caractère ; on supposera en général que X est une variable aléatoire d’espérance mathématique (moyenne) , d’écart-type , et éventuellement de loi normale. Lorsqu’on n’a pas accès à l’ensemble de la population, on procède à un échantillonnage, i.e. au choix de n individus dans la population, sur lesquels on observe la valeur x du caractère X. On aura ainsi un échantillon X1,X2,...,Xn est un échantillon de taille n de X ; pour tout i  1,...,n, la variable aléatoire Xi correspond aux valeurs du caractère du i-ème individu obtenu par échantillonage, et aura donc la même loi de probabilité que X. De plus, l’échantillonnage étant non-exhaustif (tirages avec remise), les variables aléatoires Xi sont indépendantes. Exemple introductif sur la moyenne On considère un groupe de quatre enfants, Alexis, Benjamin, Cyril et David, d’âges respectifs 12, 13, 14 et 15 ans. Lorsqu’on choisit un enfant au hasard dans le groupe, on peut considérer : - X, âge de l’enfant, variable aléatoire de loi uniforme sur 12,13,14,15 : PX  12    PX  15  1 4 , de moyenne   13,5 et d’écart-type   1.25  1.118 ; Cherchons à retrouver ou à approcher ces résultats à partir d’échantillons non-exhaustifs (avec remise) de taille n  3. Il y en a 43  64, ils forment un univers , ensemble des résultats possibles de l’expérience aléatoire "choisir un échantillon". On peut munir  de la tribu des événements A  P et de l’équiprobabilité P sur ,A. A chacun des résultats (échantillons) , on peut associer la moyenne X  x des âges de l’échantillon. On obtient les résultats présentés dans le tableau page 2. On définit ainsi une variable aléatoire X, dont on peut obtenir la loi de probabilité : xi 12,00 12,33 12,67 13,00 13,33 13,67 14,00 14,33 14,67 15,00 PX  xi 1/64 3/64 6/64 10/64 12/64 12/64 10/64 6/64 3/64 1/64 On peut alors calculer : - EX  xiPX  xi  13,5 : on remarque que EX    EX. - VarX  xi 2PX  xi  EX2  5 12 : on remarque que VarX  2 n  VarX n . 2. Estimateur - Estimation 2.1. Moyenne et variance d’échantillon Considérons un caractère quantitatif représenté par une variable aléatoire X d’espérance mathématique , d’écart-type , et un échantillon X1,X2,...,Xn de taille n de X. Pour chaque échantillonnage on peut calculer la moyenne observée du caractère x  1 n  i1 n xi , x  1 n  i1 n xi , ... Ces moyennes observées peuvent être considérées comme les valeurs observées de la variable aléatoire X  Xn  1 n  i1 n Xi, moyenne d’échantillon. Stéphane Ducay 1 S3 Maths et Info-MIAGE 2011-2012 Statistique et Probabilités Estimation, intervalle de confiance, tests - Moyenne  x A,A,A 12 A,A,B 12,33 A,A,C 12,67 A,A,D 13 A,B,A 12,33 A,B,B 12,67 A,B,C 13 A,B,D 13,33 A,C,A 12,67 A,C,B 13 A,C,C 13,33 A,C,D 13,67 A,D,A 13 A,D,B 13,33 A,D,C 13,67 A,D,D 14  x B,A,A 12,33 B,A,B 12,67 B,A,C 13 B,A,D 13,33 B,B,A 12,67 B,B,B 13 B,B,C 13,33 B,B,D 13,67 B,C,A 13 B,C,B 13,33 B,C,C 13,67 B,C,D 14 B,D,A 13,33 B,D,B 13,67 B,D,C 14 B,D,D 14,33  x C,A,A 12,67 C,A,B 13 C,A,C 13,33 C,A,D 13,67 C,B,A 13 C,B,B 13,33 C,B,C 13,67 C,B,D 14 C,C,A 13,33 C,C,B 13,67 C,C,C 14 C,C,D 14,33 C,D,A 13,67 C,D,B 14 C,D,C 14,33 C,D,D 14,67  x D,A,A 13 D,A,B 13,33 D,A,C 13,67 D,A,D 14 D,B,A 13,33 D,B,B 13,67 D,B,C 14 D,B,D 14,33 D,C,A 13,67 D,C,B 14 D,C,C 14,33 D,C,D 14,67 D,D,A 14 D,D,B 14,33 D,D,C 14,67 D,D,D 15 On démontre que EX   (on dit que X est un estimateur sans biais de ) et VarX  2 n . Pour une observation x1,x2,...,xn de l’échantillon, on dit que x  1 n  i1 n xi    est une estimation ponctuelle de . De même, on considère la variance d’échantillon S2  Sn 2  1 n  i1 n Xi  X2  1 n  i1 n Xi 2  X2. On a alors ES2  n  1 n 2 et S2 est un estimateur avec biais de 2. On considère alors la variance corrigée d’échantillon Sc 2  n n  1 S2 : on a alors ESc 2  2 et Sc 2 est un estimateur sans biais de 2. Pour une observation x1,x2,...,xn de l’échantillon, une estimation ponctuelle de 2 est sc 2  n n  1 s2   2 avec s2  1 n  i1 n xi 2  x2. 2.2. Loi de probabilité des estimateurs Cas d’un petit échantillon gaussien : n  30 et X de loi normale N; Si  est connu (cas peu utile en pratique), alors U  X    n suit la loi normale N0;1. Si  est inconnu, alors T  X   Sc n suit la loi de Student à n  1 degrés de liberté. Cas d’un grand échantillon : n  30 (et X de loi quelconque) Dans ce cas, U  X   Sc n suit approximativement la loi normale N0;1. Cas d’un échantillon gaussien : X de loi normale N; Dans ce cas, Y2  n  1 2 Sc 2 suit la loi de khi deux à n  1 degrés de liberté. Stéphane Ducay 2 S3 Maths et Info-MIAGE 2011-2012 Statistique et Probabilités Estimation, intervalle de confiance, tests - Moyenne 3. Intervalle de confiance 3.1. Pour une moyenne  Considérons un caractère quantitatif représenté par une variable aléatoire X d’espérance mathématique , d’écart-type , et un échantillon X1,X2,...,Xn de taille n de X. La moyenne d’échantillon est X  1 n  i1 n Xi et la variance corrigée d’échantillon est Sc 2  n n  1 S2, avec S2  1 n  i1 n Xi  X2  1 n  i1 n Xi 2  X2. 3.1.1. Cas d’un petit échantillon gaussien : n  30 et X de loi normale N; 3.1.1.1. Cas  connu (peu utile en pratique) On sait que U  X    n suit la loi normale N0;1. On fixe une valeur   0,1. On peut trouver un réel u tel que Pu  U  u  1   (voir table 2). On a alors 1    P u  X    n  u  P   n u  X     n u  P X   n u    X   n u  P X   n u    X   n u . On dit que I  X   n u , X   n u est un intervalle de confiance de  au niveau 1   (ou au seuil ). En pratique, on a une observation x de X, d’où une observation de cet intervalle : i  x   n u , x   n u . 3.1.1.2. Cas  inconnu On sait que T  X   Sc n suit la loi de Student à n  1 degrés de liberté. On détermine alors le réel t tel que Pt  T  t  1   (table 3). On en déduit un intervalle de confiance de  au niveau 1   : i  x  sc n t , x  sc n t . 3.1.2. Cas d’un grand échantillon : n  30 On sait que U  X   Sc n suit approximativement la loi normale N0;1. On procède alors comme au 3.1.1.1. en remplaçant  par sc et on obtient un intervalle de confiance approché de  au niveau 1   : i  x  sc n u , x  sc n u 3.2. Pour une variance 2 Considérons un caractère quantitatif représenté par une variable aléatoire X de loi normale N;, et un échantillon X1,X2,...,Xn de taille n de X. La moyenne d’échantillon est X et la variance corrigée d’échantillon est Sc 2  n n  1 S2. Alors Y2  n  uploads/Geographie/ intervalledeconfiance-pdf.pdf

  • 33
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager