BTS M´ ecanique et Automatismes Industriels Statistiques inf´ erentielles Lyc´

BTS M´ ecanique et Automatismes Industriels Statistiques inf´ erentielles Lyc´ ee Louis Armand, Poitiers, Ann´ ee scolaire 2005 2006 Statistiques inf´ erentielles 1. Introduction – vocabulaire Pour ´ etudier une population statistique, on a recours ` a deux m´ ethodes : la m´ ethode exhaustive (ou recensement) : on examine chacun des ´ el´ ements de la population. En g´ en´ eral, cette m´ ethode est jug´ ee trop longue. la m´ ethode des sondages : on n’examine qu’une partie de la population pour essayer d’en d´ eduire des informations sur la totalit´ e de la population. Cette m´ ethode comprend deux parties : l’´ echantillonage qui permet de passer de la population totale ` a une partie seulement de cette population (l’´ echantillon). l’estimation qui permet d’induire, ` a partir des r´ esultats observ´ es sur l’´ echantillon, des informations sur la population totale. Nous ne nous pr´ eoccuperons pas ici des probl` emes concernant l’´ echantillonage. Notre propos sera seulement d’exa- miner deux m´ ethodes diff´ erentes d’estimation. 2. Principe de la th´ eorie On consid` ere une population P d’effectif N. On suppose que, pour le caract` ere observ´ e, la moyenne de P est m alors que son ´ ecart-type est σ. Ce sont ces deux valeurs que nous voudrions retrouver ` a partir des ´ echantillons. Supposons donc maintenant que nous disposons de k ´ echantillons de P, chacun d’entre eux ´ etant d’effectif n. On note E1  E2  Ek ces k ´ echantillons, de moyennes respectives x1  x2  xk, et d’´ ecart-type respectifs σ1  σ2  σk. L’ensemble X =  x1  x2  xk  est une s´ erie statistique d’effectif k, s´ erie que l’on appelle distribution des moyennes. La th´ eorie montre alors que E  X = m  et σX = σ n De plus, pour n 30, la variable al´ eatoire X suit approximativement une loi normale N m  σ n . Autrement dit, la variable al´ eatoire X  m σ n suit approximativement une loi normale N (0  1) . 3. Estimation ponctuelle Connaissant la moyenne x et l’´ ecart-type σ  d’un ´ echantillon de taille n, il s’agit d’estimer la moyenne m, l’´ ecart-type σ et la variance σ2 de la population totale. Pour la moyenne, l’estimation ponctuelle est la m´ ethode na¨ ıve qui consiste ` a confondre la mesure sur l’´ echantillon avec la moyenne de la population totale. On dira que x est une estimation ponctuelle de la moyenne m . Pour la variance et l’´ ecart type, on admettra que : n n  1σ  2 est une estimation ponctuelle de la variance σ2 et donc :  n n  1σ  est une estimation ponctuelle de l’´ ecart-type σ Dans le cas o` u, pour une populationcompl` ete, c’est une fr´ equence p que l’on cherche ` a estimer ` a partir de la fr´ equence f observ´ ee sur un ´ echantillon, on bros` ede comme pour une moyenne. Plus pr´ ecis´ ement, l’estimation ponctuelle est la m´ ethode qui consiste ` a confondre la mesure sur l’´ echantillon avec la mesure de la population totale. Si f est la fr´ equence, sur l’´ echantillon, du caract` ere observ´ e, on dira que f est une estimation ponctuelle de la fr´ equence p . 1 Statistiques inf´ erentielles Lyc´ ee Louis Armand, Poitiers 4. Estimation d’une moyenne par intervalle de confiance On consid` ere une population P d’effectif N. On suppose que, pour le caract` ere observ´ e, la moyenne, inconnue, de P est m alors que son ´ ecart-type, connu, est σ. Situation r´ esum´ ee dans le diagramme ci-dessous : m : inconnu σ : connu ´ Echantillon n  x Population On pr´ el` eve au hasard, et avec remise, une succession d’´ echantillons de mˆ eme effectif n dont on calcule les moyennes respectives : x1 pour le premier, x2 pour le deuxi` eme, et ainsi de suite. Notons maintenant X la variable al´ eatoire qui associe ` a un ´ echantillon Ei sa moyenne xi. La variable X prend donc successivement les valeurs x1, x2,  Pour finir, on suppose ´ egalement que les conditions sont r´ eunies pour pouvoir utiliser une cons´ equence du th´ eor` eme de la limite centr´ ee et faire l’approximation que X suit la loi normale N (m  σ n). Autrement dit que la variable al´ eatoire T = n σ  X  m suit la loi normale N (0  1). On aura alors, pour tout t 0, P(  t  T  t) = 2Π(t)  1 4.1 - Calcul sur un exemple : intervalle de confiance ` a 95% Par exemple, si on veut obtenir un intervalle ayant 95% de chances de contenir la moyenne m de la population P, on proc` ede de la mani` ere suivante : On a 2Π(t)  1 = 0  95  Π(t) = 0  975. Avec la table donn´ ee dans le formulaire, on voit que cette valeur est obtenue pour t = 1  96. On a donc P  1  96  n σ (X  m)  1  96 = 0  95  P  1  96 σ n  (X  m)  1  96 σ n = 0  95  P m  1  96 σ n  X  m + 1  96 σ n = 0  95 Autrement dit, avant de pr´ elever un ´ echantillon de taille n dans la population, il y a 95% de chances pour que cet ´ echantillon ait une moyenne entre m  1  96 σ n et m + 1  96 σ n Comme m est inconnu, on se sert des r´ esultats pr´ ec´ edents pour encadrer m : P  X  1  96 σ n   m   X + 1  96 σ n = 0  95  P X + 1  96 σ n m X  1  96 σ n = 0  95  P X  1  96 σ n  m  X + 1  96 σ n = 0  95 Ainsi, avant de pr´ elever un ´ echantillon de taille n dans la population, il y a 95% de chances pour la moyenne x de cet ´ echantillon v´ erifie x  1  96 σ n  m  x + 1  96 σ n En revanche, apr` es le pr´ el` evement, il n’y a plus de probabilit´ e ` a envisgager : il est vrai ou faux que la moyenne m se situe dans l’intervalle envisag´ e  x  1  96 σ n  x + 1  96 σ n  . Cet intervalle est appel´ e intervalle de confiance de la moyenne de la population avec le coefficient de confiance 95% (ou avec le risque 5%). 2 Statistiques inf´ erentielles Lyc´ ee Louis Armand, Poitiers 4.2 - Cas g´ en´ eral On fonctionne exactement sur le mˆ eme principe : un coefficient de confiance choisi ` a l’avance permet de d´ efinir un nombre positif t tel que P(  t  T  t) = 2Π(t)  1 soit ´ egal ` a ce coefficient de confiance. Par exemple, 2Π(t)  1 = 0  99 si et seulement si Π(t) = 0  995, ce qui correspond ` a t = 2  58 (d’apr` es la table de la loi normale N (0  1)). En reprenant tous les calculs ci-dessus, on obtient alors le r´ esultat suivant : L’intervalle  x  t σ n  x + t σ n  est l’intervalle de confiance de la moyenne m de la population avec le coefficient de confiance 2Π(t)  1, ayant pour centre la moyenne x de l’´ echantillon consid´ er´ e. Dans la pratique, on utilise souvent des coefficients de confiance de 95%, ce qui correspond ` a t = 1  96, ou ` a 99%, ce qui correspond ` a t = 2  58. 5. Estimation d’une fr´ equence par intervalle de confiance On consid` ere une population P d’effectif N. On suppose que, pour le caract` ere observ´ e, la fr´ equence, inconnue, de P est p. On suppose ´ egalement que l’on dispose d’un ´ echantillon de atille n de cette population, ´ echantillon sur lequel le caract` ere observ´ e l’est avec la fr´ equence f. Situation r´ esum´ ee dans le diagramme ci-dessous : p : inconnue ´ Echantillon n  f Population On se place dans le cas o` u l’on peut consid´ erer que la variable F qui, ` a tout ´ echantillon al´ eatoire de taille n uploads/Geographie/ stats-inf.pdf

  • 17
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager