S3 Maths et Info-MIAGE 2011-2012 Statistique et Probabilités Estimation, interv
S3 Maths et Info-MIAGE 2011-2012 Statistique et Probabilités Estimation, intervalle de confiance, tests - Proportion Université de Picardie Jules Verne 2011-2012 UFR des Sciences Licence mention Mathématiques et mention Informatique parcours MIAGE - Semestre 3 Statistique et Probabilités Echantillonnage, estimation, intervalle de confiance, test statistique Cas d’une ou de deux proportions 1. Simulations 1.1. Loi de Bernoulli et simulation Soit ,A,P un espace probabilisé. Une variable aléatoire X suit la loi de Bernoulli de paramètre p 0,1, que l’on note Bp, si et seulement si X est à valeurs dans 0;1, et PX 1 p et PX 0 p. Une telle variable aléatoire permet d’indiquer si un événement A est réalisé (X 1) ou pas (X 0). Comme exemples d’application on peut citer : - lancer d’une pièce menant à Pile ou Face, A "obtenir Pile" ; - tirer une boule dans une urne contenant des boules blanches et noires, A "obtenir une blanche" ; - choisir d’un individu dans la population, A "l’individu est malade". Ainsi , une telle variable permet de représenter un caractère qualitatif à deux modalités. Simulation 1 p étant donné dans 0,1, on considère une urne contenant une proportion p de boules blanches. Plus précisément, on considère l’entier N plus petit multiple de 10 tel que Np soit entier, et ainsi une urne contenant N boules, dont Np boules blanches et N1 p boules noires. Par exemple, pour p 0,42, on a N 100, Np 42 et N1 p 58. On suppose que les N boules sont numérotées de 1 à N, de 1 à Np pour les boules blanches, de Np 1 à n pour les noires. A l’expérience aléatoire " tirer une boule au hasard dans l’urne ", on peut associer l’univers 1,...,N et le munir de l’équiprobabilité P. Dans ce contexte, l’événement A "obtenir une boule blanche" est A 1,...,Np, sa probabilité étant alors PA cardA card Np N p. Considérant la variable aléatoire X qui à chaque tirage d’une boule associe 1 si elle est blanche et 0 sinon, on a X 1 A et X 0 A, et donc PX 1 PA p et PX 0 PA 1 PA 1 p. Utilisation du tableur Excel (voir fichier excel - feuille Bernoulli simulation 1) Le tirage d’une boule de l’urne est simulé par l’instruction ALEA.ENTRE.BORNES(1;N) à entrer dans la cellule B8 (par exemple). La valeur correspondante de X est alors obtenue par l’instruction SI(B8Np;1;0). Simulation 2 A l’expérience aléatoire "choisir un nombre au hasard dans l’intervalle 0;1" on peut associer une variable aléatoire Y suit la loi Uniforme sur l’intervalle 0;1 (loi à densité) ; Y indique le nombre obtenu. On sait que pour tout y 0;1, PY y y. p étant donné dans 0,1, on a alors PY p p. Considérant la variable aléatoire X définie par X 1 Y p et X 0 Y p Y p, X suit la loi de Bernoulli Bp. Utilisation du tableur Excel (voir fichier excel - feuille Bernoulli simulation 2) Une valeur de Y est simulée par l’instruction ALEA() à entrer dans la cellule B7 (par exemple). La valeur correspondante de X est alors obtenue par l’instruction SI(B7p;1;0). Stéphane Ducay 1 S3 Maths et Info-MIAGE 2011-2012 Statistique et Probabilités Estimation, intervalle de confiance, tests - Proportion 1.2. Loi binomiale et simulation Reprenons l’exemple d’une urne contenant une proportion p 0,42 de boules blanches. On tire une boule au hasard dans l’urne : le nombre de "boule blanche" obtenu en un tirage est une variable aléatoire X de loi de Bernoulli Bp : PX 1 p 0.42 et PX 0 1 p 0,58. On a EX p 0,42 et VarX p1 p 0,2436. Si on effectue n 50 tirages avec remise d’une boule, on observe la réalisation de X1 , X2 , ... , X50 , variables aléatoires indépendantes de même loi que X. On dit que l’on a un échantillon aléatoire simple de taille n 50 de loi de Bernoulli de paramètre p 0,42. La proportion de "boules blanches" obtenue est une variable aléatoire : Fn X1 X2 X50 50 i1 n Xi n où i1 n Xi représente le nombre de "boules blanches" obtenues en n 50 tirages. Ayant procédé par répétitions d’expériences indépendantes, nFn i1 n Xi est une variable aléatoire de la loi Binomiale B50;0,42 Bn,p. On a donc nEFn EnFn np et n2VarFn VarnFn np1 p, d’où EFn p 0,42 et VarFn p1 p n 0,2436 n . On constate donc que lorsqu’on augmente la taille n de l’échantillon, l’espérance de Fn reste constante, égale à 0,42, alors que la variance diminue. Utilisation du tableur Excel (voir fichier excel - feuille Bernoulli simulation 1 et 2) On reprend les simulations 1 et 2 en répétant 50 les instructions précédentes sur 50 lignes. Il suffit ensuite de "sommer" les valeurs de X obtenues pour avoir le nombre de boules blanches obtenues, puis de diviser par 50 pour avoir la fréquence. 2. Echantillonnage : cas d’une proportion 2.0. Quel cadre mathématique ? Statistique et probabilités : Description des observations et modèle théorique. La Statistique consiste à étudier un ensemble d’objets (on parle de population, composée d’individus ou unités statistiques) sur lesquels on observe des caractéristiques, appelées variables statistiques. Le calcul des Probabilités permet de proposer un modèle théorique d’une situation concrète afin de quantifier la fiabilité des affirmations. Population et échantillon : Dans certains cas on peut obtenir les valeurs de ces variables sur l’ensemble de la population ; en appliquant les méthodes de la statistique descriptive il est possible, au moyen de tableaux, graphiques, paramètres, d’analyser ces résultats. Exemples : Recensement de la population française, notes obtenues par tous les candidats à un examen, salaires de tous les employés d’une entreprise, etc... Mais la population peut être trop vaste pour être étudiée dans sa totalité, par manque de moyens, ou de temps. (C’est le cas si on s’intéresse aux intentions de vote des Français pour une élection). Elle peut même être considérée comme infinie. C’est le cas si l’on note la qualité (défectueuse ou non) des pièces produites par un certain procédé : le nombre de ces pièces est a priori illimité, et on ne peut toutes les tester. De même, si l’on s’intéresse aux fréquences d’obtentions de "pile" et "face" avec une pièce de monnaie, le nombre de lancers de pièce à étudier est a priori infini : on a ici une population latente infinie. Il arrive aussi que la mesure d’une variable soit destructrice pour l’individu : si on étudie la durée de vie de certains appareils, il serait absurde de les faire tous fonctionner jusqu’à la panne, les rendant inutilisables. Dans tous ces cas, on est amené à n’étudier qu’une partie de la population, un échantillon, obtenu par sondage, dans le but d’extrapoler à la population entière des observations faites sur l’échantillon. Stéphane Ducay 2 S3 Maths et Info-MIAGE 2011-2012 Statistique et Probabilités Estimation, intervalle de confiance, tests - Proportion Fluctuation d’échantillonnage Lorsqu’on étudie un caractère sur plusieurs échantillons d’une même population, on peut observer que les résultats ne sont pas identiques selon les échantillons. Plus la taille de l’échantillon étudié est grande, plus les résultats obtenus seront fiables. Cela s’explique par la diminution de la variance, et aussi par la loi des grands nombres. La fluctuation d’échantillonnage représente la fluctuation entre les différents résultats obtenus d’une même enquête sur différents échantillons d’une même population. Ces différents résultats présentent une certaine régularité, ce qui se traduit par la notion d’intervalle de confiance. 2.1. Caractère statistique et variable aléatoire Considérons une population sur laquelle on définit un caractère qualitatif à deux modalités A et B. On convient de représenter la modalité A par 1 et la modalité B par 0. Le caractère est ainsi représenté par une application X de dans qui, à tout individu , associe un réel x X X X 0,1 ensemble des "valeurs" du caractère. Cette application modélise le caractère de façon déterministe : si on connaît l’individu , on connaît aussitôt la valeur x. Son étude relève de la statistique descriptive qui conduit, par exemple, au tableau des couples xi,fi où xi est une valeur observée et fi sa fréquence. Supposons maintenant que l’on tire au hasard un individu dans cette population pour consigner la valeur x du caractère. Ne pouvant pas prévoir quel individu précis sera tiré, on ne peut pas prévoir non plus la valeur précise de x qui sera consigner. On aimerait donc disposer uploads/Geographie/ cours-7.pdf
Documents similaires
-
20
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Apv 03, 2021
- Catégorie Geography / Geogra...
- Langue French
- Taille du fichier 0.1575MB