1 Théorèmes limites et estimation A) Théorèmes limites 1) LOI DES GRANDS NOMBRE
1 Théorèmes limites et estimation A) Théorèmes limites 1) LOI DES GRANDS NOMBRES La loi des grand nombres est un théorème mathématique fondamental des probabilités et statistiques. Cette loi exprime le fait que les caractéristiques d’un échantillon aléatoire se rapprochent des caractéristiques statistiques de la population (ensemble d’individus ou d’éléments) lorsque la taille de l’échantillon augmente à l’infini. En d’autres termes, cela garantit que, lorsque le nombre de tirages effectués selon une loi de probabilité (comme les tirages successifs d’une pièce sur le côté pile ou face) tend vers l’infini, la moyenne empirique (moyenne calculée à partir des observations) converge vers la moyenne réelle d’une variable aléatoire suivant cette loi. Cela sous des hypothèses très faibles. Soient X1, X2, ... , Xn , n variables aléatoires de même loi qu’une variable aléatoire X . Supposons que ces v.a. ont une espérance, notée m et une variance, notée σ2 E(X1+X2+ ... +Xn) = E(X1) + E(X2)+...+ E(Xn)=n.m V(X1+X2+ ... +Xn) = V(X1) + V(X2)+...+ V(Xn)=n. σ2 La moyenne empirique des v.a X1, X2, ... , Xn est une v.a: n X ... X X X n n 2 1 On sait que la moyenne empirique a pour espérance m et pour variance σ 2/n. Ainsi, plus n est grand, moins cette v.a. varie. A la limite, quand n tend vers l’infini, elle se concentre sur son espérance, m. C’est la loi des grands nombres. 2 Théorème : (Loi des grands nombres) Quand n est grand, Xn est proche de m avec une forte probabilité. Autrement dit, 0 0 m X P lim , n n On dit que Xn converge en probabilité vers m. Plus la taille de l'échantillon augmente, plus la moyenne empirique (observée sur l'échantillon) est proche de l’espérance (moyenne théorique). Exemple 1 On considère un dé truqué telle que P(X = 6) = p > 1/6, et toutes les autres probabilités sont égales : P(X = 1) = ... = P(X = 5) = (1 − p)/5. Si l’on fait n lancers Xi identiquement et indépendamment distribuées (IID) et que l’on observe la moyenne. n i n i i i n n X n n X n X ... X X X 1 1 2 1 1 Alors n X → E(X) presque sûrement, et E(X) = 6p + (1 + 2 + 3 + 4 + 5)(1 − p)/5 =6p + 3(1 − p) = 3(p + 1) Exemple 2 Sur un sondage de 1000 électeurs, 521 prétendent voter pour le candidat A d’une élection. Chaque électeur est “modélisé” par une variable de Bernoulli de paramètre p, où p est le paramètre inconnu, à savoir la proportion de individus qui vont voter A à l’élection. On suppose que les choix des personnes sondées sont indépendants, et les Xi sont donc iid. D’après la LGN, n i i X n 1 1 → E(X) Comme i X ~ B(p) , E(X) = p ainsi: 521 0 1000 521 1 1 . X n X n i i n p=1000 1 i=1, ....,521 ( ) np ( n / X n 1 Donc d’après la LGN, p est proche de 0.521, et quand le nombre de personnes sondées n grandit, n X se rapproche de p. 3 2) Théorème Central Limite Soient X1, X2, ... , Xn , n variables aléatoires indépendantes et identiquement distribuées d’espérance m et de variance σ 2 , alors la loi de n / m X n tend vers la loi normale centrée réduite. Pour tous réels a < b, quand n tend vers +∞, dx e b n / m X a P / x b a n 2 2 2 1 On dit que n / m X n converge en loi vers la loi normale N (0, 1). ) b Z a ( P b n / m X a P n où o`u Z est une variable gaussienne centrée réduite, Z ∼ N (0, 1). Le tableau ci dessous donne la distribution limite de la moyenne empirique pour différentes lois 4 A) Échantillonnage Pour décrire l'information contenue dans l'échantillon le statisticien procède à une analyse numérique et graphique (histogramme, polygone des fréquences, fonction de répartition,...) de la distribution de la variable étudiée. Si l'échantillon est choisit de façon aléatoire, on peut généraliser les résultats obtenus de l'analyse expérimentale sur toute la population. Pour déduire des informations diverses caractéristiques de la population, on utilise la statistique inférentielle à travers l'estimation et les tests d'hypothèses. I. Échantillonnage et ses caractéristiques: 1-1- Définition d'un échantillon aléatoire Ain de déduire des informations sur diverses caractéristiques d'une population, on fait recours à la méthode de sondage (vu que l'opération de recensement est coûteuse). Cette méthode consiste à interroger seulement une partie de la population appelée échantillon. L'échantillonnage est une opération permettant de dégager certaines informations au sujet d'une population. Cette opération repose sur le choix adéquat d'un échantillon devant être représentatif de la population. Les caractéristiques empiriques (moyenne, variance) dégagées de l'analyse d'un échantillon peuvent être de bonnes approximations des caractéristiques de la population appelées caractéristiques théoriques(E(X), V(X)) 1.2- Distribution d'un échantillon aléatoire: On considère un échantillon aléatoire (X1,.....,Xn), de taille n de même loi (on dit un échantillon indépendant et identiquement distribué (i.i.d)), d’espérance et de variance finies. ) ( L Xi , i=1,...,n avec E(Xi)= E(X) et V(Xi),=V(X) 5 ) X ( f ) X ( f i i=1,..,n II) Caractéristiques d'un échantillon aléatoire: Les moments empiriques 1) On appelle statistique Tn= g(X1,.....,Xn), toute valeur calculable à partir d’un échantillon (X1,.....,Xn), c’est-à-dire toute fonction de X1,....,Xn. Exemple : n i i n X T 1 , n i i n X n X T 1 1 2) La moyenne empirique: On appelle moyenne empirique la statistique : n 1 i i n X n 1 X 3) La variance empirique La variance empirique de l'échantillon 2 1 2 1 ) X X ( n S n i n i n La variance empirique corrigée de ce même échantillon 2 1 2 1 1 ) X X ( n S n i n i ' n Propriétés : La moyenne empirique étant une variable aléatoire, elle possède une espérance et une variance avec : m ) X ( E n et 2 n n 1 ) X ( V Remarque : Ces deux résultats indiquent que le calcul de la moyenne empirique sur un échantillon nous fournit en moyenne la vraie valeur de m (mais pas à chaque fois). De plus, la distribution de la moyenne empirique devient de plus en plus concentrée autour 6 de la vraie valeur m au fur et à mesure que la taille de l’échantillon grandit (car Var ( n X ) diminue avec n). 1) Échantillonnage dans une population normale: Nous considérons un échantillon i.i.d (X1,.....,Xn) de taille n d’une loi ) , ( N 2 . On note: n 1 i i n X n 1 X la moyenne empirique sur cet échantillon, et 2 n 1 i n i 2 n ) X X ( 1 n 1 S la variance empirique corrigée de ce même échantillon. On a alors : Remarque: Ces résultats servent à établir les intervalles de confiance et les procédures de test dans le cas d’un échantillon issu d’une loi normale. 7 III. Estimateur et ses propriétés statistiques: L'échantillonnage nous permet de déterminer (approximativement) des caractéristiques importantes d'une variable aléatoire à savoir l'espérance mathématique, la variance et parfois les moments d'ordre plus élevés. Dans la pratique on connait souvent à l'avance la forme de la loi de la variable étudiée et ne reste qu'à déterminer certains paramètres de cette dernière. 1) Définition d’un estimateur et d'une estimation : Étant donné un échantillon aléatoire (X1,.....,Xn), i.i.d de taille n issu d’une loi L de paramètre inconnu. Un estimateur de noté ˆ est une statistique ˆ =T(X1,.....,Xn), Disposant des réalisations (observations) x1.....xn, de l'échantillon X1,.....,Xn, la valeur calculée ˆ =T(X1,.....,Xn), s'appelle une estimation de . Estimation ponctuelle de l’espérance Supposons à présent que X est le résultat d’une expérience aléatoire, et que l’espérance E(X) = µ est inconnue, comme dans l’exemple du dé truqué. La loi des grands nombres montre que l’on peut obtenir une valeur approchée de µ en réalisant un grand nombre n de fois la même expérience, puis en calculant la moyenne n i i n X n X 1 1 , uploads/Litterature/ chapitre-4-theoremes-limites-et-estimation.pdf
Documents similaires










-
28
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Jan 04, 2022
- Catégorie Literature / Litté...
- Langue French
- Taille du fichier 0.5399MB