SUP'COM Inférence statistique Loi de χ2, loi de Student et loi de Fisher On not
SUP'COM Inférence statistique Loi de χ2, loi de Student et loi de Fisher On notera par E et var les opérateurs d'espérance mathématique et la variance respectivement d'une variable aléatoire. Moyenne et variances empiriques d'un échantillon On considère une variable aléatoire X de moyenne µ et de variance σ2. Soit X1, . . . , XN N variables aléatoires indépendantes et identiquement distribuées (i.i.d.). Dé nition 1. On appelle moyenne de l'échantillon ou moyenne empirique, la variable aléatoire suivante : ¯ X = 1 n N X n=1 Xn. (1) Dé nition 2. On appelle variance empirique de l'échantillon la variable aléatoire S2 dé nie par : S2 = 1 n N X n=1 (Xn −¯ X)2. (2) Dé nition 3. On appelle variance empirique non biaisée de l'échantillon la variable aléatoire e S2 dé nie par : e S2 = 1 N −1 N X n=1 (Xn −¯ X)2 = N N −1S2. (3) On montre que : La moyenne statistique et la variance de la moyenne empirique s'écrivent : E( ¯ X) = µ, var( ¯ X) = σ2 N . (4) la moyenne empirique est un estimateur sans biais de la moyenne statistique. Sa variance tend vers 0, quand N tend vers +∞, on parle alors d'estimateur consistant (ou convergent). La variance empirique S2 est un estimateur biaisé de σ2 : E(S2) = N −1 N σ2 ≤σ2. (5) alors que par construction, e S2 est un estimateur sans biais de la variance σ2 : E(e S2) = σ2. (6) On peut établir que : var(e S2) = 2σ4 N −1. (7) Ceci montre que e S2 est un estimateur consistant. Si X ∼N(µ, σ2) alors ¯ X ∼N(µ, σ2 N ). ¯ X et e S2 (ou S2) sont deux v.a indépendantes. 1 Loi de χ2 Dé nition 4. Soit Y1, . . . , Yν une suite de variables aléatoires i.i.d normales centrées réduites de loi N(0, 1). La variable aléatoire somme de leurs carrés Z = ν X i=1 Y 2 i suit la loi dite de khi-deux à ν degrés de liberté et qu'on note χ2(ν) et de densité : fZ(z, ν) = ( 1 2) ν 2 Γ( ν 2) z ν 2 −1 e−z 21z≥0(z), (8) où Γ(.) est la fonction gamma dé nie par : Γ(t) = Z +∞ 0 xt−1e−t dt. (9) La gure 1 a che les diérents tracés de la densité de probabilité de loi de khi-deux pour dié- rentes valeurs de ν = 2, 4, 8, 16. 0 5 10 15 20 25 30 z 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 Densité de probabilité =2 =4 =8 =16 Figure 1 Loi de chi-deux pour diérents degrés de liberté. Moyenne et variance On montre que : E(Z) = ν et var(Z) = 2ν. (10) Cas de la variance empirique non biaisée Pour un échantillon de taille N où N > 1 et tels que les Xn ∼N(µ, σ2), la variable aléatoire (N −1)e S2 σ2 ∼χ2(N −1). (11) 2 Loi de Student Dé nition 5. Soient A et B deux v.a telles que : A et B sont indépendantes A ∼N(0, 1), B ∼χ2(N), alors la v.a. T dé nie comme le ratio : T = A q B N (12) suit une loi de Student à N degrés de liberté et qu'on note T (N). Sa densité de probabilité fT s'écrit : fT(t) = Γ( N+1 2 ) √ πNΓ( N 2 ) (1 + t2 N )−N+1 2 1R(t). (13) La gure 2 fournit les tracés de fT pour N = 5, 10, 50. -5 -4 -3 -2 -1 0 1 2 3 4 5 t 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 Densité de probabilité N=5 N=10 N=50 Figure 2 Loi de Student pour diérents degrés de liberté. Moyenne et variance On montre que : E(T) = 0 si n ≥2 et var(T) = N N −2 pour N ≥3. (14) Cas de la moyenne et variance empiriques Pour un échantillon de taille N où les Xn ∼N(µ, σ2) et N > 1, ¯ X −µ e S √ N ∼T (N −1). (15) En eet, il su t de considérer la dé nition précédente avec A = ¯ X−µ σ √ N et B = (N−1)e S2 σ2 . 3 Loi de Fisher-Snedecor Dé nition 6. Soient U et V deux variables indépendantes telles que U ∼χ2(N1) et V ∼χ2(N2) alors la variables aléatoire F = U V suit la loi de Fisher-Snedecor de degrés de liberté n1 et n2 (au numérateur et dénominateur respectivement) qu'on note F(N1, N2) qu'on appelle aussi loi de Fisher. La densité de probabilité fF de la v.a F est la suivante : fF(f) = Γ( N1+N2 2 ) Γ( N1 2 )Γ( N2 2 ) N1 N2 N1 2 f N1−2 2 (1 + N1 N2f) N1+N2 2 1f>0(f). (16) La courbe de fF est représentée dans la gure 3 pour diérents couples (N1, N2). 0 1 2 3 4 5 6 7 f 0 0.2 0.4 0.6 0.8 1 1.2 Densité de probabilité (n1=5,N 2=10) (N 1=5,N 2=15) (N 1=5,N 2=30) (N 1=10,N2=30) (n1=20,N2=25) Figure 3 Loi de Fisher pour diérents degrés de liberté. Propriétés intéressantes Si F ∼F(N1, N2) alors 1 F ∼F(N2, N1). Soient deux échantillons (X1, . . . , XN1) et (Y1, . . . , YN2) de variances empiriques respectives e S2 1 et e S2 2 alors la variable aléatoire rapport des variances empiriques non biaisées est telle que : e S2 1 e S2 2 ∼F(N1 −1, N2 −1). (17) 4 uploads/Philosophie/ rappels-prob.pdf
Documents similaires
-
22
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Jan 02, 2023
- Catégorie Philosophy / Philo...
- Langue French
- Taille du fichier 0.2343MB