UNIVERSITE NATIONALE DES SCIENCES, TECHNOLOGIES, INGENIERIE ET MATHEMATIQUES (U

UNIVERSITE NATIONALE DES SCIENCES, TECHNOLOGIES, INGENIERIE ET MATHEMATIQUES (UNSTIM) ECOLE NATIONALE SUPERIEURE DE GENIE MATHEMATIQUE ET MODELISATION (ENSGMM) DEVOIR DE MODELISATION STATISTIQUE Niveau: G´ enie Math´ ematique et Mod´ elisation 2 Ann´ ee acad´ emique: 2020-2021 Dur´ ee: 3h Il sera tenu compte de la qualit´ e de la r´ edaction. NB: Le corrig´ e-type sera disponible apr` es la composition ` a l’adresse: sites.google.com/view/nicodemeatchade/ Enseignant: Dr ATCHADE Nicod` eme 1 Compr´ ehension du cours. (60 min) 1. Construire l’estimateur du coefficient θ pour les observations (X1, Y1), ..., (Xn, Yn) en con- sid´ erant le mod` ele Yi = θ −θXi + ϵi. 2. Apr` es avoir donn´ e la fonction de vraisemblance du mod` ele de r´ egression de Poisson, montrer que l’estimation du mod` ele est donn´ ee par: s(α, β) = n X i=1 (yi −λi)  1 xi  . 3. L’estimation de l’´ equation Yi = β1 + β2Xi + ϵi par moindres carr´ es ordinaires a donn´ e ˆ β1 and ˆ β2. Trouver les estimateurs par moindres carr´ es ordinaires des coefficients γ1 and γ2 du mod` ele (Yi −¯ Y ) = γ1 + γ2(Xi −¯ X) + ϵi. 4. La r´ egression d’une variable al´ eatoire sur le num´ ero d’ordre des observations pour un ´ echantillon a ´ et´ e estim´ ee: Yi = β1 + β2i + ϵi, i = 1, ..., n. Les ϵi sont ind´ ependantes, E(ϵi) = 0, V (ϵi) = σ2 ϵ. 4.1. Est-ce vrai que ˆ β2 = Yn−Y1 n−1 est un estimateur sans biais du param` etre β2 ? Trouver var( ˆ β2). 4.2. Pour quelle(s) valeur(s) de α, ˆ β1 = αY2 −Y1 est un estimateur sans biais de β1 ? Trouver var( ˆ β1). 5. Quelles sont les hypoth` eses si viol´ ees conduisent ` a l’utilisation de la m´ ethode des moindres carr´ es g´ en´ eralis´ es ? 6. Expliquer bri` evement par des formules la diff´ erence principale entre les mod` eles de r´ egression Ridge et LASSO. 7. Citer tout en distinguant les hypoth` eses stochastiques faibles des hypoth` eses fortes du mod` ele lin´ eaire. 8. Comment peut-on utiliser le VIF (Variance Inflation Factor) pour d´ etecter un probl` eme et le r´ esoudre dans un mod` ele de r´ egression lin´ eaire? 1 9. Soit le mod` ele Yi = θ0 + θ1X1,i + θ2X2,i + ϵi. Les hypoth` eses classiques du mod` ele de r´ egression lin´ eaire sont suppos´ ees v´ erifi´ ees. var(ϵ2) = 6. Trouver: 9.1. var(ϵ5), cov(ϵ5, ϵ6), E(ϵ4), cov(ϵ5, X2); 9.2. les valeurs possibles du coefficient de d´ etermination R2 du mod` ele X1,i = α1 + α2X2,i + νi; 9.3. la fonction de densit´ e de ϵ4. 10. Soit le mod` ele: y = β1x1 + β2x2 + ε. Un ´ econom` etre estime que le coefficient β1 peut ˆ etre estim´ e en appliquant la m´ ethode des moindres carr´ es ordinaires au mod` ele: y = β1x1 + ν. Montrer que l’estimateur ainsi obtenu est sans biais dans les deux cas suivants: - si β2 = 0; - si P i x1,ix2,i = 0. 11. Soit le mod` ele: yi = βixi + ui. Montrer que pour ce mod` ele la relation suivante est v´ erifi´ ee: n X i=1 y2 i = n X i=1 ˆ y2 i + n X i=1 ε2 i . 12. On a estim´ e le mod` ele de r´ egresion du salaire (w) en fonction du nombre d’ann´ ees de scolarisation (sch), de l’anciennet´ e au travail (ten), de l’ˆ age (age) et de son carr´ e: ˆ lnwi = 2.13 + 0.07sch + 0.01teni + 0.05agei −0.0005age2 i + 0.1sexi. 12.1. De combien de % le salaire des hommes exc` ede celui des femmes toutes choses ´ etant ´ egales par ailleurs ? 12.2. D´ eterminer l’ˆ age auquel pour des caract´ eristiques donn´ ees (sch, ten, sex), l’individu peut esp´ erer son salaire maximal. 2 Exercice 1. (45 min) On consid` ere le mod` ele de r´ egression : yi = θ0 + θ1xi,1 + θ2xi,2 + εi, 1 ≤i ≤n, les xi,j ´ etant des variables explicatives observ´ ees du mod` ele et les εi des v.a. i.i.d. de loi N(0; σ2). On note et on calcule: X =       1 x1,1 x1,2 . . . . . . . . . 1 xn,1 xn,2       , Y =       y1 . . . yn       ,⇒X′X =   30 20 0 20 20 0 0 0 10  , X′Y =   15 20 10  , Y ′Y = 59.5. 1. D´ eterminer n, la moyenne de (xi,2)i, le coeffcient de corr´ elation des (xi,1)i et des (xi,2)i. 2 2. Calculer num´ eriquement les estimateurs par moindres carr´ es ordinaires b θ et b σ2 de θ = (θ0, θ1, θ2)’ et de σ2. On montrera que ∥Y −Xθ∥2 = ∥Y ∥2 −∥Xθ∥2. 3. Donner pour θ1 un intervalle de confiance ` a 95%. Tester ´ egalement l’hypoth` ese θ2 = 0.8 au niveau 10%. On utilisera des valeurs approch´ ees des quantiles d’une loi de Student q27(0.975) = 2 et q27(0.95) = 1.65. 4. D´ eterminer la moyenne empirique des yi et en d´ eduire le coeffcient de d´ etermination. 3 Exercice 2. (50 min) Soit (Yi)1≤i≤n une famille de variables al´ eatoires d´ efinie par: Yi = θ0 + p X k=1 θkZ(k) i + εi (1) pour tout i ∈{1, ..., n}, o` u: θ = (θ0, θ1, ..., θp) ′ est un vecteur compos´ e de p+1 r´ eels inconnus, pour 1 ≤j ≤p, les (Zi)(j) 1≤i≤n sont p familles de r´ eels connues et la matrice X = (Zi)(j) 1≤i≤n,0≤j≤p, avec par d´ efinition Z(0) i = 1 pour tout i = 1, ..., n. On suppose que X est de rang p + 1 ≤n. La suite (εi)i est une suite de v.a. i.i.d. de loi centr´ ee et de variance σ2 > 0. On note H = (Hij)ij = X(X′X)−1X′. 1. On note Y = (Yi)1≤i≤n et ε = (εi)1≤i≤n. Ecrire le mod` ele (1) sous une forme vectorielle. 2. Rappeler l’expression de l’estimateur ˆ θ de θ par moindres carr´ es ordinaires en fonction de X et Y . 3. On note ˆ Y = X ˆ θ, ˆ ε = Y −ˆ Y et ˆ ε2 = 1 n−p−1 Pn i=1 ˆ εi 2. Ecrire ˆ ε en fonction de H et de ε. En d´ eduire E(ˆ ε) et cov(ˆ ε) en fonction de H et de σ2. 4. Soit le vecteur colonne Ji tel que Ji = (0, ..., 0, 1, 0, ..., 0) ′, le 1 se situant en i−` eme position. Calculer J ′ i ˆ ε. Ecrire var(ˆ εi) en fonction de Ji, H et σ2. En d´ eduire que var(ˆ εi) = (1 −Hii)σ2 (on pourra utiliser la trace). 4 Exercice 3. (25 min) 1. On consid` ere le mod` ele LPM (Linear Probability Model) suivant: ˆ Sexe = 0.37 + 0.02Educ −0.1City, n = 700; ˆ σ(0.02) = 0.011; ˆ σ(−0.1) = 0.046. Le mod` ele exprime la d´ ependance du sexe (1-Male, 0-Female) du niveau d’´ education (en ann´ ees) et du milieu de r´ esidence (1-urbain, 0-rural). Tester la significativit´ e des variables explicatives du mod` ele. 2. Pr´ edire la variable d´ ependante pour un citadin ayant 15 ans d’´ education. 3. Interpr´ eter les r´ esultats. Fin 3 uploads/s3/ gmm-devoir-mstat-2020-2021.pdf

  • 16
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager