UNIVERSITE NATIONALE DES SCIENCES, TECHNOLOGIES, INGENIERIE ET MATHEMATIQUES (U
UNIVERSITE NATIONALE DES SCIENCES, TECHNOLOGIES, INGENIERIE ET MATHEMATIQUES (UNSTIM) ECOLE NATIONALE SUPERIEURE DE GENIE MATHEMATIQUE ET MODELISATION (ENSGMM) EXAMEN DE MODELISATION STATISTIQUE Niveau: G´ enie Math´ ematique et Mod´ elisation 2 Ann´ ee acad´ emique: 2020-2021 Dur´ ee: 3h Il sera tenu compte de la qualit´ e de la r´ edaction. NB: Le corrig´ e-type sera disponible apr` es la composition ` a l’adresse: sites.google.com/view/nicodemeatchade/ Enseignant: Dr ATCHADE Nicod` eme 1 Exercice 1. Soit (Yi)1≤i≤n une famille de variables al´ eatoires d´ efinie par: Yi = θ0 + p X k=1 θkZ(k) i + εi (1) pour tout i ∈{1, ..., n}, o` u: θ = (θ0, θ1, ..., θp) ′ est un vecteur compos´ e de p+1 r´ eels inconnus, pour 1 ≤j ≤p, les (Zi)(j) 1≤i≤n sont p familles de r´ eels connues et la matrice X = (Zi)(j) 1≤i≤n,0≤j≤p, avec par d´ efinition Z(0) i = 1 pour tout i = 1, ..., n. On suppose que X est de rang p + 1 avec p ≤n. Pour 0 < τ < 1, connu, et n1 = [nτ] (partie enti` ere de nτ) avec (ξi)i∈N une suite de v.a. i.i.d. de loi gaussienne centr´ ee r´ eduite, εi = σ1ξi pour 1 ≤i ≤n1 et εi = σ2ξi pour n1 + 1 ≤i ≤n avec 0 < σ1 ̸= σ2 > 0. Par ailleurs, pour tout k ∈N∗, et pour M une matrice carr´ ee de taille k, on note ∥M∥= supU∈(Rk)∗ ∥MU∥ ∥U∥, o` u pour V ∈Rk, ∥V ∥2 = V ′V . On rappelle que pour A et B deux matrices carr´ ees de taille k, ∥AB∥≤∥A∥∥B∥. 1. On note Y = (Yi)1≤i≤n et ε = (εi)1≤i≤n. Ecrire le mod` ele (1) sous une forme vectorielle en pr´ ecisant la loi de l’erreur ε et Σ = cov(ε). 2. Donner l’expression de la log-vraisemblance de (Y1, ..., Yn). En supposant σ2 1 et σ2 2 con- nus, d´ eterminer sous forme matricielle l’estimateur ˆ θ par maximum de vraisemblance. En supposant θ connu, d´ eterminer explicitement les estimateurs ˆ σ2 1 et ˆ σ2 2 de σ2 1 et σ2 2 (respec- tivement) par maximum de vraisemblance. Expliquer pourquoi une expression explicite de l’estimateur par maximum de vraisemblance de θ, σ2 1 et σ2 2 n’est pas possible ` a obtenir dans le cas g´ en´ eral o` u θ, σ2 1 et σ2 2 sont inconnus. 3. On va estimer ces param` etres en 2 temps. On commence par estimer θ par moindres carr´ es ordinaires, et on note ˆ θ cet estimateur. Rappeler son expression, donner son esp´ erance et sa matrice de covariance. 4. On note Z1 (respectivement Z2) la matrice de taille (n, p + 1) dont les lignes de 1 ` a n1 (respectivement, de n1+1 ` a n) sont celles de X, et les lignes de n1+1 ` a n (respectivement, de 1 ` a n1) sont constitu´ ees de 0. Montrer que pour tout U ∈Rn, ∥X′XU∥2 = ∥Z′ 1Z1U∥2+ ∥Z′ 2Z2U∥2. En d´ eduire que max (∥Z′ 1Z1∥, ∥Z′ 2Z2∥) ≤∥X′X∥. 1 5. Exprimer X′ΣX en fonction de σ1, σ2, Z1 et Z2. En utilisant la question pr´ ec´ edente montrer que ∥cov(ˆ θ)∥≤(σ2 1 +σ2 2)∥(X′X)−1∥et donner une condition pour que ˆ θ →P n→+∞ θ. 2 Exercice 2. 1. On consid` ere le mod` ele LPM (Linear Probability Model) suivant: ˆ Sexe = 0.37 + 0.02Educ −0.1City, n = 700; ˆ σ(0.02) = 0.011; ˆ σ(−0.1) = 0.046. Le mod` ele exprime la d´ ependance du sexe (1-Male, 0-Female) du niveau d’´ education (en ann´ ees) et du milieu de r´ esidence (1-urbain, 0-rural). Tester la significativit´ e des variables explicatives du mod` ele. 2. Pr´ edire la variable d´ ependante pour un citadin ayant 15 ans d’´ education. 3. Interpr´ eter les r´ esultats. 3 Exercice 3. Et si on r´ efl´ echissait encore ? Les r´ esultats ci-apr` es pr´ esentent une matrice de corr´ elation de variables. La base de donn´ ees publi´ ees par la banque mondiale comporte 39 pays. La variable d´ ependante est l’indice de d´ eveloppement humain (HDI, %). Les variables ind´ ependantes (% du PIB) repr´ esentent la part des d´ epenses par secteur dans le PIB de chaque pays. 1. Proc´ eder au choix raisonn´ e de deux variables explicatives sur analyse de la matrice de corr´ elation pour la construction d’un mod` ele de r´ egression lin´ eaire multiple. > MR <- data.frame(HDI, Research, Health, Services, Agriculture, Education) > options(digits=3) > cor(MR) HDI Research Health Services Agriculture Education HDI 1.000 0.664 0.577 0.578 -0.534 0.320 Research 0.664 1.000 0.463 0.311 -0.370 0.215 Health 0.577 0.463 1.000 0.285 -0.239 0.321 Services 0.578 0.311 0.285 1.000 -0.637 0.417 Agriculture -0.534 -0.370 -0.239 -0.637 1.000 -0.264 Education 0.320 0.215 0.321 0.417 -0.264 1.000 2. Une r´ egression multiple ` a base des donn´ ees des 39 pays a ´ et´ e r´ ealis´ ee avec R. Les r´ esultats num´ eriques sont les suivants: > summary(MLModel) Call: lm(formula = HDI ~ Health + Services, data = MR) Residuals: Min 1Q Median 3Q Max 2 -5.2868 -1.9177 0.5024 1.7812 4.4184 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 64.3123 ? ? 5.94e-16 *** Health 0.6300 ? ? 0.000678 *** Services 0.2538 ? 3.739 0.000641 *** --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1 Residual standard error: 2.625 on 36 degrees of freedom Multiple R-squared: 0.5194,Adjusted R-squared: 0.4927 F-statistic: ? on 2 and 36 DF, p-value: 1.873e-06 Retrouver toutes les donn´ ees manquantes sachant que la matrice (X′X)−1 est donn´ ee par: 3.1495 -0.0028 -0.0435 -0.0028 0.0042 -0.0005 -0.0435 -0.0005 0.0007 Fin 3 uploads/Geographie/ gmm-examen-mstat-2020-2021.pdf
Documents similaires
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/EXlrRiR7vkcBjYLASl5ykmb3cSbCbVaj4NT3unjAXrXimwEUHSUXxAfCtiVjleLwyd6mBM0K1IpW7BzTyKSyp3zF.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/66bbD7upEG87hLzahvzMIqzDIl5noEBLOdYYnCGawVHIG8jOcgZA6ysV8VzV4XJ3QuUtXfFRKxxnBWHqZPrdRLwY.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/V31ZWerVCykVSsNlx3E50JLTXJMGTGV8ZXtm1JYiwsZ6QbAiARBZzAIUg6PEGjb7oviANDYXyP7DjvynQr3Tt151.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/tUqyaJwQSkCB2jGCoQSjyg3zEyKLCUkNfHIk8ZCHcBzPi2QDJKEFpyibj83sUYMx5lLOSHyah6ELHS3QPIO6zbrk.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/deXq9BoldnH3xUMShpEaHsx44BZahi4FdDFUVJfB4Kb0vzfaQZI6JrpAWSCzzsYjkKCWOFwI2UjEOhwekZZy8Tgl.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/Ki8rvqhnDlaoXX2JYGwie38aT5RwZQMrrXe6ePPqqZJ4Y7NvcO21kHx9FndDKGKMLV9fGctEzgPs13EsY3PgZO1w.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/QlGwi4uJIlWtMDIMdtsIP2NeZs1WLKTUonsUj21kymfYzlBQ2ky7NyFDlZf11on2bchJYnZ5y9KU77QL0Rdkl2Px.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/FlsQZrPUrKlEWrerELB0igYRmNZ70yTFF1SqzGm8DNNG2PZUmi0CBmDzwgQTzn9L8GbPyyLVuK2L85jiZpblS7Ti.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/cDMc2COArPvFK2UBjTFmAIQhrn9mWuZB1MhUxlDyrFz83qlIXEAVjh3JBOKQrD4NpUzfY7yCgCPhqvyMTg2GGyPl.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/2fp35I4vpOxF5aUgFHK1mexBNTsuB6BKmZcm1sAZJ2LFxoqGdoRmCanK4NsnetYLUdScc94aaD44pQSlAtOOuDbQ.png)
-
23
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Dec 03, 2022
- Catégorie Geography / Geogra...
- Langue French
- Taille du fichier 0.1428MB