Calcul d’un coefficient de corrélation Un agronome s’intéresse à la liaison pou
Calcul d’un coefficient de corrélation Un agronome s’intéresse à la liaison pouvant exister entre le rendement de maïs x (en quintal) d’une parcelle de terre et la quantité d’engrais y (en kilo). Il relève 10 cou- ples de données consignés dans le tableau 2 Exercice n° 1 fichier C1EX1 Rendement x 16 18 23 24 28 29 26 31 32 34 Engrais y 20 24 28 22 32 28 32 36 41 41 Tableau 2 – Rendement de maïs et quantité d’engrais 1) Tracer le nuage de points et le commenter. 2) Calculer le coefficient de corrélation simple et tester sa signification par rapport à 0 pour un seuil α = 0,05. Solution 1) Le nuage de points (graphique 6) indique que les couples de valeurs sont approxima- tivement alignés : les deux variables semblent corrélées positivement. Graphique 6 – Nuage du couple de valeurs : rendement-quantité d’engrais Quantité d’engrais Rendement 2) Afin d’appliquer la formule [2], nous dressons le tableau de calcul 3. .x y x2 y2 xy 16 20 256 400 320 18 24 324 576 432 23 28 529 784 644 24 22 576 484 528 28 32 784 1 024 896 29 28 841 784 812 26 32 676 1 024 832 31 36 961 1 296 1 116 32 41 1 024 1 681 1 312 34 41 1 156 1 681 1 394 Somme 261 304 7 127 9 734 8 286 Tableau 3 – Calcul d’un coefficient de corrélation ρx,y = (10)(8 286) −(261)(304) (10)(7 127) −2612 (10)(9 734) −3042 = 3 516 (56,11)(70,17) soit ρx,y = 0,89 et ρ2 x,y = 0,79 Le t de Student empirique (d’après [3]) est égal à : t∗= |ρx,y| (1 −ρ2 x,y) n −2 = 0,89 0,1 620 = 5,49 > t0,025 8 = 2,306 le coefficient de corrélation entre x et y est significativement différent de 0. 2. Le modèle de régression simple Année Revenu 1 8 000 2 9 000 3 9 500 4 9 500 5 9 800 6 11 000 7 12 000 8 13 000 9 15 000 10 16 000 Tableau 1 – Évolution du revenu moyen par habitant en dollars Sachant que la propension marginale à consommer est de 0,8 et que la consomma- tion incompressible est 1 000, on demande : 1) de calculer la consommation théorique sur les 10 ans ; 2) considérant que notre erreur d’observation suit une loi normale de moyenne 0 et de variance 20 000, de générer cette variable aléatoire et de calculer une consommation observée tenant compte de cette erreur. Solution Les calculs des questions 1) et 2) sont présentés dans le tableau 2. La consommation théorique (colonne 3) est calculée par application directe de la formule : Ct = 1 000 + 0,8 Yt . Génération d’une consommation aléatoire Le tableau 1 présente le revenu moyen par habitant sur 10 ans exprimé en dollars pour un pays. Exercice n° 1 fichier C2EX1 La génération de la variable aléatoire εt(εt →N(0 ; 20 000)) ne pose pas de diffi- culté particulière ; bien entendu il en existe une infinité, un exemple en est présenté en colonne 4. La consommation « observée » (colonne 5) est donc égale à Ct = 1 000 + 0,8 Yt + εt, soit la somme de la colonne 3 et de la colonne 4. Tableau 2 – Calcul de la consommation observée (1) (2) (3) (4) (5) Année Revenu Consommation Aléa Consommation disponible théorique εt observée 1 8 000 7 400 – 10,01 7 389,99 2 9 000 8 200 – 30,35 8 169,65 3 9 500 8 600 231,71 8 831,71 4 9 500 8 600 52,84 8 652,84 5 9 800 8 840 – 51,92 8 788,08 6 11 000 9 800 – 183,79 9 616,21 7 12 000 10 600 – 6,55 10 593,45 8 13 000 11 400 – 213,89 11 186,11 9 15 000 13 000 – 241,91 12 758,09 10 16 000 13 800 69,62 13 869,62 Moyenne : – 38,42 Écart type : 137,24 Nous observons que la moyenne de εt, ε = −38,42 et la variance de εt, Var(εt) = 18 834,81 sont légèrement différentes des valeurs théoriques. Cela est la conséquence du tirage particulier d’un échantillon de taille assez faible (dix observations). Estimation des coefficients de régression À partir des données du tableau 2 de l’exercice 1, on demande de calculer les esti- mations de a0 et a1. Solution Le tableau 3 présente les calculs à effectuer. 1. Les données sont centrées lorsque les observations sont centrées sur leur moyenne : (xt −x), la somme des données centrées est donc par construction nulle. Exercice n° 2 fichier C2EX2 Tableau 3 – Calcul d’un coefficient de régression (1) (2) (3) (4) (5) (6) (7) t yt xt yt −y xt −x (5)* (5) (4)* (5) 1 7 389,99 8 000 – 2 595,59 – 3 280 10 758 400 8 513 518 2 8 169,65 9 000 – 1 815,93 – 2 280 5 198 400 4 140 300 3 8 831,71 9 500 – 1 153,87 – 1 780 3 168 400 2 053 879 4 8 652,84 9 500 – 1 332,74 – 1 780 3 168 400 2 372 268 5 8 788,08 9 800 – 1 197,50 – 1 480 2 190 400 1 772 292 6 9 616,21 11 000 – 369,37 – 280 78 400 103 422 7 10 593,45 12 000 607,88 720 518 400 437 670 8 11 186,11 13 000 1 200,54 1 720 2 958 400 2 064 920 9 12 758,09 15 000 2 772,52 3 720 13 838 400 10 313 755 10 13 869,62 16 000 3 884,05 4 720 22 278 400 18 332 692 Somme 99 855,75 112 800 0 0 64 156 000 50 104 729 Moyenne 9 985,57 11 280 0 0 6 415 600 5 010 472 a1 = t=n t=1 (xt −x)(yt −y) t=n t=1 (xt −x)2 = 50 104 729 64 156 000 = 0,78 a0 = y − a1x = 9 985,57 −0,78 × 11 280 = 1 176,08 Ces estimations sont à comparer aux valeurs vraies (respectivement 0,8 et 1 000), les différences importantes en ce qui concerne surtout le terme constant sont imputables à l’aléa d’observation qui « perturbe » l’estimation des coefficients. Test de coefficient et intervalle de confiance En reprenant les résultats de l’exercice 2, on demande de répondre aux questions suivantes. 1) La propension marginale à consommer est-elle significativement différente de 0 ? Exercice n° 3 fichier C2EX2 2) Quel est l’intervalle de confiance au seuil (ou niveau) de 95 % pour la propension marginale à consommer ? Solution 1) La propension marginale à consommer est-elle significativement différente de 0 ? Cette question est très importante en économétrie. En effet, dans le cas d’une répon- se négative – le coefficient n’est pas significativement différent de 0 – la variable expli- cative Revenu ne sera pas considérée comme étant explicative de la consommation puisque son coefficient de pondération est nul. Il peut paraître étonnant de tester la différence par rapport à zéro et non pas seule- ment la positivité ou la négativité du coefficient de régression. En effet, il est commode de ne s’interroger que sur la contribution de la variable explicative, qu’elle soit positive ou négative. Ce problème peut être formulé à l’aide de la théorie des tests à partir des deux hypo- thèses suivantes : H0 : a1 = 0 H1 : a1 ̸= 0 Si nous rejetons l’hypothèse H0, à un seuil α 1 fixé, alors la propension marginale à consommer est considérée comme étant significativement différente de 0. Le seuil le plus communément employé est α = 0,05, soit un risque de rejeter à tort H0 de 5 %. Nous savons que : a1 −a1 σˆ a1 suit une loi de Student à n −2 degrés de liberté. Sous l’hypothèse H0, cette relation devient : a1 −0 σˆ a1 = a1 σˆ a1 = t∗ ˆ a1 →loi de Student à n −2 degrés de liberté. t∗ ˆ a1 est appelé le ratio de Student. Nous avons calculé a1 lors de l’exercice 2, il convient donc de calculer σˆ a1 ; or, d’après [11], σ 2 ˆ a1 = σ 2 ε t (xt −x)2 , nous connaissons t (xt −x)2 = 64 156 000 (colonne 6 du tableau de calcul 3). L’estimateur de la variance de l’erreur nous est donné par [10] : σ 2 ε = t e2 t n −2 , où et est le résidu de l’estimation (et = yt − yt) Tableau 4 – Calcul du résidu d’estimation yt et e2 t 7 423,95 – 33,96 1 153,38 8 204,93 – 35,28 1 244,98 8 595,43 236,28 55 830,26 8 595,43 57,41 3 296,40 8 829,72 – uploads/Finance/ econometrie-exercices-corriges-optimize.pdf
Documents similaires
-
20
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Apv 19, 2021
- Catégorie Business / Finance
- Langue French
- Taille du fichier 1.6388MB