2. Le modèle de régression simple N ous commenons notre tude par le modle le
2. Le modèle de régression simple N ous commenons notre tude par le modle le plus simple : une variable endogne est explique par une variable exogne. Aprs avoir tudi les consquences probabilistes de lÕerreur dÕobservation, nous prsentons en I. les formules de base permettant dÕestimer les paramtres du modle. Les hypothses stochastiques et leurs consquences sont tudies au paragraphe II. En III. et IV., la qualit de lÕestimation dÕun modle est examine lÕaide des premiers tests statistiques (Student, Fisher). Enfin, en V., le modle de rgression simple est tudi en tant quÕoutil de prvision avec le degr de confiance que nous pouvons en attendre. I. Présentation du modèle A. Exemple introductif Soit la fonction de consommation keynésienne : C = a0 + a1 Y où : C = consommation, Y = revenu, a1 = propension marginale à consommer, a0 = consommation autonome ou incompressible. Le modèle de régression simple 13 1) Vocabulaire • La variable consommation est appelée « variable à expliquer » ou « variable endogène ». • La variable revenu est appelée « variable explicative » ou « variable exogène » (c’est le revenu qui explique la consommation). • a1 et a0 sont les paramètres du modèle ou encore les coefficients de régression. 2) Spécification Nous pouvons distinguer deux types de spécifications : • Les modèles en série temporelle, les variables représentent des phénomènes observés à intervalles de temps réguliers, par exemple la consommation et le revenu annuel sur 20 ans pour un pays donné. Le modèle s’écrit alors : Ct = a0 + a1 Yt t = 1,. . . , 20 où : Ct = consommation au temps t, Yt = revenu au temps t. • Les modèles en coupe instantanée, les variables représentent des phénomènes observés au même instant mais concernant plusieurs individus, par exemple la consommation et le revenu observés sur un échantillon de 20 pays. Le modèle s’écrit alors : Ci = a0 + a1 Yi i = 1,. . . , 20 où : Ci = consommation du pays i pour une année donnée, Yi = revenu du pays i pour une année donnée. B. Rôle du terme aléatoire Le modèle tel qu’il vient d’être spécifié n’est qu’une caricature de la réalité. En effet ne retenir que le revenu pour expliquer la consommation est à l’évi- dence même insuffisant ; il existe une multitude d’autres facteurs susceptibles d’expliquer la consommation. C’est pourquoi nous ajoutons un terme (εt) qui synthétise l’ensemble de ces informations non explicitées dans le mo- dèle : Ct = a0 + a1 Yt + εt si le modèle est spécifié en série temporelle (Ci = a0+ a1 Yi + εi si le modèle est spécifié en coupe instantanée), où εt repré- sente l’erreur de spécification du modèle, c’est-à-dire l’ensemble des phéno- mènes explicatifs de la consommation non liés au revenu. Le terme εt mesure la 14 ÉCONOMÉTRIE différence entre les valeurs réellement observées de Ct et les valeurs qui auraient été observées si la relation spécifiée avait été rigoureusement exacte. Le terme εt regroupe donc trois erreurs : – une erreur de spécification, c’est-à-dire le fait que la seule variable expli- cative n’est pas suffisante pour rendre compte de la totalité du phénomè- ne expliqué ; – une erreur de mesure, les données ne représentent pas exactement le phé- nomène ; – une erreur de fluctuation d’échantillonnage, d’un échantillon à l’autre les observations, et donc les estimations, sont légèrement différentes. Le modèle de régression simple 15 Année Revenu 1 8 000 2 9 000 3 9 500 4 9 500 5 9 800 6 11 000 7 12 000 8 13 000 9 15 000 10 16 000 Tableau 1 – Évolution du revenu moyen par habitant en dollars Sachant que la propension marginale à consommer est de 0,8 et que la consomma- tion incompressible est 1 000, on demande : 1) de calculer la consommation théorique sur les 10 ans ; 2) considérant que notre erreur d’observation suit une loi normale de moyenne 0 et de variance 20 000, de générer cette variable aléatoire et de calculer une consommation observée tenant compte de cette erreur. Solution Les calculs des questions 1) et 2) sont présentés dans le tableau 2. La consommation théorique (colonne 3) est calculée par application directe de la formule : Ct = 1 000 + 0,8 Yt . Génération d’une consommation aléatoire Le tableau 1 présente le revenu moyen par habitant sur 10 ans exprimé en dollars pour un pays. Exercice n° 1 fichier C2EX1 La génération de la variable aléatoire εt(εt →N(0 ; 20 000)) ne pose pas de diffi- culté particulière ; bien entendu il en existe une infinité, un exemple en est présenté en colonne 4. La consommation « observée » (colonne 5) est donc égale à Ct = 1 000 + 0,8 Yt + εt, soit la somme de la colonne 3 et de la colonne 4. 16 ÉCONOMÉTRIE Tableau 2 – Calcul de la consommation observée (1) (2) (3) (4) (5) Année Revenu Consommation Aléa Consommation disponible théorique εt observée 1 8 000 7 400 – 10,01 7 389,99 2 9 000 8 200 – 30,35 8 169,65 3 9 500 8 600 231,71 8 831,71 4 9 500 8 600 52,84 8 652,84 5 9 800 8 840 – 51,92 8 788,08 6 11 000 9 800 – 183,79 9 616,21 7 12 000 10 600 – 6,55 10 593,45 8 13 000 11 400 – 213,89 11 186,11 9 15 000 13 000 – 241,91 12 758,09 10 16 000 13 800 69,62 13 869,62 Moyenne : – 38,42 Écart type : 137,24 1. Il ne faut pas confondre : estimateur a de a et estimation de a qui est la valeur particulière de l’estimateur pour un échantillon. Nous observons que la moyenne de εt, ε = −38,42 et la variance de εt, Var(εt) = 18 834,81 sont légèrement différentes des valeurs théoriques. Cela est la conséquence du tirage particulier d’un échantillon de taille assez faible (dix observations). C. Conséquences du terme aléatoire Dans l’exercice précédent, les valeurs vraies a0 et a1 sont parfaitement connues, cependant, dans la réalité, nous ne connaissons pas ces valeurs mais seulement les deux séries d’observations Ct et Rt. Les estimateurs1 de a0 et a1, notés res- pectivement a0 et a1, sont des variables aléatoires, qui suivent les mêmes lois de probabilité, celle de εt , puisqu’ils sont fonctions de la variable aléatoire εt . Les caractéristiques de moyenne et d’écart type de ces coefficients permettent de construire des tests de validité du modèle estimé. II. Estimation des paramètres A. Modèle et hypothèses Soit le modèle suivant : yt = a0 + a1 xt + εt pour t = 1,. . . ,n Le modèle de régression simple 17 Graphique 1 – Histogramme de la distribution de 150 a1 Fréquence Coefficient 1 Fréquence Si à l’aide d’un programme informatique ( C2EX1.PRG) nous construi- sons 150 échantillons de valeurs différentes pour la variable aléatoire εt →N(0 ; 20 000), nous allons alors trouver 150 estimations de a1 légèrement différentes entre elles dont la distribution aura la forme de l’histogramme du graphique 1. Cette distribution a pour moyenne 0,801 et écart type 0,032, nous pouvons observer qu’elle est à peu près symétrique par rapport à la moyenne et qu’elle a la forme d’une courbe en « cloche » : tous ces éléments suggèrent bien une dis- tribution normale de : a1 →N(0,801 ; 0,032) . Cela est la conséquence directe de la normalité des erreurs. 2) Quel est l’intervalle de confiance au seuil (ou niveau) de 95 % pour la propension marginale à consommer ? Solution 1) La propension marginale à consommer est-elle significativement différente de 0 ? Cette question est très importante en économétrie. En effet, dans le cas d’une répon- se négative – le coefficient n’est pas significativement différent de 0 – la variable expli- cative Revenu ne sera pas considérée comme étant explicative de la consommation puisque son coefficient de pondération est nul. Il peut paraître étonnant de tester la différence par rapport à zéro et non pas seule- ment la positivité ou la négativité du coefficient de régression. En effet, il est commode de ne s’interroger que sur la contribution de la variable explicative, qu’elle soit positive ou négative. Ce problème peut être formulé à l’aide de la théorie des tests à partir des deux hypo- thèses suivantes : H0 : a1 = 0 H1 : a1 ̸= 0 Si nous rejetons l’hypothèse H0, à un seuil α 1 fixé, alors la propension marginale à consommer est considérée comme étant significativement différente de 0. Le seuil le plus communément employé est α = 0,05, soit un risque de rejeter à tort H0 de 5 %. Nous savons que : a1 −a1 σˆ a1 suit une loi de Student à n −2 degrés de liberté. Sous l’hypothèse H0, cette relation devient : a1 −0 uploads/Finance/ modele-de-regression-simple.pdf
Documents similaires










-
24
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Apv 15, 2022
- Catégorie Business / Finance
- Langue French
- Taille du fichier 0.7680MB