UNIVERSITE MARIEN NGOUABI Faculté des Sciences Economiques LABORATOIRE DE RECHE

UNIVERSITE MARIEN NGOUABI Faculté des Sciences Economiques LABORATOIRE DE RECHERCHE ET D’ETUDES ECONOMIQUES ET SOCIALES (LARES) INTRODUCTION A L’ECONOMETRIE Document III : modèle de régression simple Par: Mathias Marie Adrien NDINGA Enseignant chercheur Avec la collaboration de : MBOU LIKIBI Gaspard Symphorien GANGA ZANDZOU Ulrich Jeanin LEKANA Herman Brazzaville, janvier 2015 1 1. Modèle de régression simple 1.1. Présentation du problème L’analyse de régression est l’un des outils les plus utilisés dans le travail économétrique. Ainsi, cette partie du cours est consacrée aux techniques de base nécessaires dans la conduite d’une analyse des données économiques. Les discussions dans cette partie du cours vont, par conséquent, démarrer par un aperçu de l’expression analyse de régression. Pour commencer, il est indispensable de répondre à une question de base à savoir : qu’est ce qu’une analyse de régression ? L’analyse de régression est une technique d’analyse qui permet la description et l’évaluation d’une relation entre une variable donnée, souvent appelée variable expliquée ou variable dépendante et une ou plusieurs autres variables appelées variables explicatives ou variables indépendantes. On peut désigner par y la variable expliquée et par x1, x2, …, xk les variables explicatives. Si k = 1, il n’y a qu’une seule variable explicative et l’on est en présence d’une régression simple et qui constitue l’objet de cette partie. Lorsque k  1, il y a plus d’une variable explicative et dans ce cas on est en présence d’une régression multiple. Celle-ci fera l’objet de la quatrième partie de ce cours. On peut néanmoins, à titre illustratif, donner les exemples suivants : Exemple 1 : régression simple y = les ventes d’eau minérale Mayo x = les dépenses de publicité pour l’eau minérale Mayo Dans cet exemple, on essaie de déterminer la relation qui existe entre les ventes et les dépenses de publicité pour l’eau minérale Mayo. Exemple 2 : régression multiple y = dépenses de consommation d’un ménage à Brazzaville x1 = le revenu du ménage x2 = les actifs financiers du ménage x3 = la taille du ménage Dans ce deuxième exemple, on essaie de déterminer la relation entre les dépenses de consommation d’une part et le revenu, les actifs financiers et la taille du ménage d’autre part. Il est indispensable de noter ici que l’étude des différentes relations permet la poursuite de plusieurs objectifs. En effet, l’étude des relations est indispensable pour : • Analyser les effets des politiques qui impliquent un changement de l’une des variables explicatives ; • Prédire les valeurs de y pour des valeurs données des différentes variables explicatives ; 2 • Examiner si les différentes variables explicatives ont un effet significatif sur la variable expliquée. Dans le deuxième cas, par exemple, l’objectif poursuivi est de déterminer l’incidence de la taille du ménage sur les dépenses de consommation. Est- ce que l’effet qu’exerce la variable taille du ménage sur la consommation est significatif sur le plan statistique. Comme on peut le constater, la présentation du problème jusqu’ici ne place pas les variables y et x au même pied d’égalité. Implicitement on a supposé que les variables xk sont celles qui influencent la variable y. On peut aussi dire que les variables x sont celles que l’on peut contrôler et changer les valeurs et y est une variable d’effet. Il y a plusieurs termes alternatifs utilisés dans la littérature pour y et les xk. Ces termes sont présentés dans le tableau suivant : Tableau n° : Classification des variables dans une analyse de régression y x1, x2, …, xk (a) Prédictant Prédicteurs (b) Régressant Régresseurs (c) Variable expliquée Variables explicatives (d) Variable dépendante Variable indépendante (e) Variable d’effet Variables causales (f) Variable endogène Variables exogènes (g) Variable objectif Variables de contrôle Chacun des termes est pertinent pour une utilisation particulière d’une analyse de régression. La terminologie (a) est utilisée lorsque l’analyse de régression est faite à des fins de prédiction. Par exemple, les ventes constituent, dans le premier exemple, le prédictant et les dépenses de publicité, le prédicteur. Les terminologies (b), (c) et (d) sont utilisées sont généralement utilisées dans les discussions sur les modèles de régression par les économistes. Ce sont des termes équivalents. La terminologie (e) est utilisée dans les études de causalité. La terminologie (f) est spécifique à l’analyse économétrique. Enfin, la terminologie (g) est utilisée pour la résolution des problèmes. Par exemple, l’objectif pourrait être l’atteinte d’un certain niveau des ventes (variable objectif) et l’on doit déterminer le niveau des dépenses de publicité (variable contrôle) pour atteindre l’objectif. Dans ce cours, on utilisera les terminologies (c) et (d). Et, dans cette partie du cours l’on considéra le cas d’une variable expliquée (dépendante) et une seule variable explicative (indépendante). Comme il a été mentionné plus haut, ce cas de figure est celui d’une régression simple qui est développé ici. 1.2. Spécification de la relation Comme il a été mentionné dans la section précédente, les discussions ici porteront sur le cas d’une variable expliquée (dépendante), que l’on va appelée y et une seule variable explicative que l’on appellera x. La relation entre y et x peut s’écrire de la manière suivante : 3 y = f (x) (2.1) Dans cette première spécification f(x) est une fonction en x. A ce stade, il est important de faire une distinction entre deux types de relations : la première relation est déterministe (relation mathématique) et la seconde est statistique, c’est-à-dire qu’elle ne permet pas d’avoir une valeur unique de y pour une valeur donnée de x, mais peut générer plusieurs valeurs de y que l’on peut exprimer terme de probabilité. Dans ce cours, le choix porte sur la relation de type statistique pour des raisons que l’on va avancer à travers un exemple. Pour ce faire, on va supposer que la relation qui existe entre les ventes y et les dépenses de publicité x se présente comme suit : y = 2500 + 100x – x2 La relation qui vient d’être spécifiée est de type déterministe. Les ventes pour les différents niveaux de dépenses de publicité peuvent être déterminées de manière exacte. Elles se présentent comme suit : x y 0 20 50 100 2500 4100 5000 2500 Par ailleurs, si l’on suppose que la relation entre les ventes y et les dépenses de publicité x se présente comme suit : y = 2500 + 100x – x2 +  Dans cette seconde spécification,  est un terme aléatoire qui peut prendre deux valeurs à savoir : -  = + 500 avec une probabilité de 50% -  = - 500 avec une probabilité de 50% En incorporant le terme aléatoire dans cette nouvelle spécification, les valeurs des ventes y pour les différents niveaux de dépenses de publicité x peuvent être décrites de manière probabiliste. Par exemple, si les dépenses de publicité sont de 50, les ventes seront de 5500 avec une probabilité de 50% et 4500 avec une probabilité de 50%. Les valeurs de y pour les différentes valeurs de x se présente maintenant comme suit : x y 0 20 50 100 2000 ou 3000 3600 ou 4600 4500 ou 5500 2000 ou 3000 4 Les valeurs de y que l’on peut observer ici pourraient être l’un des huit (8) cas possibles. Par exemple, on peut avoir : x y 0 20 50 100 2000 4600 5500 2000 Si le terme de l’erreur  est distribué suivant une loi normale centrée réduite, autrement distribué normalement avec une moyenne nulle et une variance égale à 1, alors pour chaque valeur de x correspondra des valeurs de y normalement distribuées. Ainsi, la valeur de y peut être n’importe laquelle de cette distribution. Par exemple, si la relation entre y et x est définie comme suit : y = 2 +x +  où le terme de l’erreur  est distribué suivant une loi normale centré réduite [ N (0,1)], alors chaque couple (x,y) sera également distribué normalement. Ceci peut être illustré par le graphique suivant : La droite qui est tracée sur ce graphique représente une relation déterministe y = 2 + x. Les valeurs observées de y pour chaque x seront les points situés sur les lignes verticales. La relation entre y et x, dans ce cas est appelée stochastique ou une relation statistique. Pour revenir à l’équation (3.1), on va considérer que la fonction f(x) est linéaire en x ; ce qui permet d’écrire : f(x) = α + βx. On va également supposer que cette relation est stochastique ; ce qui nous donne la relation suivante : y = α + βx +  (2.2) y y = 2 + x Valeur possible de y Pour une valeur de x 0 x 5 Dans l’équation (3.2),  est le terme de l’erreur qui dispose d’une probabilité connue (pour rappel on a supposé que ce terme était distribué suivant une loi normale centrée réduite ; ce qui en fait une variable aléatoire). Ainsi, la relation qui a été postulée ici a deux composantes dont la première (α + βx) est déterministe de y et uploads/Management/ introduction-econometrie-iii.pdf

  • 30
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Jan 21, 2022
  • Catégorie Management
  • Langue French
  • Taille du fichier 0.4151MB