Pr. BOULAHOUAL Adil Mise en contexte Le nombre d’années d’expérience et le nom
Pr. BOULAHOUAL Adil Mise en contexte Le nombre d’années d’expérience et le nombre d’erreurs commises ; L ’âge du conducteur et le nombre d’accidents d’auto ; Le volume des ventes et les dépenses en publicité ; Le nombre d’heures d’études et les résultats aux examens ; … 2 Pr. BOULAHOUAL Adil ◦Existe-il une relation ou une dépendance entre les variables statistiques? ◦Cette relation, si elle existe, est-elle linéaire ou non ? ◦Si une dépendance linéaire existe, de quelle façon peut-on la traduire par une équation mathématique ? ◦La corrélation, si elle existe, est-elle forte ou faible ? ◦Si l’équation mathématique de la relation entre les variables existe, comment prévoir les valeurs d’une certaine variable à partir de la connaissance de valeurs de l’autre variable ou des autres variables ? 3 Mise en contexte Pr. BOULAHOUAL Adil Modèle Économique Un modèle consiste en une présentation formalisée d’un phénomène sous forme d’équations mathématiques.( normalement en économétrie et comme toutes les variables économiques sont interdépendantes (notion de système), il n'est pas suffisant de construire des équations isolées mais plutôt il faut établir un système complet d‘équations.) 4 Elle consiste alors à effectuer des études sur l’échantillon et transposer les résultats sur la population. Cette transposition n’est pas stricte, elle attache toujours une probabilité aux résultats et aux conclusions émises. Inférence statistique Pr. BOULAHOUAL Adil Pr. BOULAHOUAL Adil 5 La régression linéaire CHAPITRE I Pr. BOULAHOUAL Adil L ’analyse de la régression est une méthode statistique qui permet d’étudier le type de relation pouvant exister entre une certaine variable (dépendante) dont on veut expliquer les valeurs et une ou plusieurs autres variables qui servent à cette explication (variables indépendantes) En d’autres termes, l’analyse de la régression permet d’étudier les variations de la variable dépendante en fonction des variations connues des variables 6 Pr. BOULAHOUAL Adil Le coût du loyer en fonction du nombre de pièces, du niveau d’étage dans l’immeuble, des services offerts ... ) ,..., , , ( 3 2 1 n X X X X f Y Coût du loyer Nombre de pièces Services offerts (piscine, stationnement intérieur, etc.) L’étage dans l’immeuble … Pr. BOULAHOUAL Adil Une analyse de régression est : - dite simple si elle permet de prédire les valeurs d’une variable dite dépendante (expliquée, endogène,Y ) à partir des valeurs prises par une autre variable dite indépendante (exogène, explicative, X ). - dite multiple si elle permet de prédire les valeurs d’une variable dite dépendante à partir des valeurs prises par plusieurs autres variables dites indépendantes Xi). 8 Pr. BOULAHOUAL Adil Exemple : Nuage de points ou diagramme de dispersion Supposons que le nombre d’heures d’études nécessaires pour préparer l’examen final en statistiques et le nombre de bonnes réponses obtenues par chaque étudiant sont donnés dans le tableau suivant : 9 Heures d’études 5 8 6 9 10 8 5 4 10 4 10 7 9 Bonnes réponses 5 8 7 9 10 7 4 4 8 2 9 6 8 Nuage de points ou diagramme de dispersion Pr. BOULAHOUAL Adil Exemple : Nuage de points ou diagramme de dispersion 10 Pr. BOULAHOUAL Adil Objectif de la représentation graphique du nuage de point Une fois la représentation graphique effectuée, il est facile de soupçonner l’existence d’une certaine relation entre les deux variables (caractères étudiés). Il faut maintenant chercher à exprimer cette relation à l’aide d’une équation mathématique. ) (X f Y Nous essayerons de trouver la forme math matique de la fonction é f 11 Pr. BOULAHOUAL Adil Définition : Nous appelons régression linéaire l’ajustement d’une droite au nuage statistique d’une série de couples de données. Ainsi, une régression linéaire simple va permettre de résumer, d’interpréter et de prévoir les variations d’un caractère dit dépendant (Y) en fonction d’un autre dit indépendant (X) et ce en utilisant une droite. 12 Pr. BOULAHOUAL Adil Modèle théorique de régression linéaire simple y = 0 + 1x + Équation de la régression linéaire simple (comment l'espérance de y est liée à x) E(y) = 0 + 1x Équation estimée de la régression linéaire simple (modèle empirique) y : = Variable dépendante ou expliquée = valeur estimée de y pour une valeur x 0 et 1 x = Variable indépendante ou explicative = Coefficients théoriques de régression (à estimer à l’aide d’un échantillon par b0 et b1 ) = Erreur théorique aléatoire (d’autres facteurs influencent Y) ^ x b b y 1 0 ^ Pr. BOULAHOUAL Adil L'équation estimée de la régression linéaire simple (droite de la régression estimée, modèle empirique) peut être utilisée pour une estimation ponctuelle de la valeur moyenne de y pour une valeur particulière de x ou pour prévoir la valeur ponctuelle de y associée à une valeur particulière de x y = Variable dépendante y = valeur de prévision de y pour une valeur x; x = Variable indépendante ou explicative 14 ^ x b b y 1 0 ^ Pr. BOULAHOUAL Adil Les différentes étapes d’une étude de régression 15 1- Sp cification du é mod le è 2- Validation du mod le è 3- Estimation des param tres è 4- Test des hypoth ses è 5- Application du mod le è Pr. BOULAHOUAL Adil 16 1- Spécification du modèle Diagramme de dispersion Heures d'études 0 1 2 3 4 5 6 7 8 9 10 0 2 4 6 8 10 Estimation Extrapolation Extrapolation Pr. BOULAHOUAL Adil Il existe plusieurs méthodes permettant d’estimer le modèle théorique par le modèle empirique Méthode des moindres carrés Méthode de la vraisemblance … 0 1 y x 0 1 ˆ y b b x 17 Pr. BOULAHOUAL Adil La méthode des moindres carrés Idée de base : Cette méthode essaie de construire une droite de régression empirique qui minimise la somme des carrés des distances verticales entre cette droite et chacun des points observés. 18 2 ˆ min ( ) i i y y Pr. BOULAHOUAL Adil Diagramme de dispersion Heures d'études 0 1 2 3 4 5 6 7 8 9 10 0 2 4 6 8 10 ) , ( i i y x ) ˆ , ( i i y x Illustration graphique 19 Heures d’études 5 8 6 9 10 8 5 4 10 4 10 7 9 Bonnes réponses 5 8 7 9 10 7 4 4 8 2 9 6 8 2 ˆ min ( ) i i y y Pr. BOULAHOUAL Adil Définition : nous appelons résidu ou erreur empirique ou écart de prévision, la valeur ei = yi – yi , soit la différence (l’écart vertical) entre la valeur observée yi et la valeur estimée yi obtenue à partir de la droite de régression, lorsque x = xi . L’objectif de la méthode des moindres carrés est de déterminer la droite de régression qui minimise 2 1 n i i e 20 ^ ^ Pr. BOULAHOUAL Adil La méthode des moindres carrés … 2 2 2 2 2 1 2 3 1 2 1 2 0 1 1 n ... n i i n i i i n i i i SCres e e e e e ˆ SCres y y SCres y b b x Cette mesure donne l’ordre de grandeur de la dispersion des observations Yi autour de la droite de régression Il s’agit de trouver bo et b1 de sorte que la somme des carrés des résidus SCres soit la plus petite possible (minimale). 21 Pr. BOULAHOUAL Adil n i i n i i i x n x y x n y x b x b y b 1 2 2 1 1 1 0 Principes de la méthode des moindres carrés … Comment calculer les coefficients b0 et b1? Les estimateurs ponctuelles des paramètres de la droite de régression obtenues par la méthode des moindres carrés sont : n i i n i i i x n x y x n y x b x b y b 1 2 2 1 1 1 0 Taille de l’échantillon 1 2 i i i ( x x )( y y ) b ( x x ) Autre formule pour b1 22 3- Estimation des paramètres Pr. BOULAHOUAL Adil À partir des données ci-dessous, déterminez les estimations ponctuelles des paramètres de la droite de régression selon la méthode des moindres carrés : 23 Pr. BOULAHOUAL Adil 1 1 2 2 2 1 6670 5 30 40 0 67 5500 5 30 , ( ) n i i i n i i x y nxy b x nx 0 1 40 0 67 30 19 9 , uploads/Management/ regression-simple.pdf
Documents similaires










-
38
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Jan 03, 2023
- Catégorie Management
- Langue French
- Taille du fichier 1.1294MB