Chapitre 2 : Régression linéaire simple Chapitre 2 : Régression linéaire simple

Chapitre 2 : Régression linéaire simple Chapitre 2 : Régression linéaire simple Plan du chapitre Mise en contexte Introduction à l’analyse de la régression Introduction à la régression linéaire Diagramme de dispersion Moindres carrées Qualité de la régression Mise en contexte Mise en contexte En statistiques, plusieurs problèmes consistent à définir la relation qui existe entre deux variables statistiques X et Y : – Le volume des ventes et les dépenses en publicité ; – Le nombre d’années d’expérience et le nombre d’erreurs commises ; – L’âge du conducteur et le nombre d’accidents d’auto ; – Le nombre d’heures d’études et les résultats aux examens ; – … Mise en contexte Mise en contexte Dans ce genre de problèmes, les principales questions auxquelles nous voudrons répondre sont les suivantes : – Existe-il une relation ou une dépendance entre les variables statistiques? – Cette relation, si elle existe, est-elle linéaire ou non ? – Si une dépendance linéaire existe, de quelle façon peut-on la traduire par une équation mathématique ? – La relation, si elle existe, est-elle forte ou faible ? – Si l’équation mathématique de la relation entre les variables existe, comment prévoir les valeurs d’une certaine variable à partir de la connaissance de valeurs de l’autre variable ou des autres variables ? Mise en contexte Mise en contexte Pour répondre à toutes ces questions, nous ferons appel à une théorie statistique que nous appelons : L’analyse de la régression (ou de l’ajustement) L’analyse de la régression L’analyse de la régression L’analyse de la régression est une méthode statistique qui permet d’étudier le type de relation pouvant exister entre une certaine variable (variable dépendante) dont on veut expliquer les valeurs et une ou plusieurs autres variables qui servent à cette explication (variables indépendantes). En d’autres termes, l’analyse de la régression permet d’étudier les variations de la variable dépendante en fonction des variations connues des variables indépendantes. Écriture du modèle de la régression Écriture du modèle de la régression ) ,..., , , ( 3 2 1 n X X X X f Y  Coût du loyer Nombre de pièces Services offerts (piscine, stationnement intérieur, etc.) L’étage dans l’immeuble … L’analyse de la régression L’analyse de la régression Une analyse de régression est dite : 1- simple si elle permet de prédire les valeurs d’une variable dépendante (expliquée : Y) à partir des valeurs prises par une variable indépendante (explicative : X). 2- multiple si elle permet de prédire les valeurs d’une variable dépendante (Y) à partir des valeurs prises par plusieurs variables indépendantes (X1, X2, X3, …). L’analyse de la régression linéaire simple L’analyse de la régression linéaire simple Vocabulaire : (Y) (X) Variable dépendante Variable indépendante Variable expliquée Variable explicative Variable endogène Variable exogène Variable de gauche Variable de droite ) (X f Y  L’analyse de la régression linéaire simple L’analyse de la régression linéaire simple Nuage de points ou diagramme de dispersion Supposons que le nombre d’heures d’études nécessaires pour préparer l’examen final en statistiques et le nombre de bonnes réponses obtenues par chaque étudiant sont donnés dans le tableau suivant : Tracer le nuage de points ou le diagramme de dispersion des données présentées ci-dessus. Diagramme de dispersion Heures d'études 0 1 2 3 4 5 6 7 8 9 10 0 2 4 6 8 10 L’analyse de la régression linéaire simple L’analyse de la régression linéaire simple Nuage de points ou diagramme de dispersion Une fois la représentation graphique effectuée, il est facile de soupçonner l’existence d’une certaine relation entre les deux variables. Il faut maintenant chercher à exprimer cette relation à l’aide d’une équation mathématique. C-à-d, trouver la forme fonctionnelle associant Y à X : C’est la spécification du modèle. ) (X f Y  On essaie de trouver la forme mathématique de la fonction f L’analyse de la régression linéaire simple L’analyse de la régression linéaire simple Objectif d’une analyse de régression simple L’analyse de la régression linéaire simple L’analyse de la régression linéaire simple Diagramme de dispersion Heures d'études 0 1 2 3 4 5 6 7 8 9 10 0 2 4 6 8 10 L’analyse de la régression linéaire simple L’analyse de la régression linéaire simple Définition : Nous appelons régression linéaire l’ajustement d’une droite au nuage statistique d’une série de couples de données. Ainsi, une régression linéaire simple va permettre de résumer, d’interpréter et de prévoir les variations d’un caractère dit dépendant (Y) en fonction d’un autre dit indépendant (X) et ce en utilisant une droite. Modèle de régression linéaire simple Modèle de régression linéaire simple Modèle : y = 0 + 1x +  Équation de régression : E(y) = 0 + 1x Équation estimée : (droite de la régression estimée, modèle empirique) y = Variable dépendante ou expliquée = valeur estimée de y pour une valeur x x = Variable indépendante ou explicative 0 et 1 = Coefficients théoriques de régression à estimer (à l’aide d’un échantillon) par b0 et b1 = Erreur théorique aléatoire (d’autres facteurs influencent Y)  0 1 ˆ y b b x   ˆ y Modèle de régression linéaire simple Modèle de régression linéaire simple L'équation estimée de la régression linéaire simple (droite de la régression estimée, modèle empirique) peut être utilisée pour une estimation ponctuelle de la valeur moyenne de y pour une valeur particulière de x ou pour prévoir la valeur ponctuelle de y associée à une valeur particulière de x : y = Variable dépendante ou expliquée = valeur de prévision de y pour une valeur x, ou moyenne de y estimée pour une valeur de x x = Variable indépendante ou explicative 0 1 ˆ y b b x   ˆ y L’analyse de la régression linéaire simple L’analyse de la régression linéaire simple Les différentes étapes d’une étude de régression Il existe plusieurs méthodes permettant d’estimer le modèle théorique : par le modèle empirique : 1- Méthode des moindres carrés 2- Méthode du maximum de la vraisemblance 3- Autres méthodes 0 1       y x 0 1   ˆ y b b x L’analyse de la régression linéaire simple L’analyse de la régression linéaire simple La méthode des moindres carrés La méthode des moindres carrés Critère des moindres carrés où: yi = valeur observée de la variable dépendante pour la ième observation = valeur estimée de la variable dépendante pour la ième observation 2 ˆ min ( ) i i y y   2 ˆ min ( ) i i y y   ˆi y ˆi y L’analyse de la régression linéaire simple L’analyse de la régression linéaire simple La méthode des moindres carrés Idée de base : cette méthode essaie de construire une droite de régression empirique qui minimise la somme des carrés des distances verticales entre cette droite et chacun des points observés. La méthode des moindres carrés Illustration graphique ) , ( i i y x ) ˆ , ( i i y x La méthode des moindres carrés … Définition : On appelle résidu, erreur empirique ou écart de prévision, la valeur, soit la différence (l’écart vertical) entre la valeur observée yi et la valeur estimée obtenue à partir de la droite de régression, lorsque x= xi.  ˆ ei i i y y i y ˆ L’objectif de la méthode des moindres carrés est de déterminer la droite de régression qui minimise 2 1   n i i e La méthode des moindres carrés …     2 2 2 2 2 1 2 3 1 2 1 2 0 1 1 n ... n i i n i i i n i i i SCres e e e e e ˆ SCres y y SCres y b b x                  Cette mesure donne l’ordre de grandeur de la dispersion des observations Yi autour de la droite de régression. Il s’agit de trouver bo et b1 de sorte que la somme des carrés des résidus SCres soit la plus petite possible (minimale). Principes de la méthode des moindres carrés … Comment calculer les coefficients b0 et b1? Les estimations ponctuelles des paramètres de la droite de régression obtenues par la méthode des moindres carrés sont :          n i i n i i i x n x y x n y x b x b y b 1 2 2 1 1 1 0 Taille de l’échantillon 1 2 i i i ( x x )( y y ) b ( x x )       À partir des données ci-dessous, déterminez les estimations ponctuelles des paramètres de la droite de régression selon la méthode des moindres carrés : Principes de la méthode des moindres carrés … Exercice 1 1 2 2 2 1 6670 5 30 40 0 67 5500 5 30 , ( ) n i i uploads/Management/ chapitre2-regression-simple.pdf

  • 24
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Jan 21, 2022
  • Catégorie Management
  • Langue French
  • Taille du fichier 0.5159MB