Chapitre 4: Statistique descriptive (deux dimensions) L'analyse de la régressio

Chapitre 4: Statistique descriptive (deux dimensions) L'analyse de la régression L’analyse de la régression L’analyse de la régression I- Introduction I- Introduction En statistiques, plusieurs problèmes consistent à définir la relation qui existe entre deux variables statistiques : – Le nombre d’années d’expérience et le nombre d’erreurs commises ; – L’âge du conducteur et le nombre d’accidents d’auto ; – Le volume des ventes et les dépenses en publicité ; – Le nombre d’heures d’études et les résultats aux examens ; – … Introduction Introduction Dans ce genre de problèmes, les principales questions auxquelles nous voudrons répondre sont les suivantes : – Existe-il une relation ou une dépendance entre les variables statistiques? – Cette relation, si elle existe, est-elle linéaire ou non ? – Si une dépendance linéaire existe, de quelle façon peut-on la traduire par une équation mathématique ? – La relation, si elle existe, est-elle grande ou faible ? – Si l’équation mathématique de la relation entre les variables existe, comment prévoir les valeurs d’une certaine variable à partir de la connaissance de valeurs de l’autre variable ou des autres variables ? Mise en contexte Mise en contexte Pour répondre à toutes ces questions, nous ferons appel à une théorie statistique que nous appelons : L’analyse de la régression 1- Définition: L’analyse de la régression 1- Définition: L’analyse de la régression L’analyse de la régression est une méthode statistique qui permet d’étudier le type de relation pouvant exister entre une certaine variable (dépendante) dont on veut expliquer les valeurs et une ou plusieurs autres variables qui servent à cette explication (variables indépendantes) – Régression linéaire simple: une variable indépendante En d’autres termes, l’analyse de la régression permet d’étudier les variations de la variable dépendante en fonction des variations connues des variables indépendantes. L’analyse de la régression L’analyse de la régression Le coût du loyer en fonction du nombre de pièces, du niveau d’étage dans l’immeuble, des services offerts ... ) ,..., , , ( 3 2 1 n X X X X f Y  Coût du loyer Nombre de pièces Services offerts (piscine, stationnement intérieur, etc.) L’étage dans l’immeuble … L’analyse de la régression L’analyse de la régression Une analyse de régression est : – dite simple si elle permet de prédire les valeurs d’une variable dite dépendante (expliquée (Y)) à partir des valeurs prises par une autre variable dite indépendante (explicative (X)). – dite multiple si elle permet de prédire les valeurs d’une variable dite dépendante (expliquée (Y)) à partir des valeurs prises par plusieurs autres variables dites indépendantes (explicatives (Xi)). II- L’analyse de la régression linéaire simple II- L’analyse de la régression linéaire simple C’est la représentation graphique dans le plan cartésien de l’ensemble des paires de données (xi,yi). Ces données proviennent d’une série statistique de deux variables obtenues à partir d’une étude menée sur un échantillon ou sur une population. 1- Définition : Nuage de points ou diagramme de dispersion L’analyse de la régression linéaire simple L’analyse de la régression linéaire simple 2- Exemple : Nuage de points ou diagramme de dispersion Supposons que le nombre d’heures d’études nécessaires pour préparer l’examen final en statistiques et le nombre de bonnes réponses obtenues par chaque étudiant sont donnés dans le tableau suivant : Tracer le nuage de points ou le diagramme de dispersion des données présentées ci-dessus. Exemple : Nuage de points ou diagramme de dispersion … Diagramme de dispersion Heures d'études 0 1 2 3 4 5 6 7 8 9 10 0 2 4 6 8 10 L’analyse de la régression linéaire simple L’analyse de la régression linéaire simple 3- Objectif d’une analyse de régression simple Une fois la représentation graphique effectuée, il est facile de soupçonner l’existence d’une certaine relation entre les deux variables (caractères étudiés). Il faut maintenant chercher à exprimer cette relation à l’aide d’une équation mathématique. ) (X f Y  On essaie de trouver la forme mathématique de la fonction f L’analyse de la régression linéaire simple L’analyse de la régression linéaire simple Objectif d’une analyse de régression simple L’analyse de la régression linéaire simple L’analyse de la régression linéaire simple Diagramme de dispersion Heures d'études 0 1 2 3 4 5 6 7 8 9 10 0 2 4 6 8 10 L’analyse de la régression linéaire simple L’analyse de la régression linéaire simple Définition : Nous appelons régression linéaire l’ajustement d’une droite au nuage statistique d’une série de couples de données. Ainsi, une régression linéaire simple va permettre de résumer, d’interpréter et de prévoir les variations d’un caractère dit dépendant (Y) en fonction d’un autre dit indépendant (X) et ce en utilisant une droite. III- Modèle de régression linéaire simple III- Modèle de régression linéaire simple Modèle de régression linéaire simple y = 0 + 1x +  Équation de la régression linéaire simple (comment l'espérance de y est liée à x) E(y) = 0 + 1x Équation estimée de la régression linéaire simple (droite de la régression estimée, modèle empirique) y = Variable dépendante ou expliquée = valeur estimée de y pour une valeur x x = Variable indépendante ou explicative 0 et 1 = Coefficients théoriques de régression (à estimer à l’aide d’un échantillon) par b0 et b1 = Erreur théorique aléatoire (d’autres facteurs influencent Y)  0 1 ˆ y b b x   ˆ y Modèle de régression linéaire simple Modèle de régression linéaire simple L'équation estimée de la régression linéaire simple (droite de la régression estimée, modèle empirique) peut être utilisée pour une estimation ponctuelle de la valeur moyenne de y pour une valeur particulière de x ou pour prévoir la valeur ponctuelle de y associée à une valeur particulière de x y = Variable dépendante ou expliquée = valeur de prévision de y pour une valeur x, ou moyenne de y estimée pour une valeur de x x = Variable indépendante ou explicative 0 1 ˆ y b b x   ˆ y L’analyse de la régression linéaire simple L’analyse de la régression linéaire simple 1-Les différentes étapes d’une étude de régression Il existe plusieurs méthodes permettant d’estimer le modèle théorique par le modèle empirique  Méthode des moindres carrés  Méthode de la vraisemblance  … 0 1       y x 0 1   ˆ y b b x L’analyse de la régression linéaire simple L’analyse de la régression linéaire simple IV- La IV- La méthode méthode des moindres carrés des moindres carrés Critère des moindres carrés où: yi = valeur observée de la variable dépendante pour pour la ième observation = valeur estimée de la variable dépendante pour la ième observation 2 ˆ min ( ) i i y y   ˆi y L’analyse de la régression linéaire simple L’analyse de la régression linéaire simple La méthode des moindres carrés Idée de base : cette méthode essaie de construire une droite de régression empirique qui minimise la somme des carrés des distances verticales entre cette droite et chacun des points observés. La méthode des moindres carrés … ) , ( i i y x ) ˆ , ( i i y x Illustration graphique L’analyse de la régression linéaire simple L’analyse de la régression linéaire simple L’analyse de la régression linéaire simple L’analyse de la régression linéaire simple La méthode des moindres carrés … 1- Définition : On appelle résidu ou erreur empirique ou écart de prévision, la valeur , soit la différence (l’écart vertical) entre la valeur observée yi de Y et la valeur estimée obtenue à partir de la droite de régression, lorsque x= xi.  ˆ ei i i y y i y ˆ L’objectif de la méthode des moindres carrés est de déterminer la droite de régression qui minimise 2 1   n i i e La méthode des moindres carrés …     2 2 2 2 2 1 2 3 1 2 1 2 0 1 1 n ... n i i n i i i n i i i SCres e e e e e ˆ SCres y y SCres y b b x                  Cette mesure donne l’ordre de grandeur de la dispersion des observations Yi autour de la droite de régression Il s’agit de trouver bo et b1 de sorte que la somme des carrés des résidus SCres soit la plus petite possible (minimale). L’analyse de la régression linéaire simple L’analyse de la régression linéaire simple 2- Principes de la méthode des moindres carrés … Comment calculer les coefficients b0 et b1? Les estimations ponctuelles des paramètres de la droite de régression obtenues par la méthode des moindres carrés sont :          n i i n i i i x n x y x n y x b x b y b 1 2 2 1 1 1 0 Taille de l’échantillon L’analyse de la régression linéaire simple L’analyse de la régression linéaire uploads/Management/ 2-regression-abregee.pdf

  • 28
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Mai 16, 2022
  • Catégorie Management
  • Langue French
  • Taille du fichier 0.8057MB