Regression lineaire simple

Prédire expliquer les valeurs d ? une variable quantitative Y à partir d ? une autre variable X Ricco Rakotomalala Ricco Rakotomalala univ-lyon fr Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC CÉquipe de recherche en Ingénierie des Connaissances Laboratoire ERIC CPosition du problème Exemple de régression simple Bourbonnais page Expliquer le rendement de ma? s Y en quintal à partir de la quantité d'engrais utilisé en kilo sur des parcelles de terrain similaires Variable à prédire Attribut classe Variable endogène Quantitative Identi ?ant Pas utilisé pour les calculs mais peut être utilisé pour les commentaires points atypiques etc N de parcelle Y X Variables prédictive Descripteur Variable exogène Quantitative ou binaire Modèle de régression simple y i a ? x i b i Nous disposons donc d ? un échantillon de n couples de points xi yi i i d indépendants et identiquement distribués et on veut expliquer prédire les valeurs de Y en fonction des valeurs prises par X Le terme aléatoire permet de résumer toute l ? information qui n ? est pas prise en compte dans la relation linéaire entre Y et X problèmes de spéci ?cations approximation de la linéarité résumer les variables qui sont absentes etc Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC CHypothèses Permettent de déterminer les propriétés des estimateurs Et de mettre en place les outils de statistique inférentielle tests d ? hypothèses intervalle de con ?ance H Hypothèses sur X et Y Ce sont des grandeurs numériques mesurées sans erreur X est une donnée exogène dans le modèle Y est aléatoire par l ? intermédiaire de c -à-d la seule erreur que l ? on a sur Y provient des insu ?sances de X à expliquer ses valeurs dans le modèle H Hypothèses sur le terme aléatoire Les i sont i i d indépendants et identiquement distribués H a En moyenne les erreurs s ? annulent le modèle est bien spéci ?é E i H b La variance de l ? erreur est constante et ne dépend pas de l ? observation homoscédasticité V i ? H c En particulier l ? erreur est indépendante de la variable exogène COV xi i H d Indépendance des erreurs les erreurs relatives à observations sont indépendantes on dit aussi que les erreurs ne sont pas corrélées ? H e Loi normale i ?? N ? COV i j Équipe de recherche en Ingénierie des Connaissances Laboratoire ERIC CÉquipe de recherche en Ingénierie des Connaissances Laboratoire ERIC CEstimateur des MCO Moindres carrés ordinaires Critère numérique Critère des moindres carrés trouver les valeurs de a et b qui yi a ? xi b i xi minimise la somme des carrés des écarts entre les vraies valeurs de Y et les valeurs prédites avec le modèle de prédiction ? n S i i ? n S y i ?? ax i b i ? n S y i ?? ax i ?? b i Remarque Pourquoi pas la somme des erreurs Ou la

  • 39
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise
Partager