M2 Pro Ingénierie Mathématique Année 2011-2012 Université d'Angers, Université

M2 Pro Ingénierie Mathématique Année 2011-2012 Université d'Angers, Université de Nantes TD de Corrélation Exercice 1 : Corrélation linéaire On veut étudier la corrélation entre le nombre de véhicules en circulation et le nombre d'accidents en Suisse. Pour cela, on dispose de 6 observations relevées dans 6 cantons suisses : Canton Véhicules Accidents VS 132981 3335 BL 112172 2224 SO 109543 1758 FR 108064 1661 TG 103324 1941 NE 78795 2391 1. Calculer le coe cient de corrélation empirique entre les deux variables. 2. Donner un intervalle de con ance à 95% pour ρ(X, Y ). 3. On suppose que les deux variables sont normalement distribuées. Tester l'hypothèse H0 : ”ρ(X, Y ) = 0” contre ”H1 : ”ρ(X, Y ) ̸= 0”. Conclure. 4. Aux vues des résultats, un modèle de régression linéaire simple est-il adéquate ? On donne : P(xi−¯ x)(yi−¯ y) = 23427208.33 ; P(xi−¯ x)2 = 1517014451 ;P(yi−¯ y)2 = 1876231.3. Exercice 2 : Corrélation partielle On étudie la qualité d'enseignement de 20 écoles des Etats-Unis (Mid-Atlantic et New-England). On cherche à expliquer Y, la moyenne des tests verbaux obtenue pour chaque école, à l'aide des 5 variables suivantes :  X1 : salaire des enseignants par élève ;  X2 : pourcentage des pères cols blancs parmi les élèves ;  X3 : statut socio-économique des familles obtenu en calculant entre la taille des familles, le niveau d'éducation des parents, et le nombre d'appareils électro-ménagers dans le ménage ;  X4 : moyenne des tests verbaux des professeurs ;  X5 : moyenne du niveau d'éducation des mères des élèves. On donne la matrice des corrélations : R =           X1 X2 X3 X4 X5 Y X1 1 0.1811 0.2296 0.5027 0.1968 0.1923 X2 1 0.8272 0.0511 0.9271 0.7534 X3 1 0.1833 0.8191 0.9272 X4 1 0.1238 0.3336 X5 1 0.7330 Y 1           1. Commenter. 2. Calculer rx3y.x2 et commenter. 1 Parfum Un "nez" note la qualité de n = 10 parfums. La qualité est une variable de 1 à 10 et les prix des parfums (en euros) sont présentés dans le tableau ci-dessous : Parfum Qualité Prix 1 10 63.3 2 1 40 3 2 35 4 5 34.3 5 4 33 6 3 31.6 7 6 36.6 8 7 32 9 9 37.3 10 8 35.3 Proposer et discuter l'utilisation des diérents tests pour répondre à la question suivante : les prix dépendent-ils de la qualité ? 2 M2 Pro Ingénierie Mathématique Année 2011-2012 Université d'Angers, Université de Nantes TP de corrélation Exercice 1 : Décathlon On veut étudier la corrélation partielle entre les diérentes épreuves du décathlon. Pour cela, on dispose d'un tableau des résultats de 41 athlètes aux 10 épreuves du décathlon des jeux olympiques ( chier "decathlon.txt") : 1. Récupérer les données et résumer les données. 2. Commenter la sortie graphique de la commande plot(decathlon). 3. Calculer la matrice de corrélation empirique R et commenter. Distinguer deux familles de disciplines. 4. Tester la dépendance linéaire entre les variables X100mH et X100m, puis entre les variables Longueur et X100m à l'aide du test de Pearson. Quel est le signe du coe cient de corrélation empirique ? Expliquer. 5. Tester la dépendance entre ces variables, à l'aide du test de Kendall et du test de Spearman. Commenter. Exercice 2 : Autocorrélation des résidus Tester l'autocorrélation des résidus des régressions proposées aux TP précédents à l'aide des test de Durbin-Watson et de Box-Pierce. L'hypothèse d'indépendance des résidus est-elle valable pour chacune d'entre elle ? Exercice 3 : Corrélation non-linéaire On étudie l'accélération de la tête d'un motard après un choc. Les données sont disponibles dans le chier "motard.txt". 1. Récupérer les données et faites une pré-analyse des données. 2. Calculer la correlation empirique entre le temps écoulé après le choc et l'accélération de la tête du motard. Commenter. 3. Tester la corrélation entre les deux variables à l'aide des tests de Spearman et Kendall. Que remarquez-vous ? Exercice 4 : Espérance de vie On étudie l'espérance de vie dans 38 pays, en fonction du nombre de TV par habitant et du nombre de Docteur en Physique par habitant. On dispose aussi de l'espérance de vie des hommes et des femmes séparemment. 1. Récupérer les données ( chier "lifeexp.dat") et faites la phase de pré-analyse. 2. Calculer la matrice de corrélation empirique et commenter les résultats obtenus. 3. Tester la corrélation entre l'espérance de vie et le nombre d'habitants par TV, puis entre l'espérance de vie et le nombre d'habitants par Docteur en Physique. Que conclure ? 4. Construire un modèle de régression linéaire pour expliquer l'espérance de vie en fonction de ces deux indicateurs. 5. Tester la signi cativité du modèle et tester l'autocorrélation d'ordre 1 des résidus à l'aide du test de Durbin Watson, et l'absence d'autocorrélation grâce au test de Box-Pierce. 3 uploads/Industriel/ td3-pdf.pdf

  • 11
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager