M2 Pro Ingénierie Mathématique Année 2011-2012 Université d'Angers, Université
M2 Pro Ingénierie Mathématique Année 2011-2012 Université d'Angers, Université de Nantes TD d'analyse de variance à 2 facteurs et Analyse de la covariance Exercice 1 On étudie la consommation de carburant de véhicules en fonction de la marque(A,B,C,D et E) et du type de conduite (a,b, et c). On dipose de trois répétitions pour chaque modalité, précisées dans le tableau ci-dessous : marque/conduite a b c A 20.3 19.8 21.4 21.6 22.4 21.3 19.8 18.6 21.0 B 19.5 18.6 18.9 20.1 19.9 20.5 19.6 18.3 19.8 C 22.1 23.0 22.4 20.1 21.0 19.8 22.3 22.0 21.6 D 17.6 18.3 18.2 19.5 19.2 20.3 19.4 18.5 19.1 E 23.6 24.5 25.1 17.6 18.3 18.1 22.1 24.3 23.8 1. Ecrire le modèle complet à deux facteurs et estimer les paramètres du modèle en imposant une contrainte. 2. Tester l'additivité des deux facteurs. Exercice 2 Une entreprise cherche à tester 4 modèles de machines à écrire. Pour cela, elle demande à 5 secrétaires de taper un texte pendant 15 minutes. A la n du test, on compte le nombre moyen de mots tapés en 1 minute. On répète l'expérience le lendemain. Les résultats sont présentés dans le tableau ci-dessous : Machine à écrire 1 2 3 4 1 2 3 4 1 2 Secrétaire 1 1 1 1 2 2 2 2 3 3 Résultats 33 ;36 32 ;35 37 ;39 29 ;31 31 ;31 37 ;35 35 ;35 31 ;33 34 ;36 40 ;36 Machine à écrire 3 4 1 2 3 4 1 2 3 4 Secrétaire 3 3 4 4 4 4 5 5 5 5 Résultats 34 ;37 33 ;34 34 ;33 33 ;36 31 ;35 31 ;27 31 ;31 35 ;36 37 ;40 33 ;33 1. Ecrire le modèle non-régulier. 2. Ecrire le modèle sous la forme y = Xθ + ϵ en tenant compte des contraintes habituelles pour rendre le modèle régulier. 3. tester les hypothèses suivantes : H0 : "Pas d'eet du type de machine à écrire" H0 : "Pas d'eet de la secrétaire" H0 : "Pas d'interaction entre le type de machine et la secrétaire". 1 Exercice 3 Une compagnie fabriquant des grands ventilateurs à usage industriel souhaite améliorer ses produits. Elle contacte des statisticiens (vous) a n de réaliser une étude précise. Le choix se porte sur trois facteurs suivants : le type de trou à la base des pales (hexagonal ou rond), le type de support sur lequel le ventilateur est xé (à pointes ou lisse), et la façon dont l'assemblage est fait (enfoncé ou vissé). Les détails techniques se trouvent dans la Figure 1. La mesure de qualité d'un ventilateur est basée sur le couple, mesure en Pieds.Livres, corres- pondant à la casse du ventilateur en se séparant du support. L'étude a porté, au départ, sur N = 8 ventilateurs, puis sur N = 64 ventilateurs. 1. Dé nir le modèle d'analyse de variance complet. 2. Donner les contraintes de manière à rendre le modèle orthogonal. Donner ses contraintes pour tous les eets, et donner les estimateurs correspondants. 3. Interpréter le tableau d'analyse de variance du modèle (Table 1). Proposer une explication de la colonne "Puissance observée" (calculé avec α = 5%), et une manière de la calculer. 4. Dans le cas N = 8, interpréter les résultats. Que remarquez-vous sur l'eet croisé A*B*C ? 5. Faire une étude complète du cas N = 64. Comparer avec les résultats de Table 1. Expliquer les diérences de puissances observées. 6. Conclure sur l'in uence des diérents facteurs ? Etudier les réglages optimaux conseillés dans les diérents cas (Table 1 et Table 4). Quel est l'in uence précise sur la qualité du ventilateur ? 7. Que pensez du Tableau 5 ? 2 M2 Pro Ingénierie Mathématique Année 2011-2012 Université d'Angers, Université de Nantes TP d'analyse de variance à 2 facteurs et Analyse de la covariance Exercice préliminaire Véri er les hypothèses du modèle d'analyse de variance des exercices (TD et TP) relatifs aux chapitres 4 et 5. Quand ces hypothèses ne sont pas véri ées, et que le nombre d'observations est faible, on pourra utiliser l'équivalent non-paramétrique de Kruskal et Wallis, pour étudier l'eet des facteurs. Exercice 1 : Anova à deux facteurs On veut étudier l'évolution du poids des rats selon 4 régimes diérents : combinaison de deux types de protéines diérentes (Boeuf et Céréales) et deux quantités diérentes (élevée ou basse). Chaque traitement possède 10 répétitions et on suppose notre échantillon constitué de 40 rats pris au hasard auxquels on donne un traitement au hasard. 1. Importer les données et résumer les variables d'intérêts : >rat<-read.table("weight-R.dat",header=T) >summary(rat) 2. Représenter les données à l'aide d'une boîte à moustache par traitement (croisement des deux facteurs) : >boxplot(Gain~Protein*Amount,data=rat) 3. On peut aussi analyser l'eet des deux facteurs grâce aux graphes suivants : > par(mfrow=c(1,2)) > with(rat,interaction.plot(Protein,Amount,Gain)) > with(rat,interaction.plot(Amount,Protein,Gain 4. Quel est le plus explicite ? Commenter. 5. Réaliser l'analyse de variance du modèle complet et tester l'interaction des deux facteurs : >mod.complet<-lm(Gain~Protein*Amount,data=rat) >anova(modcomplet) Conclure quant à l'hypothèse d'additivité des deux facteurs. 6. On considère le modèle sans interaction. Réaliser la phase d'estimation du modèle : >mod.add<-lm(Gain~Protein+Amount,data=rat) >summary(mod.add) Interpréter les résultats de la matrice Coe cients. Conclure sur l'eet de chacun des fac- teurs. Ces résultats dépendent des contraintes utilisées. Par défaut, R utilise les contraintes α1 = 0 et β1 = 0. 7. Retrouver les résultats de la question précédente en imposant les contraintes P αi = 0 et P βj = 0, ce qui donne : { >mod.add2<-lm(Gain~C(Protein,sum)+C(Amount,sum),data=rat) >summary(mod.add2) 8. On peut préférer xer la contrainte pour réaliser les diérentes analyses de variance. Pour cela, on peut utiliser les commandes suivantes : >options(contrasts=c("contr.sum","contr.sum")) >mod.complet<-lm(Gain~Protein+Amount+Protein:Amount,data=rat) >mod.add<-lm(Gain~Protein+Amount,data=rat) 3 Exercice 2 : Analyse de variance à 3 facteurs Une étude marketing étudie l'impact de 4 campagnes publicitaires (diusées sur des chaînes locales) sur les ventes de lait. Un échantillon de familles a été constitué en tenant compte du lieu d'habitation ainsi que de la constitution de la famille. Les données ( chier "milk.dat") contiennent les consommations en lait (en dollars) après deux mois de campagne dans 4 villes (une par cam- pagne publicitaire), dans 5 régions diérentes, pour 6 tailles de familles diérentes. Après avoir lu et réorganisé les données, étudier les diérentes hypothèses concernant les interac- tions et l'eet de chaque facteur. Exercice 3 : Ancova Le chier "jelly sh.dat" contient la taille, le poids en millimètres de 46 méduses d'Australie provenant de deux sites (Dangar Island et Salamander Bay). Réaliser une régression de la taille en fonction du poids en utilisant le site comme covariable. Considérer le modèle complet, puis le modèle avec une seule pente, puis une seule ordonnée à l'origine. Choisissez le meilleur modèle. Exercice 4 : Ancova à deux variables qualitatives On considère à nouveau le chier "milk.dat", mais cette fois-ci on considère la variable taille comme une variable quantitative. Cela permet d'économiser notablement des degrés de liberté car moins de paramètres sont estimés. Représenter les nuages de points de la consommation en fonction de la taille, en associant une couleur à chaque campagne publicitaire, et un symbole à chaque région. Estimer le modèle complet contenant toutes les interactions et commenter. Estimer les droites de régression pour chaque croisement région×pub. Déterminer la campagne la mieux adaptée à chaque région. 4 uploads/Industriel/ td5-pdf.pdf
Documents similaires










-
31
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Dec 25, 2022
- Catégorie Industry / Industr...
- Langue French
- Taille du fichier 0.0809MB