FGMGP COURS PLAN D’EXPERIENCES 2020/2021 4 Notions de statistique appliquées au

FGMGP COURS PLAN D’EXPERIENCES 2020/2021 4 Notions de statistique appliquées aux plans d’expériences 4-1 Moyenne Par définition, la moyenne arithmétique d’un ensemble de valeurs est la somme de toutes les valeurs divisées par le nombre de valeurs. Ici, la moyenne arithmétique est égale à : ´ Y=1 n∑ i=1 n Y i 4-2 Écart-type L’écart type est une mesure de la dispersion des valeurs par rapport à la moyenne σ=√∑ i=1 n ¿¿¿¿¿ On prend la racine carrée pour exprimer la dispersion dans la même unité que les données d’origine et la moyenne. 4.3 Population Supposons que nous fassions plusieurs mesures dans les mêmes conditions expérimentales. Nous obtenons une suite de valeurs qui sont proches les unes des autres mais qui sont légèrement différentes. Imaginons que nous poursuivions les mesures jusqu’à en obtenir une infinité. L’ensemble de toutes ces valeurs forme une population de grandeurs aléatoires caractérisée par : – la valeur centrale des mesures, appelée moyenne de la population et notée µ ; – l’écart-type de la population, noté σ population, – la distribution. 4.3 Échantillon D’un point de vue statistique, obtenir un échantillon de n valeurs, c’est tirer au hasard n valeurs dans la population de toutes les valeurs possibles. Un échantillon de n valeurs est caractérisé par : – la valeur moyenne des mesures ; soit un échantillon de n réponses, yi ; la moyenne ´ Y est calculée grâce à la relation : : ´ Y=1 n∑ i=1 n Y i – l’écart-type de l’échantillon, noté σ échantillon ; – l’histogramme des valeurs. Mme N.AZOUAOU Page 18 FGMGP COURS PLAN D’EXPERIENCES 2020/2021 Un histogramme est une représentation graphique de l’ensemble de toutes les valeurs de l’échantillon. En abscisse on porte les limites de classe et en ordonnée le pourcentage qu’on attribue à la classe dans l’échantillon. – La meilleure estimation de la moyenne de la population, c’est la moyenne de l’échantillon : Meilleure estimation de µ =´ Y de l’échantillon. – La meilleure estimation de l’écart-type de la population est notée par la lettre s. Elle est donnée par la relation : s = Meilleure estimation de σ population = √∑ i=1 n ¿¿¿¿¿ 4.4 Degrés de liberté Soit n réponses mesurées indépendamment les unes des autres. Il n’y a donc que n − 1 écarts indépendants. On dit que la série des n écarts à la moyenne possède n − 1 degrés de liberté (ou ddl). Le nombre de degrés de liberté est important car il intervient dans de nombreuses formules de statistique. 4.5 Distribution Au fur et à mesure que l’on ajoute des valeurs à un échantillon, on obtient un histogramme de plus en plus régulier et, pour un nombre infini de valeurs, c’est-à dire pour une population, on a une répartition qui s’appelle une distribution. Il est possible de décrire la distribution d’une population par une relation mathématique. Par exemple, la distribution la plus souvent rencontrée dans les plans d’expériences est la distribution normale ou distribution de Laplace- Gauss. Cette distribution est illustrée par une courbe ayant l’aspect d’une cloche et elle est définie par la relation : f (Y )= 1 σ population√2π e (Y −μ) 2 2σ population 2 - Il a été démontré que 68 % des valeurs de la population sont comprises entre moins un écart-type et plus un écart-type autour de la moyenne de la population. - 95 % des valeurs de la population sont comprises entre moins 2 écart-type et plus 2 écart- type autour de la moyenne de la population. - Enfin dans l’intervalle µ ± 3σ population, il y a 99,7 % des valeurs de la population. 2. Analyse statistique des résultats Mme N.AZOUAOU Page 19 FGMGP COURS PLAN D’EXPERIENCES 2020/2021 2.1. Test de Fisher L’objectif de l’analyse globale des résultats est de définir la qualité descriptive du modèle au moyen d’un tableau d’analyse de la variance (tableau ANOVA). Pour ce faire, plusieurs grandeurs doivent être préalablement définies. Soit SCT la somme des carrés totale, c’est-à- dire la somme des carrés des écarts entre les mesures de la réponse et leur moyenne :   n 2 i=1 SCT= i-y y  (I.4) Cette somme peut être décomposée en deux sommes, SCM, la somme des carrés due à la régression ou variation expliquée par le modèle et SCE, la somme des carrés des résidus ou variation inexpliquée par le modèle : SCT SCE SCM   (I.5) SCM est la somme des carrés des erreurs entre les réponses estimées et la moyenne des réponses mesurées :   n 2 i=1 SCM= i ˆ -y y  (I.6) SCE est la somme du carré des écarts entre les réponses mesurées et estimées :   n 2 i=1 SCE= i i ˆ -y y  (I.7) On effectue alors le test de Fisher. Fcal est une valeur calculée d’une valeur F de Fisher, à (p-1) et (n - p) degrés de liberté. On calcule le ratio : Fcal= SCM p−1 SCE n−p (I.8) En pratique, le modèle utilisé contient un terme constant ao, correspondant à la moyenne des réponses mesurées. Cette composante n’étant d’aucun intérêt dans l’analyse de la variance, elle est supprimée et donc on prend (p-1) degré de liberté pour le modèle de régression. Pour réunir ces informations, on utilise le tableau de la variance suivant : Mme N.AZOUAOU Page 20 FGMGP COURS PLAN D’EXPERIENCES 2020/2021 Tableau I.1. Analyse de la variance (ANOVA). Source de variation ddl Variation Carré moyen Fisher Régression p-1   n 2 i i=1 ˆ -y y    n 2 i i=1 p-1 / ˆ -y y      n 2 i i=1 n 2 i i=1 p-1 n-p i / ˆ -y y / ˆ -y y   Résiduelle n-p   n 2 i i=1 i ˆ -y y    n 2 i i=1 n-p i / ˆ -y y  Totale n-1   n 2 i i=1 -y y  On note Fcrit (p–1, n– p) la valeur critique au seuil α d’une loi de Fisher à (p–1) et (n–p) degrés On note Fcrit (p–1, n– p) la valeur critique au seuil α d’une loi de Fisher à (p–1) et (n–p) degrés de liberté avec une probabilité α si : Fcal>Fcrit (p-1 ; n-p) 2.1. Analyse statistique des coefficients (Test de Student) Les différents paramètres du modèle peuvent aussi être analysés statistiquement. L’hypothèse nulle (H0) est alors étudiée pour chacun des coefficients, selon laquelle ceux-ci sont nuls. Pour ce faire, la statistique tcal qui dépend de l’estimation de l’écart type de ai, σ (ai) est alors calculée : i i cal a = t σ(a ) (I.9) i σ (a ) : Ecart type des coefficients   n 2 i i i=1 i ˆ -y y 1 σ(a ) = n n - p              (I.10) Pour réaliser ce test au seuil α, il faut comparer la valeur de t de Student avec la valeur critique d’un Student à (n–p) degrés de liberté. On utilise une table de Student à (n–p) degré de liberté, α étant choisi, on lit dans cette table de Student la valeur t critique (α, n–p). On rejette Ho lorsque tcal > tcrit. Mme N.AZOUAOU Page 21 FGMGP COURS PLAN D’EXPERIENCES 2020/2021 Si l’hypothèse H0 est acceptée, cela veut dire que l’effet en question n’est pas, au risque de 0,05, significativement différent de «0» et donc que la variable qui lui est associée n’a pas d’influence sur la réponse. 2.1. Coefficient de détermination (R²) Le coefficient de détermination R² est à la fois la fraction des variations de la réponse expliquée par le modèle et un indice de la qualité de la régression : 2 SCM SCE R = = 1- SCT SCT (I.11) R² = 1, indique un ajustement parfait, par contre un R² qui vaut 0 indique l’absence de relation entre la variable dépendante et la variable explicative. Cependant, dans le contexte de la régression multiple, cela pose le problème de la paramétrisation du modèle. Plus l’on ajoute de variables explicatives, plus le R2 augmente. Pour éviter ce phénomène, on calcule le coefficient de détermination ajusté : 2 ajusté SCE n-p = 1- R SCT n-1 (I.12) La qualité du modèle sera donc d’autant meilleure que R2 ajusté sera proche de 1. Mme N.AZOUAOU Page 22 FGMGP COURS PLAN D’EXPERIENCES 2020/2021 Rappels sur les matrices 1.4. Matrice identité On appelle matrice identité d’ordre n, la matrice carrée dont les éléments de la diagonale sont égaux à 1 et tous les autres sont égaux à 0. on la note In. I 3=[ 1 0 0 0 1 0 0 0 1] I3 est une matrice identité d’ordre 3 2.6. Matrices inversibles Soit A une matrice carrée d’ordre n. On dit que la matrice A est inversible s’il existe une matrice carrée B d’ordre n telle que : A × B = In. Remarque: Si on admet sous les uploads/Geographie/ analyse-statistique-m2-plan-d-x27-experiences.pdf

  • 26
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager