1 Chapitre Les tests d’hypothèses 1. Principe des tests statistiques Dans le de
1 Chapitre Les tests d’hypothèses 1. Principe des tests statistiques Dans le dernier chapitre, le problème de l’estimation a été formulé ainsi : il existe un paramètre θ inconnue d’une population (moyenne, variance, proportion, …) ou d’une loi de probabilité que l’on veut estimer à partir d’un échantillon, sans idée a priori sur la valeur de ce paramètre. En théorie des tests, au contraire, une hypothèse sur le phénomène étudié, sur la valeur du paramètre, est énoncée. Confirmer cette hypothèse, ou au contraire l’infirmer, sur la base des résultats d’un échantillon est un problème de test statistique. Les tests statistiques constituent alors un autre un autre aspect important de l’inférence statistique. Le principe général d’un test d’hypothèse peut s’énoncer comme suit : soit une population dont les éléments possèdent un caractère (mesurable ou dénombrable) et dont la valeur du paramètre, relative au caractère étudié, est inconnue. Une hypothèse est formulée sur la valeur du paramètre ; cette formulation résulte des considérations théoriques, pratiques ou encore elle est simplement basée sur un pressentiment. Il est évident que la statistique (Variable d’échantillonnage) servant d’estimation aux paramètres de la population ne prendra pas une valeur rigoureusement égale à la valeur théorique proposée dans l’hypothèse ; elle comporte des fluctuations d’échantillonnage qui sont régies par des distributions connus. La construction d’un test d’hypothèse consiste effectivement à déterminer entre quelles valeurs peut varier la statistique, en supposant l’hypothèse vraie, sur la seule considération du hasard de l’échantillonnage. Les distributions d’échantillonnage d’une moyenne, d’une variance et d’une proportion que nous avons traité précédemment vont être particulièrement utile dans l’élaboration d’un test statistique. 2. Définitions 2.1. Hypothèse Statistique Une hypothèse statistique est un énoncé (une affirmation) concernant les caractéristiques (valeurs des paramètres, forme de la distribution des observations) d’une population. 2.2. Test d’hypothèse Un test d’hypothèse (ou test statistique) est une démarche qui a pour but de fournir une règle de décision permettant, sur la base des résultats d’échantillon, de faire un choix entre deux hypothèses statistiques. 2.3. Hypothèse Nulle (H0) et Hypothèse Alternative (H1) L’hypothèse selon laquelle on fixe a priori un paramètre de la population à une valeur particulière s’appelle l’hypothèse nulle ou encore l’hypothèse privilégiée est noté H0. 2 N’importe qu’elle autre alternative est appelé hypothèse adverse (ou encore hypothèse alternative ou contre hypothèse) et elle est notée H1. 2.4. Seuil de signification d’un test Statistique Le risque, consenti à l’avance et qu’on note « α », de rejeter à tort l’hypothèse nulle H0 alors qu’elle est vraie (et de favoriser alors l’hypothèse) alternative H1) s’appelle le seuil de signification du test et s’énonce en probabilité comme suit : vraie est H H Accepter P vraie est H H jeter P I Type Erreur P 0 1 0 0 / / Re α est la probabilité de rejeter à tort H0, est le risque d’erreur de premier espèce. vraie est H H Accepter P fausse est H H Accepter P II Type Erreur P 1 0 0 0 / / β est la probabilité d’accepter à tort H0, est le risque d’erreur de deuxième espèce. 2.5. Région Critique « W » et région d’acceptation de H0 1- La région de rejet ou région critique W La région de rejet de l’hypothèse H0 ou région critique W est le sous ensemble des réalisations de l’échantillon qui conduisent à rejeter l’hypothèse H0, c’est-à-dire les valeurs n x x x ,..., , 2 1 telles que : si W x x x n ,..., , 2 1 , alors on rejette H0. 2- La région d’Acceptation W La région d’Acceptation W (complémentaire de W) de l’hypothèse H0 est le sous ensemble des réalisations de l’échantillon qui conduisent à ne pas rejeter l’hypothèse H0, c’est-à-dire les valeurs n x x x ,..., , 2 1 telles que : si W x x x n ,..., , 2 1 , alors on ne rejette pas H0. 2.6.Fonction Puissance La fonction puissance, Π(θ),d’un test de H0 est la probabilité de rejeter H0 lorsque la vraie valeur du paramètre est θ. Pour des hypothèses simples : 0 1 1 1 0 0 : : H H On a : EI P 0 et 1 1 1 EII P 1 1 est appelée la puissance du test. Actions Etats Accepter H0 Rejeter H0 H0 est vraie Bonne décision (1-α) Erreur de Premier Espèce (α) H0 est fausse Erreur de Deuxième Espèce (β) Bonne décision (1-β) Exemple : Une population normale admet une variance 4 2 . Déterminer la probabilité β pour les hypothèses simples : 1 : 0 : 1 0 H H à un seuil de signification α = 0.05 pour un échantillon de taille n = 10. Calculer alors la puissance du test. 3 3. Test Uniformément le plus puissant : « La méthode de Neyman et Pearson » La méthode de Neyman et Pearson, très utilisée pour construire un test, se situe dans le contexte suivant : le test est effectué entre deux hypothèses simples : pour une taille d’échantillon déterminée, on se fixe une valeur α du risque de premier espèce et on détermine la région critique qui minimise le risque de deuxième espèce β, ou maximise la puissance du test. Le théorème de Neyman et Pearson fournit la réponse à ce problème. Soit n x x x ,..., , 2 1 un échantillon de taille « n » issu de , x f et θ0 et θ1 deux valeurs fixes de θ. La fonction Vraisemblance de n x x x ,..., , 2 1 est donnée par : n i i n x f x x x L 1 2 1 , , ,..., , . S’il existe une constante positive « k » et un sous-ensemble W de l’ensemble de réalisation telles que : 1- 0 2 1 , ,..., , W x x x P n . 2- k x L x L 1 0 , , pour W x x x n ,..., , 2 1 . 3- k x L x L 1 0 , , pour W x x x n ,..., , 2 1 . Alors W est la meilleur région critique de niveau α pour tester l’hypothèse nulle H0 : θ = θ0 contre l’hypothèse alternative H1 : θ = θ1. Exemple : Soit n x x x ,..., , 2 1 un échantillon de taille « n » issu d’une loi de poisson de paramètre λ, P . Déterminer la meilleure région critique pour tester : 4 : 2 : 1 0 H H . Calculer alors « α » pour n = 4 et k = 13. 4 4. Test d’une moyenne ou d’une espérance mathématique Le problème le plus courant est celui du test d’une moyenne. Le contexte est le suivant : Soit X une Variable Aléatoire et n x x x ,..., , 2 1 un échantillon de X ; on s’intéresse au paramètre réel X E . 4.1. Test d’une moyenne μ dans le cas où l’écart-type σ est connu 1- La variable X suit une loi Normale a- Dans le test Unilatéral droit de niveau α de 0 1 0 0 0 : ) ( : H ou H La région de rejet de H0 est : n z X WD 0 . b- Dans le test Unilatéral gauche de niveau α de 0 1 0 0 0 : ) ( : H ou H La région de rejet de H0 est : n z X WG 0 . c- Dans le test bilatéral de niveau α de 0 1 0 0 : : H H La région de rejet de H0 est : n z X n z X W 2 0 2 0 ; . Exemples : 1. Une population normale admet une variance 4 uploads/Geographie/ chapitre-v-tests-d-x27-hypotheses.pdf
Documents similaires










-
52
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Jul 04, 2022
- Catégorie Geography / Geogra...
- Langue French
- Taille du fichier 0.7491MB