Remerciez-le!

Remerciez @Admin pour avoir partagé cet document gratuitement, de la manière la plus simple, en partageant sur les réseaux sociaux.

Introduction aux tests d’hypothèses LE JUILLET 16, 2015 PAR C.ASSALEDANS OUTILS

Introduction aux tests d’hypothèses LE JUILLET 16, 2015 PAR C.ASSALEDANS OUTILS Introduction : Les tests d’hypothèses dans la vie de tous les jours Il arrive souvent qu’on soit confrontés à des dilemmes malgré les chiffres dont on dispose pour prendre une décision. Par exemple, en comparant le ratio nombre de prospections/ Nombre de clients entre les commerciaux, lequel est le plus efficace ? Imaginons un instant que vous êtes le manager d’un très petit centre d’appel. Vous disposez d’une équipe de deux personnes : Raymond et Huguette (soyons fous !). Huguette a passé 50 appels dans la journée et a gagné 20 clients, quand Raymond lui en a passé 39 et gagné 13. En faisant les ratios, on a 40% (20/50) de taux de conversion pour Huguette et 33.34% (13/39) de taux de conversion pour Raymond. Peut-on conclure qu’Huguette est meilleure que Raymond d’un point de vue conversion de prospects en clients ? Oui ? En êtes vous certains ? Ils peuvent permettre :  De comparer un échantillon obtenu lors d’essais à une population existant. Par exemple, vous réalisez des essais en laboratoire pour étalonner un appareil, et vous avez des résultats d’un benchmark pour comparer  De comparer les résultats obtenus lors d’essais entre deux échantillons différents avec des tailles différentes. Comme dans l’exemple entre Huguette et Raymond  De comparer les résultats obtenus entre plus de deux échantillons lors d’essais : Par exemple, comparer la performance entre plusieurs commerciaux. Comparer plusieurs échantillons de produits entre eux Ces tests sont de deux nature : Ils peuvent être paramétriques ou non paramétriques Définitions des tests paramétriques et non paramétriques: Test paramétrique : Test d’hypothèse réalisé qui suppose que les données à étudier suivent une loi normale. Il faut par conséquent vérifier la normalité des données à étudier. Test non paramétrique : Test d’hypothèse réalisé qui suppose que les donnée à étudier ne suivent pas une loi normale. Un test de normalité ne sert par conséquent à rien dans ce cas. Attention : Les tests paramétriques sont plus robustes que les tests non paramétriques. Veuillez vous servir des tests paramétriques en priorité si vous avez le choix entre les deux ! Avant de donner les grands principes d’un test d’hypothèse, intéressons-nous d’abord à la logique d’ensemble avec des notions de risques α et β . La décision statistique est fonction du niveau de risque qu’on juge acceptable. Ce niveau de risque est librement fixé par le décideur (aidé son statisticien conseil /black belt ). On doit tenir compte des niveaux de risques, car on ne peut pas toujours étudier une population entière. A la place on étudie un échantillon à partir duquel on va tirer des conclusions. On appelle ça réaliser une inférence d’où le terme utilisé de statistiques inférentielles. Définitions des risques α et β (Dans le cas des tests d’hypothèses ) : Un risque α : Est le risque conclure qu’une hypothèse est vraie alors qu’elle est fausse. C’est le risque de première espèce (Détecter une différence statistique qui n’existe pas et qui n’est en fait due qu’à l’échantillonnage choisi) Un risque β : Est le risque de dire qu’une hypothèse est fausse alors qu’elle est vraie. C’est le risque de deuxième espèce (Ne pas détecter du fait de l’échantillonnage une différence statistique qui existe pourtant bel et bien) La puissance d’un test : C’est la probabilité calculée par 1 – β. Note : Il n’y a pas de lien mathématique entre α et β. On doit les choisir en fonction de ce qui est étudié. Notions d’hypothèses statistiques Une hypothèse c’est l’affirmation qu’on va essayer de confirmer ou d’infirmer par le biais d’un test. On appelle H0 (ou hypothèse nulle), l’affirmation à valider (ou pas) par le test, et H1 l’hypothèse opposée qui doit inclure tous les cas non pris en compte dans H0. Exemple d’hypothèse H0 et H1 : Soient H et R les taux de conversion des prospects en clients d’Huguette et Raymond. Cas 1 : On se fiche de savoir si Huguette est meilleure que Raymond. On veut juste savoir s’ils ont la même performance. H0 : H = R (Huguette et Raymond ont la même performance) H1 : H≠ R (Huguette et Raymond n’ont pas la même performance) Cas 2 : On veut valider que la performance d’Huguette est supérieure à celle de Raymond H0 : H≤ R H1 : H>R Notions de test unilatéral et bilatéral Définitions : Test Bilatéral : Un test bilatéral est un test dans lequel il n’y a pas de zone interdite pour sa validation. Dans notre exemple avec Huguette et Raymond, on ne s’interdit pas de trouver que Raymond puisse faire mieux qu’Huguette. L’hypothèse H1 est donc l’exact contraire de l’hypothèse H0 (cas n°1 ) Test unilatéral : C’est un test dans lequel on interdit une zone pour l’étude. Par exemple, lorsqu’on teste un médicament, on veut savoir s’il a de l’effet sur la maladie ou si son effet est nul. On ne veut pas qu’il ait des effets négatifs sur les patients. On ne teste donc pas l’hypothèse avec un effet négatif sur les patients. Exemple de test unilatéral avec Huguette et Raymond : Cas N°2. Moyen mémo-technique combinant H0, H1 et les risques α et β : Processus pour mettre en place un test d’hypothèses : 1. Définir le problème de manière claire et précise: . 2. Déterminer la manière de scinder l’échantillon : Bilatéral ou unilatéral 3. Choisir le niveau de risque α (En général 5%) 4. Sélectionner le test statistique à effectuer 5. Calculer les grandeurs issues du test statistique 6. Comparer les grandeurs calculées aux valeurs critiques du test statistique 7. Conclure Prochainement, bonnes pratiques pour réaliser des tests d’hypothèses, et exemples de tests d’hypothèses. Publicités uploads/Geographie/ introduction-aux-tests-d.pdf