FICHES MÉTHODOLOGIQUES EN RECHERCHE ET EN RÉDACTION SCIENTIFIQUE Fiche Méthodol

FICHES MÉTHODOLOGIQUES EN RECHERCHE ET EN RÉDACTION SCIENTIFIQUE Fiche Méthodologique n°1 : Comment calculer la taille d’un échantillon pour une étude observationnelle ? Methodological sheet n°1: How to calculate the size of a sample for an observational study? Zineb Serhier1, Karima Bendahhou1, Ahmed Ben Abdelaziz2, Mohammed Bennani Othmani1, Réseau Maghrébin PRP2S* * Réseau- Maghrébin: Pédagogie- Recherche- Publication en Sciences de Santé (PRP2S) 1. Laboratoire Neurosciences cliniques et santé mentale, Université Hassan 2 Casablanca. 2. Laboratoire de Recherche LR19SP01 : « Mesure et Appui à la Performance des Etablissements de Santé » Série des Fiches méthodologiques Sommaire Fiche n°1 (janvier 2020): Comment calculer la taille d’un échantillon pour une étude observationnelle Serhier et al. (Faculté de Médecine et de Pharmacie de Casablanca) Cette série… Le Réseau Maghrébin PRP2S et la Rédaction de la revue « La Tunisie Médicale » ont l’honneur de vous présenter, régulièrement à partir du numéro de janvier 2020, une série des fiches techniques en épidémiologie et en bio statistique. Ces fiches méthodologiques décrivent, d’une manière standardisée, les modes d’usage des concepts, des outils et des méthodes utilisés lors des différentes phases de la rédaction médicale scientifique depuis la phase de la recherche documentaire jusqu’à la phase de le communication médicale scientifique. Cette série est rédigée par des experts de méthodologie de recherche dans les universités du Grand Maghreb et les facultés sœurs au Nord de la Méditerranée. Chaque fiche répond aux trois questions essentielles (Quoi ? Pourquoi ? Comment) du concept étudié, en se basant sur un article publié dans la revue Tunis Med. Le coordinateur de la série « Fiches méthodologiques » Professeur Ahmed Ben Abdelaziz (Président du Réseau Maghrébin PRP2S) ahmedbenabdelaziz.prp2s@gmail.com 1 LA TUNISIE MEDICALE - 2020 ; Vol 98 (01) Correspondance Ahmed Ben Abdelaziz Laboratoire de Recherche LR19SP01 « Mesure et Appui de la Performance des Etablissements de Santé ». Université de Sousse (Tunisie) : كيف احتسب حجم عينة لدراسة قائمة على املالحظة؟1 ورقة منهجية رقم Z. Serhier & al.- Comment calculer la taille d’un échantillon pour une étude observationnelle ? 2 ETUDE DE CAS Dans l’extrait suivant de l’article [1] intitulé « Effets de l’immersion en eau froide sur la récupération physique des jeunes footballeurs », les auteurs décrivent la méthode de calcul du nombre de sujet à inclure dans l’étude. « L’hypothèse nulle a été: H0: m1=m2 et l’hypothèse alternative a été Ha: m1=m2+d où d est la différence entre les deux moyennes et n1 et n2 sont les tailles des échantillons pour deux groupes (IEF et non-IEF) de telle sorte que N=n1+n2. La taille de l’échantillon total a été calculée selon l’équation suivante : N=((r+1)(Zα/2+Z1- β)2s2))/rd2. Zα/2 est la déviation normale à un niveau de signification (=1,96 pour 5% de niveau de signification); Z1-β est la déviation normale à une force 1-β % avec une erreur de type II β % (=1,28 à une puissance statistique de 90%); r (=n1/n2) est le rapport entre la taille des échantillons de deux groupes (r=1 donne une distribution de 1:1 pour les deux groupes); s et d sont l’écart-type et la différence entre les moyennes de temps de course avant et après l’IEF. Ces deux valeurs sont issues d’une étude antérieure qui avait comme objectif principal d’évaluer l’effet de l’IEF (14 °C pendant 5 min) sur la récupération en appliquant une course de 4000 m. Le groupe non-IEF avait des moyennes de temps de course de 18,0 et de 18,9 min, respectivement, avant et après le protocole, avec un écart-type moyen de 0,9. L’injection de ces données dans l’équation prédictive donne un échantillon total de 21 sujets (10 dans chaque groupe). » Quiz : 1. Pourquoi les auteurs ont calculé la taille de l’échantillon avant le début de l’étude ? a. Pour être capable de détecter une différence qui n’existe pas réellement b. Pour assurer une bonne puissance c. Pour augmenter la différence avant et après l’IEF (l’Immersion en Eau Froide) 2. Quelle est la puissance statistique visée par les auteurs ? a. 90 % b. 80 % c. 5 % 3. Quels sont les paramètres qu’ils ont utilisés pour le calcul de la taille de l’échantillon ? a. Le pourcentage de récupération b. La moyenne de la différence attendue et son écart-type c. La distance parcourue et la durée de l’IEF (l’immersion en eau froide) INTRODUCTION Le calcul de la taille de l’échantillon est une étape primordiale dans la réalisation d’un travail de recherche qu’il soit descriptif ou analytique [2]. En effet, afin d’estimer un paramètre avec précision ou détecter une différence avec une puissance adaptée, le calcul de la taille de l’échantillon à priori, s’impose. Une étude épidémiologique réalisée avec un sous-effectif est une perte de temps et de moyens car ne permettra pas d’atteindre l’objectif du travail. Dans certains cas, elle peut être considérée non éthique, notamment dans les études expérimentales car elles exposent les participants aux risques, d’effets indésirables par exemple, sans aucun bénéfice, du moment qu’elles sont incapables de démontrer l’efficacité même si elle existe réellement à cause du manque de puissance [3]. Dans cette fiche méthodologique, nous allons expliquer pourquoi c’est important de calculer la taille de l’échantillon pour une étude observationnelle, c’est quoi le calcul de la taille d’échantillon, une précision et une puissance, et comment peut-on faire ce calcul à l’aide des formules statistiques et des logiciels d’analyse statistique. Nous avons choisi un logiciel libre R (disponible sur: https:// www.r-project.org/) et un logiciel propriétaire Stata pour illustrer ces calculs. POURQUOI ? Calculer le nombre de sujet nécessaire est important car c’est la seule façon qui permet de garantir la précision ou la puissance adéquate selon l’objectif de l’étude, et d’évaluer la faisabilité en termes de temps et de moyens disponibles. Un nombre nécessaire dépassant la capacité de recrutement des patients au niveau d’un centre pendant une durée limitée doit nous pousser à allonger la durée de l’étude ou, à réaliser une étude multicentrique. On peut également accepter une plus faible précision (intervalle de confiance plus large) mais sans que ça nuise à la qualité et à l’interprétation des résultats. La faisabilité est également évaluée selon les moyens financiers disponibles car le budget nécessaire en cas d’examens couteux est d’autant plus élevé que la taille de l’échantillon est grande. Parfois, LA TUNISIE MEDICALE - 2020 ; Vol 98 (n°01) 3 on doit renoncer à l’étude si on n’a pas la possibilité d’atteindre la taille de l’échantillon adaptée. D’autre part, le calcul de la taille de l’échantillon, nous évite des dépenses inutiles en termes de temps et de moyens liés à un recrutement d’un nombre de sujet dépassant celui exigé. QUOI ? Le calcul de la taille de l’échantillon est une méthode qui va nous permettre d’obtenir le nombre minimum de sujets à inclure dans une étude pour garantir, dans les études descriptives une bonne précision, et dans les études analytiques une bonne puissance. La précision est la moitié de la largeur d’un Intervalle de Confiance (IC) c’est-à-dire c’est la distance de part et d’autre de la valeur estimée sur un échantillon définissant l’intervalle qui a une grande probabilité (généralement 95%) de contenir la vraie valeur de la population. Le risque de se tromper dans l’estimation et que la vraie valeur soit à l’extérieur de l’intervalle est alors de 5 % (appelé risque de première espèce alpha). Par exemple, l’estimation de la dépression chez des patients atteints de schizophrénie a trouvé le résultat suivant : 12,7 % avec un IC95% [7,6 %-17,8 %]. Cette estimation a une précision de 5,1 % (12,7 % ± 5,1 %). La fréquence 12,7 % a été observée sur l’échantillon, la vraie prévalence de dépression chez les schizophrènes est très probablement entre 7,6 % et 17,8 %. Si on désire une meilleure précision, c’est-à-dire un intervalle plus étroit on devrait augmenter la taille de l’échantillon, et vice versa si on avait fait l’étude sur un échantillon plus petit, on aurait obtenu un intervalle plus large et l’estimation dans ce cas ne serait d’aucun intérêt. Par exemple, si on a une précision de 10 %, IC95% serait [2,7 %-22,7 %], c’est-à-dire la vraie prévalence de dépression dans cette population de malades serait très probablement entre 2,7 % et 22,7 %. Cette estimation peu précise ne permet pas de se rapprocher de la réalité et n’apporte aucune information. Dans les études analytiques, on vise plutôt une bonne puissance statistique (1-β). La puissance est la capacité de détecter une différence lorsqu’elle existe réellement. Autrement dit, un manque de puissance (β) serait responsable d’un résultat non significatif alors que dans la réalité, la différence existe. La puissance est très liée à la taille de l’échantillon, plus l’échantillon est grand, meilleure est la puissance. Le minimum de puissance accepté pour un travail de recherche est 80 %. COMMENT ? La détermination de la taille de l’échantillon dépend de plusieurs paramètres selon l’objectif de l’étude. Cette détermination peut se faire grâce à des formules statistiques en se basant sur les résultats escomptés. Il faut noter que les données de la littérature sont importantes pour orienter le calcul de la uploads/Geographie/ pdf-vol-98-01-n01.pdf

  • 57
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager