Mise en œuvre d'études en statistique descriptive : méthode et outils Dr Jean-C

Mise en œuvre d'études en statistique descriptive : méthode et outils Dr Jean-Charles DUFOUR jean-charles.dufour@univ-amu.fr SESSTIM (Sciences Economiques & Sociales de la Santé & Traitement de l'Information Médicale) UMR 912 1 UE-STATS : Statistiques Orthophonie (2 & 3ème année) Orthoptie (2ème année) Date mis à jour : 04/12/2014 Plan du cours Nos pauvres cerveaux ont-ils vraiment besoin des stats? Qu’est ce qu’une étude descriptive Notion d’individus Admettons que oui : comment s’y prendre ? Les étapes de la mise en œuvre d’une étude descriptive Passage à l’acte : les grands principes à respecter pour construire un questionnaire et une base de données 2 3 Pourquoi faire une étude descriptive 4 5 Que pouvez-vous dire à propos de ces individus Masculin brun 49 ans Masculin roux 25 ans Féminin roux 83 ans Féminin brun 100 ans Masculin blond 12 ans Masculin brun 99 ans Féminin roux 7 ans Féminin roux 41 ans Masculin brun 62 ans Féminin blond 28 ans Masculin roux 62 ans Féminin blond 28 ans Masculin brun 96 ans Féminin brun 47 ans Masculin blond 78 ans Masculin chauve 37 ans Féminin blond 36 ans Masculin brun 55 ans Féminin brun 32 ans Masculin blond 53 ans Féminin brun 84 ans Masculin brun 81 ans Masculin brun 3 ans Masculin blond 71 ans Féminin brun 15 ans Masculin brun 14 ans Masculin roux 95 ans Féminin brun 26 ans Masculin brun 78 ans Féminin blond 18 ans ♂ ♀ ♂ ♂ ♂ ♂ ♂ ♂ ♂ ♂ ♂ ♂ ♂ ♂ ♂ ♂ ♂ ♂ ♀ ♀ ♀ ♀ ♀ ♀ ♀ ♀ ♀ ♀ ♀ ♀ 7 sexe cheveux âge Que pouvez-vous dire à propos de ces individus statistiques Qu’est-ce qu’une étude descriptive ? C’est une étude qui décritcertaines caractéristiquesd’un groupe d’individus Décrire : c'est en fait résumer par des grandeurs statistiques (moyennes, médianes, modes, écarts-types, …) ou représenter par des graphiques (histogrammes, nuages de points, …) des données disponibles pour chacun des individus Paradoxe ? : la description du groupe passe d’abord par le recueil d’informations à un niveau individuel 8 Qu’est-ce qu’une étude descriptive ? Ce que notre cerveau ne sait pas faire seul … les statistiques descriptives peuvent l’y aider 9 Qu’est-ce que n’est pas une étude descriptive ? La statistique descriptive se limite à analyser des observations : elle à pour but de décrire ce qui est, et non de tester des hypothèses La statistique inférentiellepermet de déduire (avec une certaine marge d’erreur) des caractéristiques d'une population en partant de données décrites seulement sur un échantillon de cette population 10 Mise en œuvre d’une étude descriptive Plusieurs étapes 1) Formulation du problème 2) Choix d’une méthodologie et élaboration du design de l’étude 3) Collecte les données 4) Préparation et analyse des données 5) Rédaction du rapport d’étude 11 1) Formulation du problème 12 Questionnement initial non-formalisé Question scientifique formalisée : Problème(s) à décrire, hypothèse(s) à vérifier observations cliniques lectures échanges avec des pairs recherche bibliographique avis experts 2) Méthodologie et design de l’étude Définition de la population à décrire Echantillon vs Toute la Population Critères d’inclusion / critères d’exclusion Caractéristiques des individus statistiques (détermination des variables) Type d’étudedescriptive : Itération : • Ponctuelle (ou transversale) : recueil unique • Longitudinale: recueils répétés Distance temporelle avec l’événement observé : • Prospective • Rétrospective 13 3) Collecte des données : sources des données Données primaires observations, entretiens individuels, sondages structurer correctement les données colligées (questionnaires ad hoc et base de données) Données secondaires préexistantes (ex: dossiers de soins, PMSI, INSEE, ….) bien connaitre le contexte et le mode de recueil initial 14 3) Collecte des données : modalité de recueil Enquêtes et interrogatoires ciblés Par téléphone En face-à-face Par correspondance Par internet Observation systématique Par le sujet lui-même ou par un observateur externe Observation automatisée / mécanique Analyse de traces (numériques par exemple) 15 3) Collecte des données : points clés Étape à coupler, si possible, avec la construction correcte de la base de données Choix techniques et organisationnels pratiques ++ Objectif majeur = conserver et organiser de manière cohérente les données colligées 16 4) Préparationet analyse des données La préparation est plus ou moins importante/facile en fonction de la qualité de la base de données A minima : quelques regroupement de données (calculs sommes, moyennes,…) quelques vérifications (ex: erreurs de saisies, changements d’unités, …) Peut tourner au cauchemar : base mal conçue, mal structurée variables mal pensées saisie non contrôlées/non-guidées 17 4) Préparation et analyse des données Analyse descriptives fait appel aux méthodes vues dans les cours précédents : Regroupements, calculs de grandeurs statistiques (moyennes, variances, écarts-types, quantiles, …) Tableaux de contingences et de présentation des données Représentations graphiques (histogramme, diagramme en secteurs, nuages de points,…) 18 5) Rédaction du rapport d’étude Sort du cadre de ce cours … …maisdoit exposer clairement les étapes 1 à 4 vues précédemment ! 19 20 Comment colliger les données… …et constituer la base de données Schéma classique (données primaires / questionnaire ad hoc) 21 Observations (individus statistiques) Questionnaire papier Questionnaire électronique Ressaisie Base de données extractions Analyses descriptives Conception du formulaire C’est un sujet en soi : seules quelques notions sont énoncées ici ! Organisation du questionnaire Présentation du questionnaire et de l’étude Questions introductives et qualifiantes Questions spécifiques Questions d’identification Remerciements ! 22 Conception du formulaire Règles de base pour la formulation des questions 1. Traiter un point unique par question 2. Formulations précises et concises 3. Utiliser un langage simple et adapté 4. Rester neutre dans la formulation 5. Éviter les exemples et les généralisations 6. Éviter les questions reposant sur la mémoire 7. Utiliser des questions filtres 23 Conception du formulaire 4 types d’objectif pour les questions : questions d’introduction questions destinées à collecter de l’information questions de vérification questions destinées à masquer l’objectif de l’étude 24 Conception du formulaire 2 grands types de structure pour les questions : questions ouvertes (ou non structurées) questions fermées (ou structurées) –à privilégier pour les études descriptives 25 Pourquoi utilisez-vous principalement vous internet ? Quel est votre sexe ? Masculin Féminin Choix multiples / réponse unique Combien de carrés voyez-vous ? Pas de choix imposé mais réponse unique (numérique) Conception du formulaire questions fermées (ou structurées) –à privilégier pour les études descriptives 26 Quels sports pratiquez vous ? Judo Tennis Football Ski Yoga Danse Pétanque Sieste (en compétition) Choix multiples / réponses multiples Ce cours est génial : Pas du tout d'accord Pas d'accord Ni en désaccord ni d'accord D'accord Tout à fait d'accord Choix multiples / réponse unique ordonnée (ici échelle de Likert) Conception du formulaire Toujours faire un pré-test du questionnaire (sur un petit échantillon représentatif) afin de détecter : des questions mal rédigées des modalités de réponses inadaptées ou ambiguës des problèmes de questions filtres des réponses incohérentes entre elles … Faire également un traitement statistique du pré-test : détection des erreurs de saisies potentielles détection variables trop souvent manquantes/ incomplètes détection variables ayant une trop faible variance vérification de la faisabilité des analyses envisagées … 27 Constitution de la base de données 28 Base de données et statistiques Constitution et gestion de la base doivent faire partie du processus de l’étude Des données médiocres et/ou médiocrement gérées : Compromettent les analyses Conclusions erronées Gaspillage (temps, argent, travail, …) 29 Paradigme«Garbage In –Garbage Out» Perfect Model Garbage Result Garbage Model Garbage Result Garbage Data Perfect Data 30 Avant de se lancer…se questionner ! Quelles sont les finalités ? Objectif principal Objectifs secondaires Quels sont les critères de jugement et comment les mesurer ????????? 31 Avant de se lancer…se questionner ! Quelles sont les «typesobjets» et quels sont les éléments d’informations qui les caractérisent ? Parmi ces éléments quels sont ceux à prendre en compte (et ceux à oublier) ????????? 32 33 Résister à la tentation de tout collecter ! 34 Mieux vaut des variables bien choisies, préalablement identifiées par rapport à votre objectif et dont vous pourrez contrôler la qualité ! Base de données : principes essentiels Informations organisées dans 1 ou plusieurs tables Table est composée de ligneset de colonnes Ligne = enregistrement, observation Colonne = variable, attribut, champ, élément d’information 1 Enregistrement = 1 Ligne Nom Prenom DateNaiss Sexe Rogne Olive 18/05/1922 M Dézieux Jacqueline 26/02/1942 F Greux Nadine 06/09/1967 F Valeur de la variable « Sexe » pour le 1er enregistrement = une donnée 35 Table « Patient » Chaque enregistrement doit avoir un identifiant unique (numéro, code alphanumérique, …) : Permet de désigner facilement et de manière certaine un et un seul enregistrement Permet de faciliter l’anonymisation IDPatient P1 P2 P3 Base de données : principes essentiels Nom Prenom DateNaiss Sexe Rogne Olive 18/05/1922 M Dézieux Jacqueline 26/02/1942 F Greux Nadine 06/09/1967 F 36 Base de données : principes essentiels En théorie, autant de tables que de «types d’objets» 37 Table « Bilan » IDPatient Nom Prenom DateNaiss Sexe P1 Rogne Olive 18/05/1922 M P2 Dézieux Jacqueline 26/02/1942 F P3 Greux Nadine 06/09/1967 F Table « Patient » IDBilan DateBilan HemoGb Creat TP B1 18/07/2014 12,8 194 60 B2 12/08/2014 uploads/Sante/ statistiques-descriptives-methode-et-outils.pdf

  • 15
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Jan 19, 2022
  • Catégorie Health / Santé
  • Langue French
  • Taille du fichier 1.8910MB