Statistique descriptive TALHI. R Service de Biostatistique, Faculté de Médecine

Statistique descriptive TALHI. R Service de Biostatistique, Faculté de Médecine d’Oran Année Universitaire 2020-2021 Plan du cours I- Introduction II- Les concepts de base III- Les tableaux statistiques IV- Les représentations graphiques V- Bibliographie I-Introduction La statistique descriptive est définie comme un ensemble de méthodes permettant de décrire et d'analyser, de façon quantifiée, des phénomènes repérés par des éléments nombreux, de même nature, susceptibles d'être dénombrés et classés. La distribution statistique représente des observations classées selon le ou les caractères étudiés. Cette distribution est présentée sous forme de -tableaux statistiques, -graphiques ou -Sous forme numérique: moyennes, prévalence, incidence… II-Les concepts de base Population Désigne l’ensemble des entités ou des individus qui font l’objet de l’étude. L’ensemble de toutes les observations concernant le caractère de l’étude (constitué d’un nombre d’individu qui peut être élevé). Exemple: Décès- Accidents- Malades- Enfants âgés de moins de 5 ans Echantillon C’est une partie (sous-ensemble) de la population dont l’effectif ( la taille) est très réduit et qui permet d’effectuer l’étude. Individu ou unité statistique Ce sont les éléments qui constituent l’échantillon et la population. Unité de base sur laquelle on réalise un certain nombre de mesures. Exemple: une personne, un ménage, une ville… En langage statistique ; le mot individu peut aussi désigner un objet… Série statistique Une série ou distribution statistique est un ensemble d’observations d’un caractère donnée. Exemple: les malades suivis dans un service hospitalier et inclus dans l’étude peuvent constituer une série statistique. Caractères et variables Dans une population, par exemple celle des étudiants d’une faculté, les unités sont repérées par le nom et le prénom (liste)des étudiants. Si l'on souhaite étudier cette population, on va retenir certains critères d’étude comme la filière, l’âge, la taille, le poids, la nationalité, le groupe sanguin… Parmi ces critères, certains sont quantitatifs et d’autre sont qualitatifs. Afin de différencier les deux type de critères, les critères qualitatifs sont appelés des caractères et les critères quantitatifs des variables. Modalités d’un caractère On désigne par modalités les différentes catégories d’un caractère qualitatif, et on qualifie de valeurs les différents chiffres d’une variable. Exemple: Caractère: sexe Modalités: masculin, et féminin. Un caractère est dit qualitatif quand ses différentes modalités échappent à la mesure. Exemple : couleur des yeux, profession, nationalité, groupe sanguin… Nominal: Les classes sont prédéfinies, nommées mais pas ordonnées. Exemple: le sexe, le groupe sanguin… Ordinal : Les classes peuvent être ordonnées selon une échelle de valeurs Exemple: le niveau d’instruction, la forme clinique d’une maladie… Le caractère qualitatif Un caractère est dit quantitatif quand ses différentes modalités sont mesurables (exprimées par des chiffres). Exemple : taille, poids, nombre d’enfants par famille… Variable stat. continue Elle prend toutes les valeurs appartenant à son intervalle. Exemple: la glycémie Variable stat. discontinue (discrète) Elle ne peut prendre que des valeurs isolées. Exemple: nombre d’individu par ménage Le caractère quantitatif Unités individuelles et unités groupées Les unités d’une population, que le critère soit qualitatif ou quantitatif , peuvent être présentées individuellement ou regroupées. Le regroupement peut être effectué par modalités, par valeurs ou par classes de modalités ou classes de valeurs. On distingue: Le regroupement par classes de valeurs d'amplitudes égales , et Le regroupement par classes d'amplitudes inégales. Une des méthodes empiriques pour la détermination des classes d'amplitudes égales : • Nombre de classes : N = n (n = effectif de l’échantillon) • Étendue : e = limite supérieure de la série – limite inférieure de la série • Amplitude : k = Étendue / Nombre de classes (k = e/n) Exemple: n = 50 limite supérieure de la série = 91 kg limite inférieure de la série = 30 kg Alors N = 50 = 7 classes e = 91 – 30 = 61 kg k = 61/7 = 8,71 → k = 9 kg Les classes de poids (kg) 30 – 39 40 – 49 50 – 59 60 – 69 70 – 79 80 – 89 90 – 99 Le centre de classe (xicc ) est la valeur située au milieu de la classe, il est égal à la limite inférieure de la classe + la limite supérieure de la classe divisé par deux. Dans l’exemple précédent; le centre de la 1ére classe est de 34,5 Kg → (30+39) / 2 = 34,5 Kg. III-Tableaux statistiques Le caractère d’une population peut être présenté par un tableau ,appelé tableau statistique des données. Les observations sont résumées dans ce tableau où le nombre de dimensions est en liaison avec les modalités du caractère étudié. Principe de base : -Un tableau (ou un graphe) doit être simple , compréhensible -Un tableau (ou un graphe) doit avoir : - un titre clair et explicite (englobant les trois caractéristiques; de temps, de lieu et de personnes), - un numéro, et - une référence (source). Tableau n°1 : Profil de la pathologie observée dans une consultation de médecine à Oran durant l’année 1997 Modalités du caractère ( pathologie observée) xi Effectifs (fréquences absolues) ni Fréquences relatives fi ( % ) (fi = ni /n) Pathologie ORL Intoxications Pathologie traumatique Pneumopathie Dermatoses Divers 153 102 204 510 255 51 12 8 16 40 20 4 Total n = ni= 1275 fi=100 Source: CHU d’Oran. Caractère Qualitatif Nominal Nombre d’enfants xi Nombre de familles ni Fréquences relatives fi (%) Fréquences Cumulées fi cum (%) 0 1 2 3 4 5 6 7 4 5 10 16 18 14 7 6 5 6 13 20 22 18 9 7 5 11 24 44 66 84 93 100 Total 80 100 Tableau n°2 : Nombre d’enfants par famille Caractère Quantitatif Discontinu Tableau n° 3 : Les pesées de 50 nouveau-nés. Poids (Kg) xi Effectifs ni 2.0 - 2.5 2 2.5 - 3.0 4 3.0 - 3.5 6 3.5 - 4.0 30 4.0 - 4.5 8 TOTAL 50 Caractère Quantitatif Continu IV-Les représentations graphiques Les Représentations Graphiques Les représentations graphiques représentent l'image synthétique des données (information) présentées dans un tableaux statistique Une présentation graphique est souvent plus facile à comprendre qu’une présentation numérique. Le choix d’un type de graphe dépend de la nature des données du problème posé, et du caractère à présenter. . Recommandations: Le graphique doit toujours être présenté clairement et respecter les normes suivantes : - Un titre clair et explicite, - Un numéro, - Des axes - Des unités de mesure -Une échelle de chaque axe - La source des données Caractère Qualitatif Diagramme en barres (tuyaux d’orgue)→cqo Figure 1 : Distribution des formes cliniques d’une maladie dans une série de 941 malades 0% 10% 20% 30% 40% obstétrique chir. Géné. pb médicaux cardiologie traumato. gynécologie cancer ophtalmo pb psychiatrie Figure 2: Demande en soins selon la spécialité Source : M.F. Mesli et all.Le recours aux soins: Résultats d’une enquête épidémiologique menée à Oran en mars 2002 in Journal Algérien de Médecine, janv-fev 2004, N°90, vol X Diagramme en barres horizontales →cqn Diagramme en bâtons (segments de droite)→cqn Figure 3: Répartition par nationalité des habitants du Grand-Duché de Luxembourg en 2001(source Statec) Allaitement exclusif 41% Allaitement mixte 59% n = 303 Représentation en secteurs ( en camembert )→cqn Figure 4 : Mode d’allaitement à 3 mois Caractère Quantitatif Histogramme → vqc discrétisée Figure 5: Distribution du poids chez 80 sujets adultes Polygone de fréquence →vqc Figure 6: Répartition par classe d’âge d’un échantillon de 245 hypertendus de la Wilaya d’El Tarf en 2013. Diagramme en bâtons (segments de droite)→vqd Figure 8: ………………. 0 10 20 30 40 50 60 70 80 90 100 38 42 46 50 54 58 62 Courbe des effectifs cumulés croissants (Sigmoïde)→vqc Figure 7: Courbe cumulative de la taille des membres inférieurs de 58 garçons. Pyramide → distribution par âge et par sexe d’une population Figure 10 : Pyramide des âges - Population française en 1999 V- Bibliographie • Mesli MF, Mokhtari A. Biostatistique. Édition mai 2007 • Cuggia M. Biostatistique descriptive. Université de Rennes 2006- 2007 • Mazerolle F. Statistique descriptive. Gualino éditeur, Paris 2006. • Ancelle T. Statistique Épidémiologie. Édition 2002 • Dabis F, Drucker J, Moren A. Épidémiologie d’intervention. Édition 1992 • Schwartz D. Méthodes statistiques.1992 NB: Les références soulignées sont recommandées pour tous les cours du module de Biostatistique. uploads/s3/ statistique-descriptive-2020-2021 1 .pdf

  • 35
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager