Première année de médecine Biostatistique Riad Benchoucha Ce document est distr

Première année de médecine Biostatistique Riad Benchoucha Ce document est distribué gratuitement 21 octobre 2011 L A T EX Avant-propos Ce modeste ouvrage, conçu comme un simple résumé, a pour objectif de présenter les bases de la statistique aux étudiants de première année de médecine, ainsi qu’à tous ceux qui dans d’autres disciplines, s’intéressent à cette science. C’est en constatant le manque de livres au niveau de notre université, que j’ai décidé d’apporter ma contribution. Tout au long de sa réalisation, j’ai été guidé par le souci de m’adresser à un large public et de présenter les informations de la manière la plus simple et didactique que possible. Je serais bien évidement heureux que les lecteurs me fassent part de leurs suggestions et critiques afin que je puisse améliorer et parfaire cet ouvrage. Je reste pour cela joignable par e-mail (riad47@gmail.com). Riad BENCHOUCHA Étudiant en médecine I Dans ce chapitre 1.1 Vocabulaire de base 1.2 Série statistique 1.3 Représentations graphiques Chapitre 1 Introduction à l’étude de la statistique descriptive La statistique descriptive est la branche des statistiques qui regroupe les nom- breuses techniques utilisées pour décrire, c’est-à-dire de résumer ou représenter, un ensemble relativement important de données. 1 2 Introduction à l’étude de la statistique descriptive 1.1 Vocabulaire de base Population statistique : toute étude statistique porte sur un ensemble appelé population. Les éléments de cette population sont les individus (ou unité statistique). Les premières études statistiques étaient démographiques et on a gardé ce vocabulaire. Échantillon : lorsque la population est nombreuse, on travaille sur un ou plusieurs échantillons. Pour étendre les résultats collectés à l’ensemble de la population, il est important que l’échantillon soit représentatif et non biaisé. Caractère ou variable : lors d’une étude statistique, on s’intéresse à un aspect des individus de la popu- lation appelé variable ou caractère. La variable prend différentes valeurs que l’on appelle modalités. Variable quantitative : si on peut mesurer cet aspect, c’est-à-dire y faire des opérations, la variable est dite de nature quantitative. Exemple : le poids – Si la variable quantitative ne prend que quelques valeurs, dites isolées, elle est discrète. Exemple : le nombre d’enfants – Si la variable quantitative prend n’importe quelle valeur d’un intervalle, elle est continue. Exemple : le poids Variable qualitative : si l’aspect ne se traduit pas par des nombres, ou n’est pas mesurable, la variable est de nature qualitative. Exemple : la couleur des yeux. – Mesurées dans une échelle nominale, les modalités sont exprimables par des noms et ne sont pas hiérarchisées. Exemple : la couleur du pelage, les groupes sanguins, les différents nucléotides de l’ADN. – Mesurées dans une échelle ordinale, les modalités traduisent le degré d’un état caractérisant un individu sans que ce degré ne puisse être défini par un nombre qui résulte d’une mesure. Les modalités sont alors hiérarchisées. Exemple : le stade d’une maladie. 1.2 Série statistique 1.2.1 Modalités et classes A. Variable discrète : Dans le cas d’une variable discrète, les différentes modalités du caractère étudié seront notées x1, x2, x3 , · · · , xi. B. Variable continue : Dans le cas d’une variable continue, on procède à un regroupement par classes. Amplitude d’une classe : l’amplitude, ou l’intervalle d’une classe statistique bornée est sa largeur. L’am- plitude de la classe [a, b[ est b −a. On parle aussi d’étendue d’une classe. Étendu d’une série statistique : l’étendue d’une série statistique est la différence entre les deux valeurs extrêmes prises par un caractère quantitatif, on notera : E = xmax −xmin. Regroupement par classes En règle générale, on choisit des classes de même amplitude. Pour que la distribution en fréquence ait un sens, il faut que chaque classe comprenne un nombre suffisant de valeurs (ni). 1.3 Représentations graphiques 3 Diverses formules empiriques permettent d’établir le nombre de classes pour un échantillon de taille N. Nous utiliserons celle-çi, soit : – k le nombre de classes (k ∈N) ; – N l’effectif total ; – E l’étendue de la série ; – a l’amplitude de la classe. k = √ N ; a = E k Remarque : a ⩾E/k , arrondir supérieurement. 1.2.2 Effectif A. Effectif d’une modalité ou d’une classe L’effectif d’une modalité xi est égal au nombre d’individus qui prennent cette valeur, on le note ni. Les différents effectifs seront notés n1, n2, n3, . . . . . . , ni. B. Effectif total L’effectif total est égal au nombre d’individus de la population, on le note N. On a donc : N = n1 + n2 + n3 + . . . . . . + ni = i X k=1 nk 1.2.3 Fréquence La fréquence d’une valeur est le rapport de l’effectif de cette valeur sur l’effectif total. La fréquence de la modalité xi, notée fi, est donc égale à : fi = ni N 1.2.4 Effectifs ou fréquences cumulés Effectif cumulé croissant : l’effectif cumulé croissant d’une valeur xi est la somme des effectifs des va- leurs inférieures ou égales à xi. Fréquence cumulée croissante : la fréquence cumulée croissante d’une valeur xi est la somme des fré- quences de valeurs inférieures ou égales à xi. Effectif cumulé décroissant : l’effectif cumulé décroissant d’une valeur xi est la somme des effectifs des valeurs supérieures ou égales à xi. Fréquence cumulée décroissante : la fréquence cumulée décroissante d’une valeur xi est la somme des fréquences des valeurs supérieures ou égales à xi. 1.3 Représentations graphiques Les représentations graphiques ont l’avantage de renseigner immédiatement sur l’allure générale de la distribution. Elles facilitent l’interprétation des données recueillies. 1.3.1 Caractère quantitatif discret A. Diagramme en bâtons Il sert à représenter en général un caractère quantitatif discret. La hauteur de chaque bâton représen- tant une valeur est proportionnelle à l’effectif (ou la fréquence) correspondant(e). 4 Introduction à l’étude de la statistique descriptive Remarque : si 0 (zéro) est une modalité du caractère, il est d’usage de décaler l’origine. B. Polygone des fréquences Le polygone des fréquences est obtenu en joignant les sommets des bâtons par une ligne brisée. C. Diagramme cumulatif Le diagramme cumulatif est obtenu en reliant les bâtons cumulés par une ligne en escalier. 1.3.2 Caractère quantitatif continu A. Histogramme Il sert à représenter un caractère quantitatif continu. L’aire de chaque rectangle est proportionnelle à l’effectif (ou la fréquence) de la valeur correspondante. B. Polygone des fréquences Le polygone des fréquences est obtenu en joignant les milieux des sommets des rectangles par une ligne brisée. On joindra les milieux des sommets du premier et dernier rectangle avec, respectivement, les points (a0 −a 2; 0) et (ak + a 2; 0). C. Courbe cumulative La courbe cumulative est obtenue en reliant les points ayant pour abscisse la borne supérieur de la classe et l’ordonnée nic ou fic. On joindra le premier point obtenu avec le point (a0; 0). Remarque : une courbe cumulative bien tracée ne comporte pas de cassures et a une forme en s allongé. 1.3.3 Caractère qualitatif A. Diagramme à bande Le diagramme à bande ou en tuyaux d’orgue sert à représenter un caractère qualitatif (souvent or- dinal), chaque modalité est représentée par une bande de longueur proportionnelle à l’effectif ou la fréquence. Les différentes bandes doivent avoir la même largeur. Pour comparer des séries dans le temps, il suffit de tracer sur le même diagramme des bandes juxta- posées aux premières, d’égales largeurs que ces dernières mais de couleurs différentes. Remarque : les modalité étant non mesurables, on ne met pas de flèche sur l’axe des abscisses. B. Diagramme circulaire Le diagramme circulaire ou à secteurs sert à représenter en général un caractère qualitatif nominal. Chaque secteur angulaire représentant une valeur ou modalité est proportionnel à l’effectif (ou fréquence) correspondant. Remarque : on représente souvent les caractères qualitatifs nominaux par un diagramme à bandes car il est plus facile à dessiner et permet une comparaison dans le temps de plusieurs séries. 1.3 Représentations graphiques 5 Xi Ni 1 2 3 4 5 6 7 8 9 10 FIGURE 1.1 – En bleu le diagramme en bâtons, en noir le polygone des fréquences. Xi Nic 1 2 3 4 5 6 FIGURE 1.2 – En bleu le diagramme cumulatif. 6 Introduction à l’étude de la statistique descriptive FIGURE 1.3 – En couleurs l’histogramme, en noir le polygone des fréquences. Xi Fic 1 2 3 4 5 6 7 8 9 10 1 FIGURE 1.4 – Courbe cumulée. FIGURE 1.5 – Diagramme à bande. Canada USA UK Autres Australie FIGURE 1.6 – Diagramme circulaire. Dans ce chapitre 2.1 Paramètres de position 2.2 Paramètres de dispersion Chapitre 2 Les paramètres statistiques Lorsque l’on est en face d’une série statistique comportant un grand nombre de termes, il devient difficile d’analyser directement l’ensemble des données. Nous avons vu que la représentation graphique permettait d’extraire une cer- taine information. En complément de cette analyse qualitative, le statisticien est amené à simplifier la distribution observée par des caractéristiques ou para- mètres, significatives. Nous distinguerons deux types de caractéristiques : celles de la position et celles de uploads/Sante/ biostatistique.pdf

  • 22
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Fev 04, 2021
  • Catégorie Health / Santé
  • Langue French
  • Taille du fichier 0.6227MB