Mondher Abrougui Biostatistique « I » ISEFC - 2008 1 INSTITUT SUPERIEUR DE L’ED

Mondher Abrougui Biostatistique « I » ISEFC - 2008 1 INSTITUT SUPERIEUR DE L’EDUCATION ET DE LA FORMATION CONTINUE Département Biologie – Géologie SN101/1 " BIOSTATISTIQUE - 1 " Cours & Activités : Mondher Abrougui Année Universitaire - 2008 Mondher Abrougui Biostatistique « I » ISEFC - 2008 2 PLAN DU COURS - BIOSTATISTIQUE BIOSTATISTIQUE 1 = L1 : Statistiques descriptives à une ou deux variables BIOSTATISTIQUE 2 = L2 : Statistiques inférentielles à une ou deux variables BIOSTATISTIQUE 3 = L3 : Statistiques multifactorielles descriptive et inférentielles BIOSTATISTIQUE 1 STATISTIQUES DESCRIPTIVES À UNE OU DEUX VARIABLES CHAPITRE I. ELEMENTS DE STATISTIQUE ET DE BIOSTATISTIQUE 1. INTRODUCTION A LA STATISTIQUE 2. OBJECTIF DES MODULES DE BIOSTATIQUE 2.1. Le module biostatistique I : Statistiques descriptives 2.2. Le module biostatistique II : Statistiques inférentielles 2.3. Le module biostatistique III : Statistiques multifactorielles descriptive et inférentielle 3. DEMARCHE GENERALE EN STATISTIQUE 3.1. L’identification du problème 3.2. Le recueil des données 3.3. L'analyse et l'interprétation des données 4. NOTIONS DE BASE ET TERMINOLOGIE 4.1. Ensemble / Population / Echantillon / Elément / Individu 4.2. Recensement / Echantillonnage 4.2.1. Le recensement 4.2.2. L’échantillonnage 4.3. Caractère / Modalité / Variable: 4.3.1. Le caractère 4.3.2. Modalité / Mesure 4.3.3. Tableau élémentaire 4.3.4. La variable statistique 4.3.5. Nature des variables statistiques et échelles de mesures 4.3.5.1. Variable quantitatif. 4.3.5.2. Variable qualitative 4.3.5.3. Exemple d’illustration des principaux types de descripteurs 4.3.6. Variables dépendantes et indépendantes 4.3.6.1. Les variables indépendantes 4.3.6.2. Les variables dépendantes 4.3.7. La variabilité et l'incertain en biologie 4.3.7.1 La variabilité biologique 4.3.7.2 La variabilité métrologique 4.3.8. Propriétés des variables 4.4. Inférence et risque statistique 4.5. Une définition plus explicite de la biostatistique : 4.6. Dénomination mathématique : Mondher Abrougui Biostatistique « I » ISEFC - 2008 3 5. REPRESENTATION DES DONNEES 5.1. Tableaux statistiques 5.2. Représentations graphiques et statistique descriptive 5.2.1. L’histogramme 5.2.1.1. L’histogramme : paramètres de description (mode et symétrie) 5.2.2. Barre à moustache - Box Plot 6. STATISTIQUES DESCRIPTIVES UNIVARIEES 6.1. Paramètre de position et valeurs centrales 6.1.1. Le mode, ou valeur dominante 6.1.2. La moyenne 6.1.2. 1. Calcul de la moyenne par changement d’origine et d’unité. 6.1.2.2. Autres indicateurs de moyenne : 6.1.3. La médiane et la classe médiane 6.1.3.1. Définition générale : 6.1.3.2. Médiane, pour les données rangées 6.1.3.3. Médiane, pour les données condensées 6.1.3.4. Médiane, pour les données réparties par classes 6.1.4 Quantiles : Mesures de position statistique en référence à la médiane 6.1.4.1. Définition des quantiles 6.1.4.2. Les quartiles 6.1.4.3. Les déciles 6.1.4.4. Les centiles 6.1.4.5. Calculs des quantiles 6.1.4.5.1. Détermination des valeurs de la variable à partir d’un rang centile données. 6.1.4.5.2. Détermination du rang centile à partir d’une valeur donnée de la variable. 6.1.5. Moyenne et médiane 6.1.6. Avantages et inconvénients des différentes valeurs centrales : 6.2. Paramètre de dispersion 6.2.1. Les paramètres de dispersion absolue 6.2.1.1 L’étendue de la variation 6.2.1.2. Quartile et intervalle interquartile : Mesures de la dispersion statistique en référence à la médiane 6.2.1.2.1. L'intervalle interquartile 6.2.1.2.2. L'intervalle inter-décile 6.2.1.3. Mesures de la dispersion statistique en utilisant l’écart semi-interquartile 6.2.1.4. Mesures de la dispersion statistique en référence à la moyenne arithmétique 6.2.1.4.1. Ecart absolu moyen ou Ecart Moyen Absolu « EMA » 6.2.1.2.2. Variance et écart-type : 6.2.2. Les paramètres de dispersion relative 6.3 Exercices d’Applications avec explicitation et utilisation du logiciel Excel 6.3. Paramètres de forme 6.3.1. Coefficient d’asymétrie et de dérive 6.3.1.1. Coefficient d’asymétrie 6.3.1.2. Coefficient de dérive 6.3.2. Coefficient d’aplatissement PARTIE EXERCICES CHAPITRE II Mondher Abrougui Biostatistique « I » ISEFC - 2008 4 ETUDE DE DEUX VARIABLES STATISTIQUES - SERIE STATISTIQUE DOUBLE - 1. PRESENTATION D’UNE SERIE A DEUX VARIABLES 2. GENERALISATION DES REPRESENTATIONS 3. CALCUL DES FREQUENCES D’UNE STATISTIQUE A DEUX VARIABLES 3.1. Fréquences relatives partielles 4. CALCUL DES MOYENNES MARGINALES D’UNE STATISTIQUE A DEUX VARIABLES 5. COVARIANCE 6. COEFFICIENT DE CORRELATION 7. DROITE DE REGRESSION OU D’AJUSTEMENT 7.1. Importance de l’étude de corrélation entre 2 variables statistiques 7.2. Droite de régression linéaire CHAPITRE III. INFORMATIQUE ET STATISTIQUE : Pré-requis, mise à niveau et apprentissages 1. INFORMATIQUE : PRE-REQUIS ET MISE A NIVEAU 1.1. Matériels et interfaces utiles 1.2 Pré requis 1.3 Mise à niveau théorique et pratique 2. APPRENTISSAGES INFORMATIQUE ORIENTE STATISTIQUE 2.1. Gestion de données numérique et de tableau sur Word et Excel 2.2. Gestion de calculs et de formules statistique dans Excel 2.3. Gestion et élaboration de calcul statistique sur Excel 2.4. Gestion et élaboration de représentations graphiques sur Excel 2.5. Utilisation et insertion de Macro dans Excel 2.6. Représentation de séries et calculs statistique (tableau et graphique) 2.7. Ajustement linéaire de séries chronologiques avec et sans variations saisonnières. 2.8. Présentation et principe de logiciel d’analyse de donnée statistique 2.9. Utilisation Excel et présentation d’ XLSTAT comme outil pour statistique descriptive APPLICATIONS ET TRAVAUX DIRIGES EXERCICES APPLIQUES : STATISTIQUES ET INFORMATIQUE PLANCHE D’ACTIVITES QUELQUES STATISTICIENS LEXIQUE FRANÇAIS / ANGLAIS BIBLIOGRAPHIE Mondher Abrougui Biostatistique « I » ISEFC - 2008 5 CHAPITRE I. ELEMENTS DE STATISTIQUE ET DE BIOSTATISTIQUE 1. INTRODUCTION A LA STATISTIQUE Statistique : le terme statistique désigne à la fois : 1) l'ensemble des données numériques concernant une catégorie de faits (sens très ancien). Il s'agit de l'expression dans sa signification la plus usuelle. 2) l'ensemble des méthodes mathématiques permettant : a) de résumer quantitativement l'information recueillie sur un ensemble d'éléments au moyen d'une investigation exhaustive. C'est la statistique descriptive, qui fait l'objet de ce cours. b) de généraliser à de grands ensembles d'éléments les conclusions tirées des résultats obtenus avec des ensembles beaucoup plus restreints appelés échantillons. C'est la statistique inférentielle ou probabiliste, qui sera brièvement explicitée dans ce module et plus explicitée dans les modules de Biostatistique II et III. Les statistiques ont pour origine le besoin des États pour gérer rationnellement leurs ressources. Pour cela, il était nécessaire après collecte d'informations (nécessité de techniques de quantification ; production de données nombreuses, organisées en tableaux) de disposer de méthodes permettant de définir les variations, les évolutions, les ressemblances ou les différences entre régions, entre années, entre catégories. Exemple de problèmes : Dénombrement des populations humaines : recensements Dénombrement des terres et leur répartition. Calcul et répartition des impôts. Ces techniques se sont mises en place grâce au développement du calcul des probabilités au 18ème siècle; puis, au 19ème siècle grâce à l’émergence des méthodes statistiques. Il s'agissait au départ de l'étude méthodique des faits sociaux par des procédés numériques : classements, dénombrements, inventaires chiffrés, recensements, destinés à renseigner et à aider les gouvernements dans leurs prises de décisions. À partir de 1843, la statistique désigne l'ensemble de techniques d'interprétation mathématique appliquées à des phénomènes pour lesquels une étude exhaustive de tous les facteurs est impossible, à cause de leur grand nombre ou de leur complexité. Les statistiques s'appuient sur les probabilités et sur la loi des grands nombres. La statistique vise à décrire, à résumer et à interpréter des phénomènes dont le caractère essentiel est la variabilité. Elle fournit de la manière la plus rigoureuse possible des éléments d'appréciation utiles à l'explication ou à la prévision de ces phénomènes, mais elle n'explique ni ne prévoit aucun d'entre eux (Vigneron 1997). La méthode statistique permet également d'éprouver la validité de résultats (obtenus, mesurés, collectés) en fonction même de leur variabilité, dans les domaines où les variations sont la règle, c'est-à-dire les domaines de la biologie sensu lato, dans celui des sciences de l'environnement également. La méthode statistique fournit de ce fait à tous les personnels confrontés à l'interprétation de résultats d'observation ou d'expérimentation, un outil d'interprétation adapté aux conditions particulières de leur domaine d'activité. Mondher Abrougui Biostatistique « I » ISEFC - 2008 6 L'attrait des chiffres tient dans la croyance que la mensuration est le critère primordial de toute étude scientifique (Francis Galton (1822-1911)). Cette fascination répond à l'idée que ce que nous voyons et mesurons dans le monde n'est que la représentation superficielle et imparfaite d'une réalité cachée. Il faut se méfier de cette tendance qui veut que les mesures abstraites résumant de grands tableaux de données doivent exprimer nécessairement quelque chose de plus réel et de plus fondamental que les données elles-mêmes. Tout statisticien doit faire un effort pour contrebalancer cette tendance. C'est pourquoi toute interprétation statistique doit préciser clairement quelles données (population, échantillon), et quelles hypothèses ont été utilisées pour aboutir à un certain type de conclusion. 2. OBJECTIF DES MODULES DE BIOSTATIQUE L’enseignement de la biostatistique est subdivisé en 3 modules : Biostatistique I, Biostatistique II et Biostatistique III. Ces trois modules complémentaires ont pour objectifs de permettre aux étudiants de développer des compétences qui leur permettront : - d’acquérir et de parfaire la connaissance des principales notions relatives à l’utilisation des méthodes statistiques, - de résoudre des questions empiriques par l’utilisation des tests statistiques, - de maîtriser et de compléter les notions de bases des statistiques en vue de les appliquer à des exemples spécifiques aux sciences biologiques, prises dans leur sens général (biologie, médecine, pharmacie, écologie…) - d’appliquer ces notions et méthodes sur des données biologiques à partir de logiciels simples - d’utiliser des logiciels de uploads/Geographie/ bio-statistique.pdf

  • 31
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager