LE COURS DE BIOSTATISTIQUE Xavier Noguès, André Garenne et Virgil Fiévet Enseig
LE COURS DE BIOSTATISTIQUE Xavier Noguès, André Garenne et Virgil Fiévet Enseignants-chercheurs à l’Université de Bordeaux Xavier Bouteiller Biostatisticien au CHU de Bordeaux-IHU Liryc LE COURS DE BIOSTATISTIQUE TOUT EN FICHES LICENCE 3, MASTER, ÉCOLES D’INGENIEURS 2e ÉDITION © Dunod, 2014 5 rue Laromiguière, 75005 Paris www.dunod.com ISBN 978-2-10-070528-9 © Dunod, 2014 5 rue Laromiguière, 75005 Paris www.dunod.com ISBN 978-2-10-070528-9 © Dunod, 2018, 2022 11, rue Paul Bert, 92240 Malakoff www.dunod.com ISBN 978-2-10-084286-5 Illustration de couverture : © Sonja Calovini / fotolia.com V Table des matières Avant-propos IX Comment utiliser cet ouvrage ? XII Remerciements XIV Chapitre 1 Méthodologie de la recherche et vocabulaire de base Fiche 1 Le déroulement d’une recherche 2 Fiche 2 Trois approches complémentaires : approche observationnelle, expérimentation et simulation 6 Fiche 3 Le statut des variables dans la recherche 8 Fiche 4 Les types d’hypothèses au cours d’une recherche 10 Fiche 5 Qu’est-ce qu’une interaction statistique ? 12 Fiche 6 Généralisation du concept d’interaction statistique 14 Fiche 7 Les approches expérimentale et quasi expérimentale 16 Fiche 8 Comment choisir une variable dépendante ? 18 Fiche 9 La conception d’un plan expérimental 22 Fiche 10 Comment neutraliser l’effet des facteurs secondaires ? 26 Fiche 11 Quel plan expérimental faut-il mettre en œuvre ? 28 Fiche 12 Comment constituer un échantillon représentatif ? 32 Fiche 13 Pourquoi les biologistes doivent-ils faire des statistiques ? 34 Focus Méthodologie et éthique lors le l’évaluation de médicaments 36 QCM 39 Chapitre 2 Comprendre les statistiques Fiche 14 Paramètres de positions 42 Fiche 15 Indices de dispersion d’une population 44 Fiche 16 Indices de dispersion d’une population estimés à partir d’un échantillon 48 Fiche 17 Logique de raisonnement des statistiques inférentielles et notion de p-value 50 Fiche 18 Les méthodes de rééchantillonnage 52 Fiche 19 Comprendre le test de comparaison de moyennes « t de Student » 54 Fiche 20 L’utilisation des tables pour le test t de Student 58 Fiche 21 Hypothèses fortes, hypothèses faibles, tests uni- et bilatéraux 60 Fiche 22 Comprendre la notion d’appariement et de mesures répétées 64 Fiche 23 Le théorème central limite et les principales lois de probabilité 66 Fiche 24 Les risques d’erreurs de première et deuxième espèce 70 Fiche 25 L’intervalle de fluctuation et intervalle de confiance 72 Fiche 26 Puissance d’un test et taille minimale d’échantillons 74 Fiche 27 Comprendre la formule de l’analyse de variance à un facteur 76 Fiche 28 Comprendre la covariance et la corrélation 80 Fiche 29 Régression linéaire, coefficient de détermination et analyse de la variance 84 Fiche 30 Les tests non paramétriques 88 Fiche 31 Principe des tests non paramétriques « par rangs » 90 Fiche 32 Le principe du test du c 2 92 Fiche 33 Les analyses multivariées : comprendre l’analyse en composantes principales 96 Focus Comment gérer des valeurs suspectes ? 100 QCM 103 VI Chapitre 3 Notions de base pour utiliser R en statistiques Fiche 34 Les fondamentaux du logiciel R 106 Fiche 35 Création et manipulation de variables 108 Fiche 36 Les variables à deux dimensions 112 Fiche 37 Manipulation des données 115 Fiche 38 Principes de mise en œuvre des tests statistiques dans R 118 Fiche 39 Principe d’utilisation des bibliothèques (packages) 121 Fiche 40 Fonctions graphiques de base 122 Fiche 41 Comment tracer des courbes avec R 124 Fiche 42 Graphiques statistiques avec R 126 Fiche 43 L’écriture de programmes et de scripts 129 Fiche 44 L’utilisation des boucles 132 Fiche 45 Créer ses propres fonctions 134 Focus Quelques pistes pour accélérer l’exécution d’un code R 136 QCM 141 Chapitre 4 Clés de choix de tests et méthodes pluri-catégorielles Fiche 46 Clé : étude de l’effet de facteurs sur une seule variable dépendante quantitative 144 Fiche 47 Clé : questions posées sur un échantillon unique 146 Fiche 48 Clé : étude de l’effet d’un facteur unique sur une seule variable dépendante exprimée en rangs 147 Fiche 49 Clé : étude de l’effet d’un facteur unique sur une seule variable dépendante qualitative 148 Fiche 50 Clé : étude des relations entre quelques variables observées ou dépendantes 150 Fiche 51 Clé : plusieurs variables observées, analyses multivariées 151 Fiche 52 La distribution des données suit-elle une loi normale ? 152 Fiche 53 Vérification de normalité en ANOVA et régression 156 Fiche 54 Transformations mathématiques de variables sans perte d’information 158 Fiche 55 Transformations en rangs 160 Fiche 56 Transformation en classes ou en modalités 162 Fiche 57 Normalisation : centrage et réduction 164 Fiche 58 La procédure de comparaisons planifiées et les corrections de Bonferroni et de Sidak 166 Fiche 59 La taille de l’effet 170 Focus Choisissez les bons tests statistiques, pour sauver le monde ! (Jeu en « Scenario Based Learning ») 173 QCM 177 Chapitre 5 Les tests paramétriques pour analyses univariées Fiche 60 Comment comparer une moyenne observée à une moyenne théorique ? 180 Fiche 61 Le test t de Student pour échantillons indépendants et la correction de Welch 182 Fiche 62 Le test t de Student pour échantillons appariés 186 Fiche 63 L’analyse de variance à un facteur pour échantillons indépendants et le test de Tukey 188 Fiche 64 Les tests de comparaisons multiples 192 Fiche 65 L’analyse de variance à un facteur en mesures répétées 194 Fiche 66 La condition de sphéricité en ANOVA en mesures répétées 196 Fiche 67 L’ANOVA pour plans factoriels équilibrés 198 Fiche 68 L’ANOVA vue comme un modèle linéaire 202 Fiche 69 L’ANOVA pour plans hiérarchisés 204 Fiche 70 L’ANOVA pour plans mixtes (modèle III) 206 VII Fiche 71 L’ANOVA à plusieurs facteurs pour plans déséquilibrés 210 Fiche 72 La régression linéaire simple 214 Fiche 73 La régression linéaire multiple (RLM) 216 Fiche 74 Comment gérer de nombreux facteurs en RLM : les régressions par pas 220 Fiche 75 La régression par les moindres carrés partiels 224 Fiche 76 Les modèles linéaires généralisés (GLM) 228 Fiche 77 Modèles linéaires généralisés sur données binaires : la régression logistique 232 Fiche 78 L’ANCOVA 236 Fiche 79 GLM binomial avec variable concomitante 238 Fiche 80 Comment comparer deux variances : le test de Snedecor 240 Fiche 81 Les tests d’hétérogénéité de variances 242 Focus L’esprit des lois 246 QCM 249 Chapitre 6 Les tests non paramétriques pour analyses univariées Fiche 82 Le test U de Mann-Whitney 252 Fiche 83 Le test de Kruskal-Wallis 256 Fiche 84 Le test T de Wilcoxon 258 Fiche 85 Le test de Friedman 260 Fiche 86 Quels tests post hoc utiliser après un test sur les rangs 262 Fiche 87 Les PERMANOVA 264 Fiche 88 Le test du c 2 sur table de contingence 266 Fiche 89 Le calcul de probabilité exacte (CPE) de Fisher 268 Fiche 90 Comment comparer une proportion observée à une proportion théorique 270 Fiche 91 Comment comparer plusieurs proportions indépendantes 272 Fiche 92 Comment comparer des proportions en échantillons appariés : le test Q de Cochran 276 Fiche 93 Comment comparer deux distributions empiriques : le test de Kolmogorov-Smirnov 278 Fiche 94 Comment comparer une distribution empirique à une distribution théorique 280 Fiche 95 Les tests d’asymétrie et d’aplatissement 284 Focus La librairie {dplyr} pour vous faciliter le travail 286 QCM 289 Chapitre 7 Les analyses multivariées Fiche 96 Le coefficient de corrélation de Pearson et le coefficient de détermination 292 Fiche 97 Les corrélations de rangs 294 Fiche 98 Les coefficients de corrélations partielles 298 Fiche 99 Comparaison de deux coefficients de corrélations de Pearson 300 Fiche 100 Analyse de variance multivariée (MANOVA) 302 Fiche 101 L’algorithme des k-moyens 304 Fiche 102 Le positionnement multidimensionnel non métrique 308 Fiche 103 La classification ascendante hiérarchique (CAH) 312 Fiche 104 L’analyse en composantes principales (ACP) : la préparation des données 316 Fiche 105 L’ACP : choix du nombre d’axes à conserver 320 Fiche 106 L’ACP : interprétation de l’espace factoriel 322 Fiche 107 L’ACP : l’analyse des individus 324 Fiche 108 L’ACP : variables supplémentaires 326 Fiche 109 L’ACP : individus supplémentaires 328 Fiche 110 L’analyse factorielle des correspondances (AFC) 330 Fiche 111 L’analyse des correspondances multiples (ACM) 334 Fiche 112 Les variables supplémentaires en ACM 338 Fiche 113 La CAH sur résultats d’analyse factorielle 340 Fiche 114 L’ACP non paramétrique 344 Fiche 115 L’analyse de Hill-Smith 346 Fiche 116 L’analyse factorielle discriminante (AFD) 350 Focus {ggplot2} et autres trucs pour faire de beaux graphiques 355 QCM 359 Exercices 361 Corrigés 373 Index 379 VIII IX Avant-propos Un grand nombre de personnes aiment remplir des grilles de mots croisés ou de sudokus, nous pensons que le même plaisir peut être pris en apprenant les statistiques. 1. À qui cet ouvrage s’adresse-t-il ? En premier lieu, cet ouvrage s’adresse aux étudiants en licence de biologie, des filières de la santé à l’écologie, mais le programme traité est également assez proche de celui dispensé en sciences humaines. Il s’adresse également aux étudiants de master dans ces disciplines, même si la couverture de l’ensemble des programmes aurait conduit à la rédaction d’un traité plutôt que d’un manuel. L’étudiant en biologie classique (biochimie, neurosciences, physiologie animale et uploads/Science et Technologie/ feuilletage-2734.pdf
Documents similaires
-
12
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Jul 28, 2022
- Catégorie Science & technolo...
- Langue French
- Taille du fichier 2.0883MB