ADEB I 1ère Année Master Biochimie 2021-2022 Dr. Djemaa DRIS 1 Introduction La
ADEB I 1ère Année Master Biochimie 2021-2022 Dr. Djemaa DRIS 1 Introduction La statistique a envahi aujourd'hui tous les champs scientifiques. Les statistiques, dans le sens populaire du terme, traitent des populations (dans des études démographiques), ce qui est très difficile dans le cas de la Bio-statistique. La statistique constitue, en science, l’outil permettant de répondre à de nombreuses questions qui se posent en permanence. - Le traitement A est-il plus efficace que le traitement B ? - Quelle sont les valeurs normales de grandeurs biologiques (taille, poids, glycémie, ...) ? - Les modifications de poids d’un individu sont-elles liées aux modifications de cholestérolémie ? - Un test de dépistage est-il fiable ? Leur objectif consiste à caractériser une population à partir d'une image plus ou moins floue constituée à l'aide d'un échantillon issu de cette population. On peut alors chercher à extrapoler une information obtenue à partir de l'échantillon. On trouve des applications de la statistique dans tous les domaines : industrie, environnement, médecine, finance, marketing, sport, ... etc. Le programme se compose de trois parties. 1) Généralités et notions de base ; 2) Statistiques descriptives (à une et à deux dimensions) ; 3) Statistiques inférentielles (tests de comparaison : tests paramétriques et non paramétriques). Objectifs de cours Connaître le vocabulaire particulier de la biostatistique ; Comprendre les principes du traitement des données ; Le choix de la méthode statistique opportune à chaque situation particulière ; La réalisation des calculs et des tests de base pour une et deux variables. ADEB I 1ère Année Master Biochimie 2021-2022 Dr. Djemaa DRIS 2 Chapitre I : Généralités et notions de base La Bio-statistique Définition Ensemble de méthodes à partir desquelles on recueille, organise, résume, présente et analyse des données afin d’en tirer des conclusions et de prendre des décisions avec prudence. Notions importantes Parmi les notions importantes nous avons : La variabilité Disposition à varié, qualité de ce qui est variable. La variabilité en biologie est la somme d’une variabilité métrologique et d’une variabilité proprement biologique. Population : Ensemble des individus objets de l'étude, ou Ensembles des éléments ou d’individus de même nature, visés par une problématique scientifique. Elément : Les éléments sont les unités qui composent une population. Synonymes : Objet, individu, unité statistique, unité d’échantillonnage, sujet, événement, comportement,.. Echantillon : C'est un sous ensemble de la population considérée, prélevé pour juger de cet ensemble. Echantillon représentatif : Échantillon qui reflète fidèlement la complexité et la composition de la population. Le tirage au sort ainsi que l’inventaire exhaustif (recensement), sont deux façons d’obtenir un échantillon représentatif d’une population. Caractère statistique (ou variable statistique) C'est ce qui est observé ou mesuré sur les individus d'une population statistique. Ce variable peut être quantitative (numérique) ou qualitative (non numérique). Variable quantitative : C’est un paramètre expérimental qui s’exprime par un nombre. Variabilité totale Variabilité biologique Variabilité métrologique Var. intra-individuelle Var. expérimentale Var. liée à l’appareil de mesure Var. interindividuelle ADEB I 1ère Année Master Biochimie 2021-2022 Dr. Djemaa DRIS 3 Pouvant être classées en variables continue (taille, poids) ou discontinue (discrète) (nombre d’enfants dans une famille, nombre d’œufs pondus par un oiseau). Variable qualitative : Une variable qualitative se caractérise par un ensemble discontinu d’états. Pouvant être classées en variables catégorielles (nominales) (couleurs des plumes des oiseaux) ou ordinales (résistance d’une plante vis-à-vis un ravageur classée en faible, moyenne, importante). Notion d'hypothèse L'hypothèse est une relation hypothétique (provisoire, postulée par le chercheur). On distingue deux formes d'hypothèses : Hypothèse nulle (H0) et Hypothèse significative (H1) ou alternative. Hypothèse nulle (H0): m1 = m2 ou l’absence d’une différence significative entre les moyennes ; Hypothèse alternative (H1): m1 ≠ m2 ou l’existence d’une différence significative entre les moyennes. Seuil de signification En statistique, il n'existe pas de règle rigide permettant de tirer une conclusion concernant les hypothèses ; aucun test ne nous fournit une réponse en terme de oui ou non, mais indique dans quelle mesure nous pouvons être certain de tirer des conclusions ; cette mesure se nomme niveau ou seuil de signification, ou encore probabilité d'erreur. La loi normale Une distribution normale correspond à la distribution de probabilités d'une variable aléatoire conti- nue dont la courbe est parfaitement symétrique et en forme de cloche. Lorsqu'une variable (x) se distribue de telle sorte que les fréquences de ses différentes éventualités suivent la loi normale, alors elle est dite variable normale. Types de test On parle de tests paramétriques lorsque l’on stipule que les données sont issues d’une distribution paramétrée. Dans ce cas, les caractéristiques des données peuvent être résumées à l’aide de paramètres esti- més sur l’échantillon (moyenne, mode et médiane). La distribution des données suit la loi normale. Les tests non paramétriques ne font aucune hypothèse sur la distribution sous-jacente des données (la distribution des données ne suit pas la loi normale). On les qualifie souvent de tests distribution free. ADEB I 1ère Année Master Biochimie 2021-2022 Dr. Djemaa DRIS 4 Chapitre II : Statistiques descriptives II.1. Statistiques descriptives à une dimension Paramètres de position Paramètres de dispersion La moyenne X ou m =1/n ∑ xi L'étendue E= xmax - xmin Le mode (Mo) : C'est la valeur ou classe correspondant à l'effectif (ou fréquence) le plus élevé. La variance S2X = S2X = 1/n ∑ f (xi - x)2 La médiane (Me) : valeur centrale de la série statistique. L’écart-type Sx = Racine carrée de la variance Les quartiles Les quartiles partagent la série en quatre groupes. Le premier quartile : C’est la plus petite donnée de la liste telle qu’au moins un quart des données de la liste sont inférieures ou égales à Q1 = N/4 Le troisième quartile : C’est la plus petite donnée de la liste telle qu’au moins les trois quarts des données de la liste sont inférieures ou égales à Q3 = N× 3/4 Le coefficient de variation C.V. = S/m ×100. 1) CV < 5% : Les valeurs sont très homogènes. 2) 5%<CV< 10% : Les valeurs sont homogènes. 3) 10%<CV< 15% : Les valeurs sont moyennement homogènes. 4) 15%<CV< 30% : Les valeurs sont hétérogènes. 5) CV> 30% : Les valeurs sont très hétérogènes. II.2. Statistiques descriptives à deux dimensions La statistique descriptive à deux dimensions a essentiellement pour but de mettre en évidence les relations existantes entre deux séries d’observations considérées simultanément. II.2.1 La corrélation La corrélation est la netteté ou l’intensité de la relation existante entre deux séries de données. II.2.1.1 Le coefficient de corrélation Pour des variables quantitatives, choisissez le coefficient de corrélation de Pearson ou Spearman. Coefficient de corrélation de Pearson (r)……………………………………………………………………… Rho de Spearman (ρ) ………………………………………………………………………………………….. Propriétés Si le coefficient de corrélation est positif, les points du nuage sont alignés le long d'une droite croissante. Dans ce cas X et Y évoluent dans le même sens (figure 1). Si le coefficient de corrélation est négatif, les points sont alignés le long d'une droite décroissante. Dans ce cas X et Y évoluent dans des sens opposés (figure 1). Si le coefficient de corrélation est nul ou proche de zéro, il n'y a pas de dépendance linéaire (figure 1). ADEB I 1ère Année Master Biochimie 2021-2022 Dr. Djemaa DRIS 5 Figure 1: Exemples de diagrammes de dispersion avec différentes valeurs de coefficient de corrélation. Droite de régression L’idée est de transformer un nuage de point en une droite. Celle-ci doit être la plus proche possible de chacun des points. On cherchera donc à minimiser les écarts entre les points et la droite. Cette méthode vise à expliquer un nuage de points par une droite qui lie y à x (figure 2). y = a.x + b Figure 2: La droite la plus proche possible de chacun des points. Ajustement linéaire L’ajustement linéaire consiste à remplacer le nuage de points par une droite à l’aide d’une équation de la régression. Remarque Le coefficient de corrélation permet de justifier le fait de l’ajustement linéaire. On adopte les critères numériques suivants (voir figure 3). Si | r |< 0,7 ; alors l’ajustement linéaire est refusé (droite refusée). Si | r | ≥ 0,7 ; alors l’ajustement linéaire est accepté (droite acceptée). Figure 3: La zone d’acceptation ou de refus de l’ajustement linéaire. Exemple d’application : La fécondité du poisson Scorpaenichtys marmoratus s’avère être un paramètre fastidieux à définir. Afin de simplifier une étude sur la dynamique de population de cette espèce, le nombre y d’œufs (en milliers) présent chez 11 femelles matures a été compté en relation avec leur poids (kg). Poids X Nbre d’œufs Y 14 61 17 37 24 65 25 69 27 54 33 93 34 87 37 89 40 100 41 90 42 97 ADEB I 1ère Année Master Biochimie 2021-2022 Dr. Djemaa DRIS 6 Analyser les résultats. Résultat………………………………………………………………………………………………………… …………………………………………………………………………………………………………………. ………………………………………………………………………………………………………………… Conclusion…………………………………………………………………………………………………… ………………………………………………………………………………………………………………… Chapitre III : Statistiques inférentielles (Tests de comparaison : Tests paramétriques ou non paramétriques) But : Les statistiques inférentielles, consistant en des tests permettant de confirmer ou infirmer une hypothèse. Hypothèses H0 : m1 = m2 (c'est-à-dire les deux uploads/Geographie/cours-adeb.pdf
Documents similaires










-
28
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Aoû 09, 2021
- Catégorie Geography / Geogra...
- Langue French
- Taille du fichier 0.7608MB