0 UNIVERSITE CATHOLIQUE DE BUKAVU FACULTE DES SCIENCES AGRONOMIQUES Notes de co
0 UNIVERSITE CATHOLIQUE DE BUKAVU FACULTE DES SCIENCES AGRONOMIQUES Notes de cours destinées aux étudiants de BAC2 en sciences agronomiques Mars 2023 Biométrie et Logiciel de traitement des données 1 INTRODUCTION Face aux différents défis de développement, l‟agriculture a une place essentielle à jouer. Un tel objectif appelle à un renforcement des capacités nationales et internationales dans la collecte et l‟analyse d‟informations fiables et actualisées portant sur le secteur agricole. Toutefois, améliorer la qualité des données, s‟assurer de leur validité ou élaborer un cadre effectif pour leur collecte, analyse et diffusion sont des difficultés quotidiennes et répétées pour de nombreux chercheurs. Le résultat des échanges et discussions a montré que l‟organisation des données et leur valeur passent aussi par une meilleure maîtrise des concepts et principes statistiques. La gestion de la qualité scientifique des activités de recherche agricole (une des principales missions de l‟université via sa faculté d‟agronomie) passera par l‟enseignement de la biométrie. Afin d‟appuyer les étudiants dans la conception, la conduite, l‟exploitation et l‟analyse des résultats des travaux de recherche et d‟améliorer ainsi la qualité de futures recherches. Ce cours intitulé « Biométrie, Statistique et Principe d‟expérimentation » est dispensé aux finalistes préparant leurs travaux de fin de cycle. Cette formation se présente davantage comme une initiation à la rigueur que nécessite la manipulation d‟ensembles de données afin d‟utiliser à bon escient les méthodes appropriées pour éviter de faire parler faussement les chiffres. Les concepts et méthodes statistiques seront abordées au travers de nombreux exemples que viendront ponctués des exercices à réaliser. Le cours est maintenant orienté vers certains Logiciels pour encourager les apprenants à utiliser les NTICs dans la collecte, le nettoyage et l‟analyse des données à la place de la méthode traditionnelle (à la main i.e calculette analogique, papier et stylo). 0.1. Définition La statistique est une méthode scientifique qui consiste à réunir des données chiffrées sur des ensembles nombreux, puis à analyser, à commenter et à critiquer ces données. De plus en plus, beaucoup d‟auteurs affirment que la statistique est une science ayant pour objet l'étude quantitative de grands ensembles (Populations), à l'aide de données représentatives (échantillons), le plus souvent incomplètes, et comportant généralement, de ce fait, un caractère d'incertitude. Qu‟est-ce que la Biométrie? La biométrie est la mesure et l'analyse statistique des êtres vivants ou biologiques. Elle est donc la science de la variabilité, des phénomènes qui s’y attachent et des problèmes qui en découlent. Néanmoins, cette science n‟a pas pour objet la connaissance des éléments des ensembles dans ce qui fait leur individualité, mais au contraire dans ce qu‟ils ont en commun : il s‟agit d‟obtenir des résultats globaux. Ainsi, une enquête statistique portant sur des personnes n‟a pas besoin de faire intervenir leurs noms, mais seulement les renseignements que l‟on désire étudier : elle permet de connaître la répartition de ces personnes par âge, par sexe, groupe sanguin … 0.2. Méthodes statistiques Comme dans toute autre branche de la science, la biométrie est basée sur une méthode scientifique familièrement appelée approche induco-déductive. Toute méthode scientifique passe par la formulation d‟hypothèses à partir de faits observés, puis par des cycles successifs de déduction et de vérification. Les faits sont des observations qui sont considérées comme vraies, alors qu‟une hypothèse est une conjecture provisoire concernant le phénomène à l‟examen. Des déductions sont faites à partir des hypothèses, au 2 moyen d‟arguments logiques qui sont eux-mêmes vérifiés par des méthodes objectives. Le processus de vérification peut déboucher sur de nouvelles hypothèses, déductions et vérifications s‟enchaînant dans un long processus au cours duquel émergent des théories, des principes et des lois scientifiques. 1ére étape: On collecte des données : ◊ soit de manière exhaustive (on parle ainsi de recensement lorsqu‟il s‟agit d‟une enquête) ◊ soit par sondage//(échantillonnage). 2 ème étape : On trie les données que l‟on organise en tableaux, diagrammes, et puis on les analyse 3ème étape : On interprète les résultats : on les compare avec ceux déduits de la théorie des probabilités. On pourra donc par ex.: ⇒ évaluer une grandeur statistique comme la moyenne ou la variance (estimateurs, intervalles de confiance). ⇒ savoir si deux populations sont comparables (tests d‟hypothèses). ⇒ déterminer si deux grandeurs sont liées et de quelle façon (ex la corrélation, ajustement analytique). Les conclusions, toujours entachées d'un certain pourcentage d'incertitude, nous permettent alors de prendre une décision. 0.3. Objectif et mise en pratique L'objectif est de répondre à des problèmes décisionnels dans un environnement incertain. Exemples : -Est ce que la taille des hommes et des femmes est différente en RDC? -Les variétés exotiques produisent-elles mieux que les variétés locales ? -Est-ce que l'incidence de la mosaïque africaine du manioc est plus élevée actuellement qu'il y a 20 ans ? -Y a-t-il une différence entre le niveau de vie des populations urbaines et rurales? -La dégradation des sols affecte t‟elle qualitativement et quantitativement les rendements des cultures? De quels éléments dispose-t-on pour répondre à ces différentes questions posées ? En pratique, on ne dispose que d'un échantillon soumis aux fluctuations pour répondre à ces questions. Il faut donc apprendre toute la rigueur du processus d‟échantillonnage pour mieux inférer. L‟inférence en biométrie consiste à généraliser les conclusions de l‟étude statistique faite sur l‟échantillon à la toute la population concernée par l‟étude (i.e. valider l‟hypothèse nulle ou alternative). 0.4. Objectif du cours A la fin du cours, les étudiants seront en mesure de maitriser et ou comprendre : La conduite de la collecte des données L‟analyse de données collectées La critique des modèles, l‟interprétation des données et des calculs ainsi que de la décision Au final, il s‟agira de se familiariser avec et de maîtriser la méthode statistique en vue de décrire, de résumer et d‟analyser une population ou un ensemble de données. Une initiation à l‟utilisation de l‟application Kobo dans la collecte des données et des logiciels Genstat, SPSS et/ou R sera notre point de chute. 0.5. Pré-requis 3 Ce cours est destiné en priorité non seulement aux étudiants ayant déjà eu dans leur cursus académique un cours de statistique descriptive, mais aussi à un public ayant une formation de base en statistique et cependant confronté de façon récurrente à la manipulation et à l‟analyse de séries de données. Aucun autre pré-requis n‟est exigé si ce n‟est la connaissance des opérations mathématiques de base. Pour mieux conduire l‟initiation aux logiciels cités, la maîtrise de base du tableur Excel est supposée acquise. Après, la Volonté, curiosité et ténacité des apprenants permettront de maîtriser sans encombre les notions abordés qui, malgré leur complexité apparente, demeurent relativement simples. 0.6. Vocabulaire Comme toute science, la statistique fait appel à un vocabulaire spécialisé. Ainsi, les ensembles sont appelés populations. Comme un ensemble, une population statistique doit être clairement définie. Les éléments de la population sont appelés individus ou unités statistiques, (que ce soient des hommes ou des automobiles). Population Contrairement à ce qui se dit souvent comme quoi la population est un grand nombre de personnes habitant une région, en statistique ce mot a une signification plus large. Une population est la totalité des unités de n‟importe quel genre pris en considération par les statisticiens. Ex : Des arbres, des hommes, des fermes, des comptes, des champignons, des étangs, des voitures… Une population peut être finie ou infinie selon la détermination du nombre d‟unités qu‟elle renferme. Ainsi par exemple, on peut considérer la population des insectes d‟une espèce donnée dans une région donnée comme une population infinie non seulement parce que les individus en sont difficilement dénombrable mais aussi parce que les mouvements de la population peuvent être beaucoup plus rapides. La partie de la population qui est réellement observée constitue l’échantillon. Échantillon Sous-ensemble d‟une population sur laquelle on effectue une étude statistique Son étude vise généralement à tirer des conclusions relatives à la population dont il est issu Donc l‟échantillon est un sous ensemble de la population étudiée. On décrit un échantillon, autant qu‟une population d‟ailleurs, à l‟aide des mesures comme l‟effectif (n), la moyenne (Ẍ), l‟écart- type, le pourcentage,… Les mesures qu‟on utilise pour décrire une population sont appelées paramètres tandis que celles utilisées pour l‟échantillon s‟appellent statistiques. Sachant que l‟échantillon sert à estimer une population, on peut par analogie dire que les statistiques servent d‟estimateurs d‟un paramètre. Tableau : résumé de quelques paramètres (statistiques) Paramètres/Statistiques Population Echantillon Moyenne µ Ẍ Ẍ Ecart-type ζ s Pourcentage Π p Taille N n Échantillon représentatif S‟il possède les mêmes caractéristiques que la population que l‟on souhaite étudier. Cette représentativité doit surtout se faire sur les caractéristiques pouvant influencer les réponses. 4 Faute de représentativité, les résultats obtenus sur un échantillon ne peuvent être généralisés à la population étudiée. Échantillonnage Ensemble des opérations destinées à former l‟échantillon Théorie de l’échantillonnage Etude des liaisons existant entre une population et les échantillons de cette population, prélevés par sondage. Méthodes d’échantillonnage Ensemble des techniques permettant de réaliser un sondage (de prélever un échantillon de données) au sein d‟une population, de manière à reproduire un échantillon aussi représentatif que possible uploads/Geographie/ cours-de-biometrie-facgro-ucb.pdf
Documents similaires
-
22
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Nov 19, 2021
- Catégorie Geography / Geogra...
- Langue French
- Taille du fichier 2.8510MB