TPE DE STATISTIQUE AGRICOLE THEME : Rédigé par : Enseignant : Mr KAMKANG NDADA

TPE DE STATISTIQUE AGRICOLE THEME : Rédigé par : Enseignant : Mr KAMKANG NDADA ALEX Année scolaire : 2021/2022 1 REPUBLIQUE DU CAMEROUN Paix- Travail-Patrie ******* MINISTERE DE L’ENSEIGNEMENT SUPERIEURE ******* UNIVERSITE DE MAROUA ******* ECOLE NATIONALE SUPERIEURE POLYTECHNIQUE DE MAROUA ******* DEPARTEMENT DE SCIENCES ENVIRONNEMENTALES REPUBLIC OF CAMEROON Peace-Work-fatherland ******* MINISTRY OF HIGHER EDUCATION ******* UNIVERSITY OF MAROUA ******* NATIONAL ADVANCED SCHOOL OF ENGINEERING OF MAROUA ******* DEPARTMENT OF ENVIRONMENTAL SCIENCES LA CLASSIFICATION HIERACHIQUE ASCENDANTE ET DESCENDANTE Noms et Prénoms Matricules MOUSSA ABDOU 21D0572EP NGONGANG TCHOUKAM RUTH 21D0574EP INTRODUCTION Classifier, c'est regrouper entre eux des objets similaires selon tel ou tel critère. Les diverses techniques de classification (ou d'"analyse typologique", de "taxonomie", ou "taxinomie" ou encore "analyse en clusters" (amas)) visent toutes à répartir n individus, caractérisés par p variables X1, X2, ..., Xp en un certain nombre m de sous-groupes aussi homogènes que possible. On distingue deux grandes familles de techniques de classification : Les classifications non hiérarchiques ou partitionnements, aboutissant à la décomposition de l'ensemble de tous les individus en m ensembles disjoints ou classes d'équivalence ; le nombre m de classes est fixé à l'avance. Le résultat obtenu est alors une partition de l'ensemble des individus, un ensemble de parties, ou classes de l'ensemble I des individus telles que : - toute classe soit non vide - deux classes distinctes sont disjointes - tout individu appartient à une classe. Les classifications hiérarchiques : pour un niveau de précision donné, deux individus peuvent être confondus dans un même groupe, alors qu'à un niveau de précision plus élevé, ils seront distingués et appartiendront à deux sous-groupes différents. Le résultat d'une classification hiérarchique n'est pas une partition de l'ensemble des individus. C'est une hiérarchie de classes telles que : - toute classe est non vide - tout individu appartient à une (et même plusieurs) classes - deux classes distinctes sont disjointes, ou vérifient une relation d'inclusion (l'une d'elles est incluse dans l'autre) - toute classe est la réunion des classes qui sont incluses dans elle. Remarques. Ces méthodes jouent un rôle un peu à part dans l'univers des méthodes statistiques. En effet : - L'aspect inférentiel est ici inexistant ; - Il existe un grand nombre de variantes de ces méthodes, et on peut être amené à appliquer plusieurs de ces méthodes sur un même jeu de données, jusqu'à obtenir une classification "qui 2 fasse sens" ; - Au contraire des méthodes factorielles, l'accent est souvent mis sur les n individus et non sur les p variables qui les décrivent. 3 I. CLASSIFICATION HIERACHIQUE ASCENDANTE 1. Choix des variables représentant les individus Une première étape consiste à choisir une mesure de la "dissimilarité" ou "distance" entre les sujets. Mais, les variables de départ (Taille en cm, Poids, ...) s'expriment avec des unités différentes et prennent leurs valeurs sur des échelles difficilement comparables. Nous choisissons donc de représenter les individus à l'aide des variables centrées réduites associées aux variables de départ (en utilisant l'écart type corrigé comme dénominateur) : TAI VIT DET PAS LEG STA I1 -1,1125 1,3473 1,5025 0,9702 1,1665 0,5535 I2 -0,0056 -0,7615 -0,7446 0,9702 -1,0845 - 0,9793 I3 1,1013 -0,9724 -0,6643 1,5023 -0,9514 0,0426 I4 -0,8106 1,1364 0,9407 1,2120 1,1423 0,5535 I5 -1,1125 1,3473 0,9407 -0,2392 1,2391 1,0644 I6 -0,6093 0,7146 1,1012 -0,2876 0,9124 0,8090 I7 -1,1125 0,5038 0,9407 -0,4810 1,3964 -1,2347 I8 -1,3137 1,3473 1,4222 -0,9648 1,2028 -2,0011 I9 -1,5150 1,3473 1,4222 -1,4485 1,2028 -1,7456 I10 -0,0056 -1,3941 -0,8248 1,0669 -0,4673 -1,2347 I11 0,4975 -0,1289 -0,2630 1,2120 -0,3705 -0,2129 I12 -0,1062 0,0820 -0,6643 -0,4810 -0,2857 0,2980 I13 0,3969 -0,3398 -0,6643 -0,0941 -0,5278 1,0644 I14 1,1013 -0,7615 -0,8248 -0,7229 -1,0240 0,5535 I15 1,0007 -0,5506 -1,0656 -0,8197 -0,9877 0,2980 I16 1,1013 -0,5506 -1,2261 -1,2067 -0,6246 0,8090 4 I17 1,1013 -0,9724 -0,6643 -1,2067 -1,0966 0,2980 I18 1,4032 -1,3941 -0,6643 1,0185 -0,8424 1,0644 2. Choix d'un indice de dissimilarité ou distance entre individus Chaque individu statistique est ici représenté par 6 "coordonnées", à savoir les valeurs des variables centrées réduites associées aux 6 variables TAI, VIT, DET, PAS, LEG, STA. Pour évaluer la dissimilarité entre les individus, nous utiliserons la distance euclidienne. Autrement dit, si les coordonnées des individus Ii et Ij sont données par : (xi1, xi2, xi3, xi4, xi5, xi6) et (xj1, xj2, xj3, xj4, xj5, xj6), on a : d(Ii,I j ) = (xi1 - x j1)2 + (xi2 - x j 2)2 + (xi3 - x j 3)2 + (xi4 - x j 4)2 + (xi5 - x j 5)2 + (xi6 - x j 6)2 Ainsi, la distance entre les sujets I1 et I2 est donnée par : d(I1,I2) = (−1,1125 + 0,0056)2 + (1,3473+ 0,7615)2 + ...+ (0,5535 + 0,9793)2 = 4,2588 Le tableau des distances mutuelles entre sujets est ainsi donné par : I1 I2 I3 I4 I5 I6 I7 I8 I9 I1 0 I1 1 I1 2 I1 3 I1 4 I1 5 I1 6 I1 7 I18 I1 0, 00 4, 26 4, 47 0, 71 1, 43 1, 59 2, 53 3, 21 3, 36 4, 48 3, 30 3, 40 3, 75 4, 74 4, 75 4, 89 4, 99 4,7 8 I2 4, 26 0, 00 1, 62 3, 80 4, 42 3, 84 3, 74 4, 57 4, 81 0, 93 1, 43 2, 26 2, 44 2, 54 2, 45 3, 11 2, 77 2,5 7 I3 4, 47 1, 62 0, 00 3, 93 4, 66 4, 02 4, 55 5, 52 5, 76 1, 87 1, 31 2, 65 2, 16 2, 30 2, 41 2, 92 2, 72 1,2 5 I4 0, 71 3, 80 3, 93 0, 00 1, 58 1, 62 2, 57 3, 43 3, 63 4, 00 2, 76 3, 03 3, 31 4, 34 4, 35 4, 50 4, 65 4,2 6 I5 1, 43 4, 42 4, 66 1, 58 0, 00 0, 92 2, 47 3, 19 3, 12 4, 66 3, 54 2, 86 3, 29 4, 25 4, 24 4, 20 4, 45 4,7 3 I6 1, 3, 4, 1, 0, 0, 2, 3, 3, 4, 2, 2, 2, 3, 3, 3, 3, 4,0 5 59 84 02 62 92 00 18 07 05 05 96 35 72 58 61 63 75 6 I7 2, 53 3, 74 4, 55 2, 57 2, 47 2, 18 0, 00 1, 36 1, 53 3, 72 3, 39 2, 99 3, 83 4, 33 4, 21 4, 42 4, 33 5,0 1 I8 3, 21 4, 57 5, 52 3, 43 3, 19 3, 07 1, 36 0, 00 0, 58 4, 67 4, 33 3, 89 4, 82 5, 18 5, 03 5, 27 5, 12 6,0 6 I9 3, 36 4, 81 5, 76 3, 63 3, 12 3, 05 1, 53 0, 58 0, 00 4, 92 4, 58 3, 91 4, 86 5, 21 5, 05 5, 23 5, 11 6,2 1 I1 0 4, 48 0, 93 1, 87 4, 00 4, 66 4, 05 3, 72 4, 67 4, 92 0, 00 1, 80 2, 64 2, 82 2, 89 2, 82 3, 39 3, 06 2,7 3 I1 1 3, 30 1, 43 1, 31 2, 76 3, 54 2, 96 3, 39 4, 33 4, 58 1, 80 0, 00 1, 92 1, 89 2, 42 2, 42 2, 90 2, 81 2,1 2 I1 2 3, 40 2, 26 2, 65 3, 03 2, 86 2, 35 2, 99 3, 89 3, 91 2, 64 1, 92 0, 00 1, 11 1, 69 1, 55 1, 75 1, 94 2,7 6 I1 3 3, 75 2, 44 2, 16 3, 31 3, 29 2, 72 3, 83 4, 82 4, 86 2, 82 1, 89 1, 11 0, 00 1, 27 1, 38 1, 47 1, 75 1,8 6 I1 4 4, 74 2, 54 2, 30 4, 34 4, 25 3, 58 4, 33 5, 18 5, 21 2, 89 2, 42 1, 69 1, 27 0, 00 0, 43 0, 82 0, 61 1,9 6 I1 5 4, 75 2, 45 2, 41 4, 35 4, 24 3, 61 4, 21 5, 03 5, 05 2, 82 2, 42 1, 55 1, 38 0, 43 0, 00 0, 76 0, 71 2,2 4 I1 6 4, 89 3, 11 2, 92 4, 50 4, 20 3, 63 4, 42 5, 27 5, 23 3, 39 2, 90 1, 75 1, 47 0, 82 0, 76 0, 00 0, 99 2,4 9 I1 7 4, 99 2, 77 2, 72 4, 65 4, 45 3, 75 4, 33 5, 12 5, 11 3, 06 2, 81 1, 94 1, 75 0, 61 0, 71 0, 99 0, 00 2,4 2 I1 8 4, 78 2, 57 1, 25 4, 26 4, 73 4, 06 5, 01 6, 06 6, 21 2, 73 2, 12 2, 76 1, 86 1, 96 2, 24 2, 49 2, 42 0,0 0 Le minimum non nul de ce tableau est uploads/Litterature/ tpe-stat-agri.pdf

  • 20
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager