Classification afd Ecole Nationale Polytechnique d ? Alger Cours ADD - ère Année-Génie Industriel Partie III - Classi ?cation Chapitre V ?? Classi ?cation hiérarchique Ascendante Introduction Les techniques de classi ?cation automatique sont destinées à p

Ecole Nationale Polytechnique d ? Alger Cours ADD - ère Année-Génie Industriel Partie III - Classi ?cation Chapitre V ?? Classi ?cation hiérarchique Ascendante Introduction Les techniques de classi ?cation automatique sont destinées à produire des groupements de lignes ou de colonnes d'un tableau Il s'agit le plus souvent d'objets ou d'individus les lignes décrits par un certain nombre de variables ou de caractères les colonnes Ces groupements peuvent se faire par agglomération progressive des éléments deux à deux comme cela se fait en classi ?cation hiérarchique ou par recherche directe d'une partition en a ?ectant les éléments à des centres provisoires de classes puis en recentrant ces classes méthode itérative des centres mobiles Les circonstances d'utilisation de la classi ?cation sont sensiblement les mêmes que celles des méthodes d'analyse factorielle descriptive on se trouve face à un tableau de valeurs numériques Ce tableau peut être un tableau de valeurs numériques continues valeur de la variable j pour l'individu i à l'intersection de la ligne i et de la colonne j du tableau un tableau de contingence croisant deux partitions d'une même population ou encore un tableau de présence-absence valeurs ou selon que tel individu ou objet possède tel caractère ou attribut Dans certaines applications on peut disposer d'un tableau carré symétrique de similarités ou de distances Il s ? agit de mettre sous forme de partitions des ensembles étudiés lignes ou colonnes du tableau analysé ou de hiérarchie de partitions que nous dé ?nirons de façon plus précise ultérieurement Quelquefois il s'agira d'arbres au sens de la théorie des graphes arbres dont les sommets sont les objets à classer En ?n on pourra rechercher des classes empiétantes ou simplement mettre en évidence des zones à forte densité laissant de nombreux individus ou caractères non classés CEcole Nationale Polytechnique d ? Alger Cours ADD - ère Année-Génie Industriel Pour l'essentiel les techniques de classi ?cation font appel à une démarche algorithmique et non aux calculs formalisés usuels Alors que les valeurs des composantes des axes factoriels par exemple sont la solution d'une équation pouvant s'écrire sous une forme très condensée même si sa résolution est complexe la dé ?nition des classes ne se fera qu'à partir d'une formulation algorithmique une série d'opérations est dé ?nie de façon récursive et répétitive La mise en ?uvre de la plupart des techniques de classi ?cation ne nécessite donc que des notions mathématiques relativement élémentaires Il existe plusieurs familles d'algorithmes de classi ?cation mais on se limitera à deux techniques de classi ?cation la classi ?cation ascendante hiérarchique qui peut être présentée suivant plusieurs critères d'agrégation La technique du saut minimal ? single linkage est équivalente à la recherche de l'arbre de longueur minimale alors que la technique d'agrégation selon la variance ? est compatible par ses résultats avec certaines analyses factorielles techniques d'agrégation autour de centres mobiles Un des avantages des méthodes de classi ?cation est de créer des éléments qui sont des groupements d ? individus qui se ressemblent les classes souvent

  • 28
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise
Partager