UNIVERSITÉ DU QUÉBEC RECONNAISSANCE D'ALGUES TOXIQUES PAR VISION ARTIFICIELLE E

UNIVERSITÉ DU QUÉBEC RECONNAISSANCE D'ALGUES TOXIQUES PAR VISION ARTIFICIELLE ET RÉSEAU DE NEURONES MEMOIRE DE RECHERCHE PRESENTE A L'UNIVERSITE DU QUEBEC A RIMOUSKI Comme exigence du programme de maîtrise en ingénierie pour l'obtention du grade de maître es sciences appliquées (M.Sc.A.) PAR RICHARD LEPAGE 09,2004 bibliothèque Paul-Emile-Bouletj UIUQAC Mise en garde/Advice Afin de rendre accessible au plus grand nombre le résultat des travaux de recherche menés par ses étudiants gradués et dans l'esprit des règles qui régissent le dépôt et la diffusion des mémoires et thèses produits dans cette Institution, l'Université du Québec à Chicoutimi (UQAC) est fière de rendre accessible une version complète et gratuite de cette œuvre. Motivated by a desire to make the results of its graduate students' research accessible to all, and in accordance with the rules governing the acceptation and diffusion of dissertations and theses in this Institution, the Université du Québec à Chicoutimi (UQAC) is proud to make a complete version of this work available at no cost to the reader. L'auteur conserve néanmoins la propriété du droit d'auteur qui protège ce mémoire ou cette thèse. Ni le mémoire ou la thèse ni des extraits substantiels de ceux-ci ne peuvent être imprimés ou autrement reproduits sans son autorisation. The author retains ownership of the copyright of this dissertation or thesis. Neither the dissertation or thesis, nor substantial extracts from it, may be printed or otherwise reproduced without the author's permission. RESUME Depuis de nombreuses années, on cherche à identifier rapidement si des zones de pêches côtières ont été contaminées par des algues toxiques. Une volonté affirmée se développe quant à la conception d'un système automatisé de reconnaissance d'organismes cellulaires à traitement différé ou en temps réel; l'utilité d'un tel système étant avant tout de palier les délais d'analyse taxonomique qui prennent plusieurs jours à s'effectuer avant d'en arriver à une conclusion définitive. De ce fait, la prévention est tardive et les risques plus élevés de contamination toxique pour la population humaine et animal (huîtres, moules, poissons...). La situation, en ce qui a trait aux systèmes existants pour la reconnaissance automatisée du phytoplancton, est en plein développement. Il y a néanmoins des difficultés inhérentes quant à la précision de la classification et de la détection. L'objectif de ce projet de recherche est la reconnaissance automatisée d'une espèce spécifique de phytoplancton, soit YAlexandrium tamarense. Un appareil, que l'on nomme FLOWCAM, fournit des données (images et informations cytométriques) provenant d'échantillons prélevés à des sites spécifiques. Ces données permettent à un système de reconnaissance de discriminer les espèces végétales contenant des toxines de celles qui sont inoffensives pour l'espèce humaine. II On privilégie deux stratégies dans ce mémoire de recherche, la première est une fusion de données obtenues par traitement d'images associées à des paramètres cytométriques générés par le FLOWCAM et la seconde est d'utiliser la totalité des paramètres cytométriques sans procéder au calcul des moments d'ordre n<3 sur chacune des images. Pour les deux approches, la discrimination des classes est effectuée par un réseau de neurones dont l'optimisation a été calculée par la méthode des plans d'expériences de Taguchi. Dans les deux stratégies, nous avons émis l'hypothèse que les données présentaient une distribution normale. À partir de cette distribution, 33% des données provenant de la base de données #1 et #2 ont été choisies de manière aléatoire pour être présenté au réseau de neurones lors de l'étape d'apprentissage. Nous avons ensuite présenté les données provenant de la base de données #1 et #3 au système de reconnaissance pour les deux stratégies. Les résultats que nous avons obtenus permettent de conclure que le calcul des paramètres par la méthode des moments d'ordre n<3 dans la stratégie #1 est imprécise et inadéquate comparativement à la stratégie #2 dont la discrimination se base uniquement sur les paramètres existants du FLOWCAM. Une étude plus exhaustive sera donc nécessaire pour vérifier si la méthode des moments pour n>3 fournit des résultats plus probants. Ill AVANT-PROPOS Ce travail a été effectué au sein du laboratoire de recherche en génie électrique à l'Université du Québec à Rimouski, dirigé par le professeur Jean-François Méthot. Je désire remercier mon directeur de recherche, M. Jean-François Méthot, pour la qualité de son aide, sa disponibilité ainsi que sa patience et son amabilité durant la première correction de ce mémoire. Je désire également remercier mon co-directeurs, M. Jean- François Dumais, pour le soutien moral qu'il m'a apporté durant mes études à la maîtrise et sa confiance envers mes capacités à poursuivre mes études. Je tiens à remercier en particulier M. Maurice Levasseur, du département de biologie de l'Université Laval du Québec qui a eu l'amabilité de me fournir les données permettant de tester adéquatement le système de reconnaissance dans son ensemble. Je tiens à remercier également M. Abderrazak El Ouafi qui présidait le jury d'évaluation ainsi que M. Pierre-Martin Tardif qui évalua le mémoire de recherche en tant qu'évaluateur externe de l'Université du Québec à Rimouski. Je remercie également mes coéquipiers de travail qui partageaient le même laboratoire et avec lesquels j'ai eu des discussions des plus intéressantes et fructueuses sur nombre de sujets. IV TABLE DES MATIERES RÉSUMÉ I AVANT-PROPOS III TABLE DES MATIÈRES IV LISTE DES FIGURES VII LISTE DES TABLEAUX X LISTE DES ACRONYMES XI INTRODUCTION I CHAPITRE 1 9 PROBLÉMATIQUE '. 9 CHAPITRE 2 24 LA RECONNAISSANCE DE FORMES 24 2.1 Introduction 24 2.2 Processus généraux de reconnaissance de forme 25 2.2.1 Le monde physique 26 2.2.2 Le codage 27 2.2.3 Le prétraitement des données 28 2.2.3.1 Prétraitement d'une image 29 2.2.3.2 Segmentation de l'image lors de la phase expérimentale 33 2.2.3.3 Prétraitement d'un signal 41 2.2.4 L'analyse 43 2.2.4.1 Extraction des caractéristiques de forme pour l'image 44 2.2.4.2 Filtrage et compression d'un signal 46 2.2.5 L'apprentissage 51 2.2.6 La décision 51 2.3 Conclusion 52 CHAPITRE 3 54 EXTRACTION DES CARACTÉRISTIQUES PRINCIPALES 54 3.1 Introduction 54 3.2 La méthode PCA (Principal Component Analysis) 55 3.2.1 Explication géométrique 55 3.2.2 Développement mathématique de la méthode PCA 63 V 3.3 Le réseau de Kohonen 66 3.4 Utilisation de la méthode PC A lors de 1 ' étape expérimentale 67 3.5 Conclusion 68 CHAPITRE 4 69 LES TECHNIQUES DE CLASSIFICATIONS 69 4.1 Introduction 69 4.2 Le neurone biologique 71 4.3 Les réseaux de neurones artificiels (RNA) 73 4.3.1 Le neurone formel 75 4.4 Discrimination linéaire à deux classes 80 4.5 Règle d'apprentissage de Widrow-Hoff ou règle delta 91 4.6 Le réseau MLP (Multi-Layer perceptron) 94 4.6.1 L'algorithme de rétropagation du gradient de l'erreur 95 4.6.2 Détection automatique d'un signal par réseau MLP 100 4.6.3 Méthodes d'apprentissage pour le réseau MLP 104 4.6.3.1 Apprentissage par lot (batch training) 105 4.6.3.2 Descente de gradient par lot 106 4.6.3.3 Descente de gradient par lot avec terme inertiel 106 4.6.3.4 Apprentissage à pas variable 107 4.6.3.5 Resilient backpropagation 107 4.6.3.6 Méthode d'apprentissage par algorithme du gradient conjugué.. 107 4.6.4 Les algorithmes Quasi-Newton 108 4.7 Les réseaux à apprentissage compétitif 109 4.7.1 VQ: Vector Quantization (quantification vectorielle) 109 4.7.2 Les réseaux SOM (Self Organizing Map) 110 4.7.3 LVQ: Learning Vector Quantization 113 4.8 Les réseaux à fonctions noyaux (réseaux de type bayésien) 113 4.8.1 Approximation d'une fonction par un réseau Bayésien 115 4.9 Les réseaux récurrents 116 4.10 La méthode Taguchi dans l'optimisation des réseaux de neurones 118 4.11 Conclusion 119 CHAPITRE 5 121 MÉTHODOLOGIE ET MANIPULATIONS 121 5.1 Introduction 121 VI 5.2 L'approche expérimentale 123 5.2.1 Les objectifs de recherche 123 5.2.2 Hypothèses 123 5.2.3 Description des données 124 5.2.4 Procédures et manipulations 129 5.2.5 Configuration et optimisation des caractéristiques du réseau MLP ... 145 5.3 Conclusion 156 CHAPITRE 6 157 ANALYSE DES RÉSULTATS 157 6.1 Préambule 157 6.2 Le choix des paramètres 158 6.3 Configuration du reseau MLP 159 6.4 Résultats de la simulation 160 6.5 Résultats obtenus par le logiciel associé au FLOWCAM 162 6.6 Conclusion 163 6.7 Suggestions de travaux futures 167 BIBLIOGRAPHIE 168 ANNEXE A 173 Modules communs aux deux stratégies 173 Modules pour stratégie deux (2) 185 Modules pour la stratégie un (1) 192 Simulation d'un neurone formel en code MATLAB 196 Code MATLAB d'un réseau SOM 198 Discrimination de signaux par réseau MLP 204 Processus de segmentation d'une image 207 Code MATLAB d'un réseau Bayésien 208 La méthode Taguchi des plans d'expériences 215 Le plan standard vs plan expérimental à deux niveaux 217 Le plan expérimental à trois facteurs à deux niveaux 219 Principe d'orthogonalité 224 Interaction entre les facteurs 229 VII LISTE DES FIGURES FIGURE 1.1 CYCLE DE CONSOMMATION D'ALGUES TOXIQUES PAR LES MOLLUSQUES 9 FIGURE 1.2 ORDRES DE GRANDEUR DU PHYTOPLANCTON 10 FIGURE 1.3 BLOOM D'ALGUES TOXIQUES (PHYTOPLANCTON) 12 FIGURE 1.4 SCHEMA D'UN CYTOMETRE A ÉCOULEMENT FLUIDIQUE 16 FIGURE 1.5 COMBINAISON MICROSCOPE ET LASER DU FLOWCAM 17 FIGURE 1.6 REPRESENTATION PAR NUAGES DE POINTS D'ORGANISMES MULTIPLES 18 FIGURE 1.7 IMAGE ET SIGNAUX FOURNI PAR LE FLOWCAM 20 FIGURE 1.8 EXEMPLES D'ALEXANDRIUM TAMARENSE 21 FIGURE 1.9 PSEUDO-NITZSCHIA 21 FIGURE 1.10 SIGNAUX CYTOMETRIQUE D'ALEXANDRIUM TAMARENSE PROVENANT DU FLOWCAM 22 FIGURE 2.1 SCHÉMA GÉNÉRAL D'UN SYSTÈME DE RECONNAISSANCE DE FORMES 25 FIGURE 2.2 SCHEMA BLOC DES PROCESSUS uploads/Litterature/ 24045195.pdf

  • 21
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager