Université Mohammed V-Agdal Faculté des Sciences de Rabat Habilitation à Dirige

Université Mohammed V-Agdal Faculté des Sciences de Rabat Habilitation à Diriger des Recherches Présenté par : Mohammed RZIZA Doctorat National de la Faculté des Sciences de Rabat Professeur Assistant à la Faculté des Sciences de Rabat Spécialité Informatique Méthodes de classification : Application à la détection, reconnaissance du visage et à l’indexation de document audio Soutenu le 20 mars 2010 devant le Jury : M. Driss Aboutajdine : PES à la FSR (Président) M. Mohamed El Marraki : PES à la FSR (Rapporteur Interne) M. Ahmed Hammouch : PES à l’ENSET de Rabat (Rapporteur Externe) M. EL Mustapha Mouaddib : PES à l’université d’Amiens (Rapporteur Externe) Mohammed RZIZA Méthodes de classification : Application à la détection, Reconnaissance du visage et à l’indexation de document audio. Dans le document consacré à la présentation de l'ensemble de nos travaux de recherche en vue de l’obtention de l’habilitation à diriger des recherches en Informatique. Nous avons structuré ce document en deux parties : La première représente un bilan quantitatif de l’ensemble des travaux scientifiques et pédagogiques et la deuxième partie expose un résumé détaillé des résultats scientifiques. Concernant la partie pédagogique, nous avons contribué à la formation de plusieurs promotions depuis le démarrage du système LMD, par l’encadrement de cours et des projets de fin d’étude. À propos de la partie recherche scientifique, nous avons exposé les différents travaux réalisés dans le domaine de reconnaissance de forme et d’indexation. Nous avons travaillé dans un projet industriel avec l’opérateur de Télécom IAM et dans le cadre d’autres projets de coopération franco-marocains : Action intégrée et STIC. Durant ces dernières années, nous avons participé à l’encadrement de plusieurs thèses ainsi que des PFE de DESA et de Master. Nous avons également collaboré à la réalisation de plusieurs travaux tels que la participation et l’organisation de congrès, l’animation de séminaires ainsi que la gestion de la formation DESA Informatique et Télécommunications (DESA IT). Concernant la partie résumé des résultats scientifiques, nous avons exposé différentes méthodes de détection de visage : une basée sur la modélisation de la peau, une autre sur la mise en correspondance des gabarits « Template Matching » et une troisième sur la localisation des yeux. Nous avons proposé plusieurs contributions en se basant sur la transformation DCT et sur la texture. Ces dernières sont utilisées pour modéliser la peau par des Modèles Gaussiens Généralisés. Les résultats expérimentaux ont montré la robustesse des méthodes proposées comparées à celles de la littérature. Par la suite, nous avons mis en avant deux catégories de méthodes de reconnaissance de visage : une qui s’appuie sur l’extraction et la sélection de primitives et l’autre basée la fusion d’information. La première catégorie avait pour but de trouver les primitives qui représentent le mieux le visage avec le minimum d’information possible. La méthode proposée est construite sur l’extraction des primitives en utilisant la transformation DCT et sur la sélection des meilleures primitives en se basant sur les algorithmes génétiques. Pour la méthode de classification nous avons utilisé un classificateur basé SVM. La deuxième catégorie de méthodes s’appuie sur la fusion d'information. Nous avons présenté deux nouvelles approches hybrides : La première se base sur la fusion de différentes primitives, tandis que la seconde sur la fusion de plusieurs sous bandes. Nous avons testé les différentes méthodes proposées sur plusieurs bases de données standards. Nous avons montré, par les expérimentations, que ces différentes méthodes ont amélioré les résultats de reconnaissance de visages par rapport à celles existantes dans la littérature. Ces différentes méthodes ont été testées pour la réalisation d’un système de contrôle d’accès sécurisé. Ce système a été validé sur la base de données « LRIT » que nous avons fait le choix de construire. Nous avons exposé, également, l’ensemble des travaux que nous avons réalisés dans le domaine d’indexation de documents audio au sens de locuteur dans le cas des grands volumes de données incrémentales. Plusieurs techniques d’organisation des modèles de locuteurs ont pu êtres proposés avec l’objectif de réduire le coût d’exploration et de création de la structure en s’appuyant sur des mesures de similarité telles que KL, KLm. Nous avons utilisé un modèle de mélanges gaussiens comme élément représentant un locuteur récemment détecté et ajouté à la structure d’index. Dans le but d’améliorer la performance de la distance de similarité entre modèles des locuteurs, nous avons proposé et adapté de nouvelles approximations de la divergence de Kullback-Leibler. En effet, notre contribution principale se trouve être l’organisation hiérarchique de modèles de mélanges gaussiens afin de réduire la complexité de la recherche linéaire lors du passage à l’échelle incrémentale. Nous avons proposé une contribution basée sur des techniques de mesure de similarité à l’aide de la mesure de divergence KL. Nous avons également préconisé un algorithme de fusion de modèles de mélanges gaussiens dans le but d’optimiser le coût de construction d’un arbre de recherche de modèle de locuteurs par lot de modèles de mélanges gaussiens via un arbre binaire de recherche ascendant. uploads/Science et Technologie/ soutenance-mohammed-rziza.pdf

  • 16
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager