UNIVERSIT´ E DE NICE – SOPHIA ANTIPOLIS ´ Ecole Doctorale des Sciences et Techn

UNIVERSIT´ E DE NICE – SOPHIA ANTIPOLIS ´ Ecole Doctorale des Sciences et Technologies de l’Information et de la Communication Reconnaissance structurelle de formules math´ ematiques typographi´ ees et manuscrites TH` ESE de doctorat pour obtenir le titre de Docteur en Sciences Discipline : Informatique par St´ ephane LAVIROTTE Soutenue le 14 juin 2000 ` a l’ESSI (Sophia-Antipolis) Composition du jury Pr´ esident : Jean-Marc FEDOU Professeur ` a l’Universit´ e de Nice Sophia-Antipolis Rapporteurs : Karl TOMBRE Professeur ` a l’´ Ecole des Mines de Nancy Guy LORETTE Professeur ` a l’Universit´ e de Rennes I Examinateurs : Lo¨ ıc POTTIER Charg´ e de Recherche ` a l’INRIA Sophia-Antipolis Peter SANDER Professeur ` a l’Universit´ e de Nice Sophia-Antipolis Marc BERTHOD Directeur de Recherche ` a l’INRIA Sophia-Antipolis Universit´ e de Nice Sophia-Antipolis / Institut National de Recherche en Informatique et Automatique Mis en page avec la classe thloria. Remerciements Je tiens à remercier : – Loïc Pottier pour ses conseils, son expérience et l’encadrement de cette thèse ; – les membres du jury, Jean-Marc Fédou, Peter Sander, Marc Berthod, et plus particu- lièrement Karl Tombre et Guy Lorette qui ont accepté de rapporter cette thèse ; – les anciens membres de l’équipe SAFIR ainsi que les membres des projets CAFE et LEMME de l’INRIA qui m’ont tous accueilli avec beaucoup de gentillesse et de bien- veillance. – France Limouzis et Patricia Lachaume pour leur soutient et leur aide dans les dé- marches administratives. Je veux aussi remercier toutes les personnes qui ont travaillé ponctuellement, de près ou de loin avec moi : – Andréas Kosmala dans le cadre d’une collaboration avec l’Université de Duisburg ; – Olivier Arsac avec qui les collaborations de travail furent nombreuses et toutes plus enrichissantes les unes que les autres ; – Colas Nahaboo et Jean-Michel Léon ainsi que toute l’équipe KOALA pour leurs outils de développement, leur bonne humeur et leurs conseils avisés ; – José Grimm pour tous ses précieux conseils sur L AT EX. Enfin, je remercie collectivement tous ceux qui ont bien voulu relire ma thèse, m’apporter leur aide et plus particulièrement Frédérique, qui a su me soutenir au quotidien. i ii I do not fear computers. I fear the lack of them. Isaac Asimov iii iv Table des matières Table des figures vii Introduction 1 1 Nos buts initiaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 Motivations et applications possibles . . . . . . . . . . . . . . . . . . . . . 3 3 Objectifs de l’étude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 4 Résultats obtenus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 4.1 Le composant OFR . . . . . . . . . . . . . . . . . . . . . . . . . . 5 4.2 Irma : une application . . . . . . . . . . . . . . . . . . . . . . . . 6 5 Plan de lecture . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 6 Conventions typographiques . . . . . . . . . . . . . . . . . . . . . . . . . 7 Chapitre I Reconnaissance structurelle de formules mathématiques : état de l’art 9 1 Historique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 2 De nombreuses applications possibles . . . . . . . . . . . . . . . . . . . . 11 2.1 Édition de formules mathématiques . . . . . . . . . . . . . . . . . 12 2.1.1 Syntaxe linéaire . . . . . . . . . . . . . . . . . . . . . . 12 2.1.2 Palette de modèles . . . . . . . . . . . . . . . . . . . . . 14 2.1.3 Édition bidimensionnelle . . . . . . . . . . . . . . . . . 15 2.1.4 Des modes d’édition “coûteux” . . . . . . . . . . . . . . 15 2.1.5 Vers une édition manuscrite . . . . . . . . . . . . . . . . 16 2.2 Bases de formules . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.3 Extension des systèmes de reconnaissance de documents . . . . . . 18 2.4 Diverses autres applications . . . . . . . . . . . . . . . . . . . . . 18 3 Définition des notations mathématiques . . . . . . . . . . . . . . . . . . . 19 4 Difficultés par rapport à la reconnaissance de textes . . . . . . . . . . . . . 20 v Table des matières 4.1 Bruit et petits symboles . . . . . . . . . . . . . . . . . . . . . . . . 21 4.2 Segmentation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 4.3 Reconnaissance des symboles . . . . . . . . . . . . . . . . . . . . 22 4.4 Ambiguïtés sur le rôle d’un même symbole . . . . . . . . . . . . . 23 4.5 Ambiguïté sur le placement relatif des symboles . . . . . . . . . . 24 4.6 Ambiguïté dans la notation . . . . . . . . . . . . . . . . . . . . . . 25 4.7 Peu de redondance de l’information . . . . . . . . . . . . . . . . . 26 5 Quelques traitements préliminaires . . . . . . . . . . . . . . . . . . . . . . 27 5.1 Seuil de numérisation . . . . . . . . . . . . . . . . . . . . . . . . . 29 5.2 Réduction du bruit . . . . . . . . . . . . . . . . . . . . . . . . . . 30 5.3 Réalignement de l’image . . . . . . . . . . . . . . . . . . . . . . . 31 5.4 Isoler une formule dans un document . . . . . . . . . . . . . . . . 33 5.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 6 Segmentation et reconnaissance des symboles . . . . . . . . . . . . . . . . 35 6.1 Caractères typographiés . . . . . . . . . . . . . . . . . . . . . . . 35 6.2 Caractères manuscrits . . . . . . . . . . . . . . . . . . . . . . . . 37 6.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 7 Reconnaissance de la structure . . . . . . . . . . . . . . . . . . . . . . . . 39 7.1 Identification des relations spatiales et logiques entre les symboles . 40 7.2 Reconnaissance de la structure de la formule uploads/Science et Technologie/ reconnaissance-structurelle-de-formules-mathematiques-typographies-et-manuscrites.pdf

  • 51
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager