Information extraction and knowledge modelling from oral communication notes fabrice even phd thesis

École Centrale de Nantes Université de Nantes École des Mines de Nantes ÉCOLE DOCTORALE STIM SCIENCES ET TECHNOLOGIE DE L ? INFORMATION ET DES MATERIAUX ? Année Extraction d ? Information et modélisation de connaissances à partir de Notes de Communication Orale THÈSE pour obtenir le grade de DOCTEUR DE L ? UNIVERSITÉ DE NANTES Discipline INFORMATIQUE présentée et soutenue publiquement par Fabrice EVEN le octobre à l ? UFR Sciences et Techniques Université de Nantes devant le jury ci-dessous Président Alexandre DIKOVSKY Professeur des Universités Rapporteurs Pierre ZWEIGENBAUM Professeur des Universités François ROUSSELOT Ma? tre de conférences Examinateurs Noureddine MOUADDIB Professeur des Universités Chantal ENGUEHARD Ma? tre de conférences Pascal MUCKENHIRN LINA Université de Nantes INSERM Hôpitaux de Paris LIIA INSA Strasbourg LINA Université de Nantes LINA Université de Nantes Crédit Mutuel LACO Directeur de thèse Professeur Noureddine MOUADDIB Co-encadrante Ma? tre de conférences Chantal ENGUEHARD Laboratoire Laboratoire d ? Informatique de Nantes Atlantique LINA CNRS -FRE N ED - C CEXTRACTION D ? INFORMATION ET MODELISATION DE CONNAISSANCES A PARTIR DE NOTES DE COMMUNICATION ORALE Information Extraction and knowledge modelling from oral communication notes Fabrice EVEN favet neptunus eunti Université de Nantes CFabrice EVEN Extraction d ? Information et modélisation de connaissances à partir de Notes de Communication Orale xviii CLa rivière coule sans jamais s ? arrêter pourtant les millions de gouttes d ? eau qui la composent ne sont jamais les mêmes Toute chose passe ?? Takeo KUMAGAMI C CRésumé Malgré l ? essor de l ? Extraction d ? Information et le développement de nombreuses applications dédiées lors de ces vingt dernières années cette t? che rencontre des problèmes lorsqu ? elle est réalisée sur des textes atypiques comme des Notes de Communication Orale Les Notes de Communication Orale sont des textes issus de prises de notes réalisées lors d ? une communication orale entretien réunion exposé etc et dont le but est de synthétiser le contenu informatif de la communication Leurs contraintes de rédaction rapidité et limitation de la quantité d ? écrits sont à l ? origine de particularités linguistiques auxquelles sont mal adaptées les méthodes classiques de Traitement Automatique des Langues et d ? Extraction d ? Information Aussi bien qu ? elles soient riches en informations elles ne sont pas exploitées par les systèmes extrayant des informations à partir de textes Dans cette thèse nous proposons une méthode d ? extraction adaptée aux Notes de Communication Orale Cette méthode nommée MEGET est fondée sur une ontologie modélisant les connaissances contenues dans les textes et intéressantes du point de vue des informations recherchées ontologie d ? extraction ? Cette ontologie est construite en uni ?ant une ontologie des besoins ? décrivant les informations à extraire avec une ontologie des termes ? conceptualisant les termes du corpus à traiter liés avec ces informations L ? ontologie des termes est élaborée à partir d ? une terminologie extraite des textes et enrichie par des termes issus de documents spécialisés L ? ontologie d ?

  • 26
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise
Partager