Approches multidisciplinaires pour l’étude du lexique et la construction de res

Approches multidisciplinaires pour l’étude du lexique et la construction de ressources lexicales nouvelles Mémoire d’Habilitation à Diriger des Recherches Spécialité Linguistique (7e section CNU) Núria Gala Pavia Volume I : Synthèse Mars 2015 Jury : Philippe Blache (LPL-CNRS, Aix en Pce) Directeur de recherche Nabil Hathout (ERSS, Toulouse) Rapporteur Alain Polguère (ATILF, Nancy) Rapporteur Horacio Saggion (UPF, Barcelone) Rapporteur Agnès Tutin (LIDILEM, Grenoble) Examinatrice Patrice Bellot (LSIS, Marseille) Examinateur Remerciements Le travail que je présente dans ce mémoire n’aurait pas pu aboutir sans l’aide, le support et les échanges réguliers avec plusieurs personnes à qui je voudrais ici exprimer ma gratitude. Premièrement, je tiens à remercier Philippe Blache d’avoir accepté d’être mon directeur de recherche (et de l’avoir fait avec enthousiasme !). Je le remercie pour ses conseils judicieux et pour la confiance qu’il m’a accordée. Je remercie Nabil Hathout, Alain Polguère et Horacio Saggion de m’avoir fait l’honneur d’être rapporteurs de mon travail. Un grand merci pour des échanges constructifs et enrichissants, prometteurs -je l’espère- d’échanges futurs. Merci également à Agnès Tutin et à Patrice Bellot d’avoir accepté cordialement mon invitation à faire partie du jury. Mes remerciements s’adressent très spécialement à Michael Zock pour son soutien et son œil bienveillant, et à Laurent Tichit, pour son aide pré- cieuse : merci à deux collègues et amis d’exception. De même, et surtout, merci à Jaume Gala, mon père, pour d’inestimables conseils philologiques. Plus globalement, je remercie les membres du CENTAL à Louvain- la-Neuve, spécialement Thomas François et Cédrick Fairon, ainsi que les membres de l’équipe Langues en Contact et Typologie (LCT) à Aix en Pro- vence, particulièrement Médéric Gasquet-Cyrus, Adam Wilson et Nicolas Tournadre, pour des échanges fructueux. Un grand merci également à Ma- thieu Mangeot du LIG à Grenoble, pour une relecture attentive et des com- mentaires avisés. Enfin, merci à tous les membres de mon équipe TALEP pour des collaborations précieuses, spécialement avec Alexis Nasr, Elisabeth Godbert et Carlos Ramisch, et merci au directeur du LIF Jean Marc Talbot et aux LIF angels (Nadine, Sylvie et Martine) pour leur support et bonne humeur. Un dernier merci, mais pas le moindre, à mes enfants et à mes proches, pour leurs encouragements constants et pour avoir suivi avec patience et confiance le processus de rédaction de ce mémoire. i Résumé L’intérêt pour les ressources lexicales n’a cessé d’évoluer en fonction des besoins et des technologies. Le lexique se trouve, ainsi, au cœur de nom- breuses recherches dans des domaines variés : construction de dictionnaires, apprentissage du vocabulaire, aide à la lecture, etc. Il est également le socle des outils de traitement automatique des langues et des technologies du langage au sens large. La construction et l’enrichissement de ressources reste une tâche coûteuse et requiert des compétences dans différentes disciplines. À ce jour, les traite- ments automatiques permettent d’améliorer la couverture des lexiques et le caractère explicite, détaillé et approfondi des informations qu’ils contiennent. Les méthodes de construction sont ainsi diversifiées (semi-automatiques, col- laboratives) et les lexiques qui en résultent sont de plus en plus dynamiques, dans une perspective de partage de données à grande échelle. Enfin, les ressources lexicales représentent un enjeu sociétal important, parce qu’elles sont nécessaires pour développer des applications d’assistance à l’apprentissage des langues comme dans l’aide à la remédiation de patho- logies de la lecture et de la parole, etc. Dans ce mémoire pour l’obtention de l’Habilitation à Diriger des Re- cherches, c’est par le biais de la multidisciplinarité que nous abordons le lexique et la construction de ressources. Outre la description de quelques ressources que nous avons eu l’occasion de créer et/ou enrichir, nous ap- portons une mise en perspective historique et méthodologique de quelques approches et applications où le lexique reste au centre des problématiques. iii iv Abstract The interest in lexical resources is evolving continuously as a result of different needs and technologies. The Lexicon is central to research in va- rious domains : lexicography, vocabulary learning, reading tools, etc. By and large, it is also the basis for natural language processing tools and language technologies in general. Building and enriching lexical resources remains a costly and time-con- suming task that requires competencies in different disciplines. At present, language processing tools enable better coverage of lexicons as well as the specific, explicit and detailed linguistic information contained within them. In addition, the methods used to build the resources have become diversified (automatic, collaborative) and the resulting lexicons tend to be increasingly dynamic, designed with a view towards large-scale linked data. Lastly, lexical resources are a major issue for society, because they are essential in developping tools for learning languages, assistive technologies for reading and writing, etc. With a view to obtaining the Habilitation à Diriger des Recherches, this thesis focuses on the Lexicon and on lexical resources in general. The issue is addressed through an interdisciplinary approach : as well as describing va- rious resources that we have created and/or enriched, we also offer historical and methodological insight into a number of approaches and applications of which the lexicon is the focal point. v vi Table des matières Remerciements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i Résumé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii Abstract . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v Table des figures xi Introduction 1 I Synthèse 5 1 De l’étude du lexique à sa formalisation 7 1.1 Précisions terminologiques . . . . . . . . . . . . . . . . . . . . 7 1.1.1 L’unité lexicale (le mot ?) . . . . . . . . . . . . . . . . 8 1.1.2 Lexique et Vocabulaire . . . . . . . . . . . . . . . . . . 10 1.1.3 Lexique et Grammaire . . . . . . . . . . . . . . . . . . 10 1.2 Approches anciennes . . . . . . . . . . . . . . . . . . . . . . . 11 1.2.1 Premières traces écrites . . . . . . . . . . . . . . . . . 11 1.2.2 Descriptions morphologiques . . . . . . . . . . . . . . 12 1.2.3 Considérations philosophico-sémantiques . . . . . . . . 13 1.3 Approches contemporaines . . . . . . . . . . . . . . . . . . . . 16 1.3.1 Structuralisme . . . . . . . . . . . . . . . . . . . . . . 16 1.3.2 Fonctionnalisme . . . . . . . . . . . . . . . . . . . . . 17 1.3.3 Générativisme . . . . . . . . . . . . . . . . . . . . . . 18 1.4 Études computationnelles et quantitatives . . . . . . . . . . . 20 1.4.1 Descriptions formelles . . . . . . . . . . . . . . . . . . 21 1.4.2 Statistique lexicale . . . . . . . . . . . . . . . . . . . . 23 1.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 2 De la description du lexique à sa structuration dans des dictionnaires 27 2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.1.1 Décrire les mots . . . . . . . . . . . . . . . . . . . . . 28 2.1.2 Les ’mettre en ordre’ . . . . . . . . . . . . . . . . . . . 29 2.1.3 Les interrelier . . . . . . . . . . . . . . . . . . . . . . . 36 vii 2.2 Ressources dictionnairiques imprimées . . . . . . . . . . . . . 38 2.2.1 Dictionnaires monolingues vs multilingues . . . . . . . 38 2.2.2 Diachronie vs synchronie . . . . . . . . . . . . . uploads/Geographie/ approches-multidisciplinaires-pour-letud.pdf

  • 18
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager