THéSE prŽsentŽe par Gilles SƒRASSET pour obtenir le titre de DOCTEUR DE L'UNIVE

THéSE prŽsentŽe par Gilles SƒRASSET pour obtenir le titre de DOCTEUR DE L'UNIVERSITƒ JOSEPH FOURIER Ñ GRENOBLE 1 (ARRæTƒS MINISTƒRIELS DU 5 JUILLET 1984 ET DU 30 MARS 1992) SpŽcialitŽ INFORMATIQUE SUBLIMÊ: un syst•me universel de bases lexicales multilingues et NADIAÊ: sa spŽcialisation aux bases lexicales interlingues par acceptions 8 dŽcembre 1994 Composition du jury : PrŽsident Marie-France BRUANDET Rapporteurs Helmut SCHNELLE Jean VƒRONIS Examinateurs Vincent QUINT Fran•ois RECHENMANN Directeur Christian BOITET THéSE PRƒPARƒE AU SEIN DU LABORATOIRE GETA (IMAG, UJF & CNRS) tel-00005112, version 1 - 25 Feb 2004 tel-00005112, version 1 - 25 Feb 2004 Remerciements Au moment dÕamener les voiles, le marin sait quÕil ne doit son arrivŽe au port quÕaux vents qui ont su lÕy mener. Au vif zŽphyr (Christian Boitet) qui, jubilant sur les kumquats du clown gracieux et non content dÕavoir affrŽtŽ le brigantin, a su gonfler ses voiles et le diriger sans abattre la m‰ture. Ë lÕaquilon (Fran•ois Peccoud) qui mÕa accueilli dans son aire et dont la force et la persŽvŽrance mÕont empŽchŽ dÕaffaler. Ë ƒole (Marie-France Bruandet) et aux quatres vents (Vincent Quint, Fran•ois Rechenmann, Helmut Schnelle et Jean VŽronis), qui ont su Žtudier les nÏuds du mousse et y voir un travail de matelot. Ë tous les vents de la rose, autan, mistral, khamsin, sirocco, harmattan, noro”t, simoun,ÊÉ (membres du GETA, Žquipe de BÕVITAL,ÊÉ) qui, par babord ou tribord, gonflant brigantine ou huniers, portant chant de sir•nes ou arome de terre, rafraichissant cale et carrŽ, rŽchauffant marins et matelots, ont aidŽ esquif et Žquipage ˆ maintenir le cap vers de nouveau rivages. Je ne peux oublier le brick (Mathieu Lafourcade) qui ˆ quelques enc‰blures, cinglait, tout comme moi, dans le sillage de la goŽlette (HervŽ Blanchon) qui a ouvert la marche. Au foehn (Maria), qui a su prodiguer douceur et chaleur lorsque se profilaient sargasses et dŽrives dans le cÏur du matelot. Ë tous les vents que je ne peux citer ici, quÕils me pardonnent et sachent que je nÕoublie pas leur souffle enivrant. tel-00005112, version 1 - 25 Feb 2004 tel-00005112, version 1 - 25 Feb 2004 Table des matières INTRODUCTION 1 ƒTAT DE LÕART ET PROBLéMES INTƒRESSANTS 3 I. DES DICTIONNAIRES SUR PAPIER AUX BASES LEXICALES 5 1. Dictionnaires sur papier............................................................................................ 6 1.1. Dictionnaires monolingues....................................................................................... 6 1.2. Thesaurii.................................................................................................................... 8 1.3. Dictionnaires bilingues ............................................................................................. 9 1.4. Dictionnaires multilinguesÊ...................................................................................... 10 2. Dictionnaires sur support Žlectronique.................................................................. 11 2.1. Un format de codageÊ: SGML/TEI............................................................................ 12 2.2. Dictionnaires en ligne: le Collins On-Line ............................................................. 13 2.3. Gestionnaires de dictionnaires terminologiquesÊ: MTX Termex ............................ 14 2.4. Un environnement originalÊ: le Dicologique .......................................................... 14 3. Syst•mes lexicaux spŽcialisŽs................................................................................. 16 3.1. BDLex...................................................................................................................... 16 3.2. Dictionnaires du LADL............................................................................................ 17 3.3. Ariane ...................................................................................................................... 17 3.4. BDTAO.................................................................................................................... 19 3.5. METAL..................................................................................................................... 19 II. EFFORTS EN COURS 21 1. Le Lexicaliste ........................................................................................................... 22 tel-00005112, version 1 - 25 Feb 2004 ii Table des mati•res 1.1. Vue gŽnŽrale du syst•me........................................................................................ 22 1.2. RŽseau lexical et sŽmantique.................................................................................. 23 1.3. VŽrifications de cohŽrence et valeurs par dŽfaut................................................... 23 2. EDR ......................................................................................................................... 24 2.1. Architecture lexicale ............................................................................................... 24 2.2. Architecture linguistique......................................................................................... 25 2.3. Dictionnaire de concepts ........................................................................................ 27 3. GENELEX.................................................................................................................. 31 3.1. Le mod•le conceptuel de GENELEX ....................................................................... 32 3.2. Vue gŽnŽrale dÕune unitŽ du lexique ..................................................................... 33 3.3. Le mod•le morphologique ..................................................................................... 34 3.4. Le mod•le syntaxique ............................................................................................. 36 3.5. Le mod•le sŽmantique............................................................................................ 38 4. MULTILEX................................................................................................................. 39 4.1. Architecture lexicale ............................................................................................... 39 4.2. Architecture linguistique......................................................................................... 40 4.3. Architecture logicielle ............................................................................................. 42 III. LES PROBLéMES INTƒRESSANTS 45 1. Architecture lexicale ............................................................................................... 45 2. Architecture linguistique......................................................................................... 48 3. PrŽsentation de lÕinformation ................................................................................. 49 CONCEPTION D'UNE BASE LEXICALE MULTILINGUE MULTIAPPLICATIONS 51 INTRODUCTION 53 IV. DƒFINITION DÕUNE BASE LEXICALE MULTILINGUE 55 1. DŽfinition de lÕarchitecture lexicale ....................................................................... 55 1.1. Exemples ................................................................................................................. 55 1.2. Le langage de dŽfinition de lÕarchitecture lexicaleÊ: LEXARD .................................. 59 2. DŽfinition de lÕarchitecture linguistique ................................................................. 60 2.1. Exemples ................................................................................................................. 61 2.2. Le langage de dŽfinition de lÕarchitecture linguistiqueÊ: LINGARD ......................... 75 2.3. ImplŽmentation....................................................................................................... 87 V. ARCHITECTURE LOGICIELLE ET OUTILS DE GESTION 91 1. Architecture logicielle ............................................................................................. 91 2. Niveau InterneÊ: manipulation des informations linguistiques............................... 92 tel-00005112, version 1 - 25 Feb 2004 Table des mati•res iii 2.1. DŽnoter un ensemble de structures ....................................................................... 93 2.2. Manipuler une structure linguistique...................................................................... 93 3. ƒditeur, navigateur.................................................................................................. 95 3.1. Les documents structurŽs........................................................................................ 95 3.2. Le dictionnaire, un document structurŽ ................................................................. 97 4. VŽrificateur de cohŽrence..................................................................................... 103 4.1. Notions .................................................................................................................. 103 4.2. Structure de la base lexicale ................................................................................. 104 4.3. Exemples de contraintes....................................................................................... 106 5. DŽfauteur .............................................................................................................. 108 5.1. Notions .................................................................................................................. 108 5.2. Exemples de r•gles de valeurs par dŽfaut ........................................................... 109 6. Import/Export ....................................................................................................... 110 6.1. Notions .................................................................................................................. 110 6.2. Exemple dÕexport.................................................................................................. 112 SPƒCIALISATION Ë LÕINTERLINGUE PAR ACCEPTIONS 117 INTRODUCTION 119 VI. LÕAPPROCHE PAR ACCEPTIONS 121 1. Acceptions et concepts ......................................................................................... 121 1.1. Acceptions............................................................................................................. 121 1.2. Concepts ............................................................................................................... 123 1.3. Variantes et discussion ......................................................................................... 125 2. Acceptions et fonctions lexicales.......................................................................... 129 3. Parax, une expŽrimentation ................................................................................. 129 3.1. Les dictionnaires monolingues ............................................................................. 130 3.2. Le dictionnaire interlingue.................................................................................... 130 3.3. Parax et les fonctions lexicales ............................................................................. 133 3.4. Probl•mes et limitations........................................................................................ 134 4. Conclusion de lÕŽtude ........................................................................................... 134 VII. IMPLƒMENTATION 137 1. LÕacception, une structure logique supplŽmentaire............................................. 137 1.1. Acceptions monolingues ...................................................................................... 137 1.2. Acceptions interlingues ........................................................................................ 138 1.3. Dictionnaires dÕacceptions.................................................................................... 139 2. Le lien lexical ........................................................................................................ 139 tel-00005112, version 1 - 25 Feb 2004 iv Table des mati•res 2.1. Lien gŽnŽral........................................................................................................... 139 2.2. Lien de raffinement............................................................................................... 140 2.3. Liens Òˆ la MelÕc ÿukÓ .............................................................................................. 140 3. VŽrification de cohŽrence..................................................................................... 141 3.1. Exemples de schŽmas ˆ dŽtecter.......................................................................... 141 3.2. DŽclaration dÕune contrainte de cohŽrence sur le rŽseau lexical........................ 142 CONCLUSION 145 BIBLIOGRAPHIE 147 ANNEXES 159 ANNEXE AÊ: INTRODUCTION Ë SGML 161 ANNEXE BÊ: INTRODUCTION Ë GRIF 165 ANNEXE CÊ: EXEMPLES DÕARTICLES DU DICTIONNAIRE EXPLICATIF ET COMBINATOIRE DU FRAN‚AIS CONTEMPORAIN 171 tel-00005112, version 1 - 25 Feb 2004 Liste des figures I. DES DICTIONNAIRES SUR PAPIER AUX BASES LEXICALES 5 Figure 1.1Ê: Article ÒcomposerÓ du petit Robert (Ždition de 1970) ............................................. 6 Figure 1.2Ê: LÕunitŽ lexicale complexe ÒconstruireÓ..................................................................... 7 Figure 1.3Ê: Un article du RodgetÕs thesaurus .............................................................................. 8 Figure 1.4Ê: Structure hiŽrarchique de la section G (Arithmetical and logic operations) du vocabulaire de traitement de lÕinformation. ............................................................................... 9 Figure 1.5Ê: Un exemple dÕarticle du vocabulaire de traitement de lÕinformation...................... 9 Figure 1.6Ê: Un exemple d'article du Robert & Collins.............................................................. 10 Figure 1.7Ê: Une entrŽe du dictionnaire terminologique des sciences de lÕinformation .......... 11 Figure 1.8Ê: LÕentrŽe ÒcomposerÓ du Collins On-line, version Macintosh................................. 13 Figure 1.9Ê: Un exemple dÕentrŽe dÕun dictionnaire MTX Termex ........................................... 14 Figure 1.10Ê: Exemple de la structure des ŽlŽments du Dicologique ....................................... 15 Figure 1.11Ê: Un exemple dÕentrŽes de BDLex.......................................................................... 17 Figure 1.12Ê: Automate reprŽsentant la forme flŽchie ÒpasseÓ .................................................. 17 Figure 1.13Ê: Automate reprŽsentant les diffŽrentes variantes du mot composŽ Òun roman policier de la sŽrie noireÓÉ ................................................................................................................... 17 Figure 1.14Ê: Exemple dÕarticle gŽnŽrŽ par Visulex................................................................... 18 Figure 1.15Ê: Une entrŽe lexicale de BDTAO ............................................................................ 19 II. EFFORTS EN COURS 21 Figure 2.1Ê: Une entrŽe de dictionnaire crŽŽe par Le Lexicaliste .............................................. 22 Figure 2.2Ê: ƒlŽments de la dŽfinition dÕun dictionnaire ........................................................... 22 Figure 2.3Ê: Architecture lexicale du projet EDR ....................................................................... 25 tel-00005112, version 1 - 25 Feb 2004 vi Liste des figures Figure 2.4Ê: Structure dÕune entrŽe de dictionnaire monolingue EDR...................................... 25 Figure 2.5Ê: Exemple dÕentrŽe de dictionnaire monolingue EDR ............................................. 25 Figure 2.6Ê: Un exemple dÕinformation grammaticale associŽe ˆ une entrŽe .......................... 26 Figure 2.7Ê: Exemple dÕinformation sŽmantique associŽe ˆ une entrŽe ................................... 26 Figure 2.8Ê: Structure dÕun article de dictionnaire bilingue EDR .............................................. 26 Figure 2.9Ê: Exemple dÕentrŽes de dictionnaire bilingue .......................................................... 26 Figure 2.10Ê: Un exemple dÕentrŽes de dictionnaire bilingues ................................................. 27 Figure 2.11Ê: Un exemple de classification de concepts ........................................................... 30 Figure 2.12Ê: Un extrait de la hiŽrarchie de concepts du dictionnaire EDR.............................. 30 Figure 2.13Ê: Le mŽcanisme dÕhŽritage et les relations nŽgatives ............................................. 31 Figure 2.14Ê: LÕarticulation globale dÕune unitŽ du lexique....................................................... 33 Figure 2.15Ê: Un exemple dÕunitŽ morphologique simple prŽsentŽe sous forme graphique .. 35 Figure 2.16Ê: Description de base associŽe ˆ lÕentrŽe ÒintŽressantÓ (adjectif) .......................... 37 Figure 2.17Ê: Description de lÕUSyn composŽe Òmettre en ÏuvreÓ .......................................... 37 Figure 2.18Ê: Un exemple de relations entre les diffŽrents mod•les GENELEX......................... 38 Figure 2.19Ê: LÕarchitecture lexicale de MULTILEX ..................................................................... 39 Figure 2.20Ê: Vue gŽnŽrale dÕune LU (Lexical Unit) de MULTILEX ............................................ 41 Figure 2.21Ê: Relations multi-bilingues de la LU allemande ÒFahrradÓ ..................................... 41 Figure 2.22Ê: Architecture logicielle dÕun syst•me de gestion de bases lexicales selon MULTILEX ................................................................................................................................................... 42 III. LES PROBLéMES INTƒRESSANTS 45 Figure 3.1Ê: Une base lexicale basŽe sur lÕapproche bilingue................................................... 46 Figure 3.2Ê: Une base lexicale basŽe sur lÕapproche interlingue. ............................................. 47 IV. DƒFINITION DÕUNE BASE LEXICALE MULTILINGUE 55 Figure 4.1Ê: Base lexicale quintilingue fondŽe sur une approche bilingue unidirectionnelle . 56 Figure 4.2Ê: Base lexicale quintilingue fondŽe sur une approche interlingue.......................... 58 Figure 4.3Ê: Base lexicale anglais-japonais fondŽe sur une approche mixte............................ 58 Figure 4.4Ê: Un exemple dÕentrŽe de dictionnaire..................................................................... 61 Figure 4.5Ê: Table des attributs et de leurs valeurs possibles.................................................... 61 Figure 4.6Ê: Vue gŽnŽrale dÕune LU (Lexical Unit) de MULTILEX .............................................. 64 Figure 4.7Ê: Structure commune uploads/Litterature/ 1994sublim-un-systeme-universel-de-bases-lex.pdf

  • 11
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager