Traduire Revue française de la traduction 222 | 2010 Traduire pour le théâtre L

Traduire Revue française de la traduction 222 | 2010 Traduire pour le théâtre Le Trésor de la langue française informatisé Pascale Bernard Édition électronique URL : http://traduire.revues.org/458 DOI : 10.4000/traduire.458 ISSN : 2272-9992 Éditeur Société française des traducteurs Édition imprimée Date de publication : 15 juin 2010 Pagination : 125-136 ISSN : 0395-773X Référence électronique Pascale Bernard, « Le Trésor de la langue française informatisé », Traduire [En ligne], 222 | 2010, mis en ligne le 12 novembre 2013, consulté le 01 octobre 2016. URL : http://traduire.revues.org/458 ; DOI : 10.4000/traduire.458 Ce document est un fac-similé de l'édition imprimée. 125 Le Trésor de la langue française informatisé Pascale Bernard Cet article fait suite à l’intervention présentée par l’auteur lors de la Journée de la traduction professionnelle 2009 à Lyon. Le dictionnaire le Trésor de la langue française, dictionnaire de la langue du XIXe et du XXe siècle (TLF), (CNRS, 1976-1994), est le plus grand et le plus complet des dictionnaires de langue. Il est paru en 16 volumes de plus de 1 500 pages chacun, le premier volume en 1971 et le dernier en 1994. Comme dans la plupart des dictionnaires, la majorité des mots est présentée selon l’ordre alphabétique, à l’exception des participes passés qui, dans le Trésor de la langue française, se trouvent à la suite du verbe dont ils dépendent. Ainsi, le participe passé pris se trouve après le verbe prendre indépendamment de son ordre alphabétique et comme dans la plupart des dictionnaires imprimés en plusieurs volumes, il n’est pas aisé d’y faire des recherches. Grâce au TLFi (Trésor de la langue française informatisée), suite logique du TLF (Dendien, 1996), cette importante ressource sur la langue française est disponible sur la toile. Associé à un moteur de recherche puissant (Stella), le TLFi permet de satisfaire les besoins de tous les linguistes, aussi bien sémanticiens que stylisticiens, qui peuvent exploiter toutes les possi- bilités offertes par Stella, mais il satisfait également les besoins de tous les utilisateurs, linguistes ou non. Ces recherches peuvent s’articuler autour des axes suivants : études en vue de repérer des cooccurrences et collocations, extraction de sous-lexiques, études morphologiques, études de syntaxe locale, de sémantique, de stylistiques mais on peut aussi faire la recherche d’un mot dont on ne connaît pas exactement l’orthographe ou lancer une recherche par mots clefs pour retrouver un mot oublié mais dont on connaît le sens, etc. Le TLFi peut être considéré comme une base de données lexicales en même temps qu’une base de connaissances finement structurée. Son originalité est fondée sur des spécificités liées à son contenu : • Sa nomenclature est riche d’environ 100 000 entrées (vedettes ou sous-vedettes, c’est-à- dire présentées en remarques ou dérivés). Original aussi le traitement de morphèmes gram- maticaux au même titre que les autres mots, ainsi on compte 62 mots traités sous la vedette –O, finale et finale par apocope. • Sa liste d’objets métatextuels sur lesquels repose la structuration de l’article du diction- naire : vedettes, codes grammaticaux, définitions, indicateurs stylistiques et/ou sémantiques, exemples, etc. soit, en tout, environ 40 objets métatextuels. • Sa grande quantité d’exemples référencés : environ 430 000. • La grande diversité des rubriques proposées, concernant l’étymologie, la prononciation, la bibliographie, etc. 1. Sa structure • Le dictionnaire a été balisé en XML et des balises spéciales ont été injectées pour pouvoir délimiter et atteindre chaque type d’objet textuel. Ainsi, si la recherche plein texte sur la totalité du contenu du dictionnaire reste toujours permise, il est possible aussi d’éliminer le « bruit » inhérent à un tel type de requêtes. Il est en effet possible de restreindre cette recherche plein texte à une recherche plus « pointue » sur un type particulier d’objet textuel. • De plus, une seconde dimension a été introduite : ces objets textuels ont été hiérarchisés à l’aide d’une série de balises spécifiques et d’une grammaire de contrôle. De par le traitement hautement élaboré qui a permis de décomposer le texte du TLF en objets élémentaires (définitions, exemples, indicateurs de domaine technique, indicateurs séman- tiques, grammaticaux, stylistiques, etc.) et d’analyser les relations hiérarchiques liant ces objets, il résulte des possibilités d’interrogation virtuellement illimitées. 2. Les recherches L’accès aux possibilités les plus raffinées exige la compréhension des concepts permettant de mettre en œuvre des recherches très puissantes. Trois niveaux d’utilisation de puissance croissante sont proposés : La consultation simple des articles, qui apporte d’emblée des facilités de recherche grâce au correcteur d’erreurs. Les recherches assistées, qui fournissent des possibilités étonnantes de consultation du diction- naire, et dont la mise en œuvre ne nécessite que quelques exemples types très simples. Pascale Bernard 126 Les recherches complexes, qui offrent les possibilités maximales d’investigation. Elles demandent la consultation d’une documentation présentant les différents objets rencontrés dans le TLF et les concepts permettant d’effectuer les recherches les plus raffinées. L’utilisateur pressé pourra se contenter des deux premiers niveaux d’utilisation. Qu’il sache qu’il a en réserve un potentiel considérable. Il pourra tester l’hypernavigation à travers les pages gérées par le même logiciel, ce qui apporte un plus à sa connaissance. 2.1. Consultation simple des articles On dispose de trois possibilités de consultation pour visualiser un article. 2.1.1. Avec le correcteur d’erreurs De nombreuses requêtes échouent dans la consultation d’un dictionnaire, indépendamment de son support, papier ou version électronique, car la recherche d’un mot dans un dictionnaire suppose que le lecteur connaisse l’orthographe exacte du mot. Ne plus savoir écrire chry- santhème ou ornithorynque, se tromper dans les accents (règulièrement ou reguliere- ment) ou les doubles consonnes (ramonnage) n’est pas un problème puisqu’il suffit de taper phonétiquement le mot recherché en un ou plusieurs mots (règue uli ère man, crise en taime, corps nichon). Deux modes sont proposés, mode automatique ou mode forcé. En mode automatique, le correcteur intervient si vous avez tapé une forme fautive comme celles citées précédemment, il n’intervient pas si vous avez tapé une forme existante, le logi- ciel affichera seulement la solution trouvée. Ainsi si vous cherchez le mot étique, il vous affichera uniquement ce mot puisqu’il l’a trouvé orthographié ainsi. En mode forcé, le correcteur intervient et vous propose toutes les solutions trouvées. Ainsi pour le mot étique, que vous pouvez taper etik, il vous proposera étique et éthique. 2.1.2. Avec l’utilisation de listes défilantes Les listes défilantes permettent de parcourir le TLF, comme on pourrait le faire dans la version papier, mais elles affichent uniquement les mots traités en vedette d’articles, c’est-à-dire en entrées principales. Si un mot ne figure pas dans cette liste, il ne faut pas en conclure qu’il n’est pas dans le TLF, on pourra le chercher grâce aux autres possibilités de recherche des autres formulaires. Le Trésor de la langue française informatisé 127 La recherche se fait en deux étapes : – Choix de la tranche alphabétique dans laquelle se situe le mot cherché • Exemple : VENTOUSER à VETEMENT – Choix du mot dans la tranche retenue • Exemple : VERNAL 2.1.3. Avec la saisie phonétique Cette consultation permet de rechercher un mot par sons et non par caractères alphabétiques. Certains sons sont regroupés. Lorsque le pointeur de souris est positionné sur un son il donne, dans le cadre « Explication », un ou des exemples du son ou des sons représentés. 2.2. La recherche assistée Cette recherche se fait par l’intermédiaire d’un formulaire de recherche sur lequel nous allons pouvoir faire cinq types de recherche que nous pourrons combiner entre elles. Pascale Bernard 128 Illustration : Marlène Junius, http://alotoftralala.over-blog.com Ce formulaire permet alors de considérer le Trésor de la langue française comme une vérita- ble base de données. Les cinq possibilités de base permettent de rechercher par : – Vedette contenant un mot donné • Exemple : tête - Le logiciel affiche toutes les entrées contenant ce mot, et permet de découvrir tous les mots composés avec cette entrée, - Jadis et autrefois et leurs fréquences. – Code grammatical • Un menu déroulant propose 12 codes grammaticaux. On pourra obtenir les autres codes dans le formulaire de recherche complexe (élément formant, préfixe, suffixe, interjection, …). – Domaine technique particulier • On peut choisir dans la liste proposée soit par ordre alphabétique, soit par thème, exemple : « mythologie ». – Indicateur d’emploi (grammatical, stylistique ou sémantique) • Exemple : « péjoratif ». – Objet textuel à choisir à partir d’un menu déroulant. Si l’on se sert de cette proposition, il faut impérativement choisir un contenu. • Exemple : « auteur d’exemple » contenant zola permet de trouver tous les exemples de Zola cités dans le dictionnaire. La recherche peut être restreinte à l’une des possibilités ou croiser plusieurs critères : – Chercher les animaux du domaine de la mythologie • Domaine : « mythologie ». • Définition contenant le mot animal. – Chercher tous les verbes employés par Victor Hugo dans un contexte populaire • Code grammatical : verbe. • Indicateur : populaire. • Auteur d’exemple : hugo. – Chercher tous les substantifs du domaine de la gastronomie • Code grammatical : substantif. Le Trésor uploads/Science et Technologie/ traduire-458 1 .pdf

  • 39
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager