99 Inès Sfar Université de Tunis TIL (00/UR/0201)-Université de Manouba Abstrac

99 Inès Sfar Université de Tunis TIL (00/UR/0201)-Université de Manouba Abstract: The present article focuses on a method suggested for the alignment of bilingual or multilingual corpora within the framework of a specific theory, that of the three primary functions of lexical units. After having presented the principles of this lexicalist theory applied to monolingual corpora, we withdraw the principles of the method based on the predicative analysis. We then describe the results of such an approach and its application to a bilingual corpus by demonstrating that it is possible to extract predicates, arguments and actualisers from aligned bilingual corpora and to build highly reliable correspondences. The junction of predicative analysis and corpus alignment presents itself as a tool for the evaluation of translation quality. Keywords: alignment, predicative analysis, bilingual lexicon, linguistic terminology, primary functions Introduction L’utilité des corpus alignés bilingues ou multilingues n’est plus à démontrer puisqu’ils permettent d’extraire automatiquement des équivalents de traduction, des collocations et des lexies complexes. Ce qui permet de normaliser la terminologie dans un champ donné, notamment en science du langage, discipline qui souffre énormément d’une situation de flou terminologique. La tâche de construction d’un grand corpus bilingue aligné est très importante pour la traduction automatique. Ce corpus est décrit comme un Synergies Tunisie n° 2 - 2010 pp. 99-113 L’analyse prédicative : un outil pour l’évaluation de la traduction des textes bilingues alignés Résumé : Le présent article est centré sur une méthode proposée pour l’alignement des corpus bilingues ou multilingues dans le cadre d’une théorie spécifique, celle des trois fonctions primaires des unités lexicales. Après avoir présenté les principes de cette théorie lexicaliste appliquée à des corpus monolingues, nous dégageons les principes de la méthode basée sur l’analyse prédicative. Nous exposons ensuite les résultats d’une telle démarche et son application à un corpus bilingue en montrant qu’il est possible d’extraire les unités prédicatives, argumentales et actualisatrices à partir de corpus bilingues alignés et de construire des correspondances très fiables. Le croisement de l’analyse prédicative et de l’alignement de corpus se présente comme un outil d’évaluation de la qualité de la traduction. Mots-clés : alignement, analyse prédicative, lexique bilingue, terminologie linguistique, fonctions primaires 100 ensemble de paires de phrases bilingues. Aujourd’hui, un tel corpus aligné français-arabe n’est pas disponible, mais les travaux de traduction de textes linguistiques du français vers l’arabe1, ont permis de rassembler dans des bases de données (lexicographiques, terminologiques et textuelles) un matériau comparable très important constitué de documents traduits dans plusieurs domaines. Nous proposons dans cet article une nouvelle méthode pour l’extraction de lexiques bilingues de corpus alignés à partir des fonctions assignées aux unités lexicales et terminologiques dans le discours. Pour ce faire, nous détaillons les spécificités de l’approche basée sur les trois fonctions primaires en corpus monolingue. Ensuite, nous évaluons la méthode de l’analyse prédicative sur un corpus bilingue français-arabe2, et montrons comment la combinaison de l’analyse prédicative et de l’alignement des textes permet d’évaluer la qualité de la traduction et d’améliorer de façon significative les résultats. 1. Les outils théoriques et méthodologiques 1.1. Les trois fonctions des unités lexicales Les unités linguistiques, qu’elles soient lexicales ou terminologiques, peuvent avoir trois fonctions dans la phrase : en tant que prédicats, arguments ou actualisateurs. Ce constat est valable pour le français comme pour l’arabe. Le texte arabe étant la traduction du texte français, le repérage des unités linguistiques se fait sur la même base. Nous présentons dans ce qui suit les principes méthodologiques de l’analyse prédicative des textes spécialisés en français. 1.1.1. La fonction prédicative Tout comme les énoncés du discours général, les discours spécialisés peuvent être abordés sous l’angle de la prédication. On leur applique alors les mêmes critères préconisés pour l’analyse des discours de la langue générale. C’est dans ce sens que nous faisons la distinction entre : - la prédication élémentaire, qu’on retrouve au niveau de la phrase simple et qui concerne le prédicat élémentaire chargé de sélectionner ses arguments, comme dans : « Les définitions peuvent varier considérablement pour un même vocable » - la prédication de second ordre, qui est spécifique aux phrases complexes et qui repose sur des arguments phrastiques, comme dans : « Une phrase est un lieu de flou si elle comporte un ou plusieurs prédicats flous, c’est- à-dire dont l’intension n’est que partiellement spécifiable, de telle sorte que l’extension correspondante n’est pas univoquement déterminée ». Le discours spécialisé, comme tout discours, comporte des prédicats spécifiques : il se construit à partir d’un ensemble de mots lexicaux (nom, adjectif, verbe, etc.) et grammaticaux (articles, pronoms personnels, déterminants démonstratifs, etc.) qui construisent un réseau de rapports anaphoriques et cataphoriques formant l’échafaudage qui le soutient. Par conséquent, nous avons relevé un nombre important d’unités lexicales qui fonctionnent comme des prédicats anaphoriques : « En revanche Les freins de ma voiture ont été refaits a du sens parce qu’on peut dire dans quelles conditions cela est vrai ». Synergies Tunisie n° 2 - 2010 pp. 99-113 Inès Sfar 101 Une deuxième spécificité du discours linguistique, et non des moindres, est celle de la relation caractérisante ou définitionnelle qui unit les notions, les termes et les concepts. Tout le texte en linguistique est structuré sur la base d’un jeu définitionnel dans lequel les deux arguments de la relation se transforment en prédicats : « La vérité langagière est une vérité prise en charge par un sujet » « Les relations entre phrases que l’on cherche à calculer, indépendantes de la situation discursive et valables quel que soit le locuteur dont on a sollicité le jugement, ne sont rien d’autre que des relations qui s’établissent en vertu du sens ». 1.1.2. La fonction argumentale Etant donné que les arguments sont sélectionnés par les prédicats, la nature du prédicat a donc un impact sur la nature de l’argument et sur sa forme. Si la prédication est élémentaire, les arguments sont sélectionnés en conséquence. Par exemple : « (…) d’incontestables liens unissent le sens et la vérité ». Si la prédication est complexe, les arguments sélectionnés sont de nature prédicative, notamment dans le cas de la prédication de second ordre : « Un énoncé a du sens dès lors qu’il est possible d’énumérer les conditions dans lesquelles il peut être déclaré vrai et, conséquemment, dans lesquelles il peut être déclaré faux ». Dans d’autres cas, plus spécifiques au discours des sciences du langage, nous relevons des arguments formés d’une ou plusieurs phrases successives. En effet, la spécificité des textes linguistiques est qu’ils sont structurés d’une manière binaire : exemples et commentaires. Il arrive que les exemples soient entièrement repris dans le commentaire, comme dans : « Deux et deux font quatre ou bien La racine de 81 est 9 ou encore Le plus grand dénominateur commun de 18 et 24 est 6 sont des propositions vraies par les seules règles que l’arithmétique se donne ». Par conséquent, ces phrases sont reconnues comme faisant partie des arguments du prédicat propositions. Les exemples de ce type sont très nombreux. On peut en citer un autre : « Ce type de vérité est fort éloigné de la vérité de Les chimpanzés sont des singes » Il arrive aussi que ce même argument se transforme en prédicat (cf. § 2.2.). 1.1.3. La fonction actualisatrice Les actualisateurs sont des éléments qui permettent d’inscrire les prédicats et les arguments dans l’énonciation en véhiculant les différentes catégories grammaticales de la personne, du genre, du nombre, du temps, de la diathèse, de la modalité et de l’aspect. Ils peuvent être de nature grammaticale (préposition, déterminant, flexion verbale, nominale ou adjectivale, etc.) ou lexicale (adjectifs modifieurs, adverbes, morphèmes dérivationnels, etc.). Un texte du domaine des sciences du langage représente un pourcentage élevé de présence d’actualisateurs. La raison est la suivante : le texte linguistique est un texte à contenu informatif, scientifique, de type argumentatif et L’analyse prédicative : un outil pour l’évaluation de la traduction des textes bilingues alignés 102 illustratif. Toutes ses propriétés rhétoriques font de l’usage des actualisateurs (simples ou complexes) une particularité du discours des sciences du langage. L’exemple qui revient très souvent est celui du verbe être, employé comme verbe support de prédicats nominaux ou adjectivaux. Cette fréquence d’emploi peut s’expliquer par le fait qu’il s’agit d’un texte basé sur des relations définitionnelles « caractérisantes ». Le deuxième exemple est celui des prépositions composées et des conjonctions de subordination. Il n’en demeure pas moins que la notion d’analycité est centrale pour notre propos. Préd : centrale (arg 1 : notion d’analycité ; arg 2 : propos) 1.2. La technique d’alignement automatique L’alignement automatique de textes consiste en la mise en correspondance entre des unités logiques de textes alignés, c’est-à-dire un ensemble de textes de langues différentes, constitué d’un texte original et de sa ou ses différentes traductions. L’alignement peut être réalisé à différents niveaux selon plusieurs méthodologies (cf. Kraif, 2002 ; Zimina, 2002-2004 ; Langlais, 1997, Véronis, 2000 ; etc.). Selon Véronis (2000 : 158), deux méthodes principales ont été utilisées pour l’alignement de phrases : l’ancrage lexical et la longueur des uploads/Philosophie/ sfar.pdf

  • 21
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager