Les apports possibles de la phraséologie à la didactique des langues étrangères
Les apports possibles de la phraséologie à la didactique des langues étrangères Mojca Pecman p. 109-122 Résumé L'article explore les avantages d'une analyse phraséologique du discours scientifique face aux difficultés de la maîtrise des formules conventionnelles de ce genre dans une langue étrangère, en l'occurrence en anglais. Notre recherche postule en effet l'existence d'une langue commune aux scientifiques, une langue qui transcende les disciplines, et désormais, grâce à l'anglais, les continents. Pour observer les caractéristiques de cette Langue Scientifique Générale un corpus parallèle a été mis en place recueillant des textes de trois domaines connexes : la chimie, la physique et la biologie. Le dépouillement de ce corpus a abouti à une base de données phraséologiques dont les principes qui ont guidé la construction assurent sa réutilisabilité, notamment pour la réalisation d'applications concrètes à destination des apprenants. L'article présente un projet de construction d'un dictionnaire phraséologique multifonction offrant un double accès aux unités phraséologiques (UP), un accès via la forme des UP (fondé sur une approche sémasiologique de la langue) et un accès via le sens des UP (fondé sur une approche onomasiologique de la langue). Haut de page Entrées d'index Rubriques : Recherche Haut de page Plan 1. Introduction 2. Phraséologie et TAL 2.1. Une histoire parallèle 2.2. Limites du TAL au niveau phraséologique de la langue 3. Phraséologie du discours scientifique 3.1. Langue Scientifique Générale : un postulat 3.2. Intérêt des études phraséologiques de la LSG 3.3. Historique des travaux en LSG 3.4. "Traquer" les UP de la LSG ? 3.5. Stocker les UP de la LSG 3.6. Spécificités de la phraséologie scientifique 4. Un outil d'aide à la maîtrise du niveau phraséologique de la LSG 4.1. Dictionnaire phraséologique de la LSG 4.2. Thésaurus phraséologique de la LSG 5. Conclusion Haut de page Texte intégral PDF 724k Signaler ce document 1. Introduction 1En Europe occidentale et en France tout particulièrement, la phraséologie constitue un domaine de recherche généralement encore assez peu connu. Son évolution, directement liée au développement de la linguistique de corpus et du traitement automatique du langage (TAL), va toutefois grandissant depuis les années quatre- vingt-dix. Dans cet article, la phraséologie est exploitée pour la construction d'outils d'aide à l'apprentissage des langues. L'étude explore le cas du discours scientifique et des difficultés de la maîtrise des formules conventionnelles de ce genre dans une langue étrangère, en l'occurrence en anglais. Par ailleurs, un postulat se trouve au centre de cette étude : l'existence d'une langue commune aux scientifiques à travers les disciplines, et désormais, grâce à l'accession de l'anglais au statut de lingua franca des sciences, à travers le monde. Pour observer les caractéristiques de cet univers linguistique un corpus a été mis en place recueillant des textes de domaines scientifiques variés. Le dépouillement de ce corpus a abouti à une base de données phraséologiques réutilisable. 2Le premier chapitre explore l'interaction entre le TAL et le domaine de la phraséologie. Le deuxième chapitre s'articule autour de la définition du concept de Langue Scientifique Générale (LSG) et du traitement de la phraséologie relative à cet univers linguistique particulier. Ce chapitre donne par ailleurs lieu à une discussion sur les intérêts des études phraséologiques de la LSG et il présente les travaux déjà existants sur ce sujet. Le troisième chapitre explore l'une des possibilités d'exploitation des données phraséologiques obtenues au terme de la collecte pour l réalisation d'applications concrètes. 2. Phraséologie et TAL 2.1. Une histoire parallèle 1 Bien que le domaine de la phraséologie souffre encore de nos jours d'une terminologie assez floue e (...) 3La linguistique de corpus et le TAL en général ont joué un rôle décisif dans l'évolution de la phraséologie, domaine à la frontière de la lexicologie et de la syntaxe qui se consacre à l'étude des combinaisons de mots récurrentes e arbitraires souvent appelées "collocations" ou "unités phraséologiques" (UP)[1]. Bien qu'elles constituent des éléments constants du discours, les combinaisons de mots lexicalisées n'en demeurent pas moins des éléments subliminaux du langage se refusant à tout repérage facile. Souvent absentes des dictionnaires traditionnels, elles parsèment le discours d'effets de "déjà entendu" et ne se présentent pas à l'esprit distinctement comme des unités minimales de la langue. La prolifération de corpus textuels informatisés, ainsi que de programmes pour leur exploitation, a apporté une réponse à cette difficulté en rendant possible le repérage des séquences de langue récurrentes : The increasing use of computer-held text corpora containing many millions of words has allowed linguists to establish lexico-grammatical patterns in language that were previously unavailable to observers. ([Gledhill00] : 115) 4Alors que dans les autres disciplines de la linguistique, l'apport des corpus et du TAL consiste principalement en un gage d'objectivité, en phraséologie les corpus apparaissent comme les piliers même de la recherche, puisque eux seuls permettent en effet de confirmer le statut phraséologique de certaines constructions polylexicales. Comme Habert et al. le remarquent : (...) étant donné une expression jugée "contrainte" quant à ses possibilités de transformation, les corpus permettent de chercher si ses réalisations effectives confirment ce jugement. ([Habert97] : 57) 2 Cette méthode d'investigation des amalgames de mots lexicalisés est sous-tendue par l'interprétatio(...) 5Par exemple, il n'est pas toujours aisé de déterminer si une séquence aussi banale que to start a car constitue une combinaison libre d'éléments lexicaux ou une combinaison restrictive. À première vue, il semble s'agir d'une construction libre étant donné que ses éléments constitutifs, le verbe start et le nom car, possèdent tous les deux des paradigmes combinatoires très étendus (to start [a lesson/ a play/ a book/ studying/ cooking/ singing/...], to [buy/ drive/ wash/ lend/ break/ look at/...] a car). Toutefois, grâce au TAL et aux méthodes de la statistique lexicale, il est désormais possible de connaître la probabilité de leur apparition mutuelle et d'affirmer leur statut phraséologique. Par exemple, selon les résultats fournis par le Collins Cobuild corpus, la probabilité d'apparition de l'unité start au voisinage de l'unité car est significativement forte : 8,6 %.[2] 6Souvent, l'observation d'autres langues permet de confirmer le statut avéré d'une UP moyennant une interrogation de corpus, puisque dans le cas des vraies UP la traduction mot à mot est souvent impossible : *commencer une voiture est effectivement inacceptable en français, de même que l'est*započeti auto (traduction littérale) en croate. Le choix arbitraire de la collocation devient évident puisqu'en français on dira démarrer une voitureet en croate upaliti auto (litt. "allumer la voiture"). 2.2. Limites du TAL au niveau phraséologique de la langue 7Les techniques pour le traitement automatique de corpus servant à l'identification des UP utilisent des méthodes statistiques qui s'appuient sur des modèles mathématiques solides. Malgré leur rigueur scientifique, les résultats obtenus au moyen de ces techniques pointent trois défauts majeurs de ce type de méthode lexicographique : l'exclusion des UP à fréquence faible, le recensement possible des amalgames ne constituant visiblement pas des UP et l'absence de toute catégorisation des ressources linguistiques obtenues. 8Dans le cadre du traitement automatique de corpus textuels, il existe un grand risque de négligence des modèles qui font visiblement (ou intuitivement) partie de la phraséologie, mais dont la fréquence n'est pas significative. Par exemple, dans sa quête des collocations à partir d'un corpus de textes du domaine des sciences et technologies de l'information, Curado ([Curado01] : 112) relève les unités suivantes comme ayant une fréquence très faible : first and foremost, diskette drive et ticket booth. Les lexicologues ont l'habitude de gérer ce type de problème de façon à réhabiliter ces unités dans leurs listes d'étude afin qu'elles reçoivent le même traitement que les unités de haute fréquence. De manière analogue, les unités polylexicales à haute fréquence qui ne constituent visiblement pas des UP (par ex. we accurately, access which) sont régulièrement éradiquées de ces mêmes listes. 9Enfin, les techniques pour le traitement automatique de corpus offrent comme seul résultat combinaisons de mots qui sont vraisemblablement des collocations. Elles ne sont pas capables de classer ces combinaisons suivant une typologie. Par exemple, des séquences aussi diverses que to result in,quite possible et so as to apparaîtront toutes dans une liste sans aucune information discriminatoire supplémentaire et sans aucune mise en relation des UP sémantiquement ou autrement proches. Or, une classification, par exemple selon le rôle joué par les UP dans le discours (cf. exemple 1) ou encore selon la notion à laquelle elles renvoie (respectivement "aboutissement", "probabilité" et "objectif") faciliterait grandement la manipulation des données recueillies par la suite, notamment dans le cadre de la création des applications à fins didactiques. 10Exemple 1 - avoir pour résultat -> to result in (fonction prédicative) ; - fort possible -> [very / easily / quite] possible(fonction adjectivale) ; - en vue de <qch> -> so as to <do sth>, with a view to <(doing) sth> (fonction adverbiale) ; 11Par conséquent, tout traitement automatique de la phraséologie nécessite une relecture manuelle des résultats obtenus au terme de l'exploitation du corpus. 3. Phraséologie du discours scientifique 3.1. Langue Scientifique Générale : un postulat 12Notre recherche défend l'idée de l'existence d'une langue commune aux scientifiques indépendamment de leurs spécificités disciplinaires et uploads/Science et Technologie/ les-apports-possibles-de-la-phraseologie-a-la-didactique-des-langues-etrangeres.pdf
Documents similaires
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/acPJBePW1FMAPIghgoR1DpYkOvNv2kvcmazLM5q1EeZzhFzNGsQPtqUHDFaYV0RkXFJyOWA48ADAfCnMsUkLW4OW.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/IYai3tJTZzdWKi9p6CCHmOiMNHX7CSdY0Isz82uPEFuB8qggtDkGzO66wN3pjUE2XyNkGjXY8k3YOg6T9sNqZviS.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/NF3uVtHpfJo9a5fVx6giewnXV69wmoRmYmV21jqSl9YrIsROPxNC3XXKCphRVy9T95m7pRppgnhNPvOKzox8eipd.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/ABuDkIZKalfHX8UiYakKAjSXhzZPLl0ls6FUrWxO08TFj54gLOaBrk8PbNVMTE1rYtJJUf3U1Z2MKHwX6Zh2MW3l.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/2vlxKKy5TvyqN49nJlA3futRqCeqfdPbk07j63aur9slPuD4rWoO2Db5JmvdZNgYFMC0NM0nDWOXqtvWLS1Apa45.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/IPXgiZK6Db52hldVrGbdVT5JtLRuxWoli2kPf0pJM27s3PQp68DjVWnASxbGTLOdc1mI9mam2A5nswZpHwoWbi3n.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/obiITl5Kpi7j78jzR5OULcI2s5Y11ad6AX76BUNOdGBQrphjourxaKh36iFsggrUmBxhxSfBrdbMHk018vr2IKcx.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/8gw1d37KpXnqB9rD6bPrHLIiATxKaxtiXNTUDnBEwH7KH221mZAYIMsDzPU2AuQET32smtgzeCtUszXeTaaijD7w.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/OvCd999qIas6MIpA7qT32H83PGLrdzbaQMooW7sZg2TddPkuZOKZi6YtwdBXzlkiyvztGDFtZ1IDolcqCX5Is1ht.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/cz2Q3i038Dxux4c3N28iDJznALAexUrwkelly8amQmIMY6cs0hNoN3ffHGvZbwIV6MG2CBwhJrDoXp21M3qt4svW.png)
-
21
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Sep 25, 2021
- Catégorie Science & technolo...
- Langue French
- Taille du fichier 0.2771MB