1 Étendue du vocabulaire et compréhension écrite – le français à l'université e

1 Étendue du vocabulaire et compréhension écrite – le français à l'université en Suède Mårten Ramnäs (Université de Gothenburg, Suède) Abstract: This paper investigates the amount of French vocabulary needed to read (with reasonable comprehension) three authentic novels used in a first semester course of French at a Swedish university. The analysis applies the concept of lexical coverage and uses the frequency lists of Lonsdale & Le Bras (2009). The counting unit is the lemma. This study also examines the common French word list used in all Swedish universities offering French degrees. The results show that 7 000 to 9 000 lemmas will provide the 98 % coverage needed for reasonable comprehension. This is at least twice the 4 000 lemmas contained in the university list. The results therefore point to the necessity of including a vocabulary component also in higher-level French courses. Keywords: vocabulary, coverage, reading comprehension, SLA, French 1. Introduction Il existe aujourd'hui quantité d'études qui montrent une forte corrélation entre l'étendue du vocabulaire (le nombre de mots qu'on connaît) d'un apprenant de langue seconde et ses compétences linguistiques générales. Cela vaut en particulier pour les compétences passives, mais également pour les compétences productives (Laufer, 1992, 1998; Milton et al. 2010; Stæhr, 2008). En d'autres mots, un apprenant qui a un vocabulaire étendu a le plus souvent aussi une bonne maîtrise générale de la langue qu'il apprend. Malgré les nombreuses études qui mettent en évidence ce lien, le vocabulaire peine à faire sa place dans l'enseignement des langues, et ce depuis plus d'un demi-siècle (Bogaards 1994). Or, de plus en plus de voix se font entendre pour souligner sa grande importance. En Suède, l'initiative d'une liste de vocabulaire commune valable pour le premier semestre d'études universitaire de français, introduite il y a une dizaine d'années et adoptée par toutes les universités suédoises est peut- être révélatrice de cet intérêt. 1.1 But Cet article reprend et développe un sujet déjà abordé dans une publication récente (Ramnäs 2017). En effet, nous nous proposons d'analyser ici le vocabulaire de trois textes littéraires qui sont au programme du premier semestre d'études de français à l'université de Göteborg pour essayer de déterminer l'étendue du vocabulaire nécessaire pour les lire avec fluidité et sans recours au dictionnaire. Nous examinerons aussi différents aspects de la liste de vocabulaire commune des universités suédoises mentionnée ci-dessus en la comparant avec les résultats de notre analyse: les étudiants, sont-ils capables de lire les romans s'ils ROM17 Edited by Jon Askeland, Marco Gargiulo and Synnøve Ones Rosales. BeLLS Vol. 10, No. 1 (2019), DOI 10.15845/bells.v10i1.1430. Copyright © by the Author(s). Open Access publication under the terms of CC-BY-NC-4.0. 2 connaissent les mots de la liste? Pour conclure, nous discuterons quelques implications pédagogiques de cette étude pour l'apprentissage et l'enseignement du vocabulaire. 1.2 Cadre théorique et terminologique Avant d'arriver à la présentation des résultats, il est utile de rappeler la signification de quelques termes qui seront employés dans ce qui suit. Comme la notion de mot manque de clarté, nous nous restreindrons ici à deux définitions bien distinctes. Ce terme sera tantôt employé dans le sens de token (mot-forme ou occurrence), "un ensemble de morphèmes formant une unité sémantique, et, le plus souvent isolé par deux espaces à l'écrit" (Le Querler 1994), tantôt comme synonyme du terme lemme pour désigner les mots tels que l'on les trouve dans un dictionnaire, là où ils regroupent les différentes formes flexionnelles d'un même mot (entrée). Pour les verbes par exemple, le lemme est représenté par l'infinitif (sa forme vedette ou canonique). Dans ce dernier cas, par souci de clarté, nous préférons le plus souvent le terme de lemme, mais comme d'autres chercheurs emploient parfois "mot" dans le sens de lemme, nous n'avons pas pu complètement éviter cet emploi. (En français, on trouve aussi les termes unité lexicale, lexie ou item lexical pour désigner la notion de lemme.) Les chercheurs anglophones vont souvent plus loin en utilisant le terme de famille de mots (word family) sous lequel on regroupe les mots qui partagent le même radical (la même racine), l'idée étant qu'avec des connaissances morphologiques élémentaires, on peut deviner les significations des autres membres de la famille de mots si on connaît la signification d'un membre. Pour l'anglais, il existe une définition de famille de mots à 6 niveaux proposée par Bauer et Nation (1993). Pour définir les niveaux ces chercheurs se sont servis de critères tels que la fréquence, la productivité, la transparence et la régularité des morphèmes dérivationnels. En étudiant cette définition de près, on s'aperçoit que le premier niveau correspond au terme type ("a different form is a different word", 270) et le deuxième niveau à peu près au terme lemme (regroupant les formes flexionnelles). Dans le corpus qui soutient l'étude de Bauer et Nation, le nombre de types (niveau 1) est sensiblement plus élevé que le nombre de lemmes (le niveau 2). En effet, cette différence est de 39 % alors que la différence en nombre entre lemmes (niveau 2) et familles de mots dans sa définition la plus étendue (niveau 6) est nettement moindre (22 %). Quand on compare une étude où l'unité de mesure est le lemme avec une étude où l'unité de mesure est la famille de mots, il faut tenir compte de la différence qui existe entre les deux, mais cette différence est peut-être moins importante que ce que l'on pourrait penser au premier abord. Pour le français, il n'y a, à notre connaissance, pas de définition semblable proposée, ce qui ajoute à la complexité des comparaisons. Dans l'introduction, nous avons évoqué le lien qui existe entre l'étendue du vocabulaire d'un apprenant et ses compétences linguistiques générales. L'étendue peut se définir comme le nombre de mots pour lesquels un locuteur peut donner au moins un sens correct (Schmitt 2014, 942). Or, la connaissance d'un mot comprend une multitude d'autres aspects que l'on regroupe souvent sous le terme de profondeur. Nation (2001, 48) propose de diviser ces différents aspects en trois catégories: la forme, le sens et l'utilisation. Les catégories sont ensuite divisées en sous-catégories pour lesquelles il y a toujours une face productive et une autre face réceptive. Schmitt (2014) constate que la profondeur est un concept utile pour expliquer la nécessité d'apprendre tous les aspects d'un mot (prononciation, orthographe, réseaux sémantiques, collocations, etc.), mais que ce concept est très difficile à cerner et à 3 mesurer vu sa grande complexité. D'autre part, l'étendue et la profondeur sont en relation puisque la connaissance passive d'un mot peut être considérée comme un aspect de la profondeur. En effet, pour les apprenants moins avancés, l'étendue et la profondeur montre une corrélation forte (Schmitt 2014). En dehors de ces deux concepts, Daller et al. (2007) font usage d'une troisième dimension qui est celle de la fluidité et qu'ils définissent comme la facilité et la rapidité avec lesquelles le locuteur est capable de reconnaître et d'utiliser les mots. Dans cette étude, nous nous intéresserons uniquement à l'étendue du vocabulaire en raison de la relation particulièrement étroite qui existe entre celle-ci et la compréhension écrite. En anglais, on entend par le terme coverage la proportion de mots d'un texte qui sont couverts par un certain vocabulaire. Nous emploierons en français le terme couverture. Comme les mots les plus fréquents de la langue reviennent dans tous les textes, on constate qu'un millier de lemmes suffisent souvent pour assurer une couverture atteignant les 80 %. La couverture nécessaire pour lire et comprendre un texte est une question sur laquelle se sont penchés de nombreux chercheurs. Différents chiffres ont été avancés, mais plusieurs études récentes concordent pour dire qu'au moins 98 % de couverture est nécessaire pour arriver à une lecture fluide et plaisante (Nation 2001, 2006; Schmitt et al. 2011). Une couverture de 98 % implique que 2 % des mots sont inconnus. Pour lire et comprendre un texte raisonnablement bien on n'a donc pas besoin de comprendre tous les mots qui le constituent. Les exemples ci-dessous offrent une illustration simple du phénomène de couverture. Le passage est tiré du roman La Petite Bijou (Modiano 2001) et les exemples adaptés sont tirés de Ramnäs (2017). Même si on arrive à une couverture de 80 % avec mille lemmes1, le texte reste incompréhensible puisque les mots couverts sont, à l'exception de quelques mots lexicaux très fréquents, pour la plupart des mots grammaticaux (voir le premier exemple ci- dessous). La couverture augmente vite avec un vocabulaire plus étendu comme nous le voyons dans le deuxième et le troisième exemple ci-dessous, mais au-delà des premières tranches de mille mots, chaque nouvelle tranche de mille mots ne fait augmenter la couverture que de très peu. Dans le troisième exemple, 4 mots sur 85 sont inconnus, ce qui correspond à une couverture d'environ 95 %. Pour arriver à 98 %, deux mots au maximum peuvent être inconnus dans cet extrait. 1 000 lemmes (18 mots inconnus) Une ........ m'était revenue en ........, l'une des quelques ........ que j'ai gardées de ma mère. Son visage est ........ comme si uploads/Litterature/ 1430-article-text-11829-1-10-20191107.pdf

  • 13
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager