Une étude quantitative du vocabulaire de Maupassant par Thierry Selva Dans son

Une étude quantitative du vocabulaire de Maupassant par Thierry Selva Dans son étude Le Roman qui préface Pierre et Jean, Maupassant, reprenant les idées de Flaubert1, définit sa vision de l’écriture en déclarant : Quelle que soit la chose qu’on veut dire, il n’y a qu’un mot pour l’exprimer, qu’un verbe pour l’animer et qu’un adjectif pour la qualifier. Il faut donc chercher, jusqu’à ce qu’on les ait découverts, ce mot, ce verbe et cet adjectif, et ne jamais se contenter de l’à-peu-près, ne jamais avoir recours à des supercheries, même heureuses, à des clowneries de langage pour éviter la difficulté. On peut traduire et indiquer les choses les plus subtiles en appliquant ce vers de Boileau : D’un mot mis en sa place enseigna le pouvoir. Il n’est point besoin du vocabulaire bizarre, compliqué, nombreux et chinois qu’on nous impose aujourd’hui sous le nom d’écriture artiste, pour fixer toutes les nuances de la pensée ; mais il faut discerner avec une extrême lucidité toutes les modifications de la valeur d’un mot suivant la place qu’il occupe. Ayons moins de noms, de verbes et d’adjectifs aux sens presque insaisissables, mais plus de phrases différentes, diversement construites, ingé- nieusement coupées, pleines de sonorités et de rythmes savants. Efforçons-nous d’être des stylistes excellents plutôt que des collectionneurs de termes rares. Et un peu plus loin : La langue française, d’ailleurs, est une eau pure que les écrivains maniérés n’ont jamais pu et ne pourront jamais troubler… La nature de cette langue est d’être claire, logique et nerveuse. Elle ne se laisse pas affaiblir, obscurcir ou corrompre. Ceux qui font aujourd’hui des images, sans prendre garde aux termes plus abstraits, ceux qui font tomber la grêle ou la pluie sur la propreté des vitres peuvent aussi jeter des pierres à la simplicité de leurs confrères ! Elles frapperont peut-être les confrères qui ont un corps, mais n’atteindront pas la simplicité qui n’en a pas. Par ces propos, Maupassant recherche clairement la simplicité et se positionne dans le camp des écrivains d’instinct par opposition aux écrivains de recherche. Il s’en enor- gueillit et prétend écrire avec ses tripes plutôt qu’avec son cerveau. 1 Maupassant décrit Flaubert comme étant « obsédé par cette croyance absolue qu’il n’existe qu’une manière d’exprimer une chose, un mot pour la dire, un adjectif pour la qualifier et un verbe pour l’ani- mer » et qu’il « se livrait à un labeur surhumain pour découvrir, à chaque phrase, ce mot, cette épithète et ce verbe » (Gustave Flaubert, préface aux lettres de Gustave Flaubert à George Sand, Charpentier 1884). Mais que veut dire exactement « simplicité » ? Est-ce que ce terme implique l’utilisation d’un vocabulaire commun, pauvre, avec en conséquence une certaine redondance, une certaine répétition dans les mots et tournures employés (car l’œuvre de Maupassant, si elle n’atteint pas le volume d’un Zola ou d’un Hugo, est quand même conséquente) ? Ou bien la simplicité a-t-elle un rapport avec l’emploi, ou plutôt le non-emploi, de termes rares, sans toutefois exclure une richesse et une diversité du vocabulaire ? D’ailleurs, qu’en est-il de la simplicité du vocabulaire de Maupassant ? Est-elle réelle ou apparente ? La présente étude va tenter, preuves à l’appui, d’apporter une réponse à ces questions, maintes fois débattues sans que les intervenants ne disposent jamais des seuls éléments qui permettent de résoudre le problème de manière concluante : la liste des mots employés par Maupassant dans toute son œuvre, et la taille de cette liste. Il s’agit donc ici d’une étude quantitative car les notions de rareté ou de fréquence sont liées directement au nombre d’occurrences d’un mot dans les textes. Taille du vocabulaire de Maupassant La clarté présumée du vocabulaire de Maupassant a toujours donné l’impression que celui-ci utilise très peu de mots. C’est d’ailleurs un sentiment généralement admis, même parmi les spécialistes. Armand Lanoux écrit par exemple2 : Il n’y a pas de grand écrivain français qui ait écrit aussi bien avec aussi peu de mots. De même, André Vial3 cite l’étude de Albert Schinz4 qui … dénombrant le vocabulaire de dix contes de Maupassant, constate que l’auteur se sert à peu près du dixième des mots qui existaient de son temps – ce serait en somme un rapport renouvelé de celui de Racine – … Et plus loin, Le roman de Maupassant, dans son ensemble, appelle les mêmes conclusions. A quelques exceptions près, qui seront précisées, il ne requiert du lecteur moyen l’usage d’aucun dictionnaire, et le vocabulaire dont il est fait n’épuise qu’une partie bien exiguë du Petit Larousse. Alors, qu’en est-il vraiment ? A l’époque de M. Schinz (1909), on ne pouvait que prendre son courage à deux mains et parcourir chaque texte en notant sur une feuille de papier le vocabulaire rencontré. De la sorte, on n’allait pas bien loin, et c’était compréhensible. Le problème est que le nombre de mots différents augmente avec la quantité de texte et qu’une dizaine de contes, même sélectionnés avec attention, ne sont absolument pas représentatifs de l’ensemble de l’œuvre. De nos jours, l’existence de corpus électroniques et d’analyseurs automatiques rend ce dénombrement bien moins fastidieux. Ainsi, pour cette étude, nous avons utilisé les ressources et outils dont nous disposions : d’une part le corpus Maupassant, rassemblé sur le site Maupassant par les textes (http://maupassant.free.fr), qui couvre l’ensemble de 2 Maupassant, le Bel-Ami, Grasset, 1979, p. 428. 3 Guy de Maupassant et l’Art du Roman, Nizet, 1954, p. 570. 4 Le Vocabulaire de Maupassant et de Mérimée, Revue des langues romanes, 6e série, t. II janvier-février 1909, pp. 504 à 531. l’œuvre. Il comprend 306 contes et nouvelles, six romans plus l’Âme étrangère et l’Ange- lus, inachevés et ne dépassant pas le chapitre, trois récits de voyage, un peu plus de 200 chroniques journalistiques, la poésie et le théâtre5, soit en tout l’équivalent de 5 000 pages de l’édition Pléiade. D’autre part, nous avons fait fonctionner un logiciel d’ana- lyse textuelle, Cordial Analyseur 7, qui permet d’obtenir, pour chaque mot, sa forme canonique ou lemme (infinitif pour les verbes, masculin singulier pour les adjectifs, singulier pour les noms), et qui permet de dresser ainsi l’inventaire du vocabulaire de Maupassant. Cordial Analyseur a la réputation dans le monde universitaire d’être un des meilleurs analyseurs sur le marché (on parle en fait d’étiqueteur, c’est-à-dire d’un programme qui associe à chaque mot une ou plusieurs étiquettes morpho-syntaxiques, comme le lemme ou la catégorie grammaticale). Cependant, il faut savoir que l’étiquetage de textes n’est pas, pour diverses raisons dans lesquelles nous n’entrerons pas ici, une science exacte et que l’état de l’art dans le domaine correspond à un taux d’erreur de 5 %. C’est-à-dire qu’en moyenne un mot sur vingt, ce qui est tout de même une faible proportion pour notre étude, est mal étiqueté. L’une des erreurs les plus fréquentes est la confusion entre l’adjectif et le participe passé. Ainsi, bien souvent, doué est étiqueté comme le participe passé de douer et non comme adjectif, alors que c’est bien cet emploi que l’on retrouve majoritairement dans les textes. De même certains adjectifs comme tigré ou tacheté sont considérés comme des verbes sous l’emploi de participe passé. Bien que cela soit gênant, la proportion de ces erreurs reste faible et, si les chiffres donnés ci-dessous ne sont pas exacts à 100 %, ils sont très proches de la réalité et nous permettent de tirer des conclusions fiables. L’analyse des textes a donné les résultats suivants : Noms communs Verbes Adjectifs Adverbes Total 10 021 3 117 4 352 766 18 256 Ces chiffres couvrent la quantité effective de mots dans chacune des catégories gram- maticales. Les noms propres, chiffres sous forme numérique, formes patoisantes, étran- gères (prussiennes notamment), coquilles et mots non reconnus par l’analyseur ont été écartés, soit automatiquement, soit par correction manuelle. Les listes ainsi que les textes sont accessibles sur le site Internet (http://maupassant.free.fr/travaux/frequen ces/listes.html). Si l’on rajoute au total les autres catégories (articles, pronoms, prépo- sitions, conjonctions, etc.), vides sémantiquement et qui sont au nombre de quelques centaines, on obtient donc un vocabulaire total de 18 000 à 18 500 mots. Signalons par ailleurs que la notion de mot, très floue, est ici très restrictive : est considéré comme mot, à de rares exceptions près qui sont le fait du dictionnaire de l’analyseur, toute série de lettres entre deux séparateurs typographiques (blancs, ponctuation). Donc des mots comme pomme de terre, chemin de fer, bon marché, etc. sont décomposés. Le nombre de ces unités polylexicales étant loin d’être négligeable, le vocabulaire de Maupassant s’en trouve d’autant augmenté. On est donc bien loin d’une quantité de 2 000 - 3 000 mots que l’on entend parfois ou encore, selon André Vial, d’une portion congrue des diction- naires6. Néanmoins, ces chiffres restent difficiles à interpréter dans l’absolu. 18 000 5 Nous n’avons pas inclus les lettres de la correspondance qui sont des textes privés non destinés à l’ori- gine à la publication. 6 Un dictionnaire de langue comme le Petit Robert recense environ 36 000 mots uploads/Litterature/ une-etude-quantitative-du-vocabulaire-de-maupassant 1 .pdf

  • 24
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager