Morgane SÉNÉCHAL Distribution des emplois d’un verbe polysémique 1/14 Distribut

Morgane SÉNÉCHAL Distribution des emplois d’un verbe polysémique 1/14 Distribution des emplois d’un verbe polysémique français à travers la base FRANTEXT par périodes et par types de textes Morgane SÉNÉCHAL CRISCO, Université de Caen senechal.morgane@neuf.fr Coordonnées originales : Actes de « Coldoc 05 - 2ème colloque Jeunes Chercheurs en Sciences du langage - », Université Paris X, 16-17 juin 2005, [En ligne] http://modyco2.u- paris10.fr/?u_s=8&u_a=555& Introduction De manière générale, la communauté linguistique s’accorde à voir dans la polysémie : (i) une pluralité de sens liée à une seule forme (ii) des sens qui ne paraissent pas totalement disjoints, mais se trouvent unis par tel ou tel rapport. (Kleiber : 1999, p. 55) Dans le cas de la polysémie verbale, le phénomène est plus complexe, étant donné que l’on observe une triple variation : le changement de sens s’associe généralement à un changement de construction syntaxique (au sens classique du terme) et à un changement de cadre prédicatif (François : 2003)1. Dès lors, l’étude de la polysémie verbale ne saurait se limiter à une étude de mots isolés ; elle implique au contraire une analyse détaillée des contextes dans lesquels le verbe apparaît et dont dépend l’assignation du sens2. La constitution d’un corpus s’impose donc naturellement. Pour autant, il reste à déterminer les objectifs qui vont guider son exploitation. Comme le rappellent Benoît Habert, Cécile Fabre et Fabrice Isaac, tout corpus doit répondre à un objectif théorique explicite (Habert, Fabre & Isaac : 1998, p.35) ; il est maintenant admis que le corpus n’a de valeur et d’utilité qu’au regard de ce que l’on veut en faire. De notre côté, le premier objectif de l’étude de corpus est d’obtenir une représentation de la distribution des emplois d’un verbe polysémique dans la langue et de déterminer si un sens est globalement dominant. Dans leur article « Genres et variations morphosyntaxiques », Françoise Malrieu et François Rastier ont démontré que les variations morphosyntaxiques selon les genres sont notables (Malrieu & Rastier : 2001, p.552). Du côté sémantique, nous supposons également que les emplois d’un verbe polysémique ont toute chance de se répartir inégalement dans les corpus qui, par définition, ne sont pas homogènes. Il est donc impératif de mettre en rapport les caractéristiques typologiques des textes avec les énoncés qui vont constituer notre corpus. 1. La notion de « cadre prédicatif » développée par Jacques François, correspond à celle de « structure argumentale » chez Adèle Goldberg (Goldberg : 1995). 2. Cette conception du contexte comme élément déterminant l’assignation du sens est à la base de la théorie de la construction dynamique du sens défendue par Bernard Victorri et Catherine Fuchs (Victorri & Fuchs : 1996). Morgane SÉNÉCHAL Distribution des emplois d’un verbe polysémique 2/14 La typologie textuelle est souvent ignorée par les linguistes qui utilisent le corpus comme simple « ressource linguistique » sans chercher à quantifier les types d’emplois. Or, la base de données FRANTEXT3 (qui est celle dont nous disposons au CRISCO), très souvent utilisée par les « non-spécialistes » de la linguistique de corpus, peut être exploitée en pratiquant séparément ou simultanément deux types de coupes : par période et par type de textes. Ces deux paramètres sont particulièrement intéressants pour la polysémie puisque : (i) Les différents types de textes mettent en œuvre des faisceaux sémantiques différents qui conditionnent les contenus lexicaux. (ii) Les différents emplois d’un terme polysémique n’apparaissent pas au même moment. Notre objectif est ici d’étudier l’influence du type de textes et celle du découpage en périodes sur la répartition des emplois d’un verbe polysémique en déterminant, pour chaque classe combinant chronologie et typologie, quel est le sens le plus représenté. Constituant le point de départ d’une recherche sur la polysémie des verbes locatifs, investir a été retenu pour illustrer cette étude. Outre le fait que ce verbe possède un emploi locatif, il présente également deux emplois apparus récemment, ce qui permet de mettre en évidence l’intérêt des coupes chronologiques. 1. La typologie de Frantext La classification typologique de Frantext distingue 10 types : Romans, Essais, Traités, Mémoires, Poésie, Théâtre, Récits de voyage, Pamphlets, Correspondance et Eloquence. Cette typologie présente certaines faiblesses dont il faut s’accommoder. Tout d’abord, sur le plan méthodologique, la classification de Frantext mêle des discours (Essais), des champs génériques (Poésie, Théâtre) et des genres (Récits de voyage, Mémoires). D’autre part, dans les requêtes, on ne peut distinguer les Traités et les Essais. Ce type est trop général pour prétendre recevoir une caractérisation sémantique. Il est donc indispensable de distinguer des sous-types. A partir des titres des Essais et Traités présents dans la base catégorisée de Frantext4, on peut isoler 7 sous-types : → Droit et Economie → Psychologie, Philosophie et Religion → Politique et Histoire → Sciences et Technologies → Art et Littérature → Loisirs → Divers5 Cette distinction présente l’avantage d’introduire une forte composante thématique qui va permettre d’extraire des tendances. 3. La base Frantext est accessible à l’adresse suivante : http://atilf.atilf.fr/frantext.htm 4. Afin d’éliminer les occurrences des mots investissement et investisseur qui apparaîtraient avec une recherche dans la base non catégorisée, nous travaillerons à partir de la base catégorisée de Frantext. Ce choix méthodologique se répercute sur le nombre de textes composant le corpus de référence étant donné que peu de textes de la base non catégorisée ont à ce jour subi l’étiquetage catégoriel. 5. Le sous-type « Divers » concerne un tout petit nombre de textes hybrides tenant à la fois des Récits de voyage et des Essais littéraires. Morgane SÉNÉCHAL Distribution des emplois d’un verbe polysémique 3/14 2. Méthode La méthode utilisée pour étudier l’influence du type de textes et du découpage chronologique comporte quatre étapes. 1- Tout d’abord, il est nécessaire de répertorier les sens associés à investir. En croisant les informations lexicographiques fournies par le Petit Robert Electronique et le Trésor de la Langue Française Informatisé, on distingue quatre sens, que l’on nommera respectivement S1, S2, S3 et S4. A chacun de ces sens correspondent un ou plusieurs cadres prédicatifs : S1 → introniser, doter ● N1<qqn> investit N2<qqn> (1) Autrefois les rois investissaient les évêques en leur donnant la crosse et l'anneau. ● N1<qqn/qqch> investit N2<qqn/qqch> de N3<qqch> (2) Investir un ministre de pouvoirs extraordinaires. (3) Investir qqn de sa confiance. S2 → envahir, entourer, cerner ● N1<qqn/qqch> investit N2<loc> (4) Investir une place forte, une ville. S3 → placer (de l’argent) ► 1922 ● N1<qqn> investit (N2<qqch>) dans N3<qqch> (5) Investir des capitaux dans une entreprise. S4 → mettre en œuvre, s’impliquer dans ► 1943 ● N1<qqn> investit (N2<qualité>) dans N3<qqn/qqch> (6) Investir son énergie dans son travail. ● N1<qqn> s’investit dans N2<qqch> (7) S'investir dans (une personne, une activité). ● N1<qqn> investit N2<qqch>6 (8) Il investit cette maison et il y vit. 2- Dans un deuxième temps, on effectue une recherche (&cinvestir7) à partir de la base catégorisée de FRANTEXT, sur tous les types de textes distingués dans le formulaire de requête (9 types étant donné que les Essais et les Traités sont indissociables) et sur une période d’un siècle (1900-2000) divisée en 4 « sous-périodes » (1900-1924, 1925-1949, 1950-1974 et 1975-2000). On obtient donc 36 « sous-corpus » (9 types multipliés par 4 sous-périodes). 3- On associe ensuite à chaque occurrence obtenue un des sens d’investir (S1, S2, S3 ou S4). 4- Enfin, on présente les résultats selon deux axes : 6. Ce sens relève du domaine de la psychologie et signifie « conférer une charge affective à quelque chose ». 7. Cette formule signifie : « toutes les formes du verbe investir ». Morgane SÉNÉCHAL Distribution des emplois d’un verbe polysémique 4/14 Statistiques textuelles - Rapport entre le nombre total de textes et le nombre de textes contenant le verbe investir (par sous-période et pour la totalité de la période sélectionnée). - Fréquence d’apparition du verbe par rapport au nombre total de mots du corpus (textes ne contenant pas investir inclus) par sous-période et pour la totalité de la période sélectionnée. Statistiques chronologiques - Répartition des différents sens du verbe par sous-période et pour la totalité de la période sélectionnée. 3. Composition du corpus de référence Le corpus de référence se compose des 1 206 textes intégraux catégorisés publiés entre 1900 et 2000 sur lesquels la recherche a été lancée, ce qui représente 75 476 699 mots. Il se présente ainsi : Tableau 1 : Composition du corpus de référence Nombre de textes % Textes Nombre de mots % Mots Romans 468 38,8% 36 566 980 48,4% Essais et traités 431 35,7% 25 348 032 33,6% Théâtre 126 10,5% 3 551 921 4,7% Poésie 101 8,4% 1 705 197 2,3% Mémoires 61 5,1% 6 711 288 8,9% Récits de voyage 15 1,2% 879 310 1,2% Correspondance 4 0,3% 713 971 0,9% Pamphlets 0 0% 0 0% Eloquence 0 0% 0 0% Sur les 9 types de textes présents et distingués dans Frantext, les types éloquence et pamphlets sont totalement absents de la base catégorisée pour la période 1900-2000. Le type mémoires regroupe des textes relativement longs ; il apparaît donc en uploads/Litterature/ morgane-senechal-distribution-polysemie.pdf

  • 16
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager