A quel point les chaînes de référence peuvent-elles être homogènes au sein d’un

A quel point les chaînes de référence peuvent-elles être homogènes au sein d’un même genre discursif ? Exploration contrastive allemand / anglais / français1 2 To what extent can reference chains be homogeneous within a given genre ? A contrastive analysis for German, English and French Résumé : Les travaux sur les chaînes de référence suggèrent une influence du genre discursif, mais elle est encore mal connue, et il est noté une grande diversité au-delà des tendances. Le présent article cherche donc à poursuivre ces recherches par l’angle de l’homogénéisation : si au sein d’un genre donné, on réduit beaucoup les facteurs de variation, note-t-on de fortes régularités ? L’angle contrastif est important pour identifier des récurrences propres à une langue. L’étude s’appuie sur 48 textes du genre « nouvelles », qui traitent tous d’un référent que le titre présente comme thème d’une prédication ; elle étudie la chaîne de ce référent. Elle retient deux paramètres de variation « contrôlés » : l’opposition humain / inanimé, et l’opposition entre référents à nom propre et référents sans nom propre. L’étude montre d’abord que malgré l’homogénéisation volontaire des données, les chaînes restent très hétérogènes. Elle identifie cependant des paramètres d’influence, tels que le degré d’intérêt intrinsèque porté au référent (plutôt qu’une différence humains / inanimés) ou la structure de la « pyramide inversée ». Des différences notables apparaissent par ailleurs entre l’anglais et les deux autres langues (ex. gestion de la variété lexicale). Enfin, l’étude propose une modeste contribution aux questions d’identification automatique des référents topicaux. Mots-clés : chaînes de référence, linguistique contrastive, genres, détection automatique de topiques Abstract : Recent research on reference chains notes an influence of genre, but it is not fully understood yet, and studies also suggest a broad diversity beyond the trends. The present paper therefore seeks to take this issue further, through the homogeneisation angle: if within a given genre, the variation factors are significantly reduced, do the chains exhibit strong regularities? The contrastive angle is important there, to identify language-bound recurrences. The study is based on 48 ‘soft news’ articles, which all deal with a referent presented in the title as the theme of a predication, and deals more specifically with this referent’s chain. It retains two ‘controlled’ variation parameters: the human/inanimate contrast, and whether the referents are given a proper name in the articles. 1 (nb : si un seul auteur par article est contacté, contacter plutôt Laure GARDELLE) BAUMER Emmanuel, Université Côte d’Azur et BCL, CNRS, France. <emmanuel.baumer@wanadoo.fr> ; DIAS Dominique, Université Grenoble Alpes, ILCEA4, France. <dominique.dias@univ-grenoble-alpes.fr> ; GARDELLE Laure, Université Grenoble Alpes, LIDILEM, France. <laure.gardelle@univ-grenoble-alpes.fr> ; PRAK- DERRINGTON Emmanuelle, ENS de Lyon, ICAR UMR 5191, France. <emmanuelle.prak-derrington@ens-lyon.fr> 2 Ce travail a bénéficié du soutien de l’ANR dans le cadre du projet Democrat (ANR-15-CE38-0008). 1 The study shows first that despite the deliberate homogeneisation of the data, the chains remain very diverse. However, it establishes a number of influences, such as the degree of interest in the referent (rather than a human/inanimate contrast) or the ‘inverted pyramid’ structure. Secondly, English shows major differences with French and German, for instance in its management of lexical variation. Finally, the paper proposes a modest contribution to the issue of automatic topic detection. Keywords : reference chains, contrastive linguistics, genres, automatic topic detection Introduction Les recherches sur les chaînes de référence (ex. Biber 1992, Schnedecker & Landragin 2014, Baumer 2015, Schnedecker, Glikman & Landragin 2017) suggèrent que la forme d’une expression référentielle (nom propre, pronom personnel, etc.) n’est pas seulement fonction de son contenu linguistique ou de son statut cognitif, mais aussi du genre discursif. Soit le nom propre. Dans la hiérarchie cognitive d’Ariel (1990), il signale un faible degré d’accessibilité du référent. Mais dans les textes juridiques anglo-normands, il est répété pour la partie adverse, référent pourtant saillant, parce que sa rigidité désignationnelle participe des conventions du genre (Capin 2014, 73) ; ou encore, dans les portraits journalistiques français et anglais, il est préféré au pronom personnel pour le topique, même en l’absence d’ambiguïté, lorsqu’il participe à la structuration thématique (Baumer 2015, 186-202). Schnedecker (2014, 39) conclut : « le genre textuel conditionne les modalités de l’expression référentielle et, plus précisément, la composition des chaînes de référence ». Le genre influe également sur d’autres caractéristiques des chaînes : en anglais, les documents légaux comptent en moyenne des chaînes plus courtes que la conversation (Biber 1992, 228) ; en français, des recherches monogenres ou contrastives sur des recettes de cuisine, introductions de textes encyclopédiques (Schnedecker 2014), portraits journalistiques (Schnedecker 2005) ou faits divers (Schnedecker & Longo 2013), suggèrent des effets sur la longueur des chaînes, la distance entre les maillons, la forme linguistique ou la place du premier maillon ; de même, en espagnol, pour les articles de presse d’information (Vande Casteele 2013). Cette influence du genre, cependant, est encore mal connue : les mêmes recherches font état de diversité au-delà des tendances notées. Schnedecker & Longo (2013, 8) concluent par exemple : « Il est difficile de dégager des patrons de chaînes dans les F[aits] D[ivers], tant est grande la disparité des C[haînes de] R[éférence] ». Le présent article vise donc à approcher la question sous un angle différent : si au sein d’un genre donné, on restreint beaucoup les facteurs de variation, note-t-on des régularités très grandes ? Si tel n’est pas le cas, ce gros plan permet-il de dégager certains paramètres qui influent sur la forme des chaînes ? Pour répondre, l’étude s’appuie sur un corpus exploratoire en allemand, anglais et français. L’étude commence par en définir les critères de constitution du corpus, puis présente les données quantitatives obtenues et les questions qu’elles soulèvent ; on propose alors une analyse détaillée, quantitative et qualitative, pour répondre à ces questions et dégager plus finement les facteurs de variation. 2 1. Procédure de constitution du corpus 1.1. Collecte des données Le corpus est constitué d’articles entiers de presse écrite contemporaine (2000-2017), qui relèvent de la catégorie textuelle « presse / articles d’information » (Voirol 1993, Lüger 1995, Grosse 2001), « événement rapporté » dans la classification de Charaudeau (1997, 40), ou « information sur l’actualité – (sous-type) information rapportée » pour le CREM (2017). Plus spécifiquement, ils relèvent tous du même genre, même si la distinction de genres est complexe pour la presse (Adam 2001) : il s’agit de ce qui en anglais est qualifié de « soft news » (nouvelles d’actualité, mais qui ne relèvent pas des domaines centraux de la scène nationale ou internationale) ; parmi les classifications françaises, on retiendra la « nouvelle » (CREM 2017), texte qui traite d’un élément d’actualité en mettant en scène l’essentiel des faits nouveaux, en les replaçant dans leur contexte de signification. On est proche du reportage, mais celui-ci met en avant le contexte social et humain, avec un corps de texte de type « récit ». Afin d’éviter les brèves, seuls ont été retenus des articles dont l’auteur était une personne (plutôt qu’une agence de presse) et dont la longueur dépassait trois paragraphes. De plus, toujours dans une démarche d’homogénéisation, les articles traitent tous d’un référent que le titre présente comme le thème principal : il y est thème d’une prédication, c’est-à-dire qu’il peut être glosé comme « quelqu’un (ou quelque chose) à qui il est arrivé quelque chose ». Ainsi « L’opposant chinois Liu Xiaobo reçoit le prix Nobel de la paix 2010 » (Le Monde, 2010), « Museum’s £3m Cezanne stolen » (The Guardian, 2000) ou « Niedersachsen: Grundschule brennt komplett aus » (Der Spiegel, 2017). La prédication fait bien sûr également partie de ce dont traite l’article : il s’agit de nouvelle, non de portrait (comparons à « Liu Xiaobo : un homme de combat »). Néanmoins, la structure thème / rhème retenue privilégie la personne ou l’objet considéré, à la différence par exemple de « Vol d’un tableau de Cézanne », qui placerait l’événement (« Vol ») en topique. L’étude se concentrera sur cette seule chaîne de référence, même si des comparaisons occasionnelles avec d’autres chaînes sont effectuées.3 Les données sont extraites de presse (journaux ou sites de presse, comme celui de la BBC) de trois langues (allemand, anglais, français), pour déterminer s’il existe des récurrences au sein d’une langue ou entre les langues. Les textes d’une même langue proviennent d’un même pays : Allemagne, Grande-Bretagne, France. Chaque référent a été choisi pour sa capacité à être comparé dans les trois langues. Il s’agit autant que possible du même référent ; ainsi Liu Xiaobo, à qui le prix Nobel a été remis en 2010, ou un iPhone qui a été commercialisé. Sinon, il s’agit de référents équivalents (humain ou inanimé impliqué dans un événement de même nature) ; ainsi un tableau volé. Deux paramètres de variation « contrôlés » ont été retenus, parce qu’on sait par d’autres études (hors chaînes de référence, où ces critères n’ont pas encore été explorés) qu’ils peuvent avoir une influence sur le discours : 3 De plus, la légende des photographies n’interrompt pas la lecture (les expressions uploads/Litterature/ baumer-et-al-soumission-anonyme-e-tdl.pdf

  • 26
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager