Corpus 8 (2009) Corpus de textes, textes en corpus ............................

Corpus 8 (2009) Corpus de textes, textes en corpus ................................................................................................................................................................................................................................................................................................ Patrick Charaudeau Dis-moi quel est ton corpus, je te dirai quelle est ta problématique ................................................................................................................................................................................................................................................................................................ Avertissement Le contenu de ce site relève de la législation française sur la propriété intellectuelle et est la propriété exclusive de l'éditeur. Les œuvres figurant sur ce site peuvent être consultées et reproduites sur un support papier ou numérique sous réserve qu'elles soient strictement réservées à un usage soit personnel, soit scientifique ou pédagogique excluant toute exploitation commerciale. La reproduction devra obligatoirement mentionner l'éditeur, le nom de la revue, l'auteur et la référence du document. T oute autre reproduction est interdite sauf accord préalable de l'éditeur, en dehors des cas prévus par la législation en vigueur en France. Revues.org est un portail de revues en sciences humaines et sociales développé par le Cléo, Centre pour l'édition électronique ouverte (CNRS, EHESS, UP, UAPV). ................................................................................................................................................................................................................................................................................................ Référence électronique Patrick Charaudeau, « Dis-moi quel est ton corpus, je te dirai quelle est ta problématique », Corpus [En ligne], 8 | 2009, mis en ligne le 01 juillet 2010, consulté le 16 janvier 2013. URL : http://corpus.revues.org/1674 Éditeur : Bases, corpus et langage - UMR 6039 http://corpus.revues.org http://www.revues.org Document accessible en ligne sur : http://corpus.revues.org/1674 Ce document est le fac-similé de l'édition papier. © T ous droits réservés Corpus n°8 « Corpus de textes, textes en corpus » (2009), 37-66 Dis-moi quel est ton corpus, je te dirai quelle est ta problématique Patrick CHARAUDEAU Université de Paris 13, CAD Les problèmes que pose la notion de corpus sont relativement bien connus pour avoir été longuement discutés dans le champ des sciences du langage1, mais ils n'ont toujours pas donné lieu à un consensus qui aurait permis de s'en remettre à une définition faisant autorité et à laquelle on se référerait chaque fois que l'on aurait à justifier un corpus d'analyse. Cela est peut- être le symptôme de ce que le corpus n'existe pas en soi, mais dépend – comme en témoigne l'article « corpus » du Dictionnaire d'analyse du discours2 – du positionnement théorique à partir duquel on l'envisage. S'agissant du langage, on connaît les problèmes dont je ne cite que les principaux : - le problème qui concerne le recueil des données, recueil qui dépend du choix de la matérialité langagière (paroles orales, paroles écrites), du choix du support qui véhicule ces paroles en relation avec une situation de communication (pour l'écrit : lettres, rapports, journaux, tracts, circulaires, affiches, etc. ; pour l'oral : radio, télévision, réunions diverses, meetings, conversations du quotidien, etc.). Ce sont autant d'aspects qui ont des incidences sur la manière de recueillir des données : exploration du terrain, procédés d'enregistrement libres ou contraints, au su ou à l'insu des acteurs de parole, etc. ; - le problème qui concerne l'importance du matériel recueilli et de sa valeur de représentativité ; le corpus peut-il être considéré exhaustif et clos, ou partiel et ouvert, et, 1 Voir la Revue Corpus éditée par l'université de Nice-Sophia Antipolis, particulièrement les numéros 1 (2000) et 4 (2005). 2 Charaudeau P. et Maingueneau D. (2002), Dictionnaire d'analyse du discours, Paris : Seuil. P. CHARAUDEAU 38 conséquemment, peut-il être considéré comme un objet en soi ou un simple outil (Mayaffre 2005). On sait que l'hypothèse de l'exhaustivité – vieux rêve de l'attitude positiviste – n'est plus tenue, et ce malgré le développement récent de la dénommée linguistique de corpus initiée dans le monde anglo-britannique3, et prolongée en France par quelques auteurs avec une certaine prudence4, car le langage est en perpétuelle production. Il peut se faire cependant que la clôture du corpus soit revendiquée, à titre expérimental, par certains analystes5. Si le corpus est considéré comme partiel se pose alors le problème de sa valeur comme échantillon, et de la possibilité de le faire varier en sous-corpus. Quant à considérer si le corpus est un objet en soi ou un instrument, cela renvoie à la question du contexte que nous analyserons plus loin ; - le problème qui concerne, à l'intérieur du matériau langagier, les catégories qui vont faire l'objet de l'analyse : grammaticales (connecteurs, pronoms, verbes, etc.), lexicales (par champs ou de façon aléatoire), syntaxiques (selon divers types de construction) ; mais aussi les variables externes à la production des actes langagiers, telles que les types de locuteurs, les dispositifs de communication, de même que les variables concernant le temps (l'historicité) et l'espace (les cultures) ; - le problème enfin qui concerne l'outil de traitement des données : dépouillements manuels, traitement informatique à l'aide de logiciels ad hoc, constitution d'échantillons à partir de bases de données (voir ci-dessous). Dans tous ces cas, se pose la question de la pertinence de ces choix en relation avec les présupposés théoriques, et de l'éventuelle circularité qui peut s'instaurer entre ceux-ci et le corpus. 3 Voir particulièrement Williams G. (2005). 4 Voir Habert B. et alii (1997) et Mayaffre D. (2005). 5 Dans l'article « Lexicométrie » du Dictionnaire d'analyse du discours, op.cit., M. Tournier écrit : « la lexicométrie n'est pas une théorie mais une méthodologie d'étude du discours, qui se veut exhaustive, systématique et automatisée » ; et plus loin : « [Le corpus d'étude] Il est fermé, au moins le temps d'une expérience, car on ne peut compter que sur des ensembles stabilisés ». Dis-moi quel est ton corpus, je te dirai quelle est ta problématique 39 Je voudrais montrer dans cet article de quelle façon la construction d'un corpus, en analyse de discours, dépend d'un positionnement théorique lié à un objectif d'analyse, ce que j'appelle une problématique. On envisagera trois types de corpus selon qu'ils se réfèrent à une problématique dite cognitive, communicative ou représentationnelle. Puis on montrera comment un corpus de textes se construit dans un jeu de déconstruction et de reconstruction selon des critères d'ouverture ou de clôture (intertexte et hypertexte), de contraste (interne et externe) et de pertinence quantitative et/ou qualitative. On terminera par le renvoi à un exemple d'analyse pratiqué par le Centre d'Analyse du Discours à propos du discours d'information télévisé, afin de montrer comment on peut tirer parti de certaines de ces options, et comment elles peuvent se combiner. Mais auparavant, il est nécessaire de circonscrire la spécificité de l'analyse du discours au sein des sciences du langage, car on ne peut traiter la question des corpus de discours sans s'interroger sur certaines notions souvent employées dans ce domaine. 1. De quelques distinctions indispensables pour former des corpus de discours Dans les sciences humaines et sociales, certaines disciplines privilégient des études de terrain avec des procédures suivant une démarche descriptivo-empirique (sociologie, anthropologie), d'autres privilégient des procédures d'expérimentation (psychologie sociale), d'autres des analyses à partir d'archives ou en construisant des corpus avec des procédures plus ou moins systématiques de recueil et traitement du matériel sémiologique réuni (histoire, sciences du langage). Les sciences du langage font donc partie des disciplines de corpus : rassemblement de données linguistiques (sous forme de textes écrits ou oraux, de documents divers, d'observations empiriques raisonnées ou d'enquêtes provoquées) que l'on constitue en objet d'analyse. Dès lors se pose la question de savoir quelle est la nature de ces données. On ne peut donc traiter de la question du corpus si l'on n'est pas au P. CHARAUDEAU 40 clair (c'est-à-dire si on ne prend pas position) sur certaines notions qui sont au cœur des sciences du langage, dont j'envisagerai ici les distinctions qui me paraissent les plus fondamentales : langue / discours, texte / discours, texte / contexte. 1.1 Langue / discours Vieille lune diront certains. Et pourtant, malgré Saussure lui- même déclarant que la langue n'est créée qu'en vue du discours, de nombreuses définitions de la notion de discours ont eu cours depuis les années soixante-dix qui ne facilitent pas la clarté de son opposition à langue. Renvoyons à Maingueneau qui, en 19766 puis 19967, en répertorie les définitions, et rappelons que certaines de ces définitions font du discours un prolongement de la langue, opposant l'unité de phrase à une unité « transphrastique » (Harris 1969), d'autres intègrent des catégories de discours dans la langue8, d'autres encore opposent discours à énoncé en rapportant cette notion aux « conditions de production » d’un texte9 ; d'autres enfin qui font de ce terme de discours un usage que Maingueneau qualifie de « paralinguistique » dans la mesure où il s’intègre dans une réflexion qui participe de plusieurs disciplines telles que l’histoire, la philosophie, la sémiologie, voire la psychanalyse10. Ici n'est pas le lieu de discuter ces définitions. Il s'agit seulement de bien marquer la différence entre langue et discours dans ce qu'elle implique du point de vue de l'analyse et de la constitution de son objet. Ces deux notions signalent deux lieux de structuration du langage. 1) La langue, comme lieu de conformation entre des formes et du sens s'organisant en systèmes, c'est-à-dire en réseaux de relations entre des unités minimales selon des règles 6 Initiation aux méthodes de l’analyse du discours, Paris, Hachette- Université, 1976. 7 Les termes clés de l'analyse du discours, uploads/Management/charreaudeau-notion-de-corpus-2009.pdf

  • 36
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Apv 11, 2021
  • Catégorie Management
  • Langue French
  • Taille du fichier 0.1694MB