RÉCITAL 2005, Dourdan, 6-10 juin 2005 Cent mille milliards de poèmes et combien

RÉCITAL 2005, Dourdan, 6-10 juin 2005 Cent mille milliards de poèmes et combien de sens ? Une étude d’analyse potentielle Florentina Vasilescu Armaselu Université de Montréal, Département de littérature comparée armaselu@sympatico.ca Mots-clefs – Keywords Unité du discours, réseaux de cohésion, analyse thématique, littérature potentielle Discourse unity, networks of cohesion, thematic analysis, potential literature Résumé – Abstract A partir du concept de cohésion comme mesure de l’unité du texte et du modèle oulipien de la littérature par contraintes, notre étude propose une méthode d’analyse potentielle sur ordinateur dans le cas des Cent mille milliards des poèmes. En s’appuyant sur un ensemble de contraintes initiales, notre programme serait capable d’analyser tous les textes potentiels produits par la machine en utilisant ces contraintes. Using the concept of cohesion as a measure for the unity of text and the Oulipian model of the literature by constraints, our study proposes a computational method of potential analysis for One hundred billions sonnets. Starting from a set of initial constraints, our program would be able to analyze all the potential texts produced by the machine under these constraints. 1 Introduction Les mécanismes de compréhension du sens d’un texte dans son ensemble restent encore peu connus. Des modèles du processus d’interprétation (comme compréhension, pas comme interprétation critique) ont été déjà proposés : la théorie des cadres (Minsky, 1975), la hiérarchisation des expressions anaphoriques (Lakoff, 1976), les réseaux de cohésion (Halliday, Hasan, 1976), l’hypothèse de la connectivité (Gentner, 1981). (Rastier, 1987) relie la notion de sens d’un texte à la modalité de perception de l’unité du texte, dans le processus d’interprétation. A partir de l’étude des réseaux de cohésion (Stoddard, 1991) et de la notion de cohésion lexicale (Morris, Hirst, 1991) nous proposons une nouvelle approche d’analyse sur ordinateur des réseaux de cohésion comme mesures de l’unité d’un texte, dans le cas des Cents mille milliards de poèmes (Queneau, 1961). Notre analyse s’appuie sur des relations d’ordre sémantique, syntaxique et cognitif qui contribuent à la perception d’un texte comme un tout cohésif. Ne disposant pas d’un dictionnaire électronique comportant ce type d’information, nous avons annoté manuellement (voir 4.1) les mots considérés significatifs (noms, verbes, adjectifs) des dix sonnets originaux de Queneau. A partir de cet ensemble d’annotations et en utilisant un mécanisme combinatoire permettant l’engendrement de nouveaux sonnets, notre programme de composition et d’analyse produit des diagrammes, des calculs estimatifs et des descriptions thématiques (voir 4.1, 4.2, 5), en simulant la « compréhension » d’un sonnet en termes d’unité thématique et de relations de cohésion établies entre les mots. Florentina Vasilescu Armaselu Le choix des Cents mille milliards de poèmes comme banc d’essai pour notre étude n’a pas été aléatoire. Premièrement, parce que le modèle oulipien de la création par contraintes et son mécanisme combinatoire (voir 2), représenteraient un point de départ pour une analyse potentielle du texte. Nous entendons par cela un programme qui, à partir d’un ensemble de contraintes initiales (dans notre cas, les dix sonnets originaux annotés), serait capable d’analyser, par des procédés combinatoires, tous les textes potentiels produits par la machine en utilisant ces contraintes. Deuxièmement, les dix poèmes originaux, doués, selon Queneau, d’un « thème » et d’une « continuité », joueraient le rôle de base de comparaison pour notre analyse. Troisièmement, en tenant compte que notre objet d’étude est une collection de sonnets, notre intérêt porte sur les enjeux d’un traitement automatique du sens dans le cas des textes littéraires. En d’autres mots, il s’agissait de reformuler en termes interrogatifs la bien connue citation de Turing placée par Queneau en tête de ses Cent mille milliards de poèmes : Est-ce qu’une machine peut apprécier un sonnet écrit par une autre machine ? 2 Une machine à fabriquer des sonnets Les deux tendances majeures de la recherche oulipienne sont la reprise des œuvres du passé et l’invention de nouvelles règles de création littéraire, à partir de contraintes formelles (Le Lionnais, 1986). Selon (Motte W.F. Jr., 1986), les Cent mille milliards de poèmes représentent le modèle de l’entreprise oulipienne, par la reprise d’une forme poétique traditionnelle, le sonnet, et par l’invention d’une nouvelle forme poétique combinatoire permettant à chaque vers d’être intégré dans l’ensemble quasi-infini de sonnets potentiels. Comme l’affirme (Queneau, 1961), Cent mille milliards de poèmes est une « machine » à fabriquer 1014 poèmes différents. Le fonctionnement de cette machine s’appuie sur un ensemble de contraintes formelles, internes et combinatoires. Les contraintes internes concernent la forme de chaque sonnet (deux quatrains et deux tercets), les rimes qui ne doivent pas « être trop banales […] trop rares ou uniques » et l’existence d’un « thème » et d’une « continuité » pour chacun des dix sonnets d’origine. Les contraintes combinatoires exigent une structure grammaticale invariante et l’absence des désaccords en genre et en nombre pour toute substitution de vers possible. En tenant compte de cette immense mais encore limitée potentialité créative, qu’est- ce qu’on pourrait dire alors sur la potentialité de sens de ce type de machine ? 3 Cohésion et unité du texte Le concept de sens fait l’objet d’étude de plusieurs disciplines dans le cadre des sciences humaines. Comme nous avons déjà mentionné, notre démarche s’intéresse seulement à une partie plus restreinte de ce concept, reliée à la modalité par laquelle nous percevons l’unité d’un texte dans le processus d’interprétation (Rastier, 1987). Selon (Morris, Hirst, 1991), le texte ou le discours n’est pas une simple succession de mots et de phrases faisant référence à des choses différentes, mais un ensemble d’entités reliées l’une à l’autre qui portent sur un même sujet. C’est une propriété qui confère au texte la qualité d’unité et qui est appelée cohésion. La cohésion n’est pas pourtant une caractéristique inhérente au texte, elle dépend aussi de lecteur. Dans l’acception de (Stoddard, 1991), la cohésion est un mécanisme unificateur que nous construisons pendant le processus d’interprétation et qui nous aide à dériver beaucoup plus de sens du texte dans son ensemble que de la simple somme des sens des mots et des phrases qui le composent. La cohésion impliquerait ainsi la construction de liens mentaux entre les parties composantes d’un texte, dans le processus d’interprétation. Cent mille milliards de poèmes et combien de sens ? Une étude d’analyse potentielle Il y a plusieurs types de relations déterminant la cohésion. Notre étude s’intéresse aux relations sémantiques existant entre les mots (partie/tout, co-occurrence dans des contextes similaires, appartenance à un même domaine) et déterminant la cohésion lexicale (Morris, Hirst, 1991). De plus, notre analyse s’appuie sur le modèle des réseaux de cohésion (Stoddard, 1991), utilisé dans l’analyse des articles définis, des pronoms et des dislocations d’agents verbaux. Le réseau de Stoddard comporte un nœud (le référent, par exemple Abraham Lincoln) et des éléments de cohésion (par exemple, les pronoms he, him, his) reliés au nœud par des relations de cohésion sémantico-syntaxiques. Stoddard fait ainsi une distinction entre la cohésion, une caractéristique sémantico-syntaxique, et la cohérence une mesure de « l’unité de sens d’un texte » qui entraîne « l’environnement cognitif » et « l’expérience » du lecteur. Nous avons adapté ce modèle, en considérant le réseau de cohésion comme une structure de nœuds (noms, verbes, adjectifs préalablement annotés) reliés entre eux par des relations de cohésion qui dépendent de la nature des attributs attachés aux nœuds et qui impliquent des connaissances d’ordre lexico-sémantique, syntaxique et cognitif (voir 4.1). 4 Ouvroir d’analyse potentielle Le programme permet à la fois la construction et l’analyse d’un poème. Il y a deux modalités de construire un poème : choisir un des dix sonnets originaux en indiquant son numéro dans un champ de saisie ou composer un nouveau poème, en combinant les vers des dix sonnets à l’aide de 14 listes déroulantes. Le module d’analyse utilise les attributs attachés manuellement aux mots, comme des contraintes initiales. Après la composition d’un sonnet tel indiqué ci- dessus, le programme compare les attributs et construit un lien entre deux mots (nœuds), s’il y détecte au moins une valeur commune, indifféremment du type des attributs. 4.1 Les contraintes initiales L’annotation des mots (en format XML) comporte un attribut obligatoire (le lemme) et un ensemble d’attributs optionnels1 (voir Figure1), selon les quatre types de relations considérés : 1. Relations de type sémantique, décrites par l’attribut domaine, une classe sémantique reliée à « l’expérience d’un groupe » et qui encode une « pratique sociale » (Rastier, 1997). Ce type d’attribut permet de construire, par exemple, un lien entre Tamise et bateaux (domaine = navigation), climat et bise (domaine = météo), Socrate et Platon (domaine = philosophie), etc. 2. Relations de type syntaxique entre un nom et son complément (ou son attribut) et un verbe et son complément. Ces relations sont mises en évidence par l’attribut relatif_à associé au complément ou à l’attribut : « climat londonien » (londonien, relatif_à = climat) ; « Sa sculpture est illustre » (illustre, relatif_à = sculpture) ; « on transporte et le marbre …» (marbre, relatif_à = transporter). 3. Relations extratextuelles supposant des connaissances du monde, définies par les attributs appartenance et allusion. Le programme uploads/Litterature/2005-jeptalnrecital-recitalcourt-14.pdf

  • 13
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager