HAL Id: hal-00279663 https://hal.archives-ouvertes.fr/hal-00279663 Preprint sub
HAL Id: hal-00279663 https://hal.archives-ouvertes.fr/hal-00279663 Preprint submitted on 15 May 2008 HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés. Romain Gary et Emile Ajar Dominique Labbé To cite this version: Dominique Labbé. Romain Gary et Emile Ajar. 2008. hal-00279663 Dominique Labbé Institut d'Etudes Politiques de Grenoble BP 45 38040 Grenoble Cedex dominique.labbe@iep-grenoble.fr Romain Gary et Emile Ajar (mai 2008) De 1945 à 1980, R. Gary a publié une trentaine de romans et essais sous son nom ou sous pseudonyme. Son premier roman (Education européenne) a obtenu le prix Interalliés en 1945. Il a également reçu deux fois le prix Goncourt : la première en 1956 pour les Racines du ciel (publié sous son nom) et une seconde fois en 1975 pour la Vie devant soi, paru sous le pseudonyme de E. Ajar. Pour l'histoire de cette mystification littéraire organisée par R. Gary avec la complicité de son cousin Paul Pavlowitch, voir : Gary 19811, Pavlowitch 1981, Bona 1987. Michel lafon et Benoît Peeters ont consacré un chapitre de leur livre Nous est un autre (2006) à cette mystification. Pour écrire ce chapitre, ils ont souhaité savoir si réellement R. Gary était parvenu à créer un vocabulaire et un style propres à Ajar - distincts des siens – ce qui expliquerait que tous les critiques littéraires ont été trompés. Ou bien si des méthodes scientifiques d'attribution d'auteur auraient permis de démasquer R. Gary. En réponse à ces questions, le 5 juin 2004, la note ci-dessous a été envoyée à Michel lafon et Benoît Peeters qui l'ont partiellement utilisée dans leur ouvrage. En mai 2008, les tableaux de cette note ont été modifiés pour intégrer dans les calculs le dernier roman de R. Gary (les Cerfs-volants, 1980) qui n'avait pas été pris en compte en 2004. 1 Les références complètes des ouvrages cités sont données en annexe. Grenoble 5 juin 2004 Vous avez bien voulu m'interroger sur le cas Gary-Ajar qui semble intéresser encore le public comme en témoigne la réédition récente de la biographie de cet auteur (Bona 1987). Est-ce que la statistique permet d'identifier Gary dans l'ombre de Ajar, avec quels outils et avec quel degré de certitude ? Comme indiqué dans mes précédents courriers, et comme l'explique l'essai sur Corneille dans l'ombre de Molière, la principale difficulté réside dans l'impossibilité d'accéder aux fichiers électroniques de la quasi-totalité des romans français du XXe siècle. Certes, ces fichiers existent à l'Institut de la Langue Française, mais cet organisme refuse de communiquer les œuvres couvertes par des copyrights, même aux fins de recherche. Il fallait donc passer ces livres au scanner, ce qui est un travail très long du moins si l'on veut un traitement sans faute… Pour cette raison, la note ci-dessous se limite à une comparaison des 4 romans signés Ajar avec les cinq romans contemporains de Gary. Pour Ajar, les 4 romans ont tous été publiés au Mercure de France : Gros-Câlin (1974), La vie devant soi (1975), Pseudo (1976) et L'angoisse du roi Salomon (1979). Les 5 romans contemporains signés Gary, ont tous paru chez Gallimard : Chien blanc (1970), Au-delà de cette limite, votre ticket n'est plus valable (1974), Charge d'âme (1977), Clair de femme (1977), les Cerfs-volants (1980). Au total ce corpus compte 510 180 mots, soit 200.000 mots pour Ajar et 300.000 mots pour Gary. Après passage au scanner, les textes ont été normalisés et lemmatisés, selon des procédés éprouvés sur lesquels on ne revient pas ici (Labbé, 1990), avant de subir les traitements statistiques standards. Parmi les traitements intéressants pour l'attribution d'auteur, cette note présente les résultats du calcul de la distance intertextuelle et l'observation de certaines combinaisons caractéristiques de mots (verbe + verbe). I. La distance intertextuelle L'ensemble du raisonnement est présenté dans les articles parus en décembre 2001 dans le Journal of Quantitative Linguistics et, en français, dans le numéro 2 de la revue Corpus (2003). Il s'agit de mesurer la proximité ou l'éloignement de deux ou plusieurs textes, les uns par rapport aux autres, en considérant tous leurs mots. On calcule ainsi un indice de la distance qui varie uniformément entre zéro (exactement les mêmes mots avec les mêmes fréquences) et un (aucun mot en commun). Quatre facteurs influencent cette distance : — le genre. On ne parle pas comme on écrit ; la fiction romanesque a ses codes qui ne sont pas ceux du théâtre, etc. Le carcan imposé par le genre est plus ou moins rigide. Celui de la fiction romanesque à l'époque contemporaine étant très lâche, la distance aura tendance à être plus forte que dans d’autres genres plus codifiés ; — le vocabulaire de l'époque. L'œuvre de Gary s'étend sur plus de 35 ans. Sur de telles étendues de temps, le style et le vocabulaire d'un auteur évoluent nécessairement. D'ailleurs, il est lui-même pris dans le flux qui change lentement le lexique de la langue. Il est donc indispensable de comparer des œuvres contemporaines, ce qui est fait ici. — le thème traité. Chaque thème a un vocabulaire propre. Ce sont d'abord des noms de lieux, de personnes et une série de substantifs particuliers… — enfin et surtout : l'auteur… Pour rechercher la paternité d'un texte anonyme ou dont l'auteur est contesté, il faut donc le comparer à d'autres dont la signature n'est pas contestée, ayant été écrits à la même époque et traitant de thèmes voisins, dans un même genre (poésie, prose, roman, théâtre…). Ce point est important. En l'état actuel de la technique, on ne peut comparer que ce qui est comparable : un roman avec un autre roman, le théâtre avec le théâtre, une lettre avec de la correspondance… Ce calcul - appliqué à plusieurs milliers de textes en français de toutes origines (romans, pièces de théâtre, poésie, articles de presse, discours politiques, entretiens…) depuis le XVIIe siècle - a permis de confirmer la validité du raisonnement et d'étalonner une échelle de la distance. Les valeurs ci-dessous s’appliquent aux textes dont les longueurs sont comprises entre 5 000 et 20 000 mots pour les textes plus longs, on utilise des extraits selon la méthode présentée dans Labbé (2007) : — une valeur inférieure ou égale à 0.20 ne se rencontre jamais chez des auteurs différents ; — entre 0.20 et 0.25, il est pratiquement certain que l'auteur est le même. Sinon, les deux textes ont été écrits à la même époque, dans un même genre, sur un sujet et avec des arguments semblables. Ce cas se rencontre parfois dans les articles de presse, à propos d'un même événement, parce que les journalistes travaillent à partir des mêmes sources et citent les mêmes noms de lieux et de personnes... Dans le cas d'œuvres littéraires appartenant à deux auteurs différents, il est très probable que le second s'est plus qu'"inspiré" du premier (dans l'ordre chronologique). En tous cas, ce genre de "collision" peut difficilement se produire plusieurs fois entre deux auteurs distincts. — au-dessus 0.25, on entre dans une zone "grise" où deux hypothèses sont envisageables : un même auteur et des thèmes très différents ou deux auteurs contemporains traitant, dans un même genre, un thème proche avec leur style propre… De telle sorte que, plus on s'élève au- dessus de ce seuil, plus il sera difficile d'attribuer la paternité d'un texte anonyme à l'auteur considéré sans que, pour autant, cette paternité puisse être rejetée ; — au-dessus de 0.40 les auteurs sont très probablement différents ou bien, pour un même auteur, les textes sont de genres très éloignés, par exemple : oral et écrit. Les trois tableaux ci-dessous présentent les résultats détaillés obtenus sur l'ensemble du corpus (les résultats significatifs sont placés en gras). Les deux premiers portent sur les œuvres signées Ajar puis Gary qui sont comparées dans le troisième. Tableau I. Les distances entre les 4 romans de Emile Ajar Gros-Câlin Vie devant soi Pseudo Salomon Moyenne Gros câlin 0,273 0,224 0,247 0,248 Vie devant soi 0,273 0,255 0,176 0,235 Pseudo 0,224 0,255 0,246 0,242 SalomonTotal 0,247 0,176 0,246 0,223 * Ce tableau est symétrique selon la diagonale (comme les deux suivants). On ne considère que la moitié nord- est. D'après l'échelle des distances présentée ci-dessus, on en tire que les 4 romans ont bien été écrit par la même personne et que deux d'entre eux sont même très proches (la Vie devant soi et l'Angoisse du roi Salomon). En fait, cette distance très faible concerne le dernier Ajar paru et montre que Gary, du moins après La vie devant soi, avait "codifié" le style et le vocabulaire propre à "Ajar" et qu'il était capable de le reproduire assez fidèlement… La même uploads/Litterature/ lab-be-gary-ajar-2008.pdf
Documents similaires










-
34
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Apv 08, 2022
- Catégorie Literature / Litté...
- Langue French
- Taille du fichier 0.2284MB