REMARQUES SUR LES BASES DE LA CONJUGAISON Olivier Bonami Université Paris-Sorbo

REMARQUES SUR LES BASES DE LA CONJUGAISON Olivier Bonami Université Paris-Sorbonne & LLF (UMR 7110) Gilles Boyé ERSS (UMR5610) & Université Nancy 2 La modélisation des données de la flexion met souvent en jeu une tension entre phonologie et morphologie : face à la multiplicité des réalisations d’un même lexème, on est amené, soit à postuler des représentations et des opérations phonologiques abstraites, soit à rendre plus complexe la représentation morphologique du lexème. Cet article considère un cas particulier de cette situation, la modélisation des alternances morpho-phonologiques intervenant dans la conjugaison régulière en français, qui rendent problématique la détermination d’une forme de base des lexèmes verbaux. Dans la tradition générative, ces alternances ont été mises sur le compte de formes phonologiques sous-jacentes susceptibles de réalisations transparentes ou opaques suivant le contexte flexionnel (voir entre autres Schane 1968, Plénat 1987). Nous nous basons sur des idées issues du Minimal Generalization Learner de Albright et Hayes (2003), et sur la notion d’espace thématique mise en place par Bonami et Boyé (2003) pour proposer une nouvelle approche de ces données : tous les lexèmes réguliers sont associés à une forme de base, mais celle-ci n’a pas le même statut morphologique pour tous les lexèmes. Spécifiquement, ce n’est pas toujours la même case de l’espace thématique qui sert de forme de base. Cette hypothèse permet de rendre compte de la conjugaison régulière sans faire d’hypothèse coûteuse sur la nature des représentations phonologiques. 1. DE LA FORME SOUS-JACENTE À L’ESPACE THÉMATIQUE 1.1. PLÉNAT (1987) Quelle modélisation peut-on proposer pour les variations de forme que met en œuvre la conjugaison des verbes français ? Plénat (1987) tente de répondre à ces questions en poussant au bout les outils de la phonologie et de la morphologie génératives classiques : les formes de surface des passés simples et des participes passés des verbes des second et troisième groupes sont obtenues par un jeu de règles phonologiques à partir d’une forme sous-jacente unique du verbe. Ainsi le participe passé de SAVOIR /sy/ est-il obtenu à partir du radical /sav-V/ (V étant une voyelle sous-spécifiée) et du suffixe de participe /t/. Cette étude se termine sur une conclusion à la lucidité admirable : (1) Les thèmes de PS et de PP de l’ « autre » conjugaison constituent un ensemble fini et peu susceptible de s’accroître. Dans un tel ensemble, il est fatal qu’un linguiste découvre un certain nombre de régularités : il doit au moins déceler les traces des évolutions régulières ou analogiques par lesquelles est passé le système. Mais a-t-il pour autant le droit de supposer que ces régularités sont repérées et apprises comme telles par les locuteurs, d’en faire des règles que la grammaire de chacun intériorise ? Plénat (1987 : 138) L’auteur conclut que seules les données psycholinguistiques sont à même de trancher la question : l’examen des erreurs des apprenants est à même de nous informer sur le fait qu’ils exploitent ou non les généralisations observables. L’exemple suivant est particulièrement frappant : parmi les 145 verbes dont l’infinitif se termine en /Cr/, où C est une occlusive, une minorité (44%) a un participe passé en /Cy/. Le caractère minoritaire de la classe, ainsi que sa petite taille, pourrait faire croire qu’il n’y a pas de généralisation à faire ici. Pourtant, les parents de jeunes enfants constatent tous l’opiniâtreté avec laquelle les apprenants cherchent à étendre cette classe, et produisent des participes passés comme /prdy/ pour PRENDRE ou /pdy/ pour PEINDRE. Quoi que cette observation soit anecdotique, elle laisse penser qu’il existe une régularité inhérente à la conjugaison du français et qui veut que certains types de verbes ont, de manière régulière, un participe passé en /y/, et ce malgré la petite taille de la classe de verbes concernée. 1.2. LE MINIMAL GENERALIZATION LEARNER La littérature psycholinguistique récente sur la flexion fourmille de propositions de modélisation de la flexion irrégulière ou semi-régulière ; la plupart des travaux s’accordent à penser que cette partie de la flexion fonctionne sur le mode associatif, les lexèmes formellement semblables tendant à se fléchir de la même manière. Parmi les travaux de ce type ressort le modèle de Minimal Generalization Learner (« Apprenant de généralisations minimales » ; dorénavant MGL) de Albright et Hayes (Albright, 2002a, 2002b ; Albright et Hayes, 2002, 2003). Ce modèle est un modèle stochastique à base de règles phonologiques familières à la SPE (Chomsky et Halle 1968), ce qui rend le dialogue entre travaux linguistiques et psycholinguistiques plus aisé. Le MGL tente de modéliser le comportement d’un sujet qui apprend à former une certaine forme d’un lexème sur la base d’une autre. L’idée générale est que face à une nouvelle paire de formes, l’apprenant construit toutes les règles phonologiques qui pourraient relier ces deux formes, puis fait un calcul de fiabilité des règles concernées en prenant en compte leur efficacité passée. Reprenons l’exemple de l’infinitif et du participe passé en français. L’apprenant est exposé à des paires de formes comme lave,lave (LAVER), finir,fini (FINIR), rdr, rdy (RENDRE), prdr,pri (PRENDRE), etc. Considérons ce qui se passe quand la paire rdr, rdy est rencontrée. Toutes les règles susceptibles de relier ces deux formes doivent être considérées ; quelques exemples sont listés en (2). (2) a. r  y / __ # b. r  y / +consonantique vocalique sonnant continu             __ # c. r  y / d __ # d. r  y / consonantique +vocalique +nasal           d __ # e. r  y / d __ # f. r  y / #rd __ # Toutes ces règles sont également utilisables pour dériver /rdy/ de /rdr/, mais elles ne sont pas également précises. À un extrême, la règle (2a) a une précision à peu près nulle, puisqu’elle donne des résultats incorrects pour l’immense majorité des verbes à infinitif en /r/, dont le participe passé n’est pas en /y/. A l’autre extrême, (2f) a une précision parfaite, puisqu’elle s’applique correctement à un verbe unique. Les cas intermédiaires ont des niveaux de précision intermédiaires. Une fois déterminée la précision d’une règle, reste à déterminer sa fiabilité : une règle ayant une précision parfaite, comme (2f), est de peu d’utilité dans la mesure où elle n’est applicable qu’à un petit ensemble de forme. La mesure de fiabilité proposée par Albright et Hayes pénalise les règles qui ont un champ d’application étroit, même si leur précision est grande1. La mesure de fiabilité des différentes règles est indiquée en (3). (3) Fiabilité des règles (2)2 : r  y N° (2a) (2b) (2c) (2d) (2e) (2f) Précision 9,7 % 45,5 % 51,5 % 51,8 % 72,7 % 100 % Fiabilité 9 % 42,8 % 48,1 % 48,1 % 67,6 % 31,7 % On voit que dans ce cas particulier, la fiabilité de la règle croît plus ou moins avec la précision du contexte, et ce malgré le fait que le nombre de cas concernés décroît simultanément. La règle la plus fiable est la règle (2e). La plus précise est (2f), mais elle est peu fiable, ne s’appliquant qu’à un seul verbe. Par ailleurs elle n’a aucun intérêt pratique, puisque la formulation de la règle est telle qu’elle ne pourrait pas s’appliquer à un autre verbe. Elle ne peut donc permettre à un locuteur de savoir comment fléchir un verbe nouveau. Sur la base de ce type de calcul de fiabilité, le MGL permet de simuler le comportement d’un locuteur quand il tente de fléchir une nouvelle forme : parmi les règles applicables à cette forme que le locuteur a déjà rencontré, la plus fiable est celle qui a le plus de chances d’être appliquée. Par exemple, s’il tente de construire le participe passé de FINIR, il est très improbable que le locuteur utilise la règle (2a), dont la fiabilité est très mauvaise ; il lui préfèrera à coup sûr la règle [r  Ø / i__ #], qui a une fiabilité de 76,6 %. En revanche, face à l’infinitif de PRENDRE /prdr/, l’utilisation de la règle (2e), dont la fiabilité est assez bonne, est compréhensible. 1 Le détail du calcul de fiabilité est donné dans Albright (2002, p. 40-41). Pour aller vite, la précision (raw reliability dans le vocabulaire d’Albright) est le rapport entre le nombre d’items correctement couverts par la règle et le nombre d’items candidats. La fiabilité (adjusted reliability) est obtenue en retranchant à la précision sa limite de confiance inférieure, un nombre qui augmente quand le nombre de candidats diminue ; à précision égale, une règle est donc plus fiable si elle s’applique à plus de cas. 2 Les calculs reposent sur les formes verbales de BDLEX (de Calmès & Pérennou 1998), qui contient environ 6500 verbes. Le modèle du MGL a deux traits particulièrement intéressants. D’une part, il permet de largement dépasser le débat sur la pertinence de règles au sens traditionnel, par opposition à une mémoire associative (souvent modélisée par un réseau de neurone) uploads/s3/ bobo-bases.pdf

  • 35
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager