Laboratoire Modèles, Dynamiques, Corpus Unité mixte de recherche 7114 Responsab

Laboratoire Modèles, Dynamiques, Corpus Unité mixte de recherche 7114 Responsable : Bernard Laks Départements : SHS et MIPPU CNRS, Université Paris 10 EHESS Rapport à mi-parcours 1er décembre 2005 Table des matières 2. DOSSIER SCIENTIFIQUE..........................................................................................................4 2.1. Rapport scientifique........................................................................................................4 2.1.1. Modèles...................................................................................................................4 2.1.1.1. Phonologie de la syllabe et phonologie du français ..........................................7 2.1.1.2. Morphologie et sémantique lexicale................................................................11 2.1.1.3. Syntaxe et sémantique descriptive du français................................................14 2.1.1.4. Modélisation de données linguistiques dans la perspective du traitement automatique des langues (Metal)..................................................................................17 2.1.1.5. Problèmes épistémologiques du TAL (Petal)..................................................21 2.1.1.6. Linguistique cognitive et microgenèse des formes sémiotiques .....................24 2.1.1.7. Mise en place d’un réseau franco-suédois en linguistique ..............................28 2.1.1.8. Bibliographie indicative de la composante......................................................29 2.1.2. Dynamiques des langues.......................................................................................31 2.1.2.1. Appropriation du français en situation diglossique.........................................32 2.1.2.2. Représentation des événements : sémantique verbale, temporalité et développement des énoncés complexes .......................................................................37 2.1.2.3. Langage, langues et école : acquisition, interactions et construction des connaissances en langue de scolarisation (L1 ou L2) et autres langues.......................41 2.1.2.4. Didactique de la syntaxe..................................................................................43 2.1.2.5. Elaboration d’un glossaire de termes grammaticaux.......................................46 2.1.2.6. La variation stylistique ....................................................................................48 2.1.2.7. Sociolinguistique variationniste ......................................................................50 2.1.2.8. Bibliographie indicative de la composante......................................................53 2.1.3. Linguistique textuelle / Corpus.............................................................................56 2.1.3.1. Genres et linguistique de corpus......................................................................57 2.1.3.2. Ecrit et Ecriture scolaire ..................................................................................61 2.1.3.3. Problèmes diachroniques.................................................................................64 2.1.3.4. Textes littéraires ..............................................................................................68 2.1.3.5. Linguistique interactionnelle...........................................................................72 2.1.3.6. CAN : Corpus, Annotation, Navigation ..........................................................76 2.1.3.7. Bibliographie indicative de la composante......................................................80 2.2. Bilan quantitatif sur les deux dernières années.............................................................81 2.2.1. Production scientifique : bilan quantitatif - récapitulatif ......................................81 2.2.2. Listes de la production scientifique ......................................................................83 2.2.2.1. Articles dans des revues avec comité de lecture (ACL)..................................83 2.2.2.2. Articles dans des revues sans comité de lecture (SLC)...................................90 2.2.2.3. Articles dans des actes de colloque (ACT)......................................................91 2.2.2.4. Communications en colloque sans actes (COM).............................................99 2.2.2.5. Ouvrages ou chapitres d’ouvrage (O)............................................................110 2.2.2.6. Directions d’ouvrage (DO)............................................................................115 2 2.2.2.7. Rapports de recherche (RAP)........................................................................117 2.2.2.8. Vulgarisation (VUL) .....................................................................................117 2.2.2.9. Autres publications/productions (AP) ...........................................................118 2.3. Déclaration de politique scientifique pour la période 2005-2008...............................122 2.3.1. Organigramme par opérations scientifiques (2005-2008) ..................................126 2.3.2. Membres du laboratoire ......................................................................................131 2.3.4. Récapitulatif quantitatif.......................................................................................136 ANNEXE 1 : LE SITE MODYCO..............................................................................................137 ANNEXE 2 : DECLARATION COMMUNE DE MODYCO (CNRS UMR 7114 ET UNIVERSITE DE PARIS 10) ET DU LEAPLE (CNRS UMR 8606 DU CNRS & UNIVERSITE PARIS 5) ...........140 3 2. Dossier scientifique 2.1. RAPPORT SCIENTIFIQUE Les nouveaux projets sont identifiés par « Nouveau projet » au début de la description. Ils ne comportent pas bien évidemment de partie « Bilan ». La production scientifique notée dans chaque projet est indicative et non exhaustive. On se reportera à la section « Listes de la production scientifique » pour disposer de l’ensemble des références. 2.1.1. MODELES Coordination : Marcel Cori & Sylvain Kahane 1) Phonologie de la syllabe et phonologie du français 2) Morphologie et sémantique lexicale 3) Syntaxe et sémantique descriptive du français 4) Modélisation de données linguistiques dans la perspective du traitement automatique des langues (METAL) 5) Problèmes épistémologiques du TAL (PETAL) 6) Linguistique cognitive et microgenèse des formes sémiotiques La composante Modèles du laboratoire couvre l’ensemble des facettes d’un modèle linguistique, du son au sens : phonologie, morphologie, syntaxe et sémantique. Les aspects lexicaux comme grammaticaux sont pris en compte. Les études vont de la linguistique descriptive à la modélisation informatique en passant par la formalisation mathématique, la réflexion épistémologique, notamment en traitement automatique des langues, et l’interrogation sur la pertinence cognitive des modèles. La perspective modélisatrice se donne comme programme de recherche la description explicite et formalisée des langues, qui se réalise par la définition et l’exploration de différents plans organisationnels du langage (à tout le moins : phonologie, morphologie, syntaxe, sémantique) et par la découverte des relations de dépendance et d’autonomie de ces plans. En effet les différents chercheurs convergent sur le point de vue qui peut se résumer en la formule « le langage n’est pas un », ou « le langage est structuralement hétérogène ». La composante Modèles structure 6 opérations de recherche : 4 (1) L’opération Phonologie de la syllabe et phonologie du français conjoint deux dimensions de recherche : une reconstruction des phénoménologies de la phonologie du français contemporain (projet PFC), et une construction de modèles dynamiques de la syllabe propres à prendre en compte ces phénoménologies (modèles DLM). 9 thèses nationales ou en co- tutelle internationale, ainsi qu’une post-doctorante CNRS y participent. Le réseau international du programme PFC comprend plus de 60 chercheurs de 15 pays. Le programme organise 2 colloques par an. Les phonologues de MoDyCo font aussi partie du Réseau Français de Phonologie. (2) L’opération Morphologie et sémantique lexicale, à partir de nombreuses descriptions empiriques, vise à élaborer la problématique de l’analyse morphologique dans toutes ses dimensions, en insistant en particulier sur le système catégoriel et les types sémantiques, comme architecture sous-jacente du lexique, simplex et construit. Le travail a porté en particulier sur la caractérisation des unités accessibles aux opérations morphologiques, sur la polysémie des lexèmes et sur les questions de (dé)nomination et de lexicalisation. (3) L’opération Syntaxe et sémantique descriptive du français reconfigure l’opération Connecteurs telle qu’elle existait en 2003 : la raison en est que la caractérisation des adverbes ou groupes adverbiaux, prépositions ou groupes prépositionnels, conjonctions et complémenteurs (et des phrases qu’ils introduisent) est étroitement liée à celle des verbes et donc des compléments ou ajouts verbaux – sans toutefois s’y borner. Cet infléchissement s’est trouvé conforté par le rattachement à MoDyCo de Denis Le Pesant, dont les préoccupations de recherche concernent largement le domaine verbal (les classements syntactico-sémantiques des verbes incluant bien entendu la prise en compte de leur complémentation, en particulier prépositionnelle ou phrastique) et par la mise à disposition des membres du groupe du travail de Jean Dubois et Françoise Dubois-Charlier Les verbes français. La réflexion menée parallèlement sur le verbe dans le domaine didactique (cf. opération Didactique de la syntaxe dans la Composante Dynamique des langues) n’a fait que confirmer la nécessité d’une reconfiguration du projet. Cette opération a donné lieu à plusieurs journées scientifiques actées : « Semi-figement » (Linx 2006 : I), « La « cause » à travers les sciences » (Linx 2006 : II), « Classement syntactico-sémantique des verbes français » (Langue française 150, 2006). (4) L’opération Modélisation de données linguistiques dans la perspective du TAL [Metal] développe des travaux allant de la description des phénomènes linguistiques (morphologiques, syntaxiques et sémantiques) au traitement informatique des langues en passant par la formalisation des descriptions et l’élaboration de modèles mathématiques. L’opération a été enrichie par le rattachement en 2005 de S. Kahane au laboratoire Modyco. L’opération participe également à la normalisation et la diffusion des ressources lexicales informatisées à travers le projet LexSynt. (5) L’opération Problèmes épistémologiques du traitement automatique des langues [PETAL] a pour objectif de clarifier la nature des travaux actuels dans le domaine du TAL, et de faire le point sur les rapports du TAL à la linguistique, et plus spécialement à la linguistique formelle. On s’intéresse également aux outils d’aide à la navigation sur Internet, aux systèmes question- réponse, à la recherche d’informations. Enfin, la réflexion sur les méthodes d’évaluation est un des points importants sur lesquels est porté l’effort. L’usage sans cesse croissant des corpus en linguistique a conduit à se focaliser sur cette question, dans la mesure où les corpus sont liés au traitement automatique des langues. Un 5 numéro de la revue Langages a été accepté sur le thème « Linguistique et grands corpus » (parution prévue en 2007). (6) L’opération Linguistique cognitive et microgenèse des formes sémiotiques est un nouveau projet lancé début 2005 lorsque V. Rosenthal et M. de Fornel ont rejoint le laboratoire Modyco. Cette opération se propose de réunir dans une même approche construction de théories et modèles affine aux linguistiques cognitives et aux courants dynamiques et ‘culturalisants’ des sciences cognitives et travail expérimental de type psycholinguistique. L’opération n’en est qu’à ses début, mais elle s’appuie déjà sur deux séminaires de recherche qu’elle co-organise, et elle organisera en 2006 la seconde édition de la conférence internationale Language and Culture Mind. La composante Modèles pilote par ailleurs trois projets externes visant à la constitution de ressources pour la communauté scientifique francophone : 1) Le projet Phonologie du Français Contemporain [PFC], soutenu depuis 2003 par la DGLF, l’ILF et l’ANR, vise à construire une vaste base de données d’enregistrements sonores annotés pour des études à grande échelle en phonologie du français (opération 3.1.1.). 2) Le projet Lexiques Syntaxiques et Interface Lexique-Grammaire [LexSynt], soutenu depuis 2005 par l’ILF, vise à normaliser et fusionner des lexiques syntaxiques du français qui, interfacés avec une grammaire formelle, pourront être utilisés pour le traitement automatique des langues (opération 3.1.4). 3) Le projet Grammaire de Référence du Français Contemporain, co-piloté par A. Delaveau (Modyco) et D. Godard (LLF) et soutenu depuis 2003 par l’ILF, vise à enregistrer les savoirs acquis sur la langue française au cours des cinquante dernières années du 20ème siècle. Ces savoirs appartiennent principalement à la description de la syntaxe : éclairée par des vues en phonologie, en morphologie, en sémantique, la description syntaxique constitue l’armature du projet. L’enjeu est de trouver l’articulation et de formuler la cohérence de uploads/Science et Technologie/ modycorapportscientifique-2005-pdf.pdf

  • 38
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager