Conception et developpement dun formalisme de correction grammaticale automatique applicaion au fracais

UNIVERSITÉ STENDHAL ?? GRENOBLE LABORATOIRE LIDILEM CONCEPTION ET DÉVELOPPEMENT D'UN FORMALISME DE CORRECTION GRAMMATICALE AUTOMATIQUE - APPLICATION AU FRANÇAIS - Agnès Souque Juin Mémoire de Master Sciences du Langage mention Industries de la Langue Spécialité parole écrit et conception d'outils pour l'apprentissage des langues Parcours Traitement Automatique de la Langue Ecrite et de la Parole Orientation Recherche Directeur de mémoire Thomas Lebarbé Ma? tre de conférences C Table des matières Introduction Chapitre Existant Structure générale d'un correcteur grammatical Tokenization Tagging et désambigu? sation Segmentation en syntagmes minimaux Détection des fautes Travail de M Lechelt adaptation au français d'un correcteur existant Analyse de di ?érents correcteurs Rejet de GRAC et de LanguageTool Sélection de An Gramadóir Adaptation de An Gramadóir à la correction grammaticale du français La tokenization Le tagging La détection des fautes La rédaction des règles Évaluation et perspectives Évaluation et limites de An Gramadóir Perspectives LanguageTool Rejet de la première version de l'outil Structure de LanguageTool à l'époque Points faibles à l'origine du rejet Évolutions et nouvelle version de l'outil Évolutions du système Structure actuelle de LanguageTool Conclusion Chapitre Adaptation de LanguageTool à la correction du français Test des règles existantes Test et erreurs détectées C Problème de l'ambigu? té catégorielle Tentative de contournement du problème Implantation d'un désambigu? seur Choix d'un type de désambigu? seur Choix d'un formalisme pour les règles Intégration dans LanguageTool Importation des règles de An Gramadóir dans LanguageTool Importation des règles de désambigu? sation Représentation en XML Réécriture des règles Importation des règles d'erreurs Réécriture automatique Réécriture des règles sur les syntagmes verbaux Réécriture des règles sur les syntagmes nominaux Augmentation des règles à partir d'un corpus de fautes Analyse des fautes commises Fautes d'orthographe Fautes déjà détectées par LanguageTool Fautes a priori non détectables Fautes détectables avec un nouveau formalisme Fautes détectables avec le formalisme actuel de LanguageTool Rédaction de nouvelles règles d'erreurs Accord Déterminant Nom Verbe Accord en nombre Être Participe passé ou Adjectif Confusion entre la forme verbale et la forme nominale Confusion entre on et ont Confusion entre cet cette ces et c'est Accord Pronom relatif qui Verbe Typologie des erreurs corrigées Les erreurs corrigées par LanguageTool Les erreurs de proximité phonétique Les erreurs d'accord dans le syntagme nominal Les erreurs dans le groupe verbal C Les erreurs d'accord avec le sujet Des fautes d'orthographe ou de grammaire Point de vue linguistique orthographe lexicale et orthographe grammaticale Point de vue informatique correction orthographique et correction grammaticale Chevauchement des fautes d'orthographe et de grammaire Les fautes du dactylographe Conclusion Chapitre Amélioration du formalisme de LanguageTool Critique des limites du formalisme actuel Le pattern-matching rigide Explosion combinatoire des règles Nécessité et impossibilité de prévoir tous les contextes Limitation au contexte immédiat De nombreuses fausses alarmes Mots ambigus Mots mal étiquetés Détections multiples Détections en cascade Première évolution du formalisme Segmentation en chunks et uni ?cation de structures de traits Chunks Rappels sur les structures de traits et l'uni ?cation Intérêt de la combinaison chunks-uni ?cation pour la correction grammaticale Correction intra-chunk

  • 26
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise
Partager