République Algérienne Démocratique et Populaire Ministère de L’enseignement Sup
République Algérienne Démocratique et Populaire Ministère de L’enseignement Supérieur et de la Recherche scientifique Université d’Oran Faculté des lettres, des langues et des arts Ecole doctorale de Français Pole ouest-Oran Intitulé : TRAITEMENT AUTOMATIQUE DU LANGAGE, OU INGENIERIE LINGUISTIQUE ETUDES ET ILLUSTRATIONS A TRAVERS QUATRE OUTILS ET APPLICATIONS DU GÉNIE LINGUISTIQUE Mémoire de Magister Présenté par : Titt Karima Sous la direction de : Mme SARI Fawzia Membres du jury : Mme BOUTALEB Jamila MC UNIVERSITE D’ORAN PRESIDENTE Mme SARI FAWZIA PROFESSEUR UNIVERSITE D’ORAN ENCADREUR M. FARI Gamal-El-Hak MC UNIVERSITE D’ORAN EXAMINATEUR Mme HAMIDOU Nabila MC UNIVERSITE D’ORAN EXAMINATRICE Année 2010 /2011 SOMMAIRE Remerciements Avertissement *…………………………………………………………………………………1 Sommaire.....…………………………………………………………………………………….4 Introduction. …………………………………………………………………………………….8 CHAPITRE I : Aperçu historique, définition, famille d’outils et niveaux d’analyse…….12 1.1-Aperçu historique …………………………………………………………………………………..12 1.2- Appellations…………………………………………………………………………………14 1.3- Définitions……………………………………………………………………………………….....14 1.4 -Liste thématique des outils du traitement automatique du langage ………………………...13 1.5- Famille des outils linguistiques du traitement automatique de l’information………………14 1.6-Grammaires et formalismes syntaxiques …………………………………………………….16 1 .7-Niveaux d’analyse …………………………………………………………………………..17 CHAPITRE II : Correcteur automatique / logiciel ou outil de correction orthographique, grammaticale et stylistique /correcticiels …………………………..…………………19 2.1-Correcteur automatique et nouveau mode d’écriture………………………………………19 2.2- Brève typologie historique des correcteurs automatique…………………………………………………21 2.3-Les outils existants ………………………………………………………………………………………………………22 2 .3.1 -Les correcticiels intégrés dans les traitements de texte …………………………………………………22 2.3.2-Les correcticiels indépendants………………………………………………………………………………………23 *Prière de lire l’avertissement. 2.4 Application : le logiciel Word ………………………………………………………………………………....24 2 .4.1-Description du logiciel…………………………………………………………………………………………….24 2 4- Expérimentation : correction automatique…………………………………………………………………….…25 2.5- Fonctionnement du correcticiel ………………………………………………………..26 2 .5-Analyse du processus de correction ………………………………………………………………………………..26 2-6 Typologie des erreurs détectées par les correcteurs :……………………………………………………..…28 2.7 Etapes du processus de correction ………………………………………………………………………………..….. 2.8 Un champ d applications particulier des correcteurs : leur utilisation pour l’apprentissage/enseignement du français……………………………………………………………………….……..29 CHAPITRE III : Ingénierie linguistique et interdisciplinarité. Le cas de l’analyse automatique statistique et documentaire des texte…………………………………………………………………………………………36 3.1- Interdisciplinarité et interactions : 3.1.1- Le pourquoi de l’interdisciplinarité : ( qu’ est ce qui fait que l’ ingénierie linguistique est interdisciplinaire) …………………………………………………………………………….37 3 .1.2 – Le comment de l’interdisciplinarité (par quelles procédure le traitement automatique est- il interdisciplinaire ?) ………………………………………………………………….39 3.2-L’analyse automatique des textes …………………………………………………………………………….42 3.2-Interactions, points en commun et importances des interactions. 3 .3 Analyse (linguistique) statistique :…………………………………………………...46 3.3.1-Le model du logiciel d’analyse automatique statistique Hyperbase…………………..46 3. 3.2-Les trois logiciels d’analyse automatique statistique et documentaire de la gamme .d’ « Ascetic » …………………………………………………………………………………………………………………………..50 CHAPITRE IV : 4.1- Traduction automatique Traduction automatique et interdisciplinarité ……………………………………………53 4.2.-Question épistémologique ……………………………………………………………….55 4. 3: logiciel de traduction ………………………………………………………………………….56 4 . 3 .2 Composants d'un logiciel de traduction………………………………………….57 4.3.2.1- Les règles linguistiques ……………………………………………………………..58 4.3.2.2- Dictionnaires : (spécifiques)………………………………………………………...58 4.3.2.3- L'interface …………………………………………………………………………..59 4.4 Comment fonctionne la traduction automatique ? ………………………………………60 4.5-Cas pratique : Le traducteur « Reverso » ………………………………………...63 4.6-Limites du traducteur : (a quel point est-il performant ?)………………………66 CHAPITRE V : Apprentissage et enseignement assisté par ordinateur ( Logiciel d’apprentissage du Français ) . ………………………………………………………………………………..69 5.1-Présentation, exploration et expérimentation du logiciel ………………………………...…71 5.2 - L’informatique, le numérique, le traitement automatique au service de l’acquisition, apprentissage, diffusion et promotion des langues 74: 5 .2 .1 Les prémices à partir de 1976 ………………………………………………....74 5 .2.2-L’après guerre froide, les années 80, une nouvelle interaction ……………..…75 5.2.3- Les années 90 , Flexibilité et adaptabilité ……………………………………..77 5.2.4- A partir de l’an 2000, l’autonomie ………………………………………………78 5.2.5-L’accessibilité aux ressources …………………………………………………..79 5.2.6-Une deuxième lecture du progrès en question ……………………………..…..81 5.2.7-Le pour et le contre (véhicule de communication ou de marginalisation ? )………...82 5.2.8-Complémentarité entre l’Homme et la machine …………………………...82 6-Conclusion et ( perspectives) ……………………………………………………..85 7-Bibliographie ……………………………………………………………………… 88 8-Annexes …………………………………………………………………………….92 8. 1- Apprentissage des langues 8.2- Dictionnaire électronique 8.3- Recherche en langage naturel 8 .4 Gestion électronique de documents et de l'information 8.5- Reconnaissance et synthèse vocales 8.6-- Traduction automatique 8.7- Indications sur l’état de l’art technologique (Associations, agences et relais) . Tables des illustrations : Figure 1 : Représentation des niveaux d’analyse du langage ………………………..17 Figure 2 : Logiciel de traitement de texte simplifié «aide TTX PAPA NOEL »…..34 Figure 3 : Une page du dictionnaire (ou index)……………………………………….48 Figure 4 : exemple de la fonction « Contexte » …………………………………………..…………..49 Figure 5: exemple d’une représentation en forme d’histogramme …………………..50 Figure 6 :Schéma récapitulatif du processus de traduction……………………………62 Figure 7: Les principaux constituants de l’interface du logiciel de traduction automatique Reverso …………………………………………………………………………60 Figure 8 :Environnement informatique d’apprentissage BLCC : exemple d’une plate forme d’apprentissage ………………………………………………………………….79 Tableau 1 : Exemple de correction automatique ………………………………….……………………..25 8 Introduction « …Au commencement était le vers » Depuis le début de l’histoire de la communication entre les Hommes; le signe et le mot furent au centre de l’univers et notamment celui (l’univers) des savoirs et des connaissances .Avec la mise en place des premiers alphabets ; la fonction ainsi que le pouvoir du mot sont devenus incontestables. Vinrent ensuite les sciences et disciplines en succession l’une après l’autre ; jusqu’au XIX ème siècle ; qui a vu naître la linguistique en tant que science à part entière. Depuis Saussure cette science n’a cessé d’évoluer, de se diviser en plusieurs spécialités, et dernièrement d’interagir avec d’autres disciplines, afin de donner naissance à de nouveaux champs et domaines d’étude. L’une des disciplines scientifiques et techniques avec laquelle les sciences du langage ont entretenu d’étroits rapports et continuent est l’informatique. Depuis le début des années quarante, l’idée de fusionner les deux domaines s’est manifestée d’abord aux Etats-Unis, conceptualisée, ensuite opérationnalisée et concrétisée dans d’autres territoires au niveau des plus grands laboratoires, instituts et centres de recherche et notamment en France. La nécessité des réciproques interrogations et interactions entre les deux disciplines en question; et les quelques points en commun qui existent entre eux ont donné naissance à un nouveau domaine connu sous le nom de linguistique- informatique, traitement automatique du langage ou encore ingénierie linguistique. (cf. présentations des différentes appellations du domaine dans le § 2 du chapitre I) .Toutes ces interactions se sont avérées incontournables pour plusieurs raisons, nous citons entre autres ; d’une part ; le souci de répondre aux préoccupations grandissantes des sociétés en plein expansion, d’autres part comme résultats logique de 9 l’accélération de la communication de l’information suite à l’essor et au progrès des nouvelle technologies. Le fait que cette nouvelle discipline se base à 60% sur les sciences du langage ,le développement rapide de cette discipline caractérisé par l’apparition d’un certain nombre de nouveaux outils et de nouvelles applications et pratiques intégrés dans la vie au quotidien , par exemple le traitement de texte, l’utilisation de différents outils et logiciels de traitement automatique du langage ;comme la correction et la traduction automatique, les analyseurs automatiques de texte, ou encore les logiciels d’apprentissage de langue (cf. voir liste des outils et applications dans le § 4 et 5 du chapitre I), l’effervescence des manifestations et activités de recherche , ainsi que la profusion de différents spécialistes investies dans le développement de cette discipline furent toutes des raisons nous ayant incité à essayer de traiter d’une certaine manière ce thème récent et sensible . Technologies du langage ,traitement automatique du langage, Ingénierie linguistique, ou encore linguistique informatique sont toutes des appellations pour un domaine émergeant, d’actualité et d’avenir- comme l’a si bien noté Jocelyne Pierre dans son rapport à la « Délégation générale à la langue française et aux langues de France » en parlant du numérique et de toutes ces nouvelles technologies- que nous tenterons d’approcher à travers un certains nombre de questions et d’interrogations auxquelles nous essayerons de répondre à savoir ; qu’est ce que l’ingénierie linguistique ou le traitement du langage au juste ? Quelles valeurs ajoutées, nouveaux défis ,enjeux et perspectives ouvre ce domaine ? A quel point les outils existants sont- ils performants ? Quelle est la dimension interdisciplinaire de ce nouveau champ ? Et à quel lendemain on s’attend ? Afin de parvenir à cet objectif, nous procéderons comme suit : Une entrée en matière, à travers le premier chapitre dans lequel nous présenterons un bref aperçu historique croisé de la linguistique et de l’informatique, les différentes appellations du domaine , trois de ses définitions pour tenter de cerner notre champ d’étude, une liste thématique des applications, et une présentation des plus importants outils du traitement automatique de l’information organisés en famille d’outils , ainsi que les grammaires et les différents niveaux du traitement du langage effectuées automatiquement . 10 En deuxième lieu, nous présentons le premier outil d’étude, un correcteur automatique intégré au logiciel de traitement de texte « Word ». Nous commençons par attirer l’attention sur le nouveau mode d’écriture et rapport à l’erreur caractérisé par le recours grandissant aux logiciels de traitement de texte (qui font le travail à la place du rédacteur …) présentons ensuite un bref historique et typologie historique des correcticiels1. Après quoi nous donnons une idée sur le paysage actuel en matière de correction automatiques. Nous passerons après cela à un cas pratique ; qui est donc le logiciel « Word », nous le décrirons, expérimenterons en lui soumettant un petit passage à corriger, analyserons les résultats de la correction en nous approchant de son fonctionnement et de son processus de correction. Nous citerons la typologie des erreurs détectées par les logiciels de correction automatique, ainsi que les étapes uploads/Management/ th3674.pdf
Documents similaires
-
16
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Aoû 11, 2021
- Catégorie Management
- Langue French
- Taille du fichier 0.9736MB