Logique, Linguistique et Informatique Christian Retoré, Université Bordeaux 1 É

Logique, Linguistique et Informatique Christian Retoré, Université Bordeaux 1 Équipe Signes linguistiques, grammaire et sens: algorithmique logique de la langue INRIA-Futurs, LaBRI -C.N.R.S. et Département des Sciences du Langage Université Bordeaux 3 Linguistique et informatique :une longue histoire . . . . . . . . . . . . . . . . . . . 2 Exemple d’outils de linguistique computationnelle . . . . . . . . . . . . . . . . . . 3 Linguistique computationnelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Niveaux d’analyse de la langue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Modèles informatiques et mathématiques en linguistique . . . . . . . . . . . . 10 Un classique:grammaire générative et langages formels . . . . . . . . . . . . 13 Logique et grammaire : un lien naturel et traditionnel. . . . . . . . . . . . . . . . 19 Syntaxe et sémantique des langues en théorie des types . . . . . . . . . . . 24 Réseaux de démonstration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 GEOCAL CIRM Logic ⊗Linguistics 13 février 2006 Plan Début Fin Préc. Suiv. ◀ Linguistique et informatique : une longue histoire • 1949 Machine Translation →aide à la traduction, – The flesh is weak but the spirit is willing – The meat is rotten but the vodka is strong – La chair est faible mais l’esprit est fort. aujourd’hui réparti dans les deux disciplines suivantes • 1960 Computational Linguistics Structuration du précédent (théories mathématiques, linguistiques) • 1965 Automatic / Natural Language Processing Focalisé sur les outils et plus particulièrement: ▶Analyse syntaxique ▶Méthodes statistiques • 1970 Natural Language Understanding (AI) →approches cognitives GEOCAL CIRM Logic ⊗Linguistics 13 février 2006 Plan Début Fin Préc. Suiv. ◀ Exemple d’outils de linguistique computationnelle ▶Le Graal: la traduction automatique (il faut savoir tout traiter pour y parvenir) ▶Aide à la traduction: domaine spécifique repère les expressions idiomatiques (aller bon train) propose pour chaque mot ou expression des traductions les assemble avec les choix du lecteur (éviter au maximum la représentation des connaissances) ▶L ’interface homme/machine en langue naturelle par exemple: interrogation de BD en langage naturel Quels sont les films des années cinquante qui passent actuellement à Bor- deaux? GEOCAL CIRM Logic ⊗Linguistics 13 février 2006 Plan Début Fin Préc. Suiv. ◀ ▶Correcteurs orthographiques (pas simple): Quels livres crois-tu qu’il sait que je pense que tu as lus? ▶Génération automatique de bulletins météo, de comptes-rendus,.. ▶Résumé automatique ▶Recherche d’information (notamment sur le web) production laitière / production de lait production minière / production de mine(s)??? ▶reconnaissance de la parole (par ex. pour sous-titrage) nécessite une analyse morpho-syntaxique pour fonctionner en temps réel GEOCAL CIRM Logic ⊗Linguistics 13 février 2006 Plan Début Fin Préc. Suiv. ◀ Linguistique computationnelle (ou linguistique informatique) Un domaine interdisciplinaire : ■mathématiques • logique • théorie des langages • probabilités ■informatique • algorithmique • génie logiciel ■linguistique • paramètres phonologiques • grammaire générative • syntaxe structurale • philosophie du langage GEOCAL CIRM Logic ⊗Linguistics 13 février 2006 Plan Début Fin Préc. Suiv. ◀ Des objectifs variés : ▶Réalisation d’outils de traitement des langues ▶Formalisation des théories linguistiques vérification ou réfutation d’hypothèses linguistiques surtout si celles-ci sont de nature algorithmique ex. les modèles syntaxiques doivent admettre des algorithmes d’apprentissage efficaces à partir d’exemples positifs ▶Développement des théories informatiques et mathématiques, pour elles-mêmes, éventuellement pour d’autres objectifs GEOCAL CIRM Logic ⊗Linguistics 13 février 2006 Plan Début Fin Préc. Suiv. ◀ Niveaux d’analyse de la langue La langue étant un système complexe un des apports de la linguistique a été d’organiser soné tude suivant divers modules. phonétique étude des sons concrets d’une langue Accoustique - Système phonatoire/auditif phonologie Les sons abstraits: systéme discret (dans un continu) Bali / Paris indistincts pour un japonais prosodie Structure du phrasé et de leur enchainement: pauses, intonation "Je serai très heureux de venir parler au LaBRI, laboratoire auquel je dois ma formation initiale en informatique, par exemple sur la lambda-DRT." "Je serai très heureux de venir parler au LaBRI — laboratoire auquel je dois ma formation initiale en informatique — par exemple sur la lambda-DRT." GEOCAL CIRM Logic ⊗Linguistics 13 février 2006 Plan Début Fin Préc. Suiv. ◀ morphologie structure des mots morphologie dérivationnelle [formation des mots] préfixes, suffixes, nom composés, etc. changement de catégorie possible noble→noblesse petit→petitesse maison→maisonnette camion→camionnette carpe→carpette? morphologie flexionnelle [déclinaisons, conjugaisons] en général pas de changement de categorie (sauf except, part present) arriver →arriv[er][ons] cheval →chevaux syntaxe étude de la structure de la phrase *Je fais la réparer Je la fais réparer * [[Pierre [mange une]] pomme] Pierre [mange [une pomme]] GEOCAL CIRM Logic ⊗Linguistics 13 février 2006 Plan Début Fin Préc. Suiv. ◀ sémantique étude du sens des mots, des phrases hors contexte sémantique lexicale sens des mots et relation entre eux livre, imprimer (objet concret), lire (contenu abstrait) sémantique logique 2 aspects indépendants sémantique vériconditionnelle déterminer les conditions dans lesquelles un énoncé est Vrai ou Faux ou . . . (sens = formule logique) sémantique compositionnelle calcul du sens d’un constituant à partir du sens des parties (λ-calcul pour gérer la composition du sens et les substitutions) pragmatique utilisation de la langue pour communiquer dans un contexte énon- ciatif Référence des indexicaux: 1et 2personnes (je, nous, vous), ici, maintenant, démonstratifs, . . . Allons plutôt dans ce restaurant. GEOCAL CIRM Logic ⊗Linguistics 13 février 2006 Plan Début Fin Préc. Suiv. ◀ Modèles informatiques et mathématiques en linguistique ■probabilités, statistiques marquage des parties du discours sur un texte en fonction des n mots précédents : si les mots précédents sont article, nom, adjectif il est peu probable que le mot suivant soit article sauf apposition GEOCAL CIRM Logic ⊗Linguistics 13 février 2006 Plan Début Fin Préc. Suiv. ◀ ■grammaires formelles • morphologie: automates d’états finis, transducteurs nombres, dates chanterons →chanter 1pers. pl. , futur • syntaxe générative, théorie des langages formels [La [petite brise]] [la glace] [La petite] [[brise [la glace]] Il [regarde [une passante]] [avec des lunettes noires]. Il [regarde [une [passante [avec des lunettes noires]]] Elle [[a trouvé] [son [parapluie bizarre]]] Elle [[[a trouvé] [son parapluie]] [bizarre]] Syntaxe étendue vers la sémantique: * Ili a revendu un livre que Pierrei a lu. Combien de livres que Pierrei a lus a-t-ili revendu? GEOCAL CIRM Logic ⊗Linguistics 13 février 2006 Plan Début Fin Préc. Suiv. ◀ ■logique • logique pour la sémantique tous les médecins sont des conducteurs (donc) tous les médecins français sont des conducteurs français *(donc) tous les bons médecins sont des bons conducteurs J’avais trois pièces, j’en ai perdu une. Je la cherche. *J’avais trois pièces, j’en ai perdu deux. Je la range dans ma poche. • une particularité dans la famille logique linéaire logique pour la syntaxe structure d’analyse = déduction formelle = graphe GEOCAL CIRM Logic ⊗Linguistics 13 février 2006 Plan Début Fin Préc. Suiv. ◀ Un classique: grammaire générative et langages formels En informatique, mathématique, biologie,... développements conséquents: compilation, parallélisme, groupes profinis, génômique,... grammaires formelles: notion linguistique due à Noam Chomsky (+ contribution mathématique de Marcel-Paul Schützenberger) première notion de grammaire hors-contexte Pan .ini, 5e s. av. J.C. ■Une langue n’est pas l’ensemble des énoncés de ses locuteurs : on peut toujours produire des phrases nouvelles qui sont identifiées comme des phrases par les locuteurs par ex. Ei+1 = Il croit que Ei ■→Hypothèse: La langue est un ensemble de règles (inconscientes) : les enfants surgénéralisent lorsqu’ils ont acquis une règle: "vous faisez" GEOCAL CIRM Logic ⊗Linguistics 13 février 2006 Plan Début Fin Préc. Suiv. ◀ ■d’où grammaires formelles, hiérachie de Chosmky • Distinction compétence /performance : la grammaire / ce qu’on utilise Le loup a dévoré la chèvre. La chèvre que le loup a dévoré avait mangé le chou. ? Le chou que la chèvre que le loup a dévoré avait mangé appartenait au passeur. ?? Le passeur auquel le chou que la chèvre que le loup a dévoré avait mangé appartenait possède plusieurs bateaux. ??? Les bateaux que le passeur auquel le chou que la chèvre que le loup a dévoré avait mangé appartenait possède sont des uploads/Philosophie/ logique-linguistique-et-informatique.pdf

  • 35
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager