Tal1 helamahersia Université de Carthage Faculté des Sciences de Bizerte Département Informatique Mastère de Recherche Traitement Automatique des Langues TAL Dr Ing Hela mahersia Email helamahersia yahoo fr CPartie Introduction CPlan Motivation Applicatio
Université de Carthage Faculté des Sciences de Bizerte Département Informatique Mastère de Recherche Traitement Automatique des Langues TAL Dr Ing Hela mahersia Email helamahersia yahoo fr CPartie Introduction CPlan Motivation Applications Dé ?s CMotivation TAL Chapitre CTAL Objectif L'objectif du TAL est la conception de logiciels capables de traiter de façon automatique des données exprimées dans une langue naturelle ? CL ? intelligence arti ?cielle CMotivation Le traitement automatique des langues TAL étudie la composante langagière de l ? intelligence arti ?cielle Une caractéristique la plus distinctive de l ? intelligence humaine sa capacité à comprendre utiliser des langues complexes C ? est une composante dans le test de Turing primordiale CTest de Turing Turing Computing machinery and intelligence Les machines sont-elles capables de penser Les machines peuvent-elles avoir un comportement intellectuel Le test si la conversation avec la machine ne peut pas être di ?érenciée de la conversation humaine on peut dire que la machine possède de l ? intelligence Durée du Test min de conversation But Deviner qui est la personne et qui est la machine CExemple Question-réponse avec Watson CExemple Question-réponse avec Watson CTraitement Automatique des Langues Compréhension Encodage stockage de documents Classi ?cation de documents Extraction d'information Recherche d'information Génération Restitution Visualisation Résumé Synthèse CApplications du TAL Chapitre CReconnaissance de caractères OCR Principe général Numérisation de documents écrits scanner en images Application de techniques de reconnaissance de formes lettres à l'aide d'apprentissage réseaux de neurones HMM Exploitation d'un modèle de langage dont des ressources dictionnaires grammaires etc pour déterminer l'hypothèse la plus probable Applications pratiques dématérialisation de documents bibliothèques formulaires chèques administration adresses pour le tri postal identi ?cation d'immatriculation CCorrection orthographique grammaticale Principe général Identi ?er les mots tokenization Correction orthographique mots qui n'appartiennent pas au dictionnaire et qui ne sont pas en langue étrangère ni des noms propres ni des chi ?res ni des sigles Correction grammaticale déterminer la fonction des mots au sein de la phrase déterminant nom verbe adverbe etc puis réaliser une analyse syntaxique à l'aide de grammaires Applications pratiques correion de document rédiger par des aitudian exemple de fautes CTraduction automatique Principe général Sélection des langues source et cible Deux stratégies actuellement ? Utilisation d'un modèle de langage pour la source et pour la cible éventuellement d'un modèle pivot ? ? Recherche des traductions possibles et probables Applications pratiques traduction de documents dictionnaires bilingues recherche d'informations multilingue CExtraction et recherche d'informations Principe général Enregistrer des documents ou leurs adresses et déterminer un ensemble de caractéristiques selon leur analyse Construire des indices accessibles et régulièrement mis à jour Répondre à la demande aux requêtes par sélection des documents les plus pertinents Applications pratiques recherche en ligne veille surveillance résumé automatique classi ?cation de documents CReconnaissance de la parole Principe général Traitement acoustique du ux audio Analyse du signal transformée de Fourier Reconnaissance par modèles appris HMM ou réseaux de neurones avec implémentation de modèle de langage qui donne la séquence la plus probable Applications pratiques dictaphones smartphones serveurs vocaux hotline transcriptions
Documents similaires










-
21
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise- Détails
- Publié le Oct 31, 2021
- Catégorie Management
- Langue French
- Taille du fichier 36.7kB