TALN 2005, Dourdan, 6–10 juin 2005 RITEL : dialogue homme-machine à domaine ouv
TALN 2005, Dourdan, 6–10 juin 2005 RITEL : dialogue homme-machine à domaine ouvert Olivier Galibert, Gabriel Illouz, Sophie Rosset LIMSI - CNRS F-91403 Orsay Cedex {galibert,gabrieli,rosset}@limsi.fr Mots-clefs : dialogue homme machine, recherche d’information précise, corpus Keywords: human machine dialog, question answering, information retrieval, corpus Résumé L’objectif du projet RITEL est de réaliser un système de dialogue homme-machine permettant à un utilisateur de poser oralement des questions, et de dialoguer avec un système de recherche d’information généraliste (par exemple, chercher sur l’Internet “Qui est le Président du Sénat ?”) et d’en étudier les potentialités. Actuellement, la plateforme RITEL permet de collecter des corpus de dialogue homme-machine. Les utilisateurs peuvent parfois obtenir une réponse, de type factuel (Q : qui est le président de la France ; R : Jacques Chirac.). Cet article présente brièvement la plateforme développée, le corpus collecté ainsi que les questions que soulèvent un tel système et quelques unes des premières solutions envisagées. Abstract The project RITEL aims at integrating a spoken language dialog system and an open-domain question answering system to allow a human to ask a general question (f.i. “Who is currently presiding the Senate?”) and refine his research interactively. As this point in time the RITEL platform is used to collect a new human-computer dialog corpus. The user can sometimes recieve factual answers (Q : who is the president of France ; R : Jacques Chirac). This paper briefly presents the current system, the collected corpus, the problems encountered by such a system and our first answers to these problems. Introduction Les progrès réalisés ces dernières années tant en reconnaissance de la parole qu’en recherche d’information permettent d’envisager de nouvelles études. L’objectif du projet RITEL est de réaliser un système de dialogue homme-machine permettant à un utilisateur de poser orale- ment des questions, et de dialoguer avec un système de recherche d’information généraliste (par exemple, chercher sur l’Internet “Qui est le Président du Sénat ?”) et d’en étudier les po- tentialités. Le terme de système de dialogue indique généralement un système permettant une interaction entre un humain et un système dans un cadre restreint (Glass J. R. et al., 2000). Toutefois, notamment dans le cadre des travaux sur les systèmes de question-réponse, le cadre tend à s’élargir. Un dialogue est une suite d’échanges entre interlocuteurs dans un contexte donné. Un système de dialogue homme-machine interprète les requêtes de l’utilisateur en fonc- tion de la tâche à accomplir, de l’histoire du dialogue et du comportement de l’utilisateur. Son O. Galibert, G. Illouz, S. Rosset objectif est de donner à l’utilisateur les informations recherchées tout en assurant une interac- tion efficace et naturelle. Actuellement, Les systèmes concernent des domaines restreints tels que l’information horaire de moyens de transports (trains, avions, cinéma) ou les informations touristiques, par exemple le projet européen Le3-Arise (horaires de train), le projet américain ATIS du DARPA Communicator (voyages en avions), et le projet français Technolangue ME- DIA (informations touristiques). Ces projets ont donné lieu à des évaluations et ont permis d’en asseoir la faisabilité. Des modèles de gestion dynamique du dialogue et de génération adaptée ont été proposés. Même si ce qu’on entend par interaction naturelle est très variable d’un système à un autre (Villaneau J., 2003), ces systèmes permettent une interaction (orale) relativement naturelle : l’utilisateur peut à tout moment changer d’avis et revenir sur des choix exprimés, interrompre la réponse du système en prenant la parole, le système peut lui aussi changer de stratégie d’interaction en fonction des réactions de l’utilisateur. Un système de di- alogue utilise des sources de connaissances diverses et complexes : connaissances acoustiques, phonétiques, lexicales, morphologiques, syntaxiques et sémantiques, pragmatiques, ainsi que des connaissances sur le dialogue, sur la tâche à réaliser et sur l’interlocuteur. En recherche d’information et extraction d’information, des progrès (Harabagiu S. et al., 2001) ont été mo- tivés par des campagnes d’évaluations (américaine TREC, 98-2003, européenne CLEF, et na- tionale Equer/Technolangue, 2004). Ces systèmes sont limités à une question et une réponse. Des tentatives ont été faites pour des questions enchaînées, portant sur un même thème. Mais il ne s’agissait pas de dialogues, il n’y avait pas réellement d’interaction, il n’y avait pas de négociations possibles. Le projet RITEL s’appuie sur des progrès récents en reconnaissance de la parole conversationnelle et multi-locuteurs (Gauvain J.L., Lamel L., 2002) Un projet riche et complexe doit faire face à plusieurs points épineux. Les plus évidents sont : la reconnaissance de la parole qui doit être à grand vocabulaire et sur laquelle une contrainte temps réel s’applique, la gestion d’un dialogue en domaine ouvert, la communication et l’échange d’informations en- tre un système de question-réponse et le dialogue, la génération de la réponse. Cet article ne répond pas à toutes ces questions, seuls certains problèmes rencontrés et les réponses apportées seront présentés. Nous présentons un état des lieux du projet RITEL et décrivons le corpus collecté jusqu’à présent avec la plateforme. Nous concluons sur les perspectives de cette étude. 1 Dialogue oral et recherche d’information : intégration Un système de dialogue oral homme-machine a pour objectif de donner à l’utilisateur l’informa- tion qu’il recherche en s’aidant de diverses sources de connaissances (statiques : connaissance du domaine, dynamique...), et le système de question-réponse de rechercher une réponse précise à une question. L’objectif du projet RITEL est l’intégration de ces différents systèmes en une plateforme unique. 1.1 Reconnaissance de la parole Intégrer un système de reconnaissance de parole dans une telle plateforme suppose de mettre en place un système de reconnaissance à grand vocabulaire (taille de lexique de 65000 à 300000 mots), temps réel, multi-locuteur et fonctionnant sur un signal téléphonique. Dans de telles conditions aucun système de reconnaissance, au niveau de l’état de l’art, ne permet d’obtenir des performances nécessaires pour un système de dialogue (aux alentours de 20% d’erreur). Il faut donc envisager des techniques d’adaptations dynamiques des différents modèles. L’adaptation RITEL : dialogue homme-machine à domaine ouvert Table 1: Exemples avec une question : qui est le président des États-Unis? Réponses score thème contexte Réponses score thème contexte G.W. Bush 0.99 pol 2000- élu au suffrage indirect 0.6 droit - Bill Clinton 0.7 pol 93-2000 né sur le sol américain 0.6 droit - Satan 0.1 pol_opi 2005 un pantin 0.2 pol_opi - Mère Theresa 0.2 pol_opi 2002-04 Dumbo Bush 0.3 pol_opi 2004 Bartlet 0.6 fic_série 1999- H. Ford 0.5 fic_film 1997- dynamiques des modèles de langage est rendue possible par l’indexation en thème des énoncés utilisateur et des réponses du système de recherche d’information. L’adaptation des modèles acoustiques s’effectue dynamiquement et de manière de plus en plus poussée au fur et à mesure des échanges entre l’utilisateur et le système. De plus le gestionnaire de dialogue peut le cas échéant demander à l’utilisateur d’épeler certains mots de sa demande. 1.2 Recherche d’information Le système d’information prend en entrée la sortie du système de reconnaissance. Il s’agit de parole libre et potentiellement erronée. Il est donc nécessaire d’adapter la communication par rapport à un moteur question-réponse classique, notamment l’analyse de la question ne peut se faire à l’aide de contraintes morpho-syntaxiques fortes mais plutôt d’une analyse syntaxico- sémantique plus lâche. Les étapes suivantes restent sensiblement les mêmes que dans un moteur question-réponse classique. Par contre, pour ce qui est du retour de l’information, celle-ci doit être adapté au dialogue. Il ne s’agit plus seulement de mettre les "meilleures" réponses en pre- mier mais bien de permettre au dialogue d’aider l’utilisateur à choisir celles qui lui conviennent le mieux. Pour ce faire, les réponses sont constituées de listes indicées par un score de confiance ce qui aide le système de dialogue à prendre sa décision pour générer une réponse (ou non) à l’utilisateur (cf. tableau 1). Selon ce score la réponse pourra comporter une information infor- mant l’utilisateur du degré de confiance qu’a le système dans sa réponse (ex. je crois que,...) Le nombre de document est lui aussi associé à une réponse. Pour un grand nombre de document retourné, deux stratégies sont possibles. Le Regroupement par thèmes permet au dialogue de proposer différentes possibilités à l’uti- lisateur pour que celui-ci oriente sa recherche. Pour chacun de ces topics, un score de confiance sera attribué de façon à aider le dialogue à orienter au mieux l’utilisateur. (R: J’ai plusieurs réponses possibles, 2 dans le domaine de la politique, 3 qui s’apparentent à des opinions et 2 concernant des fictions. Quelle est la thématique de votre recherche ? ) La Demande de précision a lieu si le regroupement par thème n’est pas possible. Le système soit demande à l’utilisateur de préciser sa requête soit lui propose quelques exemples pour qu’il y réagisse. ( R: J’ai des réponses avec des noms de personnes et d’autres sans. Par exemple, G.W. Bush est le ... ou une réponse de type définition comme élu au suffrage universel indirect. Que recherchez-vous précisément ? ) Ainsi, contrairement à l’augmentation de la précision en utilisant le retour d’information en aveugle (Blind relevance feedback), nous avons ici un retour d’information éclairé par l’utilisateur. O. Galibert, G. Illouz, uploads/Litterature/ 2005-jeptalnrecital-court-10.pdf
Documents similaires
-
11
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Oct 27, 2021
- Catégorie Literature / Litté...
- Langue French
- Taille du fichier 0.0297MB