24e Conférence sur le Traitement Automatique des Langues Naturelles (TALN) Orlé

24e Conférence sur le Traitement Automatique des Langues Naturelles (TALN) Orléans, France – 26-30 juin 2017 https://taln2017.cnrs.fr Actes de l’atelier « DéfiFouille de Textes » (DEFT 2017) Farah Benamara, Cyril Grouin, Jihen Karoui, Véronique Moriceau, Isabelle Robba (Eds.) Sponsors : Préface L’analyse des sentiments est un domaine de recherche extrêmement actif en traitement automatique des langues. En effet, ces dernières années ont vu se multiplier les sources de données textuelles porteuses d’opinion disponibles sur le web. Devant cette abondance de données et de sources, l’au- tomatisation de la synthèse des multiples avis devient cruciale pour obtenir efficacement une vue d’ensemble des opinions sur un sujet donné. Globalement, les systèmes actuels ont obtenu de bons résultats sur la classification automatique du caractère subjectif ou objectif d’un document (Liu, 2015). En revanche, les résultats sur la tâche d’analyse de polarité restent encore peu concluants. La raison principale de cet échec est l’incapacité des algorithmes actuels à comprendre toutes les subtilités du langage humain. Parmi ces subtilités, nous nous focalisons sur le langage figuratif. Contrairement au langage littéral, le langage figuratif détourne le sens propre pour lui conférer un sens dit figuré ou imagé, comme l’ironie, le sarcasme, l’humour, la métaphore ou encore les jeux de mots. La détection automatique du langage figuratif est un sujet de recherche extrêmement actif principalement en raison de son importance pour améliorer les performances des systèmes d’analyse d’opinions (Maynard and Greenwood 2014 ; Ghosh et al. 2015, Benamara et al, 2017). Pour ce défi, nous nous intéressons en particulier à l’ironie, au sarcasme et à l’humour. L’ironie est un phénomène complexe largement étudié en philosophie et en linguistique (Grice 1975 ; Sperber and Wilson 1981 ; Utsumi 1996). Globalement, l’ironie est définie comme une figure de rhétorique par laquelle on dit le contraire de ce qu’on veut faire comprendre. Par exemple, pour exprimer une opinion négative envers son téléphone portable, on peut utiliser une forme littérale ("Ce téléphone est un désastre") ou alors une forme imagée ("Quel super téléphone !"). En linguistique computationnelle, l’ironie est un terme générique employé pour désigner un ensemble de phénomènes figuratifs incluant le sarcasme, même si ce dernier s’exprime avec plus d’aigreur et d’agressivité (Clift 1999). La détection du langage figuratif et son rôle dans l’analyse de sentiment a fait l’objet de plusieurs campagnes d’évaluation ces dernières années. Citons notamment la campagne SemEval 2015 Task 11 (Ghosh et al. 2015) sur des tweets anglais et les campagnes SENTIPOLC@Evalita dans leurs éditions de 2014 et 2016 sur des tweets italiens (Basile et al., 2014 ; Barbieri et al., 2016). Grâce à cette édition de DEFT, nous mettons en place une 1ère campagne d’évaluation autour de ces thèmes iii pour le français. La tâche est ouverte aux équipes de recherche académiques et industrielles. iv Comités Comité scientifique Patrice Bellot, LSIS, Aix-Marseille Université Caroline Brun, XRCE-XEROX, Grenoble Béatrice Daille, LINA, Université de Nantes Guy Lapalme, RALI, Université de Montréal Patrick Paroubek, LIMSI, CNRS, Université Paris-Saclay Comité d’organisation Farah Benamara, IRIT, Université de Toulouse Cyril Grouin, LIMSI, CNRS, Université Paris-Saclay Jihen Karoui, IRIT, Université de Toulouse Véronique Moriceau, LIMSI, CNRS, Univ. Paris-Sud, Université Paris-Saclay Isabelle Robba, LIMSI, CNRS, UVSQ, Université Paris-Saclay v vi Table des matières Session « oral » Analyse d’opinion et langage figuratif dans des tweets : présentation et résultats du DéfiFouille de Textes DEFT2017 Farah Benamara, Cyril Grouin, Jihen Karoui, Véronique Moriceau, Isabelle Robba . . . . . . . . . . . 1 LIA @ DEFT’2017 : Multi-view Ensemble of Convolutional Neural Network Mickael Rouvier, Pierre-Michel Bousquet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 Système d’ensemble pour la classification de tweets, DEFT2017 Damien Sileo, Camille Pradel, Philippe Muller, Tim Van de Cruys . . . . . . . . . . . . . . . . . . . . . . . . . . 27 FrenchSentiClass : un Système Automatisé pour la Classification de Sentiments en Français Mike Donald Tapi Nzali, Amine Abdaoui, Jérôme Azé, Sandra Bringay, Christian Lavergne, Caroline Mollevi, Pascal Poncelet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 "L’important c’est de participer" : positive ironie. Analyse de sentiments et détection de l’ironie Les systèmes du LIUM et d’OCTO. Amira Barhoumi, Vincent Levorato, Nicolas Dugué, Nathalie Camelin . . . . . . . . . . . . . . . . . . . . . . 42 Participation de l’IRISA à DeFT2017 : systèmes de classification de complexité croissante Vincent Claveau, Christian Raymond . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 TWEETANEUSE : Fouille de motifs en caractères et plongement lexical à l’assaut du DEFT 2017 Davide Buscaldi, Aude Grezka, Gaël Lejeune . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 Exploitation des plongements de mots pour l’analyse d’opinion et du langage figuratif des tweets (DEFT 2017) Amir Hazem, Basma El Amal Boussaha, Nicolas Hernandez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 Participation d’Orange Labs à DEFT2017 Aleksandra Guerraz, Nicolas Voisine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .84 vii Polarity analysis of non figurative tweets : Tw-StAR participation on DEFT 2017 Hala Mulki, Hatem Haddad, Mourad Gridach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 DEFT 2017 - Texts Search @ TALN / RECITAL 2017 : Deep Analysis of Opinion and Figurative language on Tweets in French Vinayakumar R, Sachin Kumar S, Premjith B, Prabaharan P, and Soman K P . . . . . . . . . . . . . . . . 99 viii Analyse d’opinion et langage figuratif dans des tweets : présentation et résultats du DéfiFouille de Textes DEFT2017 Farah Benamara1 Cyril Grouin2 Jihen Karoui1 Véronique Moriceau3 Isabelle Robba4 (1) IRIT, Université de Toulouse (2) LIMSI, CNRS, Université Paris-Saclay (3) LIMSI, CNRS, Univ. Paris-Sud, Université Paris-Saclay (4) LIMSI, CNRS, UVSQ, Université Paris-Saclay {farah.benamara, jihen.karoui}@irit.fr {cyril.grouin, veronique.moriceau, isabelle.robba}@limsi.fr RÉSUMÉ La détection automatique du langage figuratif dans les réseaux sociaux est un sujet de recherche extrêmement actif principalement en raison de son importance pour améliorer les performances des systèmes d’analyse d’opinions. Pour la première fois, l’édition 2017 du DéfiFouille de Texte (DEFT) s’intéresse à l’influence du langage figuratif (en particulier l’ironie, le sarcasme et l’humour) dans l’analyse d’opinions à partir de tweets en français. Trois tâches de niveaux de complexité croissants ont été proposées aux participants : (T1) déterminer la polarité globale des tweets non figuratifs, (T2) déterminer si un tweet contient ou non du langage figuratif, et (T3) déterminer la polarité globale des tweets figuratifs et non figuratifs. Douze équipes ont participé à ce défi. Les meilleurs résultats, en macro f-mesure, sont de 0,650 pour (T1), 0,783 pour (T2) et 0,594 pour (T3). Ces résultats montrent clairement que l’usage du langage figuratif complique considérablement l’analyse d’opinions. ABSTRACT Figurative language detection has gained relevance recently, due to its importance for efficient sentiment analysis. For the first time, the DéfiFouille de Texte (DEFT) shared task aims to analyse the impact of figuratif language (focusing in particular on irony, sarcasm and humor) on sentiment analysis of French tweets. Three tasks with an increasing level of complexity have been proposed to participants : (T1) polarity analysis of non figurative tweets, (T2) figurative language detection, and (T3) polarity analysis of non figurative and figurative tweets. Twelve teams participated in the competition. Best results in terms of macro f-score are 0.650 for (T1), uploads/Litterature/analyse-d-opinion-et-langage-figuratif-d.pdf

  • 18
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager