Machine Translated by Google Une enquête sur la détection des discours de haine
Machine Translated by Google Une enquête sur la détection des discours de haine à l'aide du traitement du langage naturel Anna Schmidt Systèmes de langue parlée Université d¨ e la Sarre D-66123 Sarrebruck, Allemagne anna.schmidt@lsv.uni-saarland.de Michel Wiegand Systèmes de langue parlée Université d¨ e la Sarre D-66123 Sarrebruck, Allemagne michael.wiegand@lsv.uni-saarland.de Résumé Cet article présente une enquête sur la haine détection de la parole. Compte tenu de la croissance constante du contenu des médias sociaux, le le nombre de discours de haine en ligne est également en augmentation. En raison de l'ampleur massive de le web, des méthodes qui détectent automatiquement discours de haine sont nécessaires. Notre enquête décrit les domaines clés qui ont été explorés reconnaître automatiquement ces types de énoncés utilisant le traitement du langage naturel. Nous discutons également des limites de ces approches. 1. Introduction Le discours de haine est généralement défini comme toute communication qui dénigre une personne ou un groupe sur le base de certaines caractéristiques telles que la race, la couleur, origine ethnique, sexe, orientation sexuelle, nationalité,religion ou autre caractéristique (Nockleby, 2000). Les exemples sont (1)-(3).1 (1) Va te tuer putain et meurs déjà laid inutile tas de connard de merde. (2) Le pédé juif derrière l'effondrement financier (3) J'espère qu'une de ces salopes tombera et se cassera la jambe En raison de l'essor massif des contenus Web générés par les utilisateurs, en particulier sur les réseaux sociaux, la le nombre de discours de haine augmente également considéré comme un message de discours de haine peut être influencé par des aspects tels que le domaine d'un énoncé, son contexte de discours, ainsi que le contexte constitué d'objets médiatiques simultanés (par exemple, des images, vidéos, audio), l'heure exacte de publication et le monde événements en ce moment, identité de l'auteur et destinataire visé. Ce document propose une présentation courte, complète et aperçu structuré de la détection automatique des discours de haine et décrit les approches existantes dans de manière systématique, en se concentrant sur l'extraction de caractéristiques en particulier. Il s'adresse principalement aux chercheurs en PNL qui débutent dans le domaine du discours de haine détection et veulent s'informer sur la l'état de l'art. 2 Terminologie Dans cet article, nous utilisons le terme discours de haine. Nous avons opté pour l'utilisation de ce terme car il peut être considéré comme un terme générique générique pour de nombreux types de contenus insultants créés par les utilisateurs dans les travaux individuels que nous résumons dans cet article. Le discours de haine est également le plus fréquemment utilisé expression de ce phénomène, et est même un terme légal dans plusieurs pays. Ci- dessous, nous énumérons d'autres termes utilisés dans la communauté PNL. Cette devrait également aider les lecteurs à trouver d'autres documents sur cette tâche. Dans les premiers travaux sur le discours de haine, Spertus régulièrement. Au cours des dernières années, l'intérêt pour la haine en(l1ig9n9e7) parle de messages abusifs, de messages hostiles ou de la détection de la parole et en particulier l'automatisation de cette tâche n'a cessé de croître, parallèlement avec l'impact sociétal du phénomène. Traitement du langage naturel axé spécifiquement sur ce phénomène est nécessaire car les filtres de mots de base n'apportent pas un remède suffisant : Qu'est-ce 1Les exemples de cet ouvrage sont inclus pour illustrer la gravité du problème du discours de haine. Ils sont tirés de données web réelles et ne reflètent en aucun cas l'opinion des auteurs. flammes. Plus récemment, de nombreux auteurs ont s'est déplacé vers l'emploi du terme cyberintimidation (Xu et al., 2012ÿ; Hosseinmardi et al., 2015; Zhong et al., 2016; Van Hee et al., 2015; Dadvar et al., 2013; Dinakar et al., 2012). Le terme réel de discours de haine est utilisé par Warner et Hirschberg (2012), Burnap et Williams (2015), Silva et al. (2016), Djuric et Al. (2015), Gitari et al. (2015), Williams et Bur nap (2015) et Kwok et Wang (2013). Plus loin, 1 Machine Translated by Google Actes du cinquième atelier international sur le traitement du langage naturel pour les médias sociaux , pages 1 à 10, Valence, Espagne, 3-7 avril 2017. c 2017 Association for Computational Linguistics Machine Translated by Google Sod et al. (2012a) travaux sur la détection (personnelle) insultes, grossièretés et messages d'utilisateurs caractérisés par une intention malveillante, tandis que Razavi et al. (2010) faire référence à un langage offensant. Xiang et al. (2012) se concentrent sur le langage vulgaire et le contenu vulgaire lié au blasphème. Xu et al. (2012)2 regarder plus loin dans des taquineries formulées en plaisantant dans des messages qui représentent des épisodes d'intimidation (éventuellement moins graves). Enfin, Burnap et Williams (2014) spécifiquement se pencher sur le langage altériste, caractérisé par une dichotomie nous-eux dans la communication raciste. 3 fonctionnalités pour la détection du discours de haine Comme c'est souvent le cas avec la classification tâches, l'un des aspects les plus intéressants distinguant différentes approches est de savoir quelles fonctionnalités sont utilisé. La détection du discours de haine ne fait certainement pas exception puisque ce qui différencie un discours haineux d'un discours inoffensif n'est probablement pas attribuable à une seule classe d'aspects influents. Si l'ensemble des caractéristiques examinées dans les différents travaux est très variable, les méthodes de classification se concentrent principalement sur l'apprentissage supervisé (§6). 3.1 Caractéristiques de surface simples Pour toute tâche de classification de texte, la plus évidente les informations à utiliser sont des caractéristiques au niveau de la surface, comme sac de mots. En effet, les unigrammes et plus les n-grammes sont inclus dans les ensembles de fonctionnalités par une majorité d'auteurs (Chen et al., 2012; Xu et al., 2012; Warner et Hirschberg, 2012 ; Sood et coll., 2012; Burnap et Williams, 2015 ; Van Hee et al., 2015; Waseem et Hovy, 2016 ; Burnap et Williams, 2016ÿ; Hosseinmardi et al., 2015ÿ; Nobata et al., 2016). Ces caractéristiques sont souvent signalées comme étant hautement prédictif. Pourtant, dans de nombreux travaux, les approches basées sur l'orthographe, car les variations orthographiques inhabituelles entraîneront des résultats très rares, voire inconnus. jetons dans les données d'entraînement. Les approches au niveau du personnage, en revanche, sont plus susceptibles de capturer la similitude avec l'orthographe canonique de ces jetons. Mehdad et Tétreault (2016) comparer systématiquement les caractéristiques des n-grammes de caractères avec des n- grammes symboliques pour la détection des discours de haine, et trouvent que les n- grammes de caractères s'avèrent plus prédictifs que les n-grammes de jeton. Outre les fonctionnalités basées sur les mots et les caractères, la détection des discours de haine peut également bénéficier d'autres caractéristiques de surface (Chen et al., 2012ÿ; Nobata et al., 2016), telles que des informations sur la fréquence des Mentions d'URL et ponctuation, commentaires et longueurs de ken, majuscules, mots qui ne peuvent pas être trouvées dans les dictionnaires anglais, et le nombre de caractères non alphanumériques présents dans les jetons. 3.2 Généralisation des mots Alors que les fonctionnalités de sac de mots donnent généralement un bon performances de classification dans la détection des discours de haine, afin de fonctionner efficacement, ces fonctionnalités nécessitent que des mots prédictifs apparaissent dans les deux formations et les données d'essai. Cependant, étant donné que la détection des discours de haine est généralement appliquée sur de petits morceaux de texte (par ex. passages ou même des phrases individuelles), on peut faire face à un problème de rareté des données. C'est pourquoi plusieurs travaux abordent ce problème en appliquant une certaine forme de la généralisation des mots. Ceci peut être réalisé par effectuer un regroupement de mots, puis utiliser des identifiants de cluster induits représentant des ensembles de mots comme fonctionnalités supplémentaires (généralisées). Un algorithme standard pour cela est le clustering de Brown (Brown et al., 1992) qui a été utilisé comme long métrage dans Warner et Hirschberg (2012). Tandis que le regroupement de Brown caractéristiques n-grammes sont combinées avec une large sélection d'autres produit des clusters durs - c'est-à-dire qu'il attribue à chacun Caractéristiques. Par exemple, dans leurs travaux récents, No bata et al. (2016) rapportent que si les caractéristiques de jeton et de n- grammes de caractères sont les caractéristiques uniques les plus prédictives dans leurs expériences, les combiner avec toutes les fonctionnalités supplémentaires améliore encore les performances. Les fonctionnalités n-grammes au niveau des caractères peuvent fournir un moyen d'atténuer le problème de variation orthographique de dix rencontré lors de l'utilisation de texte de commentaire généré par l'utilisateur. Par exemple, la phrase ki11 anslef a$$hole, qui est considéré comme un exemple de haine discours, posera très probablement des problèmes de jeton 2Les données de ce travail sont disponibles sous http:// recherche.cs.wisc.edu/intimidation mot individuel à un groupe particulier - Latent L'allocation de Dirichlet (LDA) (Blei et al., 2003) produit pour chaque mot une distribution thématique indiquant dans quelle mesure un mot appartient à chaque thème. De telles informations ont également été utilisées à des fins haineuses détection de la parole (Xiang et al., 2012ÿ; Zhong et al., 2016). Plus récemment, les représentations de mots distribuées (basé sur les réseaux de neurones), également appelé les incorporations de mots, ont été proposées dans un but similaire. Pour uploads/Management/ a-survey-on-hate-speech-detection-using-natural-language-processing.pdf
Documents similaires
-
22
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Fev 17, 2021
- Catégorie Management
- Langue French
- Taille du fichier 0.1466MB