République Algérienne Démocratique et Populaire Ministère de l’enseignement sup

République Algérienne Démocratique et Populaire Ministère de l’enseignement supérieur et de la recherche scientifique UNIVERSITÉ ECHAHID HAMMA LAKHDAR D’EL OUED FACULTÉ DES SCIENCES EXACTES DEPARTEMENT D’INFORMATIQUE Mémoire de fin d’étude M MA AS ST TE ER R A AC CA AD DE EM MI IQ QU UE E Domaine : Mathématiques et Informatique Filière : Informatique Spécialité : Systèmes Distribués et Intelligence Artificiel (SDIA) Thème Préparé par : - KARA Mostefa - MELOUK Abdelbasset Soutenu devant le jury composé de M. BEGGAS Mounir Président Univ. d’El Oued M. OTHMANI Samir Examinateur Univ. d’El Oued Dr. LEJDEL Brahim MCA Encadreur Univ. d’El Oued Année universitaire : 2018 – 2019. N° d’ordre : N° de série : Analyse des sentiments dans les réseaux sociaux en dialecte algérien Remerciements Tous d’abord, nous tenons à remercier le bon Dieu de nous avoir accordé toute la détermination, la volonté et la force pour qu’on puisse réaliser ce modeste travail. Nous remercions infiniment notre encadreur Dr. LEJDEL Brahim pour ses conseils, sa patience, sa disponibilité et son soutien tout au long de cette période. Nous tenons à exprimer notre profonde gratitude et nos sincères remerciements aux : Membres de jury d’avoir accepté de juger notre travail et de l’avoir enrichi. Toutes les personnes qui nous ont aidés, de près ou de loin, en particulier : Notre enseignant Dr. NAGOUDI El Moatez Bellah. Nous adressons aussi nos remerciements à tous nos enseignants qui ont veillé sur notre formation. Résumé Aujourd’hui, l’analyse des textes a une grande importance surtout dans les domaines comme politiques, productions et services…etc. Actuellement, les réseaux sociaux pleins des textes dans lesquelles, les internautes s’expriment en différents sujets, l'intérêt de leurs opinions est considérable, où la compréhension du contenu véhiculé par ces textes est un élément essentiel. On peut dire que le bon gestionnaire ce qui écoute bien aux opinions des citoyens. Dans ce sens-là, l’analyse de sentiments est très importante pour satisfaire les besoins des citoyens. Dans ce travail, nous allons utiliser quatre algorithmes qui permettent d’analyser et classifier un ensemble de publications dérivées des réseaux sociaux. Les classes que nous avons définies sont : la classe positive, négative ou neutre. A Notre savoir ce travail est parmi les premiers travaux qui utilisent et comparent plusieurs algorithmes de classification des commentaires en Facebook, en utilisant le dialecte algérien. Mots clés : fouille d’opinions, analyse des sentiments, fouille de texte, détection émotionnelle, web social, corpus annoté, Lexique de sentiments. Abstract Today, text analysis has a great importance, especially in areas such as politics, productions and services...etc. Currently, the social networks full of the texts in which, the Internet-users express in different subjects, the interest of their opinions is considerable, where the comprehension of the content conveyed by these texts is an essential element. We can say that the good manager who listens well to the opinions of citizens. In this sense, the Sentiment Analysis is very important to meet the needs of citizens. In this work, we will use four algorithms that analyze and classify a set of publications derived from social networks. The classes that we have defined are: positive, negative or neutral. To our knowledge this work is among the first one that uses and compares several comment classification algorithms in Facebook, using Algerian dialect. Keywords: opinion mining, Sentiment Analysis, text mining, emotional detection, social web, annotated corpus, Lexicon of Sentiment. ملخص في هذه االيام، يكتسي تحليل النص وص أهمية ،كبيرة خاصة في مجاالت مثل السياسة واإلنتاج .والخدمات كذلك نالحظ أ ن الشبكات االجتماعية مليئة بالنصوص التي يعبر فيها متصفحي االنترنت عن أنفسهم في مواضيع مخت،لفة ي وف آرائهم أهمية،كبيرًا حيث يكون فهم المحتوى الذي تنقله هذه النصوص عنصرًا أساسيًا .يمكننا القول إن الم سير الجيد هو الذي يستمع جيدًا آلراء المواطنين .بهذا ،المعنى فإن تحليل المشاعر مهم جدًا لتلبية احتياجات هم .في هذا العمل سنستعمل أربع خوارزميات تل حليل وتصنيف مجموعة من المنشورات المستمدة من الشبكات االجتماعية . الفئات التي حددناها :هي إيجابية، سلبية أو محايدة . على حد علمنا هذا العمل يعتبر من بين االعمال األو ل ائ الذي يوظف ويقارن مجموعة من خوارزميات تصنيف ال تعليقات في ا الف يسبوك باللهجة الجزائرية. الكلمات:المفتاحية التنقيب في اآلراء ، تحليل ،المشاعر، التنقيب في النصوص، الكشف عن العواطف الشبكات االجتماعية، المعجم المعلق، قاموس المشاعر. Table des matières Liste des figures I Liste des tableaux II Introduction générale 1 Nomenclature des notions 2 1 Etat de l’art ..................................................................................................................... 5 1.1 Introduction ............................................................................................................. 5 1.2 Identification de la polarité ..................................................................................... 5 1.2.1 Opinions de polarité unique ............................................................................. 6 1.2.2 Opinions basées sur les aspects ....................................................................... 6 1.3 Approches de l’Analyse des Sentiments ................................................................. 6 1.3.1 Approches basée sur lexique ........................................................................... 6 1.3.2 Approches basée sur corpus ............................................................................ 7 1.3.3 Approches hybrides ......................................................................................... 7 1.4 Difficultés de l’analyse de sentiments .................................................................... 8 1.5 Travaux connexes ................................................................................................... 8 1.5.1 Analyse de sentiments - cas de MSA .............................................................. 9 1.5.2 Analyse de sentiment - cas de dialecte tunisien ............................................ 11 1.5.3 Analyse de sentiment - cas de dialecte marocain .......................................... 13 1.5.4 Analyse de sentiment - cas de dialecte saoudien ........................................... 16 1.5.5 Analyse de sentiment - cas de dialecte égyptien ........................................... 19 1.5.6 Analyse de sentiment - cas de dialecte jordanien .......................................... 20 1.5.7 Analyse de sentiment - cas de dialecte algérien ............................................ 21 1.6 Discussion ............................................................................................................. 22 1.7 Conclusion ............................................................................................................ 23 2 La langue arabe et le dialecte ....................................................................................... 25 2.1 Introduction ........................................................................................................... 25 2.2 Voyellation ............................................................................................................ 25 2.3 La richesse de la langue arabe .............................................................................. 25 2.4 Eléments de structure de la langue arabe .............................................................. 26 2.5 Arabe algérien ....................................................................................................... 26 2.6 Les difficultés de l’arabe et du dialecte ................................................................ 27 2.7 Conclusion ............................................................................................................ 28 3 Modélisation ................................................................................................................. 30 3.1 Introduction ........................................................................................................... 30 3.2 Contribution .......................................................................................................... 30 3.3 Source de données ................................................................................................ 30 3.4 Annotation ............................................................................................................ 31 3.5 Création de dictionnaire ........................................................................................ 32 3.6 Conclusion ............................................................................................................ 33 4 Implémentation............................................................................................................. 35 4.1 Introduction ........................................................................................................... 35 4.2 Ressources utilisées .............................................................................................. 35 4.3 Exemples de codes sources ................................................................................... 36 4.4 Fonctionnalités ...................................................................................................... 40 4.5 Expérimentations et résultats ................................................................................ 41 4.6 Discussion ............................................................................................................. 42 4.7 Exemples de sorties .............................................................................................. 43 4.8 Conclusion ............................................................................................................ 44 Conclusion générale et perspectives 45 Synthèse 45 Perspectives 45 Références 46 Liste des figures Figure 1.1 : Etapes du processus proposé pour l’analyse des sentiments. ......................... 13 Figure 1.2 : Evolution du taux de bon classement en fonction des variables introduites pour la configuration : Unigram + Bigram / TF. ................................................................. 15 Figure 1.3 : F-score de deux voies. .................................................................................... 18 Figure 1.4 : F-score de trois voies. ..................................................................................... 18 Figure 1.5 : F-score de quatre voies. .................................................................................. 18 Figure 3.1 : Exemple d’une partie de dictionnaire (positif). .............................................. 32 Figure 3.2 : Exemple d’une partie de dictionnaire (négatif). ............................................. 33 Figure 4.1 : Appel des Bibliothèques. ................................................................................ 36 Figure 4.2 : Lire le Dataset et le dictionnaire. .................................................................... 36 Figure 4.3 : Compter le nombre de mots positifs. .............................................................. 37 Figure 4.4 : Compter le nombre de mots négatifs .............................................................. 37 Figure 4.5 : Tester l’existence d’un mot positif. ................................................................ 37 Figure 4.6 : Tester l’existence d’un mot négatif. ............................................................... 38 Figure 4.7 : Introduire la fonctionnalité de la langueur. ..................................................... 38 Figure 4.8 : Introduire la fonctionnalité du pourcentage de sentiment. ............................. 38 Figure 4.9 : Préparation à l’analyse. ................................................................................... 39 Figure 4.10 : Appel du classificateur SVM. ....................................................................... 39 Figure 4.11 : Appel du classificateur DT............................................................................ 39 Figure 4.12 : Appel du classificateur RF. ........................................................................... 39 Figure 4.13 : Appel du classificateur NB. .......................................................................... 40 Figure 4.14 : Exemple de niveau de sentiments. ................................................................ 40 I Liste des tableaux Tableau 1.1 : Exemples de conversions à partir d'un symbole vers un mot. ........................ 9 Tableau 1.2 : Les résultats de classification par la méthode d'évaluation : validation croisée. ................................................................................................................................. 10 Tableau 1.3 : Les résultats de classification par apprentissage. ......................................... 11 Tableau 1.4 : Statistiques de corpus TSAC. ....................................................................... 11 Tableau 1.5 : Résultats d'expériences d’Analyse de Sentiment tunisien en utilisant divers classificateurs avec différents ensembles de tests. .............................................................. 12 Tableau 1.6 : Exemple de prétraitement d’un commentaire. ............................................. 14 Tableau 1.7 : Taux de bon classement pour les configurations testées avec sélection de variables. .............................................................................................................................. 15 Tableau 1.8 : Caractéristiques utilisées dans le modèle de classification. ......................... 16 Tableau 1.9 : Les étiquettes utilisées dans les figures. ....................................................... 17 Tableau 1.10 : Division de Dataset : Entrainement et test. ................................................ 17 Tableau 1.11 : F-mesure résultat. ....................................................................................... 19 Tableau 1.12 : Taux d'exactitude (Accuracy) des résultats. ............................................... 20 Tableau 1.13 : Résultat de capacité de lexique. ................................................................. 21 Tableau 1.14 : Distribution des données collectées selon leurs thèmes. ............................ 21 Tableau 1.15 : Résultats obtenus par les deux configurations liées au "module de calcul de similarité de phrases courantes". ......................................................................................... 22 Tableau 3.1 : Données collectées. ...................................................................................... 31 Tableau 3.2 : Nombre de commentaires par polarité. ........................................................ 31 Tableau 3.3 : Exemple de notation de quelques commentaires. ........................................ 31 Tableau 3.4 : Statistiques de notre dictionnaire. ................................................................ 32 Tableau 4.1 : Les fonctionnalités utilisées. ........................................................................ 41 Tableau 4.2 : Résultats de classification. ........................................................................... 41 Tableau 4.3 : Comparaison des résultats uploads/Management/analyse-des-sentiments-dans-les-reseaux-sociaux-en-dialecte-algerien.pdf

  • 15
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Jul 02, 2022
  • Catégorie Management
  • Langue French
  • Taille du fichier 1.8905MB