Université de Montréal Visualisation de données dans le domaine de l’E-recrutem
Université de Montréal Visualisation de données dans le domaine de l’E-recrutement par Abdessamad Outerqiss Département d’informatique et de recherche opérationnelle Faculté des arts et des sciences Mémoire présenté à la Faculté des arts et des sciences en vue de l’obtention du grade de Maître ès sciences (M.Sc.) en informatique Décembre, 2016 c ⃝Abdessamad Outerqiss, 2016. Université de Montréal Faculté des arts et des sciences Ce mémoire intitulé: Visualisation de données dans le domaine de l’E-recrutement présenté par: Abdessamad Outerqiss a été évalué par un jury composé des personnes suivantes: Miklós Cs˝ urös, président-rapporteur Philippe Langlais, directeur de recherche Guy Lapalme, membre du jury Mémoire accepté le: 7 mars 2017 RÉSUMÉ La récente profusion des données, communément appelée Big Data, nécessite une analyse pertinente de ces larges volumes de données afin d’en tirer l’information utile nécessaire à la prise de décision. La visualisation de données se révèle à cet égard un moyen efficace pour transmettre cette information de façon interactive et synthétique. Le travail décrit dans ce mémoire qui constitue un volet du projet BPP, collaboration entre le RALI et la société LittleBigJob (LBJ), vise à répondre à ce besoin par l’im- plémentation d’un tableau de bord permettant la visualisation des offres d’emploi sur le web. Ces offres étant composées de plusieurs sections : titre de l’offre, compagnie qui recrute, description de l’offre, etc. Certaines informations contenues dans la description de l’offre ne peuvent pas être extraites directement. Ainsi, pour l’extraction des compé- tences citées dans une offre, nous utilisons les techniques de l’apprentissage automatique et plus particulièrement les champs markoviens conditionnels (CRF) utilisés pour l’éti- quetage des séquences. Les expériences menées visent également à tester la capacité de ces modèles à trouver ces compétences dans la description de l’offre avec un ensemble d’entraînement partiellement étiqueté, d’une part parce que nous ne disposons pas d’une liste complète de compétences nécessaire à l’étiquetage, et d’autre part, parce que de nouvelles compétences apparaissent continuellement. Mots clés: E-recrutement, visualisation de données, extraction d’information, apprentissage automatique. ABSTRACT The large amount of data available nowadays, so-called Big Data, requires a relevant analysis to derive information and get insights for decision making. Data visualization is an effective way to convey this information interactively and synthetically. This work, which is part of BPP Project, a collaboration between the RALI and LBJ, aims to meet this need by implementing a dashboard for visualization of job offers on the web. These offers consist of several sections: title, company, description, etc. Some information contained in the description cannot be extracted directly. Thus, for the extraction of skills from the description of an offer, we use machine learning techniques, especially Conditional Random Fields (CRF) used for sequence labeling. We also tested the ability of those models to find skills in the description of the offer with partial labeled training dataset, as we do not have a complete list of skills required for labeling, and also because new skills appear constantly. Keywords: E-recruitment, Data Visualization, Information Extraction, Ma- chine Learning. TABLE DES MATIÈRES RÉSUMÉ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii ABSTRACT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv TABLE DES MATIÈRES . . . . . . . . . . . . . . . . . . . . . . . . . . . . v LISTE DES TABLEAUX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii LISTE DES FIGURES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii LISTE DES ANNEXES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . x LISTE DES SIGLES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi REMERCIEMENTS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xii CHAPITRE 1 : INTRODUCTION . . . . . . . . . . . . . . . . . . . . . . 1 1.1 Préambule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 Contexte du projet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2.1 L’appariement profils/offres . . . . . . . . . . . . . . . . . . . 3 1.2.2 La génération automatique d’ontologie . . . . . . . . . . . . . 4 1.2.3 La génération des lettres de motivation . . . . . . . . . . . . . 4 1.2.4 Baromètre de l’emploi . . . . . . . . . . . . . . . . . . . . . . 5 1.3 Structure du mémoire . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 CHAPITRE 2 : ÉTAT DE L’ART . . . . . . . . . . . . . . . . . . . . . . . 6 2.1 Évolution de la visualisation d’information . . . . . . . . . . . . . . . 7 2.2 Types de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 2.3 Taxonomies de visualisation d’information . . . . . . . . . . . . . . . . 12 2.4 Visualisation de l’information dans le web . . . . . . . . . . . . . . . . 16 CHAPITRE 3 : BAROMÈTRE DE L’EMPLOI . . . . . . . . . . . . . . . 20 3.1 Préparation des données . . . . . . . . . . . . . . . . . . . . . . . . . 20 3.2 Choix du type des graphiques . . . . . . . . . . . . . . . . . . . . . . . 26 CHAPITRE 4 : EXTRACTION DES COMPÉTENCES . . . . . . . . . . 31 4.1 Données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 4.1.1 Description des données . . . . . . . . . . . . . . . . . . . . . 31 4.1.2 Prétraitement des données . . . . . . . . . . . . . . . . . . . . 36 4.1.3 Identification de la section des compétences . . . . . . . . . . . 37 4.2 Approche basée sur l’apprentissage automatique . . . . . . . . . . . . . 41 4.2.1 Motivations du choix des CRF . . . . . . . . . . . . . . . . . . 41 4.2.2 Protocole expérimental . . . . . . . . . . . . . . . . . . . . . . 43 4.2.3 Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 CHAPITRE 5 : CONCLUSION . . . . . . . . . . . . . . . . . . . . . . . 55 BIBLIOGRAPHIE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 vi uploads/Science et Technologie/ visualisation-de-donnees-dans-le-domaine-de-l-x27-e-recrutement.pdf
Documents similaires
-
19
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Fev 13, 2021
- Catégorie Science & technolo...
- Langue French
- Taille du fichier 2.7051MB