page 1 Information interne Machine Learning Aroua Hedhili Sbaï page 2 Informati

page 1 Information interne Machine Learning Aroua Hedhili Sbaï page 2 Information interne Plan ● Concepts et notions de base ● Apprentissage non supervisé ● Apprentissage supervisé ● Apprentissage profond (Deep learning) Aroua Hedhili Sbaï page 3 Information interne Concepts et Notions de base Aroua Hedhili Sbaï page 4 Information interne Introduction : exemple introductif ● Affectation de prêt immobilier (banque, client) Ä Analyse de dossier de prêt Ä Variables explicatives (âge, salaire, statut, nombre d’enfants,…) Ä Une fonction pour prévoir une prédiction Aroua Hedhili Sbaï page 5 Information interne Introduction : exemple introductif ● Expert humain : Ä Accumulé expérience considérable Ä Connu par ses décisions justes ● Système expert : Ä Cogniticien extrait les connaissances (entretiens) Ä Savoir chez les experts humains Ä Ne dépasse pas le niveau des experts ● Système d’apprentissage : Ä Extrait tout seul l’expertise à partir de données Ä Découverte de nouvelles connaissances Aroua Hedhili Sbaï page 6 Information interne Motivations Aroua Hedhili Sbaï Masse importante de données (millions de milliards d’instances) : • BD très larges - Very Large Databases (VLDB) • Données multi-dimensionnelles (milliers d’attributs) • BD denses page 7 Information interne Motivation ● Le Machine Learning envahit plus discrètement les systèmes informatiques de toutes les entreprises. Lorsque vous parcourez Internet ne serait-ce que quelques minutes, une horde de systèmes d’apprentissage automatique s’activent: ● Certains analysent votre personnalité pour vous proposer les produits qui vous correspondent le mieux, ● d’autres sélectionnent les publicités qui attireront votre attention, ● et d’autres encore analysent votre comportement pour s’assurer que vous n’êtes pas un fraudeur page 8 Information interne Motivation ● Mais le Machine Learning n’est pas réservé aux géants du web : qu’il s’agisse de prédire des séries temporelles (comme les cours de la Bourse), de détecter des anomalies de production, d’optimiser des centres d’appel, d’analyser les profils des clients, ou encore de classer automatiquement des documents, l’apprentissage automatique s’est révélé d’une grande utilité dans une multitude de domaines. page 9 Information interne Introduction ● L’explosion des données ü Les outils de collecte automatique des données et les bases de données conduisent à des masses énormes de données stockées dans des entrepôts. ● Submergés par les données, manque de connaissance! ● Solutions: Entrepôts de données et/ou le big data et fouille de données ü Entrepôts de données et analyse on-line ü Extraction de la connaissance intéressante (règles, régularités, patterns, contraintes) à partir de grandes bases de données Aroua Hedhili Sbaï page 10 Information interne Définition du Machine Learning L’apprentissage automatique (Machine Learning) est la science (et l’art) de programmer les ordinateurs de sorte qu’ils puissent apprendre à partir de données. Aroua Hedhili Sbaï L’apprentissage automatique est la discipline donnant aux ordinateurs la capacité d’apprendre sans qu’ils soient explicitement programmés. (Samuel, 1959) Étant donné une tâche T et une mesure de performance P, on dit qu’un programme informatique apprend à partir d’une expérience E si les résultats obtenus sur T, mesurés par P, s’améliorent avec l’expérience E. (Mitchell, 1997) page 11 Information interne Définition de Machine Learning ● Votre filtre anti-spam, par exemple, est un programme d’apprentissage automatique qui peut apprendre à identifier les e-mails frauduleux à partir d’exemples de pourriels ou «spam» (par exemple, ceux signalés par les utilisateurs) et de messages normaux (parfois appelés « ham »). ● Les exemples utilisés par le système pour son apprentissage constituent le jeu d’entraînement (en anglais, training set). ● Chacun d’eux s’appelle une observation d’entraînement (on parle aussi d’échantillon). page 12 Information interne Définition de Machine Learning ● Dans l’exemple de spam: Ä la tâche T consiste à identifier parmi les nouveaux e- mails ceux qui sont frauduleux, Ä l’expérience E est constituée par les données d’entraînement, Ä et la mesure de performance P doit être définie (vous pourrez prendre par exemple le pourcentage de courriels correctement classés). Cette mesure de performance parti- culière, appelée exactitude (en anglais, accuracy), est souvent utilisée dans les tâches de classification. page 13 Information interne L’apprentissage automatique-un exemple Un patient décrit par un ensemble d’attributs : âge, sexe, pression sanguine, … Ä La classe : attribut binaire concluant ou non à l’affectation du patient par une maladie Ä Apprentissage automatique : apprendre des règles de classification à partir d’un ensemble de descriptions de patients Aroua Hedhili Sbaï page 14 Information interne ● Reconnaissance de caractères ● Comportement d’un « robot » autonome L’apprentissage automatique-un exemple 3 3 6 6 … … … Système de reconnaissance de chiffres Navigation pou accomplir une tâche (e.g., collecter de la « nourriture ») Aroua Hedhili Sbaï page 15 Information interne L’apprentissage automatique-Schéma général Environnement Nouvel exemple Raisonnement automatique Echantillon (BD) Expérience des experts Apprentissage automatique Connaissances Lois d’expertise Aroua Hedhili Sbaï page 16 Information interne Types de systèmes d’apprentissage automatique ● Il existe tellement de types de systèmes d’apprentissage automatique différents qu’il est utile de les classer en grandes catégories : Ä selon que l’apprentissage s’effectue ou non sous supervision humaine (apprentissage supervisé, non supervisé, semi-supervisé ou avec renforcement), Ä selon que l’apprentissage s’effectue ou non progressivement, au fur et à mesure (apprentissage en ligne ou apprentissage groupé), page 17 Information interne Types de systèmes d’apprentissage automatique Ä selon qu’il se contente de comparer les nouvelles données à des données connues, ou qu’il détecte au contraire des éléments de structuration dans les données d’entraînement et construise un modèle prédictif à la façon d’un scientifique (apprentissage à partir d’observations ou apprentissage à partir d’un modèle). ● Ces critères peuvent être combinés. Ainsi, un filtre anti- spam dernier cri peut apprendre au fur et à mesure en s’appuyant sur un modèle de réseau neuronal profond dont l’apprentissage s’effectue sur des exemples de messages indésirables ou non : ceci en fait un système supervisé d’apprentissage en ligne à partir d’un modèle. page 18 Information interne L’apprentissage automatique-Apprentissage supervisé ● L'apprentissage supervisé utilise des exemples étiquetés ou classés. Ces étiquettes ou ces classes peuvent être vues comme fournies par un professeur ou un superviseur, d'où le nom d'apprentissage supervisé. Le but de l'apprentissage est alors de produire une fonction de classification permettant de déterminer la classe d'un exemple. Aroua Hedhili Sbaï page 19 Information interne L’apprentissage automatique-Apprentissage supervisé ● On dispose d’un ensemble de données étiquetées par un expert -> La base d’apprentissage ● Objectif de l’apprentissage supervisé : Ä Construire à partir de la base d’apprentissage des fonctions de classement. Ä Fonction de classement : reconnaître un attribut particulier (la classe) à partir de la description d’un objet. Aroua Hedhili Sbaï page 20 Information interne L’apprentissage automatique-Apprentissage supervisé Apprentissage Fonction de classement f Base d’apprentissage Fonction de classement f Phase de reconnaissance: Phase d’apprentissage: Aroua Hedhili Sbaï page 21 Information interne L’apprentissage automatique-Apprentissage supervisé π population π Ω’ Ω X(π)=(X1(),……..,Xp(π)) Espace de représentation R X Y Y(π) ensemble des classes C f ? Population π • Xi variables prédictives : les attributs • y variable à prédire : la classe [Zighed et al. 92] Aroua Hedhili Sbaï page 22 Information interne Apprentissage supervisé - Exemple ● Un exemple classique de tâche d’apprentissage supervisé est la classification. Le filtre de spam en constitue un bon exemple : son apprentissage s’effectue à partir de nombreux exemples d’e-mails accompagnés de leur classe (spam ou normal), à partir desquels il doit apprendre comment classer les nouveaux e-mails. page 23 Information interne Apprentissage supervisé - Exemple ● Une autre tâche classique consiste à prédire une valeur numérique cible (en anglais, target) telle que le prix d’une voiture à partir des valeurs d’un certain nombre d’attributs ou variables. Ces valeurs sont appelées les caractéristiques (en a n g l a i s , f e a t u r e s ) d ’ u n e o b s e r v a t i o n . ● Ces variables, comme le kilométrage, l’âge, la marque, etc., sont appelées variables explicatives ou encore prédicteurs. ● Une tâche de ce type est une régression. Pour entraîner le système, vous devez lui donner beaucoup d’exemples de voitures, en y intégrant à la fois les variables explicatives et la variable à expliquer (les caractéristiques et les étiquettes). page 24 Information interne Apprentissage supervisé ● Les plus importants algorithmes d’apprentissage supervisé : Ä K plus proches voisins Ä Régression linéaire Ä Régression logistique Ä Machines à vecteurs de support Ä Arbres de décision et forêts aléatoires Ä Réseaux neuronaux page 25 Information interne L’apprentissage automatique-Apprentissage non supervisé ● L'apprentissage non supervisé recherche des régularités parmi un ensemble d'exemples. ● Dans l’apprentissage non supervisé, les données d’apprentissage ne sont pas étiquetées ● Le système essaie d’apprendre sans professeur. Aroua Hedhili Sbaï page 26 Information interne Apprentissage non supervisé : exemple le clustering ● On dispose d’une masse de données indifférenciées et l’on désire si elles possèdent une quelconque structure de groupes. -> Clustering ou cluster Analysis Ä Regrouper en classes des objets en se basant sur des similarités entre eux . Ä Maximiser la similarité intra-classe Ä Minimiser la similarité inter-classes Aroua Hedhili Sbaï page 27 Information interne Apprentissage non supervisé ● Les plus importants uploads/Philosophie/cours-ml-s1.pdf

  • 20
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager