Remerciez-le!

Remerciez @Admin pour avoir partagé cet document gratuitement, de la manière la plus simple, en partageant sur les réseaux sociaux.

IFT 603 Techniques d’apprentissage Thème 1 Techniques d’apprentissage : concept

IFT 603 Techniques d’apprentissage Thème 1 Techniques d’apprentissage : concepts et définitions André Mayers Hiver 2012 1 PLAN Introduction Motivation pour l’apprentissage automatique (AA) Paramètres d’un problème d’AA (paradigmes d’apprentissage) Apprentissage supervisé Concepts fondamentaux ◦Espace d’hypothèses Fonction cibles, ◦Critères de performances fonctions objectives courbes de performances et types d’erreurs Exemples de techniques d’apprentissage pour la classification 2 PLAN Introduction Motivation pour l’apprentissage automatique (AA) Paramètres d’un problème d’AA (paradigmes d’apprentissage) Apprentissage supervisé Concepts fondamentaux ◦Espace d’hypothèses Fonction cibles, ◦Critères de performances fonctions objectives courbes de performances et types d’erreurs Exemples de techniques d’apprentissage pour la classification 3 Quelques notions voisines ou synonymes machine learning apprentissage machine apprentissage automatique apprentissage artificiel apprentissage algorithmique acquisition de connaissances extraction d’un concept catégorisation, classification, régression prédiction généralisation compréhension 4 Un domaine interdisciplinaire STATISTIQUES, analyse de données OPTIMISATION AUTOMATIQUE, commande, robotique INTELLIGENCE ARTIFICIELLE Apprentissage Artificiel VISION Apprentissage naturel & artificiel L’ Apprentissage naturel est la faculté d’apprendre de ses expériences passées et de s’adapter est une caractéristique essentielle des formes de vies. Elle est essentielle À l’être humain dans les premières étapes de la vie pour apprendre des choses aussi fondamentales que reconnaître une voix, un visage familier, apprendre À comprendre ce qui est dit, à marcher et à parler... Elle est également essentielle dans d’autres étapes de la vie. Apprentissage artificiel (Machine Learning) est le nom de la science qui cherche à comprendre et reproduire cette faculté d’apprentissage dans des systèmes artificiels. Il s’agit, très schématiquement, de concevoir des algorithmes capables, à partir d’un nombre important d’exemples (les données correspondant à l’expérience passée), d’en assimiler la nature afin de pouvoir appliquer ce qu’ils ont ainsi appris aux cas futurs. 6 Apprentissage automatique : définitions « Capacité d’un système à améliorer ses performances via des interactions avec son environnement » Une des familles essentielles de techniques pour l’Intelligence Artificielle (IA) : permet conception et/ou adaptation automatisée du modèle et/ou du comportement d’agents « intelligents » Un programme possède des capacités d’apprentissage si ses potentialités de comportement sur les données se modifient en fonction de ses performances au fur et à mesure qu’il traite les données. Un programme possède des capacités d’apprentissage si au cours du traitement d’exemples représentatifs de données il est capable de construire et d’utiliser une représentation de ce traitement en vue de son exploitation. ◦i.e. élaboration d’un modèle pour la prédiction et la découverte. 7 PLAN Introduction Motivation pour l’apprentissage automatique (AA) Paramètres d’un problème d’AA (paradigmes d’apprentissage) Apprentissage supervisé Concepts fondamentaux ◦Espace d’hypothèses Fonction cibles, ◦Critères de performances fonctions objectives courbes de performances et types d’erreurs Exemples de techniques d’apprentissage pour la classification 8 Ma motivation pour l’apprentissage artificiel Selon un point de vue cognitiviste, il s’agit de bien comprendre le phénomène d’apprentissage ◦chez l’humain, les animaux, dans la nature … Cependant en tant qu’informaticien, cette compréhension doit passer par la construction de modèles computationnels en mesure de reproduire le phénomène d’apprentissage. Mon intérêt pour la science m’entraîne ◦à explorer les conséquences de postulats initiaux, et de leurs variations, ◦à définir ce qu’est une inférence valide, un apprentissage correct et les conditions nécessaires pour qu’il puisse avoir lieu. ◦Cette exploration m’entraîne loin de l’intelligence humaine pour aborder le phénomène de l’intelligence partout où elle se manifeste. Le tout est extrêmement utile puisque les techniques d’apprentissage sont utilisés en finances, modélisation de l’usager, vision artificielle, médecine, génétique … voir prochaines diapositives. 9 Autres approches ou motivations Construction de programmes qui s'améliorent automatiquement à partir de leur expérience. ◦Programme de jeu Il est plus facile d’écrire un programme qui a pour but d’apprendre comment jouer au jeu d’échec plutôt que de convertir l’expertise d’un joueur professionnel en programme informatique. ◦Robotique robot autonome qui apprend à se déplacer dans son environnement 10 Autres approches ou motivation  Construction de logiciels que l’on ne sait pas programmer "à la main". Exemple : ◦lecture de codes postaux ◦reconnaissance de caractères 11 Autres motivations Campagne de publicité ciblée ◦Découvrir que le profil des personnes ayant des produits de valeurs à la maison pour leur vendre de l’assurance Analyse de crédit ◦Découvrir des signes précurseurs de faillites personnelles Comportements psychologiques ◦Où retrouver les personnes suicidaires 12 PLAN Introduction Motivation pour l’apprentissage automatique (AA) Paramètres d’un problème d’AA (paradigmes d’apprentissage) Apprentissage supervisé Concepts fondamentaux ◦Espace d’hypothèses Fonction cibles, ◦Critères de performances fonctions objectives courbes de performances et types d’erreurs Exemples de techniques d’apprentissage pour la classification 13 Les paramètres d’un problème d’AA L’objectif Le protocole Le critère de succès La nature des entrées (l’espace de représentation) La nature du résultat (l’espace des hypothèses ou fonctions cibles) 14 L’objectif Acquisition de connaissances ◦Apprentissage de concepts ◦Classification  Amélioration des performances ◦Adaptation ◦Amélioration en ligne 15 Le protocole Présentation des données ◦Tous à la fois (batch ou hors ligne) ◦Un par un, selon un certain tirage (en ligne) ◦Par renforcement La rétroaction est pour le résultat final. 16 Protocole d’apprentissage 17 Identification Prédiction protocole d’identification = apprentissage « batch ». l’apprenant doit trouver une hypothèse h. protocole de prédiction = apprentissage en-ligne, l’apprenant doit trouver la bonne réponse pour chaque donnée on suppose qu’après chaque prédiction, l’apprenant reçoit une confirmation Le critère de succès Critère relatif à un observateur externe. ◦Souvent, la performance est mesurée en fonction du nombre d’erreurs commises par l’apprenant (un algorithme d’apprentissage) en cours d’apprentissage ou en fonction de son taux d’erreur après apprentissage. ◦Ce critère est toujours formalisé (fonction de coût, objectif) et devient la fonction à optimiser ◦Sa formalisation peut être complexe La valeur d’un coup aux échecs en fonction de l’espace, du temps … Exemple ◦en classification il s’agit de mesurer le taux des objets mal classifiés. 18 Nature des données d'entrée Numériques;  Symboliques (binaires, nominales, séquentielles, etc.);  Mixtes  Exemple ◦Les attributs ou variables gènes, protéines, pixels, caractéristiques … 19 Nature du résultat L’espace des hypothèses ◦Règles de décision (arbres de décisions) ◦Fonctions discriminantes linéaires ou non linéaires (machines à noyaux) ◦Décision dans l’espace de représentation des entrées (plus proches voisins) ◦Optimisation de la structure et des paramètres (réseaux bayésien) Pour chaque espace, il faut aussi considérer sa cardinalité. 20 T echniques d’apprentissage  Apprentissage supervisé (classification/catégorisation) ◦ Fonction discriminante linéaire et non linéaire. ◦ Algorithmes  arbres de décision,  réseaux de neurones,  méthodes bayésienne,  machines à noyaux.  descente de gradient,  résolution exacte,  problème quadratique, ◦ Certain algo sont qualifiés d’heuristique  Algo d’auto-organisation non supervisée de Kohonen  Algorithmes évolutionnistes (GA, GP, …)  « colonies de fourmis » (Ant Colony Optimization)  Optimisation par Essaim Particulaire (OEP)  Renforcement (Q-learning, …)  Apprentissage non supervisé ◦ techniques pour découvrir  des associations,  des corrélations  des tendances. ◦ Algorithmes de clustering. 21 Taxonomie des techniques d’apprentissage Induction, généralisation ◦Avec professeur : supervisé (nommé souvent classification pour les données discrètes) Il faut apprendre à identifier les objets à partir d’exemples dont on connaît la classe ◦Sans professeur : non supervisé (nommé souvent segmentation (clustering)) Il faut apprendre inférer les classes qui divisent les exemples pour un but donné alors qu’on ne connaît que leurs attributs Déduction ◦Explication, Déduire les connaissances exactes ou erronées qui expliquent les actions d’un apprenant dans un environnement d’apprentissage. Découvrir les symptômes, les causes d’une maladie (arbre décision) ◦Révision des connaissances Mettre à jour le modèle des connaissances d’un apprenant en observant son comportement dans un environnement d’apprentissage 22 Utilisation de l’apprentissage artificiel pour le jeu d’échec  L’objectif est d’obtenir un algorithme qui ◦ effectue une recherche en avant dans l’arbre des coups possibles, ◦ évalue chaque position atteinte en fonction de certains critères (par exemple : l’occupation du centre, l’avantage matériel, etc.),  Le protocole ◦ joue un coup à la fois et une partie à la fois  Le critère de succès ◦ joue le coup lui permettant de maximiser le gain que l’adversaire est obligé de lui concéder. ◦ L’apprentissage artificiel consiste à déduire cette fonction d’évaluation,  c’est elle qui détermine la qualité des décisions.  La nature des entrées ◦ Toutes les configurations possibles  La nature des résultats ◦ Toutes les fonctions qui prédisent le prochain coup à jouer ◦ Une algorithme d’apprentissage artificiel trivial pourrait tout simplement mémoriser toutes les parties jouées et construire une table d’association entre une position et le coup à jouer.  Pour le tic-tac-toe : OK  Pour le jeu d’échec : l’espace d’hypothèses est trop grand  Pas tant que ça, voir l’apprentissage par renforcement. 23 Autres façons de caractériser un problème d’apprentissage En arrière de chaque façon d’aborder un problème d’apprentissage se trouve un paradigme qui se caractérise par ◦Un modèle, le plus souvent paramétrique ◦Une façon d’interagir avec l’environnement ◦Une « fonction de coût » à minimiser (sauf exceptions) ◦Un algorithme pour adapter le modèle, en utilisant les données issues de l’environnement, de façon à optimiser la fonction de coût Nombreux paradigmes Régression linéaire par moindre carrés Algo ID3 ou CART pour arbres de décision Méthodes probabilistes … Rétropropagation du gradient sur réseau neuronal à couches Cartes topologiques de Kohonen Support Vector Machines uploads/Management/ 1-introduction 5 .pdf