IFT 603 Techniques d’apprentissage Thème 1 Techniques d’apprentissage : concept
IFT 603 Techniques d’apprentissage Thème 1 Techniques d’apprentissage : concepts et définitions André Mayers Hiver 2012 1 PLAN Introduction Motivation pour l’apprentissage automatique (AA) Paramètres d’un problème d’AA (paradigmes d’apprentissage) Apprentissage supervisé Concepts fondamentaux ◦Espace d’hypothèses Fonction cibles, ◦Critères de performances fonctions objectives courbes de performances et types d’erreurs Exemples de techniques d’apprentissage pour la classification 2 PLAN Introduction Motivation pour l’apprentissage automatique (AA) Paramètres d’un problème d’AA (paradigmes d’apprentissage) Apprentissage supervisé Concepts fondamentaux ◦Espace d’hypothèses Fonction cibles, ◦Critères de performances fonctions objectives courbes de performances et types d’erreurs Exemples de techniques d’apprentissage pour la classification 3 Quelques notions voisines ou synonymes machine learning apprentissage machine apprentissage automatique apprentissage artificiel apprentissage algorithmique acquisition de connaissances extraction d’un concept catégorisation, classification, régression prédiction généralisation compréhension 4 Un domaine interdisciplinaire STATISTIQUES, analyse de données OPTIMISATION AUTOMATIQUE, commande, robotique INTELLIGENCE ARTIFICIELLE Apprentissage Artificiel VISION Apprentissage naturel & artificiel L’ Apprentissage naturel est la faculté d’apprendre de ses expériences passées et de s’adapter est une caractéristique essentielle des formes de vies. Elle est essentielle À l’être humain dans les premières étapes de la vie pour apprendre des choses aussi fondamentales que reconnaître une voix, un visage familier, apprendre À comprendre ce qui est dit, à marcher et à parler... Elle est également essentielle dans d’autres étapes de la vie. Apprentissage artificiel (Machine Learning) est le nom de la science qui cherche à comprendre et reproduire cette faculté d’apprentissage dans des systèmes artificiels. Il s’agit, très schématiquement, de concevoir des algorithmes capables, à partir d’un nombre important d’exemples (les données correspondant à l’expérience passée), d’en assimiler la nature afin de pouvoir appliquer ce qu’ils ont ainsi appris aux cas futurs. 6 Apprentissage automatique : définitions « Capacité d’un système à améliorer ses performances via des interactions avec son environnement » Une des familles essentielles de techniques pour l’Intelligence Artificielle (IA) : permet conception et/ou adaptation automatisée du modèle et/ou du comportement d’agents « intelligents » Un programme possède des capacités d’apprentissage si ses potentialités de comportement sur les données se modifient en fonction de ses performances au fur et à mesure qu’il traite les données. Un programme possède des capacités d’apprentissage si au cours du traitement d’exemples représentatifs de données il est capable de construire et d’utiliser une représentation de ce traitement en vue de son exploitation. ◦i.e. élaboration d’un modèle pour la prédiction et la découverte. 7 PLAN Introduction Motivation pour l’apprentissage automatique (AA) Paramètres d’un problème d’AA (paradigmes d’apprentissage) Apprentissage supervisé Concepts fondamentaux ◦Espace d’hypothèses Fonction cibles, ◦Critères de performances fonctions objectives courbes de performances et types d’erreurs Exemples de techniques d’apprentissage pour la classification 8 Ma motivation pour l’apprentissage artificiel Selon un point de vue cognitiviste, il s’agit de bien comprendre le phénomène d’apprentissage ◦chez l’humain, les animaux, dans la nature … Cependant en tant qu’informaticien, cette compréhension doit passer par la construction de modèles computationnels en mesure de reproduire le phénomène d’apprentissage. Mon intérêt pour la science m’entraîne ◦à explorer les conséquences de postulats initiaux, et de leurs variations, ◦à définir ce qu’est une inférence valide, un apprentissage correct et les conditions nécessaires pour qu’il puisse avoir lieu. ◦Cette exploration m’entraîne loin de l’intelligence humaine pour aborder le phénomène de l’intelligence partout où elle se manifeste. Le tout est extrêmement utile puisque les techniques d’apprentissage sont utilisés en finances, modélisation de l’usager, vision artificielle, médecine, génétique … voir prochaines diapositives. 9 Autres approches ou motivations Construction de programmes qui s'améliorent automatiquement à partir de leur expérience. ◦Programme de jeu Il est plus facile d’écrire un programme qui a pour but d’apprendre comment jouer au jeu d’échec plutôt que de convertir l’expertise d’un joueur professionnel en programme informatique. ◦Robotique robot autonome qui apprend à se déplacer dans son environnement 10 Autres approches ou motivation Construction de logiciels que l’on ne sait pas programmer "à la main". Exemple : ◦lecture de codes postaux ◦reconnaissance de caractères 11 Autres motivations Campagne de publicité ciblée ◦Découvrir que le profil des personnes ayant des produits de valeurs à la maison pour leur vendre de l’assurance Analyse de crédit ◦Découvrir des signes précurseurs de faillites personnelles Comportements psychologiques ◦Où retrouver les personnes suicidaires 12 PLAN Introduction Motivation pour l’apprentissage automatique (AA) Paramètres d’un problème d’AA (paradigmes d’apprentissage) Apprentissage supervisé Concepts fondamentaux ◦Espace d’hypothèses Fonction cibles, ◦Critères de performances fonctions objectives courbes de performances et types d’erreurs Exemples de techniques d’apprentissage pour la classification 13 Les paramètres d’un problème d’AA L’objectif Le protocole Le critère de succès La nature des entrées (l’espace de représentation) La nature du résultat (l’espace des hypothèses ou fonctions cibles) 14 L’objectif Acquisition de connaissances ◦Apprentissage de concepts ◦Classification Amélioration des performances ◦Adaptation ◦Amélioration en ligne 15 Le protocole Présentation des données ◦Tous à la fois (batch ou hors ligne) ◦Un par un, selon un certain tirage (en ligne) ◦Par renforcement La rétroaction est pour le résultat final. 16 Protocole d’apprentissage 17 Identification Prédiction protocole d’identification = apprentissage « batch ». l’apprenant doit trouver une hypothèse h. protocole de prédiction = apprentissage en-ligne, l’apprenant doit trouver la bonne réponse pour chaque donnée on suppose qu’après chaque prédiction, l’apprenant reçoit une confirmation Le critère de succès Critère relatif à un observateur externe. ◦Souvent, la performance est mesurée en fonction du nombre d’erreurs commises par l’apprenant (un algorithme d’apprentissage) en cours d’apprentissage ou en fonction de son taux d’erreur après apprentissage. ◦Ce critère est toujours formalisé (fonction de coût, objectif) et devient la fonction à optimiser ◦Sa formalisation peut être complexe La valeur d’un coup aux échecs en fonction de l’espace, du temps … Exemple ◦en classification il s’agit de mesurer le taux des objets mal classifiés. 18 Nature des données d'entrée Numériques; Symboliques (binaires, nominales, séquentielles, etc.); Mixtes Exemple ◦Les attributs ou variables gènes, protéines, pixels, caractéristiques … 19 Nature du résultat L’espace des hypothèses ◦Règles de décision (arbres de décisions) ◦Fonctions discriminantes linéaires ou non linéaires (machines à noyaux) ◦Décision dans l’espace de représentation des entrées (plus proches voisins) ◦Optimisation de la structure et des paramètres (réseaux bayésien) Pour chaque espace, il faut aussi considérer sa cardinalité. 20 T echniques d’apprentissage Apprentissage supervisé (classification/catégorisation) ◦ Fonction discriminante linéaire et non linéaire. ◦ Algorithmes arbres de décision, réseaux de neurones, méthodes bayésienne, machines à noyaux. descente de gradient, résolution exacte, problème quadratique, ◦ Certain algo sont qualifiés d’heuristique Algo d’auto-organisation non supervisée de Kohonen Algorithmes évolutionnistes (GA, GP, …) « colonies de fourmis » (Ant Colony Optimization) Optimisation par Essaim Particulaire (OEP) Renforcement (Q-learning, …) Apprentissage non supervisé ◦ techniques pour découvrir des associations, des corrélations des tendances. ◦ Algorithmes de clustering. 21 Taxonomie des techniques d’apprentissage Induction, généralisation ◦Avec professeur : supervisé (nommé souvent classification pour les données discrètes) Il faut apprendre à identifier les objets à partir d’exemples dont on connaît la classe ◦Sans professeur : non supervisé (nommé souvent segmentation (clustering)) Il faut apprendre inférer les classes qui divisent les exemples pour un but donné alors qu’on ne connaît que leurs attributs Déduction ◦Explication, Déduire les connaissances exactes ou erronées qui expliquent les actions d’un apprenant dans un environnement d’apprentissage. Découvrir les symptômes, les causes d’une maladie (arbre décision) ◦Révision des connaissances Mettre à jour le modèle des connaissances d’un apprenant en observant son comportement dans un environnement d’apprentissage 22 Utilisation de l’apprentissage artificiel pour le jeu d’échec L’objectif est d’obtenir un algorithme qui ◦ effectue une recherche en avant dans l’arbre des coups possibles, ◦ évalue chaque position atteinte en fonction de certains critères (par exemple : l’occupation du centre, l’avantage matériel, etc.), Le protocole ◦ joue un coup à la fois et une partie à la fois Le critère de succès ◦ joue le coup lui permettant de maximiser le gain que l’adversaire est obligé de lui concéder. ◦ L’apprentissage artificiel consiste à déduire cette fonction d’évaluation, c’est elle qui détermine la qualité des décisions. La nature des entrées ◦ Toutes les configurations possibles La nature des résultats ◦ Toutes les fonctions qui prédisent le prochain coup à jouer ◦ Une algorithme d’apprentissage artificiel trivial pourrait tout simplement mémoriser toutes les parties jouées et construire une table d’association entre une position et le coup à jouer. Pour le tic-tac-toe : OK Pour le jeu d’échec : l’espace d’hypothèses est trop grand Pas tant que ça, voir l’apprentissage par renforcement. 23 Autres façons de caractériser un problème d’apprentissage En arrière de chaque façon d’aborder un problème d’apprentissage se trouve un paradigme qui se caractérise par ◦Un modèle, le plus souvent paramétrique ◦Une façon d’interagir avec l’environnement ◦Une « fonction de coût » à minimiser (sauf exceptions) ◦Un algorithme pour adapter le modèle, en utilisant les données issues de l’environnement, de façon à optimiser la fonction de coût Nombreux paradigmes Régression linéaire par moindre carrés Algo ID3 ou CART pour arbres de décision Méthodes probabilistes … Rétropropagation du gradient sur réseau neuronal à couches Cartes topologiques de Kohonen Support Vector Machines uploads/Management/ 1-introduction 5 .pdf
Documents similaires
-
23
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Oct 08, 2021
- Catégorie Management
- Langue French
- Taille du fichier 2.7699MB