Faculté des Sciences de Tunis Leila Ben Othman LCS3 Année universitaire: 2021 -

Faculté des Sciences de Tunis Leila Ben Othman LCS3 Année universitaire: 2021 - 2022 Introduction au Machine Learning (Apprentissage Automatique) Plan 1 Introduction Contexte Motivation Pourquoi faire du Machine learning? Dé nition Applications du Machine Learning 2 Les méthodes L'apprentissage supervisé (Supervised Learning) Classi cation Régression L'apprentissage non supervisé (Unsupervised Learning) Regroupement - Clustering Règles d'association 3 Les étapes 4 Di cultés de l'apprentissage automatique Introduction Contexte Contexte • Intelligence arti cielle (IA): ensemble des théories et des techniques développant des programmes informatiques complexes capables de simuler certains traits de l'intelligence humaine (raisonnement, apprentissage). • Machine Learning (Apprentissage Automatique): est un champ d'étude de l'intelligence arti cielle qui se base sur des approches mathématiques et statistiques. Leila Ben Othman, FST 2021-2022 4 / 33 Introduction Motivation Motivation: les données (Data) • Augmentation exponentielle de la quantité de données structurées et non structurées: Email, chat, blog, web, musique, photo, vidéo, etc. • Twitter: 50M tweets/jour (7 teraoctet) • Facebook: 10 terabytes/jour • Youtube: 50h of videos/minute • 2.9 millions of e-mails/seconde • Augmentation de la capacité de stockage et de la puissance de calcul. Leila Ben Othman, FST 2021-2022 5 / 33 Introduction Pourquoi faire du Machine learning? Pourquoi faire du Machine learning? Problème à résoudre →deux situations: 1 On connaît le calcul à eectuer pour résoudre notre problème. 2 On ne connaît pas le calcul qui résout notre problème: Comment? • Reconnaître un visage sur une photo • Prédire le cours de la bourse • Reconnaître des chires écrits à la main à partir d'une image scannée • Déterminer une typologie des clients d'une banque = ⇒Il est facile d'avoir une base de données regroupant de nombreuses instances du problème. Solution: Machine Learning Leila Ben Othman, FST 2021-2022 6 / 33 Introduction Pourquoi faire du Machine learning? Pourquoi faire du Machine learning? • On utilise le machine learning lorsqu'il est di cile ou impossible de dé nir les instructions explicites à donner à un ordinateur pour résoudre un problème, mais que l'on dispose de nombreux exemples illustratifs. • L'apprentissage automatique consiste alors à programmer des algorithmes permettant d'apprendre automatiquement de données et d'expériences passées et cherchant à résoudre au mieux un problème donné. Leila Ben Othman, FST 2021-2022 7 / 33 Introduction Dé nition Machine Learning: Dé nition • L'apprentissage automatique est la science de programmer les ordinateurs de sorte qu'ils puissent apprendre à partir de données. Dé nition 1 - Arthur Samuel,1959 Machine Learning is the science of getting computers to learn without being explicitly programmed. Dé nition 2 - Tom Mitchell, 1997 Étant donné une tâche T et une mesure de performance P, on dit qu'un programme informatique apprend à partir d'une expérience E si les résultats obtenus sur T, mesurés par P, s'améliorent avec l'expérience E. = ⇒Une machine apprend quand sa performance à faire une certaine tâche s'améliore avec de nouvelles expériences. Leila Ben Othman, FST 2021-2022 8 / 33 Introduction Applications du Machine Learning Machine Learning: Applications • Reconnaissance d'image • Reconnaissance vocale/faciale • Conduite autonome • Chat Bots • Détection de fraude • Recommandation de produits • Diagnostique médical • Détection des SPAM • Prédiction des prix Leila Ben Othman, FST 2021-2022 9 / 33 Introduction Applications du Machine Learning Machine Learning: Applications • Détection des SPAM: • Analyser la composition d'un mail (le contenu, le nombre d'occurrences des mots, etc). = ⇒Décider si un mail est un SPAM ou non. • Recommandation de produits: • Se baser sur les historiques d'achats faites en ligne par un internaute. = ⇒Recommander des produits à l'internaute qui pourront l'intéresser (Net ix, Amazon). • Diagnostique médical: • Se baser sur les données médicales d'un patient. = ⇒Diagnostiquer si le patient est atteint d'une maladie donnée. Leila Ben Othman, FST 2021-2022 10 / 33 Introduction Applications du Machine Learning Machine Learning: Applications • Détection d'objets (classi cation d'objet) • Détecter la présence d'une instance (reconnaissance d'objet) ou d'une classe d'objets dans une image numérique. = ⇒Une attention particulière est portée à la détection de visage et la détection de personne. • Reconnaissance faciale • Reconnaître une personne grâce à son visage de manière automatique. Leila Ben Othman, FST 2021-2022 11 / 33 Introduction Applications du Machine Learning Machine Learning L'apprentissage automatique repose sur: • Les mathématiques et les statistiques • construction de modèles • leur inférence à partir de données. • L'informatique • représentation des données • implémentation e cace d'algorithmes. Leila Ben Othman, FST 2021-2022 12 / 33 Introduction Applications du Machine Learning Machine Learning L'apprentissage automatique est très lié aux domaines suivants: • La science des données (Data science) : approche pluri-disciplinaire pour l'extraction de connaissances à partir de données hétérogènes. • Les données massives (Big data) : mettant l'accent sur les problématiques "5V" (volume, vélocité (vitesse), variété, véracité, valeur) et des solutions issues du stockage/calcul distribué. Leila Ben Othman, FST 2021-2022 13 / 33 Les méthodes Les méthodes du Machine Learning • L'apprentissage supervisé (Supervised Learning): Le but est d'apprendre à faire des prédictions, à partir d'exemples étiquetés, c'est-à-dire accompagnés de la valeur à prédire. • Classi cation (Classement): Les plus proches voisins. • Régression: Régression linéaire, régression polynomiale, régression multiple. • L'apprentissage non supervisé (Unsupervised Learning): Dans le cadre de l'apprentissage non supervisé, les données ne sont pas étiquetées. Il s'agit alors de modéliser les observations pour mieux les comprendre. • Regroupement (Clustering): K-Means. • Règles d'association: Technique de fouille de données. Leila Ben Othman, FST 2021-2022 14 / 33 Les méthodes L'apprentissage supervisé (Supervised Learning) Les méthodes du Machine Learning • L'apprentissage supervisé (Supervised Learning): Le but est d'apprendre à faire des prédictions, à partir d'exemples étiquetés, c'est-à-dire accompagnés de la valeur à prédire. Leila Ben Othman, FST 2021-2022 15 / 33 Les méthodes L'apprentissage supervisé (Supervised Learning) Apprentissage supervisé • Dataset: des observations/exemples/un échantillon X • Features: des variables xi (i = 1, ..., n) • Target: des étiquettes/des labels/des classes/cible y • Modèle/fonction: f pour prédire y à partir de X. Leila Ben Othman, FST 2021-2022 16 / 33 Les méthodes L'apprentissage supervisé (Supervised Learning) Apprentissage supervisé Échantillon X = ⇒Fonction f = ⇒Label y (décision) = ⇒À partir d'un ensemble de données d'entraînement, l'algorithme va apprendre un modèle qui lui permettra de faire des prédictions ultérieurement. Leila Ben Othman, FST 2021-2022 17 / 33 Les méthodes L'apprentissage supervisé (Supervised Learning) Leila Ben Othman, FST 2021-2022 18 / 33 Les méthodes L'apprentissage supervisé (Supervised Learning) Classi cation Dé nition (Classi cation binaire) Un problème d'apprentissage supervisé dans lequel l'espace des étiquettes est binaire, autrement dit Y = {0, 1} est appelé un problème de classi cation binaire. • On peut prédire si: • un email est un spam ou non. • ne image contient ou non une girafe. • une molécule peut ou non traiter la dépression. • une transaction nancière est frauduleuse ou non. • un client d'une banque peut lui être accordé un crédit ou non. Leila Ben Othman, FST 2021-2022 19 / 33 Les méthodes L'apprentissage supervisé (Supervised Learning) Classi cation Dé nition (Classi cation multi-classe) Un problème d'apprentissage supervisé dans lequel l'espace des étiquettes est discret et ni, autrement dit Y = {1, 2, ..., C} est appelé un problème de classi cation multi-classe. C est le nombre de classes. • On peut prédire: • en quelle langue un texte est écrit. • à quelle espèce appartient une plante. Leila Ben Othman, FST 2021-2022 20 / 33 Les méthodes L'apprentissage supervisé (Supervised Learning) Classi cation Leila Ben Othman, FST 2021-2022 21 / 33 Les méthodes L'apprentissage supervisé (Supervised Learning) Classi cation Leila Ben Othman, FST 2021-2022 22 / 33 Les méthodes L'apprentissage supervisé (Supervised Learning) Régression Dé nition (Régression) Un problème d'apprentissage supervisé dans lequel l'espace des étiquettes est Y = R est appelé un problème de régression. Leila Ben Othman, FST 2021-2022 23 / 33 Les méthodes L'apprentissage supervisé (Supervised Learning) Régression On peut prédire: • Le prix d'un appartement en fonction de sa surface habitable, sa localisation géographique, etc. • La température qu'il fait à Tunis en fonction de la pression atmosphérique, du mois de l'année, etc. • La distance d'arrêt d'une voiture en fonction de sa vitesse, de l'état des pneus, l'état de la route, etc. • Le chire d'aaire d'un magasin en fonction du mois de l'année, de sa localisation, etc. Leila Ben Othman, FST 2021-2022 24 / 33 Les méthodes L'apprentissage supervisé (Supervised Learning) Régression linéaire simple Leila Ben Othman, FST 2021-2022 25 / 33 Les méthodes L'apprentissage supervisé (Supervised Learning) Régression polynomiale Leila Ben Othman, FST 2021-2022 26 / 33 Les méthodes L'apprentissage non supervisé (Unsupervised Learning) L'apprentissage non supervisé (Unsupervised Learning) Principe (Apprentissage non supervisé) L'apprentissage non supervisé désigne la situation d'apprentissage automatique où les données ne sont pas étiquetées. Il s'agit donc de découvrir les structures sous-jacentes à ces données non étiquetées. • Dataset: des observations/exemples/un échantillon X • Features: des variables xi (i = 1, ..., n) • Target: Pas d'étiquettes. NB: • Données avec étiquettes: coûteuse à obtenir sur des grands volumes de données. • Données sans uploads/Industriel/ ml-intro 2 .pdf

  • 10
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager