Chapitre 4 : L’apprentissage automatique Année 2020-2021 L. LAZIB et S. SADI Li
Chapitre 4 : L’apprentissage automatique Année 2020-2021 L. LAZIB et S. SADI Lien: https://sites.google.com/view/depinfo-ia/ Introduction et généralités Apprentissage supervisé Apprentissage par renforcement Apprentissage non supervisé Conclusion 2 Apprentissage profond Évaluation Introduction et généralités L 'apprentissage automatique (AA) est l'étude des algorithmes informatiques qui s'améliorent automatiquement grâce à l'expérience et à l'utilisation de données. C'est un champ d'étude de l'IA qui fait beaucoup intervenir les statistiques et les probabilités notamment. 3 Introduction et généralités : Définitions ➢Définition 1, donnée par Arthur Samuel en 1959 : ○ « un champ d'études qui donne aux ordinateurs la capacité d'apprendre sans être explicitement programmé » ➢ Définition 2, donnée par Tom Mitchell en 1997 : ○ « un programme informatique apprend de l'expérience (E) en ce qui concerne une certaine classe de tâches (T) et une mesure de performance (P), si ses performances aux tâches dans T, telles que mesurées par P , s'améliorent avec l'expérience E ». 4 Introduction et généralités : Principe ➢ L 'intérêt principal de l’AA est de pouvoir réaliser des programmes informatiques pour résoudre des problèmes (exemple: faire des prédictions ou prendre des décisions), sans devoir explicitement coder les règles permettant de le faire. ➢ Le principe de l’AA, consiste à donner à la machine des données et de la laisser seule déduire les règles à utiliser pour atteindre un but donné. ➢ Exemple 1 : Nous donnons à la machine une collection d’articles de journaux. ○ La machine doit identifier des groupes d’articles portant sur un même sujet, sans qu’aucune règle ne soit explicitement programmée. ➢ Exemple 2 : Nous donnons à la machine une collection d’images de chats et de chiens. ○ La machine doit classer automatiquement une nouvelle image (pas nécessairement présente dans la collection) dans une des catégories « chien » ou « chat ». 5 Introduction et généralités : Principe (suite) ➢ Exemple 3 : Nous donnons à la machine une base de données regroupant les caractéristiques des logements dans une ville : superficie, quartier, étage, prix, année de construction, nombre d’occupants, montant des frais de chauffage, etc. ○ La machine doit pouvoir prédire la facture de chauffage à partir des autres caractéristiques pour un logement qui n’appartiendrait pas à cette base. ➢ Exemple 4 : Nous donnons à la machine un ensemble de parties de jeux d’échecs, sans donner aucune règle de jeu et en indiquant à chaque fois le joueur gagnant. ○ La machine doit pouvoir apprendre les règles des jeux d’échecs et pouvoir prédire à chaque fois le coup gagnant. De plus, la machine doit s'améliorer en jouant. 6 Introduction et généralités : Types ➢ Il existe trois types principaux d’apprentissage automatique : ○ L ’apprentissage supervisé ; ■ Il englobe la classification et la régression. ○ L ’apprentissage non supervisé ; ■ Il traite le clustering (regroupement) et l’apprentissage de fonctionnalités (ou l’extraction de règles d’association). ○ L ’apprentissage par renforcement. ➢ Il existe d’autres types d’apprentissage automatique (secondaires): ○ L ’apprentissage semi-supervisé ; ○ L ’apprentissage par transfert. 7 Introduction et généralités : Apprentissage Supervisé ➢ L ’apprentissage supervisé passe par les étapes suivantes : 1. Entrainement : on présente à l'ordinateur plusieurs exemples d'entrées et leurs sorties souhaitées (qu’on appelle étiquettes ou labelles), données par un expert, et le but est d'apprendre une règle générale qui fait correspondre les entrées aux sorties. 2. Prédiction : on présente à l’ordinateur des entrées uniquement (sans la sortie, qui est inconnue). Le but est de prédire la sortie en utilisant les règles apprises lors de l'entraînement. ➢ Il traite de deux sous problèmes : 1. La classification : lorsque la valeur cible (étiquette) est discrète (on cherche à prédire des classes ou des catégories). 2. La régression : lorsque la valeur cible est continue (on cherche à prédire, par exemple, un prix, une durée, etc.). 8 Introduction et généralités : Apprentissage Supervisé (suite) ➢ Exemple 1 : Nous donnons à l’ordinateur des photos d’animaux, en indiquant à chaque fois de quoi il s’agit. Le but est de pouvoir faire une prédiction sur de nouvelles photos. ○ Type : classification. Classes = {chien, chat, cheval, …} ○ Donnée en entrée : une image (sa représentation en pixels). ○ Donnée en sortie : une classe. ➢ Exemple 2 : Nous donnons à l’ordinateur plusieurs descriptions de voitures (kilométrage, usure de la peinture, modèle, année, etc.) avec leurs prix. Le but est de pouvoir faire une prédiction sur des voitures non listées. ○ Type : régression. ○ Donnée en entrée : description de la voiture. ○ Donnée en sortie : un flottant (le prix). 9 Introduction et généralités : Apprentissage Non Supervisé ➢ Apprentissage non supervisé : ○ Aucune étiquette n'est donnée à l'algorithme d'apprentissage, le laissant seul pour trouver une structure dans son entrée. ○ L 'apprentissage non supervisé peut être un objectif en soi (découvrir des modèles cachés dans les données) ou un moyen d'atteindre une fin (apprentissage des fonctionnalités). ➢ Parmi les problématiques abordées : ○ Le clustering (ou regroupement) : pour classer les données dans des groupes homogènes. ○ La détection d’anomalies : pour identifier les éléments, évenements ou observations rares qui se démarquent de la majorité des données. 10 Introduction et généralités : Apprentissage Non Supervisé (suite) ➢ Exemples : ○ Regrouper des clients en tenant comptes de différents critères. Les entreprises utilisent l’apprentissage non supervisé pour répartir leurs clients dans différents groupes et ainsi employer des stratégies de marketing adéquates et plus ciblées par exemple. ○ Déterminer des règles d’association : pour déterminer quels produits sont achetés souvent ensemble par exemple dans un supermarché. ○ Détecter des activités frauduleuses ou des produits défectueux parmis un ensemble d’activités ou de produits (à travers la détection d’anomalies). ○ La réduction de dimensionnalité : lorsqu’il existe trop de variables en entrées pour un problème donnée, l’apprentissage non supervisé peut être utilisé pour réduire ce nombre de variables. Ainsi, d’autres algorithmes peuvent exploiter la sortie ainsi produite et opérer plus efficacement. 11 Introduction et généralités : Apprentissage par Renforcement ➢ Apprentissage par renforcement : ○ un programme informatique interagit avec un environnement dynamique dans lequel il doit réaliser un certain objectif (comme conduire un véhicule ou jouer à un jeu contre un adversaire). ○ Au fur et à mesure qu'il navigue dans son espace de problèmes, le programme reçoit des retours et s'améliore en conséquence. ➢ Exemple : Jeux d’échecs, trading, etc. 12 Introduction et généralités : Autres ➢ Apprentissage semi-supervisé : ○ utilise un ensemble de données étiquetées et non étiquetées. ○ C’est donc un type d’apprentissage qui emploie l’apprentissage supervisé avec une partie des données, puis l’apprentissage non supervisé pour une autre partie des données. ➢ Apprentissage par transfert : ○ permet de transférer des connaissances apprises (par apprentissage supervisé ou non supervisé) sur des problèmes similaires mais différents des problèmes initiaux (traités lors de l’apprentissage). ○ Par exemple, si l’on entraine un modèle à reconnaître les photos contenant un chat, on peut entraîner un autre modèle pour reconnaître les photos contenant des chiens rapidement en exploitant le premier modèle. 13 Introduction et généralités : Phases d’un projet d’AA ➢ Un projet d’AA passe par les étapes suivantes : 1. Définir les objectifs du projet : ■ Bien formaliser la problématique. ■ Considérer les risques et les critères de succès. ■ Etc. 2. L ’extraction et le traitement des données : ■ Trouver les données, nettoyer le bruit contenu dans les données, étiqueter les données, etc. 3. Construire le modèle : ■ Sélectionner les données à utiliser ; ■ Choisir l’approche à utiliser et la configurer (choix des hyper-paramètres); 4. Entraîner le modèle avec un ensemble de données d'entraînement. 5. Évaluation et validation du modèle : 6. Retourner à l’étape 1, si les critères de succès ne sont pas atteints. 14 Introduction et généralités : Jeu de données ➢ L ’apprentissage se base sur des données. Il est donc important de bien comprendre comment prétraiter et utiliser ces données. ➢ Ces données, également appelées jeu de données, en anglais dataset, est formé d’un certain nombre d’observations (échantillons, exemples) relatives au problème à résoudre. ➢ Selon le type d’apprentissage, une observation est composée de l’entrée et (s’il s’agit d’apprentissage supervisé) de la sortie souhaitée du modèle qui sera construit. ○ L ’entrée est constituée d’un ensemble d’attributs (ou features en anglais). Chaque valeur d’attribut est notée xi où i est l’indice de l’attribut. ○ La sortie peut consister d’une ou plusieurs valeurs notées yi. ■ Dans le cas de la classification, ces valeurs indiquent en général, les probabilités d’appartenance à chaque classe. Un autre terme utilisé est celui d’étiquettes ou labels. 15 Introduction et généralités : Jeu de données (suite) ➢ Il est généralement plus facile de constituer un jeu de données non étiquetées qu’un jeu de données étiquetées. ➢ Dans le premier cas, il « suffit » de collecter des données après un pré-traitement minimal, alors que dans le second cas une intervention humaine potentiellement coûteuse est souvent nécessaire pour définir les étiquettes. ➢ La collecte et la préparation des uploads/Industriel/ chapitre-4-apprentissage-automatique.pdf
Documents similaires
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/EzzYaxwMwbsXoZ6SxbJD0OrWW1uK22Lp4VH3rrctJbYrFIUBLQtVzGDlGaiwMBRdgSLriiami7EYdp1rTClVICP4.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/Djhz9IVSupmaKCteuZwvzA0KOOQ7chAoeGkD2w2hqOtarbbwzhidLiMAr8zUxRm3JLwItWsL1ExUdkEYpRWExVxR.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/As67dfTBqPV6ABz6hKvkgdUUze5QkMhD8hoSWYS9CS7O6ya2vt6Wp6GqK9Xkm5BnVTvP0i9CzFyQGCUASxqi9aTD.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/wisQyOtoiyHUHNhCM31U9b4kcBZFJ72BoMsXnILQEUqMb6rhZ6gqKDkgszGNbBDOZRm1S4o0DCxiifHNvozDMoV7.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/cmlKwlwd1fTNKCoMKZ6rbtTpfpx5YZ19QdU6itA5TIue6insqInHjJCFoFwynszEifP2ePQuAerMFetlESdPZ32Q.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/rHtTbI8BpffpYmptH2xWVT5wW0r4It4TqLXJWhKbb7vbraYSHJ8hNVkQ27DqLGUJy7q9p3HuhKp1Tqvny7vernkn.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/ZOta8OYei8ZZfTTvY6RxihMyyKwZkd7GuspPxK0neuOEcUpC2TxYqZCxaFxIdmnS9n4kOuku6hxBc9WoXygRI3oY.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/51gl6N89RAPNQAA8kVOFxMwWK0IJccSXRJn6mQHzWxRKlCu3hZu4McTXUtSvvqPSdAXnsKmepZ5e2oJTDMSYiqdw.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/ICfDeCxK2uK4ZXoXtkeILOeLzwQEMMWG6U7lshJs1DF22hFrzGLN0k37Wh9vyyOHK4Cb5gcODgIKRpDT4YNKeqho.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/G4r5xVM1A2UC7oiiJaM8odrwZKBQSWVPzscAa7AbUxFL9dZXwweNtrkxNLsiLdHwjVzPXUPApwz9p2mFcc9S1aNB.png)
-
24
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Nov 28, 2021
- Catégorie Industry / Industr...
- Langue French
- Taille du fichier 0.4033MB