Apprentissage supervisé Sommaire Définition Méthodes d'apprentissage supervis
Apprentissage supervisé Sommaire Définition Méthodes d'apprentissage supervisé Applications Definition L'apprentissage supervisé (supervised learning en anglais) est une tâche d'apprentissage automatique consistant à apprendre une fonction de prédiction à partir d'exemples annotés, au contraire de l'apprentissage non supervisé. On distingue les problèmes de régression des problèmes de classement1. Ainsi, on considère que les problèmes de prédiction d'une variable quantitative sont des problèmes de régression tandis que les problèmes de prédiction d'une variable qualitative sont des problèmes de classification Les exemples annotés constituent une base d'apprentissage, et la fonction de prédiction apprise peut aussi être appelée « hypothèse » ou « modèle ». On suppose cette base d'apprentissage représentative d'une population d'échantillons plus large et le but des méthodes d'apprentissage supervisé est de bien généraliser, c'est-à-dire d'apprendre une fonction qui fasse des prédictions correctes sur des données non présentes dans l'ensemble d'apprentissage. Différentes tâches sont associées à l'apprentissage supervisé Classification(ou classification supervisée est la catégorisation algorithmique d'objets. Elle consiste à attribuer une classe ou catégorie à chaque objet (ou individu) à classer, en se basant sur des données statistiques. Elle fait couramment appel à l' apprentissage automatique et est largement utilisée en reconnaissance de formes.) Régression(est un ensemble de méthodes statistiques très utilisées pour analyser la relation d'une variable par rapport à une ou plusieurs autres.) Type d’apprentissage Si les classes sont prédéterminées et les exemples connus, le système apprend à classer selon un modèle de classification ou de classement ; on parle alors d'apprentissage supervisé (ou d'analyse discriminante). Un expert (ou oracle) doit préalablement étiqueter des exemples. Le processus se passe en deux phases. Lors de la première phase (hors ligne, dite d'apprentissage), il s'agit de déterminer un modèle à partir des données étiquetées. La seconde phase (en ligne, dite de test) consiste à prédire l'étiquette d'une nouvelle donnée, connaissant le modèle préalablement appris. Parfois il est préférable d'associer une donnée non pas à une classe unique, mais une probabilité d'appartenance à chacune des classes prédéterminées. Méthodes d'apprentissage supervisé Boosting Machine à vecteurs de support Mélanges de lois Réseau de neurones Méthode des k plus proches voisins Arbre de décision Classification naïve bayesienne Inférence grammaticale Espace de versions Méthode des k plus proches voisins En intelligence artificielle, la méthode des k plus proches voisins est une méthode d’apprentissage supervisé. En abrégé k-NN ou KNN, de l'anglais k-nearest neighbors En reconnaissance de forme, l'algorithme des k plus proches voisins (k- NN) est une méthode non paramétrique utilisée pour la classification et la régression. Dans les deux cas, il s'agit de classer l'entrée dans la catégorie à laquelle appartient les k plus proches voisins dans l'espace des caractéristiques identifiées par apprentissage. Le résultat dépend si l'algorithme est utilisé à des fins de classification ou de régression : en classification k-NN, le résultat est une classe d'appartenance. Un objet d'entrée est classifié selon le résultat majoritaire des statistiques de classes d'appartenance de ses k plus proches voisins, (k est un nombre entier positif généralement petit). Si k = 1, alors l'objet est assigné à la classe d'appartenance de son proche voisin. en régression k-NN, le résultat est la valeur pour cet objet. Cette valeur est la moyenne des valeurs des k plus proches voisins. Suite k-nn Que ce soit pour la classification ou la régression, une technique efficace peut être utilisée pour pondérer l'influence contributive des voisinages, ainsi les plus proches voisins contribuent-ils plus à la moyenne que les voisins plus éloignés. Pour exemple, un schéma courant de pondération consiste à donner à chaque voisin une pondération de 1/d, ou d est la distance de l'élément, à classer ou à pondérer, de ce voisin. Arbre de décision L’apprentissage par arbre de décision désigne une méthode basée sur l'utilisation d'un arbre de décision comme modèle prédictif. On l'utilise notamment en fouille de données et en apprentissage automatiqu Dans ces structures d'arbre, les feuilles représentent les valeurs de la variable-cible et les embranchements correspondent à des combinaisons de variables d'entrée qui mènent à ces valeurs. En analyse de décision, un arbre de décision peut être utilisé pour représenter de manière explicite les décisions réalisées et les processus qui les amènent. En apprentissage et en fouille de données, un arbre de décision décrit les données mais pas les décisions elles-mêmes, l'arbre serait utilisé comme point de départ au processus de décision. C'est une technique d'apprentissage supervisé : on utilise un ensemble de données pour lesquelles on connaît la valeur de la variable-cible afin de construire l'arbre (données dites étiquetées), puis on extrapole les résultats à l'ensemble des données de test. La majorité des experts machine learning utilisent un apprentissage supervisé. L’apprentissage supervisé consiste en des variables d’entrée (x) et une variable de sortie (Y). Vous utilisez un algorithme pour apprendre la fonction de mappage de l’entrée à la sortie. Y = f (X) Le but est d’appréhender si bien la fonction de mappage que lorsque vous avez de nouvelles données d’entrée (x), vous pouvez prévoir les variables de sortie (Y) pour ces données. C’est ce qu’on appelle l’apprentissage supervisé, car le processus d’un algorithme tiré de l’ensemble de données de formation peut être considéré comme un enseignant supervisant le processus d’apprentissage. Nous connaissons les réponses correctes, l’algorithme effectue des prédictions itératives sur les données d’apprentissage et est corrigé par l’enseignant. L’apprentissage s’arrête lorsque l’algorithme atteint un niveau de performance acceptable. Les problèmes d’apprentissage supervisé peuvent être regroupés en problèmes de régression et de classification. Classification: Un problème de classification survient lorsque la variable de sortie est une catégorie, telle que «rouge» ou «bleu». Régression: Un problème de régression se pose lorsque la variable de sortie est une valeur réelle, telle que «dollars» ou «poids». Certains types courants de problèmes fondés sur la classification et la régression incluent la prévision et la prévision de séries chronologiques, respectivement. Voici quelques exemples populaires des algorithmes d’apprentissage supervisé: Régression linéaire pour les problèmes de régression. Forêt aléatoire pour les problèmes de classification et de régression. Soutenir les machines à vecteurs pour les problèmes de classification. En apprentissage supervisé, vous allez récupérer des données dites annotées de leur sorties pour entraîner le modèle, c'est à dire que vous leur avez déjà associé un label ou une classe cible et vous voulez que l'algorithme devienne capable de la prédire sur de nouvelles données non annotées une fois entraîné. Dans notre exemple, les données d'entrée seraient des images, et la cible (ou target en anglais) la catégorie de photos que vous voulez. Comparaison Applications Vision par ordinateur Reconnaissance de formes Reconnaissance de l'écriture manuscrite Reconnaissance vocale Traitement automatique de la langue Bio-informatique uploads/Management/ apprentissage-supervise.pdf
Documents similaires
-
11
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Mai 12, 2021
- Catégorie Management
- Langue French
- Taille du fichier 0.4753MB