Chapitre 1 Introduction au Machine Learning 1. Introduction Vous trouverez faci

Chapitre 1 Introduction au Machine Learning 1. Introduction Vous trouverez facilement des exemples où les concepts d'apprentissage automatique et d'apprentissage profond sont utilisés de manière interchangeable dans les médias. Cependant, les experts les distinguent généralement. Si vous avez décidé d’étudier ce domaine, il est important que vous compreniez ce que signifient ces mots et, plus important encore, en quoi ils diffèrent. Qu'est-ce qui vous est arrivé quand vous avez entendu le terme «Machine Learning» pour la première fois ? Réfléchissez un peu ! Comprendre le machine learning mal entraînera une grave confusion. Bien que l'apprentissage soit une branche de l'intelligence artificielle, il donne une idée très différente de ce que c’est « apprendre » En général, l’intelligence artificielle, l’apprentissage automatique et l’apprentissage en profondeur sont liés comme suit: «L'apprentissage en profondeur est une sorte d'apprentissage machine et l'apprentissage est une sorte d'intelligence artificielle.» Cette classification peut ne pas être aussi absolue que les lois de la nature, mais elle est largement acceptée. Laissez-nous creuser un peu plus loin. L'intelligence artificielle est un mot très commun qui peut impliquer beaucoup de choses différentes. Il peut indiquer toute forme de technologie comportant des aspects intelligents plutôt que de cibler un domaine technologique spécifique. En revanche, l’apprentissage automatique fait référence à un domaine spécifique. En d'autres termes, nous utilisons Machine Learning pour indiquer un groupe technologique spécifique d'intelligence artificielle. L'apprentissage automatique comprend également de nombreuses technologies. L'un d'eux est Deep Learning, Le fait que l’apprentissage profond soit un type d’apprentissage automatique est très important et c’est la raison pour laquelle nous passons en revue ce long examen sur les liens qui unissent intelligence artificielle, apprentissage automatique et apprentissage profond. Deep Learning (apprentissage profond) a récemment été sous les feux des projecteurs, car il a résolu avec compétence certains problèmes qui ont mis au défi l'intelligence artificielle. Ses performances sont sûrement exceptionnelles dans de nombreux domaines. Cependant, il fait également face à des limites. Les limites de Deep Learning proviennent de ses concepts fondamentaux hérités de son ancêtre, le Machine Learning. En tant que type d’apprentissage automatique, Deep Learning ne peut pas éviter les problèmes fondamentaux auxquels l’apprentissage automatique est confronté. C'est pourquoi nous devons passer en revue le Machine Learning avant de discuter du concept de Deep Learning. 2. Qu'est-ce que l'apprentissage automatique ? En bref, Machine Learning est une technique de modélisation qui implique des données. Cette définition peut être trop courte pour que les débutants puissent saisir ce que cela signifie. Alors, laissez-moi élaborer un peu sur ce sujet. L'apprentissage automatique est une technique qui définit le «modèle» à partir de «données». Ici, les données désignent littéralement des informations telles que documents, audio, images, etc. Le «modèle» est le produit final de Machine Learning. Avant d'aller plus loin dans l’explication de ce que c’est le modèle, laissez- moi s'écarter un peu. N’est-il pas étrange que la définition de l’apprentissage automatique ne traite que des concepts de données et de modèle et n’ait rien à voir avec «l’apprentissage» ? Le nom lui-même indique que la technique analyse les données et trouve le modèle par elle-même plutôt que par un humain. Nous appelons cela «apprendre» parce que le processus ressemble à une formation avec des données pour résoudre le problème de la recherche d'un modèle. Par conséquent, les données utilisées par Machine Learning dans le processus de modélisation sont appelées données «de formation». La figure 1-2 illustre ce qui se passe dans le processus d’apprentissage automatique. Figure 1-2. Que se passe-t-il pendant le processus d'apprentissage automatique? Maintenant, reprenons notre discussion sur le modèle. En réalité, le modèle n’est rien de plus que ce que nous voulons réaliser comme produit final. Par exemple, si nous développons un système de filtrage automatique pour supprimer le courrier indésirable, le filtre de courrier indésirable est le modèle dont nous parlons. En ce sens, nous pouvons dire que le modèle est ce que nous utilisons réellement. Certains appellent le modèle une hypothèse. Ce terme semble plus intuitif pour ceux qui ont des connaissances en statistiques. L'apprentissage automatique n'est pas la seule technique de modélisation. Dans le domaine de la dynamique, les gens utilisent depuis longtemps une certaine technique de modélisation qui utilise, par exemple, les lois de Newton et décrit le mouvement des objets sous la forme d’une série d’équations appelées équations du mouvement. Dans le domaine de l'intelligence artificielle, nous avons le système expert, qui est un modèle de résolution de problème basé sur les connaissances et le savoir-faire des experts. Le modèle fonctionne aussi bien que les experts eux- mêmes. Cependant, dans certains domaines, les lois et le raisonnement logique ne sont pas très utiles pour la modélisation. Des problèmes typiques peuvent être rencontrés au niveau de l'intelligence, tels que la reconnaissance d'images, la reconnaissance de la parole et le traitement du langage naturel. Laisse-moi vous donner un exemple. Regardez la figure 1-3 et identifier les nombres. Figure 1-3. Comment un ordinateur identifie-t-il les numéros quand ils ne possèdent pas de motif reconnaissable ? Je suis sûr que vous avez terminé la tâche en un rien de temps. La plupart des gens le font. Faisons maintenant un ordinateur faire la même chose. Si nous utilisons une technique de modélisation traditionnelle, nous devrons trouver une règle ou un algorithme permettant de distinguer les nombres écrits. Pourquoi n'appliquons-nous pas les règles que vous venez d'utiliser dans votre cerveau pour identifier les nombres? Assez facile, n'est-ce pas ? Eh bien pas vraiment. En fait, c'est un problème très difficile. Il fut un temps où les chercheurs pensaient que c'était un jeu d'enfant pour les ordinateurs, car c'est très facile, même pour un humain, et les ordinateurs sont capables de calculer beaucoup plus rapidement que les humains. Eh bien, cela ne leur a pas pris beaucoup de temps jusqu'à ce qu'ils réalisent leur erreur de jugement ! Comment avez-vous pu identifier les numéros sans une spécification claire ou une règle ? Il est difficile de répondre, n’est-ce pas ? Mais pourquoi ? C'est parce que nous n'avons jamais appris une telle spécification. Depuis tout jeune, nous venons d’apprendre que c’est 0, et que c’est 1. Nous avons juste pensé que c’était ce que c’était et nous sommes parvenus à distinguer les chiffres de plus en plus différents. Qu'en est-il des ordinateurs, alors ? Pourquoi ne laissons-nous pas les ordinateurs faire la même chose ? C'est tout ! À partir de cet exemple, vous pouvez saisir le concept d’apprentissage automatique. Machine Learning a été créé pour résoudre les problèmes pour lesquels des modèles analytiques sont difficilement disponibles. L'idée principale de Machine Learning est de créer un modèle utilisant les données d'apprentissage lorsque les équations et les lois ne sont pas prometteuses. 3. Les défis de l'apprentissage automatique Nous venons de découvrir que le Machine Learning est la technique utilisée pour trouver (ou apprendre) un modèle à partir des données. Il convient aux problèmes impliquant l'intelligence, tels que la reconnaissance d'images et la reconnaissance de la parole, lorsque les lois physiques ou les équations mathématiques ne produisent pas des modèles exploitables. D'une part, l'approche utilisée par Machine Learning est la clé du succès du processus. Par contre, cela pose des problèmes inévitables. Cette section présente les problèmes fondamentaux auxquels Machine Learning est confrontée. Une fois que le processus d'apprentissage automatique a trouvé le modèle à partir des données d'apprentissage, nous l'appliquons aux données de terrain réelles. Ce processus est illustré à la figure 1-4. Le flux vertical de la figure indique le processus d'apprentissage, et le modèle formé est décrit comme le flux horizontal, appelé inférence. Figure 1-4. Appliquer un modèle basé sur des données de terrain. Les données utilisées pour la modélisation dans le Machine Learning et les données fournies dans l'application de terrain sont distinctes. Ajoutons un autre bloc à cette image, comme illustré à la figure 1-5, pour mieux illustrer cette situation. Figure 1-5. Il faut faire la différence entre les données d’apprentissage (Training Data) et les données réelles appelées Input Data en anglais (ou de terrain, ou pratiques) La spécificité des données de formation (appelées aussi données d’apprentissage) et des données d'entrée est le défi structurel auquel le Machine Learning doit faire face. Il n’est pas exagéré de dire que chaque problème de Machine Learning provient de cela. Par exemple, qu’en est-il de l’utilisation des données de formation, composées de notes manuscrites d’une seule personne ? Le modèle reconnaîtra-t-il l'écriture d’une autre personne ? La possibilité sera très faible. Aucune approche d'apprentissage automatique ne peut atteindre l'objectif souhaité avec des données de formation erronées. La même idéologie s'applique à l'apprentissage profond. Par conséquent, il est essentiel que les approches d’apprentissage automatique obtiennent des données de formation (données d’apprentissage) non biaisées qui reflètent correctement les caractéristiques des données de terrain. Le processus utilisé pour assurer la cohérence des performances du modèle, quelles que soient les données d'apprentissage ou les données d'entrée, est appelé généralisation. Le succès de l’apprentissage automatique dépend en grande partie de la qualité de la généralisation. 4. Surinterprétation (Overfiting) La surinterprétation est l’une des principales causes uploads/Industriel/ chapitre-1-cours.pdf

  • 29
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager