Chapitre 1 1 INTRODUCTION AUX RESEAUX DE NEURONES Résumé Un réseau de neurones non bouclé est constitué par plusieurs opérateurs algébriques élémentaires appelés neurones et réalise une fonction paramétrée non linéaire par rapport aux entrées et aux param
INTRODUCTION AUX RESEAUX DE NEURONES Résumé Un réseau de neurones non bouclé est constitué par plusieurs opérateurs algébriques élémentaires appelés neurones et réalise une fonction paramétrée non linéaire par rapport aux entrées et aux paramètres La famille des réseaux de neurones à une couche de neurones cachés possède la propriété d'approximation parcimonieuse Cela signi ?e qu'elle est capable d'approcher n'importe quelle fonction bornée et su ?samment régulière en utilisant moins de paramètres ajustables que les familles de fonctions usuelles telles que les polynômes Dans l'optique d'une modélisation statistique on utilise les réseaux de neurones pour approcher la fonction de régression du processus L'intérêt de la parcimonie est alors de limiter le nombre d'exemples nécessaires pour obtenir une bonne estimation de la fonction de régression Par opposition aux modèles linéaires par rapport aux paramètres pour lesquels la solution des moindres carrés s'obtient en résolvant un système d'équations l'ajustement des paramètres d'un réseau de neurones appelé aussi apprentissage nécessite la mise en ?uvre d'algorithmes itératifs À cet égard il convient de bien distinguer l'étape de calcul du gradient de la fonction de coût par rapport aux paramètres par exemple par rétropropagation du gradient de l'étape de modi ?cation des paramètres méthodes du gradient simple de quasi-Newton de Levenberg-Marquardt etc Introduction L'objectif de ce chapitre est double il s'agit tout d'abord de rappeler les dé ?nitions de base relatives aux réseaux de neurones ainsi que les propriétés mathématiques de certains d'entre eux Ensuite nous nous attacherons à détailler certains aspects de leur mise en ?uvre et plus particulièrement de leur apprentissage Un réseau de neurones est une fonction paramétrée qui est la composition d'opérateurs mathématiques simples appelés neurones formels ou plus simplement neurones pour les distinguer des neurones biologiques A ?n de préciser ces notions nous commencerons par présenter les dé ?nitions relatives aux neurones avant de détailler di ?érentes architectures de réseaux de neurones Les neurones On appelle neurone une fonction algébrique non linéaire paramétrée à valeurs bornées de variables réelles appelées entrées Par soucis de commodité on commet fréquemment un abus de langage en désignant par le terme neurone linéaire une fonction linéaire et plus généralement a ?ne On a pris l'habitude de représenter un neurone formel comme indiqué sur la ?gure Cy f x x xn Figure Un neurone réalise une fonction non linéaire bornée y f x xn q qp o? les xi sont les entrées et les qj sont les paramètres Les paramètres dont dépend la valeur de y peuvent intervenir de deux manières ? ils peuvent intervenir dans la fonction f elle-même ? ils peuvent intervenir dans l'argument de la fonction f Les réseaux de fonctions radiales ou d'ondelettes cf Oussar entrent dans la première catégorie les paramètres ajustables sont le centre et la largeur pour les fonctions radiales ou le centre et la dilatation pour les ondelettes Dans ce travail nous avons toujours utilisé des neurones ou fonctions qui appartiennent à la seconde catégorie l'argument de la fonction f est une combinaison linéaire des entrées du
Documents similaires










-
67
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise- Détails
- Publié le Dec 21, 2021
- Catégorie Heavy Engineering/...
- Langue French
- Taille du fichier 51.4kB