1 • Notre environnement spatial est composé d’objets, à structure 3D • L’humain
1 • Notre environnement spatial est composé d’objets, à structure 3D • L’humain sait décrire et interpréter cet environnement (presque parfaitement) • Or l’information disponible sur la rétine n’est qu’un ensemble de points • Pour un capteur on parle de pixels (picture elements) Qu’est-ce que la vision ? 2 Qu’est-ce que la vision ? Les éléments « vus » (table, chaise, personnage, …) n’existent pas sur la rétine !! des informations sur la lumière reçue en ce point de la rétine (quantité, contenu spectral/couleur, Orientation de la source de lumière) Un pixel : point résultat du processus visuel : Interprétation Traitement : vision et cerveau 3 Qu’est-ce que la vision ? Analyse qualitative La Neurobiologie • but : comprendre l’anatomie du cerveau et le fonctionnement de l'acquisition et des mécanismes neuronaux des systèmes biologiques. • outil : l'exploration in situ (modèle, expériences, ..) La Psychologie Perceptive (ou psychophysique) • but : comprendre les mécanismes sous-jacent à la perception visuelle, incluant les mécanismes intelligents. • outil : l'analyse de la réaction à des situations particulières. • ….. 4 Analyse quantitative La Vision par Ordinateur (VO) but : concevoir et analyser les aspects calculatoires et algorithmiques des processus d'acquisition, de traitement et d'interprétation des images numériques. outil: la modélisation mathématique et algorithmique. --> La vision Industrielle but : construit des machines capables de traiter un ensemble connu de tâches basées sur la vision . outil : la méthodologie de conception de systèmes industriels et l'intégration. modèle computationnel 5 I.0 . Un peu d’histoire 6 I.0 . Un peu d’histoire L'histoire de ce domaine (assez récent) qu'est la vision artificielle est généralement découpée en quatre grandes parties : Origine Observateur Humain : Transmission (avec le premier client : la presse). Avant l’apparition des satellites : moyens limités (1920) 1 semain pour 1 image entre Londres et N. York Système Bartlane --> 3heures : image codée 5 niveaux/point Æ Reconstruction après 1923 Æ on passe à 15 niveaux 7 I.0 . Un peu d’histoire Début du traitement d'images : 1950 (avec les premières analyses d'images dans les chambres à bulles). Application : Rayons X, OCR, ... Des images de mauvaise qualité et très volumineuses (déjà 700 x 500 pixels sur 8bits par image) Trois domaines dominants : Restauration (corriger les défauts liés à l'acquisition) Amélioration (rendre l'image "belle" pour l'affichage) Compression (réduire le volume de l'image) Des premières images à leur traitement (1950-1970): 8 • Une évolution naturelle vers l'extraction automatique d'informations • Apparition de la notion de description structurelle (ensemble des informations contenues dans une image et que l'on peut extraire sans aucune connaissance a priori de l'application). • Des nouveaux thèmes : seuillage, segmentation, extraction de contours, morphologie mathématique Du traitement à l'interprétation d'images (1970 - 1980) : I.0 . Un peu d’histoire 9 Interprétation (au départ lié à l’IA) • Un engouement explosif au moment de l'apparition des systèmes experts • Une déception proportionnelle à l'engouement --> Les raisons de l'échec - il n'y a pas d'expert pour la vision (règles difficile à cerner) - le savoir est trop complexe pour être modélisé I.0 . Un peu d’histoire 10 La vision par ordinateur (vers 1980) : • de l'image 2D aux modèles tri-dimensionnels • Analyse du mouvement -->Vision pour la robotique (mouvement, 3D, détection d'obstacle, trajectoire) S’appuie sur le paradigme de Marr !! Un bilan très mitigé (peu de problèmes résolus, le 3D complet est-il possible ? est-ce même une solution ?) De la vision passive à la vision active !!! I.0 . Un peu d’histoire 11 Et maintenant... • Plus réaliste, conscient des limites. --- On sait que l’analyse dépend du but poursuivi --- -->>Un nouvel élan : - la réalité augmentée - les bibliothèques numériques Représentation (quels traitement, quel codage ?) Transmission (codage et réseaux) il ne s'agit plus d'interpréter pour interpréter mais d'interpréter pour recherche restituer une information (Indexation, reconstruction basée images, ….) I.0 . Un peu d’histoire 12 I.1. Une Théorie de la VO ? 13 Est-il possible de concevoir un modèle computationnel ? I.1. Une Théorie de la VO ? Peut être mais !! La VO ne cherche pas à comprendre ou à reproduire la vision biologique Il s’agit de construire un modèle mathématique et/ou algorithmique vu de l’extérieur le modèle créé, possède des propriétés semblables Il ne s’agit pas de machine qui voit (trop tôt) 14 Une théorie de la vo ? Paradigme en 3 étapes •Enoncer la théorie : spécifier les données (l’entrée) et élaborer les concepts de bases -->exprimer le cadre formel qui est à la base de la théorie. •Formaliser les concepts modèle mathématique algorithmique (ne pas confondre mathématique et analytique) •Réaliser un ensemble expérimental qui permet de vérifier la théorie 15 Une théorie de la vo ? Enoncé (Radu Horaud): • processus de traitement de l’information. l’entrée du système est une séquence d’image • utilise des stratégies bien définies pour atteindre ses buts. Les stratégies font intervenir un certain nombre de connaissances (contraintes liées à l’entrée) • la sortie est une description de l’entrée en termes d’objets, des état des objets et de relations entre ces objets 16 Une théorie de la vo ? Schéma Image : ensemble de pixel Information sensorielle Connaissances à priori: Forme, couleur, comportement physique, … Processus algorithmiques Analyse/ Interprétation Description de la scène (forme, position, état, mouvement, … ) 17 Une théorie de la vo ? stratégies Interprétation Connaissances a priori Images (ensemble de pixels) Niveau de description Stratégies descendantes Stratégies ascendantes Extraction de descripteurs élémentaires (contours 2D, plages homogènes, …) On « dispose » d’informations sur les objets et on déduit une description (extraite des images) Mise en correspondance Description abstraite 18 Une théorie de la vo ? Connaissances a priori • Quantitatives : - géométrique (forme, formation de l’image) - physiques (optiques, lumière,…) - … •---> Quantifiable, mesurable (souvent) • Qualitatives : - sémantiques (fonction des objets, relations entre les objets, comportement) 19 Une théorie de la vo ? Algorithmes et méthodes • Algorithmes : processus traduisant des stratégies d’analyse et des méthodes dérivant de théories mathématiques - extraction de primitives, de descripteurs - représentation et organisation des connaissances - comparaison, appariement • Exigences : -un système de vision doit être fiable, rapide robuste aux conditions initiales 20 Une théorie de la vo ? Paradigme de David Marr Image 1 Image 2 Image n …… Extraction de primitives 2D Première ébauche (primal sketch) Ebauche 2,5D Représentation centrée sur l’observateur (le monde 3D vu depuis la caméra) - Stéréoscopie - Analyse du mouvement, - Ombrage, reflets, textures, … But : construire l’environnement 3D, centré sur la scène + Connaissances 3D 21 II. Segmentation, reconstruction, reconnaissance 22 Paradigme de David Marr Segmentation, reconstruction, description La segmentation est la pierre de base : analyse bas niveau Reconstruction : calibrage, mises en correspondance description : quelques algorithmes (squelettisation, ..) 23 II.1 Segmentation 24 II.1 Segmentation La segmentation est la pierre de base : analyse bas niveau e situe juste après l’étape de traitement : Beaucoup d’algorithmes souvent des variantes de la même stratégie Filtrage (traitement du bruit liés à l'acquisition) Restauration (corriger les défauts liés à l'acquisition) 25 II.1 Segmentation 2 familles de méthodes : Méthodes à bases de détection de contours (Edge based methods) Méthodes à bases de décomposition en régions (region based methods) 26 II.1.1 Segmentation à base de frontières Detection de contours : Edge detection Contours : zones de pixels correspondant à une forte transition. Changement brusque de la valeur image. --> Les opérateurs différentiels sont des opérateurs qui mettent en évidences certaines variations spatiales dans les images. -->Ils sont utilisés comme traitements de base dans de nombreuses opérations 27 II.1.1 Segmentation à base de frontières Detection de contours : Edge detection * Présentation des opérateurs de convolution * Définition d’une convolution : * Gradient d’une image * Interprétation géométrique du gradient Quelques profils de contours : marche, rampe, toit, pic Contour entre région R1 et région R2 contour « marche d’escalier » 2 principes de détection de contours : différentielle d’ordre1 dérivée d’ordre 2 28 II.1.1 Segmentation à base de frontières Produit de convolution Convolution Analogique L’équation générale de convolution est une application du principe de superposition. Il s'agit de somme de réponses impulsionnelles pour les réponses ∫ − = ∞ + ∞ − du u f u t X t y ) ( ) ( ) ( La convolution est l’opération de traitement de signal la plus fondamentale. Elle indique que la valeur du signal de sortie à l’instant t est obtenue par la sommation (intégrale) pondérée des valeurs transmises du signal d'excitation X(t). La fonction f est la fonction de transfert du signal. Elle joue le rôle de fonction de pondération. C’est précisément la réponse impulsionnelle f(t). Cette intégrale est appelée produit de convolution des fonctions X et f. On la note par : X * f 29 II.1.1 Segmentation à base de frontières Produit de convolution * Cas discret : ∑ − = = = n I i i i t t f I t Y 1 ) ( ) ( uploads/Management/ cours-vison-2.pdf
Documents similaires










-
18
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Jan 13, 2021
- Catégorie Management
- Langue French
- Taille du fichier 1.0742MB