See discussions, stats, and author profiles for this publication at: https://ww

See discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/333421391 Indexation et recherche visuo-textuelle des bases de données images Conference Paper · May 2019 CITATIONS 0 READS 128 1 author: Some of the authors of this publication are also working on these related projects: indexation et recherche des bases de données images View project Fairouz Hadi Ferhat Abbas University of Setif 4 PUBLICATIONS 0 CITATIONS SEE PROFILE All content following this page was uploaded by Fairouz Hadi on 14 February 2020. The user has requested enhancement of the downloaded file. Indexation et recherche visuo-textuelle des bases de données images Hadi Akram LRSD, Département d’informatique, Faculté des Sciences, Université Ferhat Abbas-Sétif 1, Algérie. akram_ha92@yahoo.fr Hadi Fairouz LRSD, Département d’informatique, Faculté des Sciences, Université Ferhat Abbas-Sétif 1, Algérie. Info_had@yahoo.fr Boukerram Abdallah LRSD, Département d’informatique, Faculté des Sciences, Université Ferhat Abbas-Sétif 1, Algérie. boukerram@hotmail.com Résumé— La recherche d’images par le contenu est toujours considérée comme une tâche difficile. A cet effet, on utilise des informations textuelles, tel que le nom de l’image, pour tenter de comprendre le sens de l’image. Cependant, le nom de l’image n’est toujours pas en rapport avec celle-ci. Pour améliorer la recherche d’images, la combinaison des informations textuelles et visuelles semble être une méthode prometteuse. Ce travail porte sur l’étude des différentes méthodes d’indexation de bases de données images, pour proposer ensuite, un système d’indexation visuo-textuelle de bases de données images. Mots clés- Traitement d’images; indexation textuelle ; indexation visuelle ; indexation visuo-textuelle ; base de donnée image ; distances métriques. I. INTRODUCTION L’image est porteuse de deux types d’informations :  d’une part, son contenu : il est appelé niveau syntaxique (ou graphique) qui donne des renseignements sur la scène que représente l’image.  d’autre part, son interprétation : elle se nomme niveau sémantique, c’est la phase d’interprétation de l’image qui varie d’une personne à une autre en fonction des connaissances de chacun et du contexte d’observation. Des bases de données ont alors été construites afin de stocker toutes ces images. Au fil des années, les images de natures très diverses ont gagné en importance occupant parfois jusqu'à plusieurs téraoctets de mémoire. Afin de pouvoir consulter et retrouver au mieux les images, de nombreux chercheurs s’intéressent de près cette discipline qu’est, la recherche d’images. C’est un problème ouvert qui met à l’épreuve des thématiques de recherche diverses :  Les bases de données pour le stockage et l’indexation des images,  Le traitement d’images pour l’extraction de paramètres discriminants.  Les statistiques, les distances métriques pour l’évaluation de distances entre images.  La classification pour le classement des images les unes par rapport aux autres.  L’aspect réseau pour la gestion des bases de données à distance en tenant compte des problèmes de sécurité et de transmission de l’information qui en découlent. Le but des systèmes de tri automatique (indexation) est de permettre à un utilisateur de trouver, dans des bases d’images, toutes celles qui sont semblables à l image qui l’intéresse. Un programme d’indexation se conçoit comme un système qui prend en entrée une image de référence et qui retourne un critère de similarité entre l’image de référence et toutes les images de la base. Ceci permet de trier ces images, de la plus similaire à la moins similaire. On distingue, deux approches principales: l’une emploie des annotations textuelles manuelles et l’autre emploie des descripteurs extraits automatiquement à partir des images. La première approche, basée sur l’annotation textuelle manuelle d’images, est aujourd’hui la plus employée. Mais l’indexation de ces images représente une tâche longue et répétitive pour l’humain, surtout avec les bases d’images qui deviennent de plus en plus grandes, où l’on remarque beaucoup d'erreurs d'indexation, liées au fait que le texte ne correspond pas toujours à l'image. Pour surmonter les défaites des systèmes de recherche d'images basées sur l’annotation textuelle manuelle, le système de recherche des images basé essentiellement sur le contenu est proposé. Cette deuxième approche a deux directions : - recherche d'image basée sur le contenu symbolique - recherche d’image basée sur le contenu sémantique. Les méthodes symboliques emploient des descripteurs extraits automatiquement de l’image telle que la couleur, la texture, les formes.... Quoiqu’ il est difficile de trouver les descripteurs puissants pour représenter des images : à cet effet, des méthodes de recherche sémantique sont apparues pour améliorer le résultat de recherche. Ce travail présente, dans une première partie, le principe d’indexation textuel de base de données images pour présenter ensuite, l’indexation et recherche d'images par le contenu visuel. En fin, nous développons l’implémentation du système mis en œuvre suivi de la combinaison des deux méthodes décrites précédemment. Une conclusion reprenant les points forts de ce travail et les perspectives futures terminent ce papier. II. INDEXATION ET RECHERCHE TEXTUELLE D'IMAGES L’indexation des images par des mots, bien qu'incontournable, reste une gageure en raison de la multiplicité des entités présentes dans l'image. Dès les premières tentatives de description d’une photographie, nous nous trouvons confrontés à l'infinité des éléments qui la composent. Il semble que la charge sémantique d'un mot et la charge sémantique d’une photographie soient incomparables. Définir une image à partir d’un seul terme s’apparente à une véritable réduction de l’image, d’autant plus que le terme qui a un sens pour moi, ne sera pas forcément celui partagé par la majorité. En effet, une image est le support d’une multitude d’interprétations possibles. Le domaine de recherche d'indexation d'images est de plus en plus actif. La problématique de la recherche d'images se résume en la recherche de mots, et ce, en se basant sur les attributs textuels des images tels que le nom des fichiers par exemple. Cette approche nécessite une entrée manuelle des mots définissant l'image (légende) et ne peut donc être appliquée au flux, toujours croissant, d'arrivée de nouvelles images. Dans la première génération des systèmes d’indexation, les images sont représentées par des termes sémantiques de type mots-clés comme par exemple, Google, Yahoo. A. Indexation textuelle manuelle L'indexation textuelle manuelle d'images est le plus souvent réalisée par un documentaliste appelé iconographe. Son rôle est de classer et d'indexer les images en les associant à des catégories et à des groupes de mots, souvent extraits d'un thésaurus, permettant de retrouver facilement les images. Son travail est très utile pour les agences de presse, les centres de documentation, les musées... Du fait de l'accroissement du nombre de photographies personnelles, ce travail est aussi souvent réalisé par les utilisateurs qui souhaitent décrire leurs images personnelles [1]. L’indexation textuelle se fait en termes d’objets, de contenu et de structure. La sémantique elle-même n’est pas inscrite dans l’image, mais se trouve ailleurs. Il faut donc rechercher ces sources extérieures pour avoir accès aux clés de décodage sémantique de l’image. Dans une image, la sémantique dépend de deux principes: - - du niveau de connaissances et de la perception que possède l’observateur, - de l’objectif poursuivi par l’utilisateur de cette image lorsqu'il la regarde. B. Domaines d'application Les domaines potentiels d'application de l'indexation sont nombreux [2] : Domaines Applications Aérospatiale Analyse des images satellites Médecine Indexation des images représentant des caractères pathologiques Télécommunications Archivage et codage d’images par leur contenu Art Etude et archivage de styles artistiques Création de musées en ligne Education Création d’encyclopédie d’illustrations Médias Recherche d’illustration d’un événement ou d’une personne Surveillance Identification de personne Authentification Recherche et vérification des contrefaçons Design Styles et textures dans l’industrie Photographie Recherche des photos adéquates pour un article Audiovisuel Recherche d’un plan cinématographie C. Systèmes de recherche existants Voici une liste non-exhaustive de logiciels existants et présentés sur Internet. Cela montre bien l'intérêt industriel que suscite le problème de l'indexation de grandes bases de données multimédia. Il est très difficile de comparer les résultats de ces produits, pour plusieurs raisons : ils utilisent tous des bases d'images différentes. Ces bases ne sont pas connues dans leur intégralité par l'utilisateur, ce qui rend impossible le calcule d’une quelconque efficacité ou précision. Nous ne pouvons pas savoir si les bases ne sont pas déjà pré- triées, car souvent les images similaires se suivent par leur numéro de série [2].  QBIC (Query by Image Content)  Virage  RetrievalWare  Photobook  NeTra  CIIR (Center for Intelligent Info Retrieval) III. INDEXATION ET RECHERCHE D'IMAGES PAR LE CONTENU VISUEL L’archivage des images et des séquences vidéos aussi bien pour les chaînes de télévision, les journaux, les musées, voire même pour les moteurs de recherche sur Internet ne se fait qu’au prix d’une étape d’annotation manuelle à l’aide de mots- clés. Cette indexation représente une tâche longue et répétitive pour l’humain, surtout avec les bases d’images qui deviennent aujourd’hui de plus en plus grandes. De plus, cette tâche est très subjective à la culture, à la connaissance et aux sentiments de chaque personne. Le besoin de méthodes d’indexation et de recherche directement basé sur le contenu de l’image n’est donc plus à démontrer. Le premier prototype de système fut proposé en 1970 et attira l’attention de la communauté des chercheurs. Les premiers systèmes d’indexation d’images par le contenu sont crées uploads/Science et Technologie/ indexation-et-recherche-visuo-textuelle-des-bases-de-donnees-images.pdf

  • 41
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager