Chapitre ii indexation en ri
Cours Recherche d ? Information RI Master Spécialités - Ingénierie du Logiciel et Traitement de l ? Information ILTI - Systèmes d ? Information Répartis SIR - Technologie de l ? Information TI Université M ? Hamed Bougara ?? Boumerdès Département Informatique Enseignante AZZOUG CChapitre II Représentation de l ? information -Indexation- CChapitre II II Indexation Pourquoi C ? est quoi -Dé ?nition II Approches d ? indexation II Indexation Automatique classique II Etapes d ? Indexation automatique classique II Problématique de l ? indexation classique CII Indexation Pourquoi ? L ? objectif principal d ? un SRI est de retrouver les documents qui traite de ? la requête ? En règle générale un document traite de la requête s ? il partage des mots de la requête Comment retrouver les mots de la requête dans un document ? Un mot est une séquence de caractères entité lexicale ? Pour identi ?er les mots de la requête dans un document deux parcours sont possibles -Parcours séquentiel recherche séquentielle parcourir le texte du document en entier à la recherche des occurrences de la requête ? parcours complet de l ? ensemble des documents de la collection avec les termes de la requête est impossible trop de documents et temps de réponse prohibitif - Recherche indexée l ? idée est de construire des structures de données ou indexer le texte dans le but d ? accélérer la recherche ? Le but de l ? indexation transformer des documents en substituts capables de représenter leurs contenus ? Salton et McGill CII Indexation c ? est quoi L ? indexation est un processus chargé de représenter un document donné par un descripteur dit index composé d ? un ensemble d ? éléments clés décrivant son contenu L ? ensemble des descripteurs associés à un document facilite l ? exploitation de son contenu informationnel par un SRI Document Langage naturel exprimé par un texte libre Indexation MultiMedia Eléments clés information textuelle image vidéo Représentation interne Langage d ? indexation descripteur composé d ? éléments-clés Information textuelle ? Termes-clés mots simples pomme ou composés rouge-gorge ou groupes de mots pomme de terre Image ? Pixels Couleur Forme Légende la sélection par le SRI de l ? image similaire à l ? image soumise par l ? utilisateur repose sur des techniques de projection ? ? ? vidéo ? Pixels représentation numérique du signal segmentation en plans et en scènes ? CII Indexation C ? est quoi Exemples Soient D D D trois documents de la collection et Q requête utilisateur Construire les index qui représentent l ? ensemble des termes-clés représentatifs D Avocat de justice ?? Index-D avocat justice D Rouge-gorge familier est une espèce de passereaux ?? Index- D rouge-gorge familier espece passerau D Joconde Mona-Lisas ?? Index-D joconde mona-lisas Segmentation de l ? image en pixels Q Base de données BDD ??Index-Q base donnee bdd CII Dé ?nition de l ? indexation L ? indexation peut être - Manuelle Expert d ? indexation -
Documents similaires


