THÈSE DE DOCTORAT DE L’UNIVERSITÉ PARIS 6 Spécialité : Informatique présentée p

THÈSE DE DOCTORAT DE L’UNIVERSITÉ PARIS 6 Spécialité : Informatique présentée par Christophe BROUARD pour obtention du titre de DOCTEUR DE L’UNIVERSITÉ PARIS 6 Sujet de la thèse : Construction et Exploitation de Réseaux Sémantiques Flous pour l’Extraction d’Information Pertinente : le système RELIEFS Soutenue le 7 Janvier 2000 devant le jury composé de : Mme Bernadette BOUCHON-MEUNIER Directrice de thèse M. Charles TIJUS Co-Directeur Mme Anne DOUCET Examinateur M. Daniel KAYSER Rapporteur M. Jian Yun NIE Rapporteur T Remerciements Je tiens à remercier ma directrice de thèse, Bernadette Bouchon-Meunier, pour tous ses conseils, commentaires et critiques. Je la remercie pour la liberté qu’elle m’a laissée tout en me donnant des éléments me permettant d’une part, d’amorcer ma recherche et d’autre part, de faire des liens avec différents travaux en logique floue. Je remercie Charles Tijus, mon co-directeur, pour sa disponibilité, pour son enthousiasme, pour les riches discussions que nous avons eu. Je suis très heureux d’avoir pu partager ses problématiques et celles de son équipe. Cette thèse n’aurait pas eu pour moi la même dimension sans cet échange. Je tiens à remercier Jian-Yun Nie, pour son accueil chaleureux, et pour l’intérêt immédiat qu’il a manifesté pour mon travail. Quand je l’ai contacté, je ne mesurais pas encore la proximité de nos recherches. Je suis maintenant convaincu de la fertilité de notre future collaboration. Je remercie Daniel Kayser d’avoir accepté d’être rapporteur. Il fût mon professeur à l’Université Paris Nord et ses travaux sur la représentation des connaissances et sur les sciences cognitives en font pour moi un interlocuteur privilégié. Je suis très heureux et très honoré qu’il fasse partie de mon jury. Je remercie Anne Doucet d’avoir bien voulu présider ce jury. Son expertise en bases de données permettra très certainement d’ouvrir des perspectives intéressantes. L’équipe LOFTI a constitué un cadre de travail agréable, un lieu d’échanges et de discussions. Je tiens à remercier tous ses membres en commençant par nos deux « anciens » Herman et Louis et en poursuivant par les membres présents et passés que j’ai eu le plaisir de côtoyer, Andréas, Anne, Christophe (M.), Leïla, Nathalie, Nédra, Maria, Martin, Mohamed et Virginie. T Il est souvent difficile de se partager entre deux équipes. La gentillesse, l’ouverture et la bonne humeur de l’ensemble des membres de l’équipe processus cognitif de Paris 8 m’a rendu les choses plus faciles. Je tiens à remercier en particulier ceux avec lesquels j’ai travaillé et dont les compétences ont constitué pour moi une aide précieuse, Elizabeth, Isabel, Jean-Marc et Sébastien, ainsi que ceux avec lesquels j’ai partagé l’aventure des congrès de l’ARC’98 et de CogSci’98, Béatrice, Christine, Denis C., Denis L., Elisabetta, Emanuel, Mojdeh, Séverine. En parlant de bonne humeur, il est impensable de ne pas mentionner les membres du personnel administratif du LIP6, Andrée, Jacqueline, Ghislaine, Valérie, ainsi que Marie-Claire, notre ingénieur système. Je remercie Denis Coulombier, Daniel Levy-Bruhl et Anne Perrocheau de m’avoir fait partager avec enthousiasme leur expérience de l’analyse de données épidémiologiques. Je remercie mes deux compères moniteurs de Créteil, Christophe et Gwenaël pour les nombreuses « poilades » que nous avons partagées. Je remercie également Danielle Beauquier, Alessandra Carbone et Michel Spyratos pour leur initiation au métier d’enseignant. Enfin, je remercie Caroline pour sa relecture du document, pour ses commentaires, et pour son soutien en général, sans lequel, tout eût été plus difficile. Table des matières 5 TABLE DES MATIERES 1 INTRODUCTION GENERALE __________________________________________ 13 2 UNE APPROCHE PLURIDISCIPLINAIRE DE LA NOTION DE PERTINENCE_ 17 2.1 Etymologie ________________________________________________________________ 18 2.2 Quelques questions__________________________________________________________ 18 2.3 Différentes approches _______________________________________________________ 20 2.3.1 Pertinence et cognition ____________________________________________________ 21 2.3.1.1 La mémoire sémantique________________________________________________ 22 2.3.1.2 L'attention __________________________________________________________ 25 2.3.2 Pertinence et sciences de l’information________________________________________ 28 2.3.2.1 En Intelligence Artificielle______________________________________________ 28 2.3.2.1.1 La sélection des attributs pertinents ____________________________________ 28 2.3.2.1.2 L’extraction de règles_______________________________________________ 33 2.3.2.1.3 La sélection des règles à appliquer _____________________________________ 36 2.3.2.1.4 Un parcours sélectif de l’espace des états d’un problème____________________ 37 2.3.2.1.5 Conclusions ______________________________________________________ 38 2.3.2.2 En Recherche d’Information ____________________________________________ 38 2.3.2.2.1 Problématique ____________________________________________________ 39 2.3.2.2.2 Des éléments pour l’évaluation de la pertinence___________________________ 40 2.3.2.2.3 Evolution de la notion de pertinence en Recherche d’Information _____________ 42 2.3.2.2.4 Solutions, tendances actuelles ________________________________________ 44 2.3.2.3 Une logique de la pertinence ____________________________________________ 44 2.3.2.3.1 La pertinence comme une relation d’implication __________________________ 44 2.3.2.3.2 L’inadéquation de l’implication matérielle_______________________________ 46 2.3.2.3.3 Vers une logique de la pertinence______________________________________ 48 2.3.3 Pertinence et communication _______________________________________________ 50 2.4 Synthèse __________________________________________________________________ 51 6 Table des matières 2.4.1 Quels points communs entre toutes ces approches ? ______________________________ 51 2.4.1.1 Les critères d’évaluation _______________________________________________ 51 2.4.1.2 L’évaluation d’une implication __________________________________________ 52 2.4.1.3 Un lien privilégié avec la notion d’interaction_______________________________ 56 2.4.1.4 Construction et exploitation d’une structure ________________________________ 57 2.4.2 La cognition située : une approche explicative __________________________________ 57 2.4.3 Les grands principes d’un système d’extraction d’informations pertinentes ____________ 59 3 SYSTEMES DE REPRESENTATION DES CONNAISSANCES POUR L'EXTRACTION D'INFORMATION PERTINENTE ____________________________ 65 3.1 Un tour d'horizon des différentes méthodes utilisées en Intelligence Artificielle et en Recherche d'Information________________________________________________________ 66 3.1.1 Le modèle de l’espace vectoriel _____________________________________________ 66 3.1.2 Réseaux neuronaux_______________________________________________________ 68 3.1.2.1 Les cartes auto-organisatrices (Self-Organising Maps) ________________________ 68 3.1.2.2 Les réseaux de Hopfield _______________________________________________ 71 3.1.2.3 Les cartes cognitives floues (Fuzzy Cognitive Maps)__________________________ 73 3.1.3 Les réseaux bayésiens_____________________________________________________ 75 3.1.4 Les systèmes à base de règles _______________________________________________ 77 3.1.4.1 Des systèmes pour la classification _______________________________________ 77 3.1.4.2 Un système plus général : CHARADE ____________________________________ 78 3.1.4.2 Les algorithmes rapides de recherche d’associations _________________________ 79 3.2 Les réseaux sémantiques _____________________________________________________ 82 3.2.1 Historique ______________________________________________________________ 82 3.2.2 Méthodes pour la construction ______________________________________________ 84 3.2.3 Méthodes pour l'exploitation________________________________________________ 87 3.2.3.1 Diverses méthodes____________________________________________________ 87 3.2.3.2 Les méthodes basées sur la propagation d’activation__________________________ 88 3.2.4 Les réseaux sémantiques flous ______________________________________________ 91 3.2.4.1 Des hiérarchies de concepts intégrant la notion d’imprécision___________________ 91 3.2.4.2 Les thésaurus flous en Recherche d’Information _____________________________ 90 Table des matières 7 4 PRESENTATION DU SYSTEME RELIEFS________________________________ 97 4.1 Evaluer la règle « SI A ALORS B » à partir d’un ensemble d’observations ____________ 98 4.1.1 Introduction ____________________________________________________________ 98 4.1.1.1 Etat de l’art _________________________________________________________ 98 4.1.1.2 Trois critères d’évaluation _____________________________________________ 100 4.1.2 Méthode ______________________________________________________________ 102 4.1.2.1 Une règle d’apprentissage incrémentale et associative _______________________ 102 4.1.2.2 Prise en compte du nombre d’observations ________________________________ 103 4.1.3 Exemple ______________________________________________________________ 105 4.2 Construction du réseau _____________________________________________________ 107 4.2.1 Introduction ___________________________________________________________ 107 4.2.1.1 Le choix de la structure des règles_______________________________________ 107 4.2.1.2 L’explosion combinatoire liée à la construction de conjonctions________________ 107 4.2.2 Méthode ______________________________________________________________ 108 4.2.2.1 Une première méthode________________________________________________ 108 4.2.2.2 Le principe d’économie_______________________________________________ 109 4.2.2.3 Implémentation du principe d’économie __________________________________ 109 4.2.3 Exemple ______________________________________________________________ 112 4.3 Construction automatique des sous-ensembles flous ______________________________ 112 4.3.1 Introduction ___________________________________________________________ 112 4.3.1.1 Le problème posé ___________________________________________________ 112 4.3.1.2 Etat de l’art ________________________________________________________ 113 4.3.2 Méthode ______________________________________________________________ 114 4.3.2.1 Principe général_____________________________________________________ 114 4.3.2.2 Résoudre le problème des données manquantes et harmoniser les fonctions d’appartenances___________________________________________________________ 115 4.3.3 Exemple ______________________________________________________________ 117 4.4 Exploitation du réseau sémantique flou ________________________________________ 119 4.4.1 Introduction ___________________________________________________________ 119 8 Table des matières 4.4.1.1 Une utilisation naturelle des méthodes de propagation d’activation _____________ 119 4.4.1.2 Considérer la spécificité ______________________________________________ 119 4.4.2 Méthode ______________________________________________________________ 120 4.4.2.1 Principe général_____________________________________________________ 120 4.4.2.2 Choix d’une mesure de spécificité_______________________________________ 122 4.4.2.3 Compléments_______________________________________________________ 123 4.4.2.3.1 Divers__________________________________________________________ 123 4.4.2.3.2 Prise en compte des relations transitives _______________________________ 123 4.4.3 Exemple ______________________________________________________________ 124 4.5 Discussion ________________________________________________________________ 126 4.5.1 Discussion générale _____________________________________________________ 126 4.5.2 Point de vue cognitif_____________________________________________________ 129 4.5.2.1 Principes liés à la règle d’apprentissage___________________________________ 129 4.5.2.2 Principes liés à la construction des catégories ______________________________ 129 4.5.2.3 La notion de filtre ___________________________________________________ 130 4.5.2.4 Principes liés à l’exploitation du réseau sémantique _________________________ 132 5 APPLICATIONS _____________________________________________________ 135 5.1 Application de RELIEFS à des données épidémiologiques _________________________ 136 5.1.1 Introduction ___________________________________________________________ 136 5.1.2 Description des données __________________________________________________ 137 5.1.3 Extraction de l’information pertinente _______________________________________ 139 5.1.4 L’intérêt des filtres pour les zones géographiques_______________________________ 142 5.1.5 Prise en compte de la relation de transitivité __________________________________ 143 5.2. Une méthode pour l’analyse de données sensorielles basée sur la notion de filtre ______ 144 5.2.1 Introduction ___________________________________________________________ 144 5.2.2 Expériences____________________________________________________________ 146 5.2.2.1 Expérience 1 _______________________________________________________ 146 5.2.2.2 Expérience 2 _______________________________________________________ 148 5.2.3 Application de la méthode de diffusion_______________________________________ 150 Table des matières 9 5.2.3.1 Construction des filtres _______________________________________________ 150 5.2.3.2 Modification des profils par diffusion ____________________________________ 150 5.2.3.1 Réévaluation des implications entre propriétés _____________________________ 153 5.3 Application à l’interprétation de commandes verbales ____________________________ 156 5.3.1 Introduction ___________________________________________________________ 156 5.3.2 Expérience ____________________________________________________________ 157 5.3.2.1 Objectifs __________________________________________________________ 157 5.3.2.1 Méthode___________________________________________________________ 157 5.3.3 Résultats et discussion ___________________________________________________ 159 5.3.3.1 Résultats empiriques _________________________________________________ 159 5.3.3.2 Précision des commandes_____________________________________________ 159 5.3.3.3 Au sujet des commandes incomplètes ____________________________________ 160 5.3.4 Un modèle de l’interprétation de commandes verbales : le système SIROCO _________ 163 5.3.4.1 Description générale _________________________________________________ 163 5.3.4.2 Analyse des différentes composantes_____________________________________ 164 5.3.4.2.1 Traitement de l’incomplétude à partir de réseaux sémantiques_______________ 164 5.3.4.2.2 Représenter une commande par des sous-ensembles flous 165 5.3.4.2.3 Appliquer des modificateurs linguistiques ______________________________ 167 5.3.4.2.4 Appliquer une relation floue_________________________________________ 168 5.3.4.2.5 L’historique de la communication ____________________________________ 169 5.3.5 Validation _____________________________________________________________ 172 5.3.5.1 Les paramètres du modèle _____________________________________________ 172 5.3.5.2 Simulation_________________________________________________________ 172 5.3.5.2.1 Description de uploads/Geographie/ thesis.pdf

  • 44
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager