1 L’ingénierie des connaissances ? Une introduction A Mille 2012 IC A Mille 201

1 L’ingénierie des connaissances ? Une introduction A Mille 2012 IC A Mille 2012 2 Plan Méthodes et outils de l’objectif historique : faciliter la réalisation de SBC Focus sur l’élicitation ontologique, avec l’objectif de « gestion des connaissances » IC A Mille 2012 3 Objectif historique : faciliter la construction des Systèmes à Base de Connaissances ? Le « monde » à modéliser Le SBC « représentant le « monde » IC A Mille 2012 4 Première étape : les langages de représentation des connaissances Idée : Se rapprocher du niveau d’abstraction supposé des experts  modèle cognitif humain sous-jacent et donc : Concevoir des langages facilitant le « codage » de la représentation des connaissances conforme au modèle cognitif LISP ( approche résolution de problème -> expression simple de processus récursifs) Prolog = langage de prédicats + moteur d’inférence Smalltalk ( représentation objets « réactifs » aux messages, réflexivité, auto-représentation) Yafool, KL, … schémas  langages de « frames » IC A Mille 2012 5 La question de la validation d’un SBC Retour vers l’expert Tests sur un jeu de problèmes Confronter Experts / SBC Savoir résoudre le plus grand nombre de problèmes / savoir résoudre les problèmes les plus difficiles Évaluer le « raisonnement » suivi IC A Mille 2012 6 Evaluation de MYCIN 10 cas 8 experts + Mycin + solution du cas telle qu’elle a été appliquée (10 prescripteurs) Chaque expert évalue toutes les prescriptions Note/80 Le collège évalue toutes les prescriptions  Note/8 Le collège signale les solutions « inadmissibles » Mycin : meilleurs résultats des 10 prescripteurs Et pourtant MYCIN n’a jamais pu être implémenté de manière opérationnelle : POURQUOI ? IC A Mille 2012 7 Une règle MYCIN IC A Mille 2012 8 Dépasser les problèmes de MYCIN Stratégie de résolution implicite Capacités auto-explicatives pauvres Grande distance entre la pratique des experts et l’expression sous forme de règles liées à l’approche logique Dégradation forte aux limites du domaine couvert Connaissances de surface essentiellement Pas de généricité des systèmes construits Pas de modélisation « lisible » du domaine couvert IC A Mille 2012 9 => Mieux modéliser le raisonnement ? Neo Mycin : métarègles / stratégie Connaissances stratégiques : comment effectuer une tâche ? Connaissances du domaine : qu’est-ce qui est « vrai » dans le domaine et dans le contexte de la tâche considérée  Notion de Modèle Conceptuel = Connaissances stratégiques associées aux connaissances du domaine IC A Mille 2012 10 Le virage des années 1980 : l’appel d’Alan Newell pour travailler « au niveau connaissance » Le « monde » à modéliser Modélisation intermédiaire de représentation appropriée par l’expert Le SBC « représentant le « monde » ? ? IC A Mille 2012 11 Qu’est-ce que la modélisation « au niveau connaissance » ? Conceptualisation du domaine et des interactions Niveau adapté pour la « spécification » d’un SBC donc : Existence d’un langage partagé par l’expert et le « cogniticien », Langage capable d’exprimer la sémantique des « connaissances » mais nécessitant le passage à … … un langage exploitable également par « l’artefact » (calculs en accord avec l’interprétation intentionnelle des experts). IC A Mille 2012 12 Modélisation au niveau connaissances Acquisition de connaissance et compréhension des méthodes de résolution à utiliser Recueil, Analyse  modèle spécifique Modèle d’expertise = étape dans le développement de SBC Modélisation indépendante des structures de représentation et des algorithmes Langage intermédiaire non orienté implémentation, semi- formel Acquisition des connaissances guidée par la réutilisation de modèles et/ou de composants génériques IC A Mille 2012 13 Acquisition de connaissances conduite par les modèles Acquisition / données Construction du schéma MC Instanciation du schéma MC Conception du SBC Expertise partielle SBC Schéma du MC MC « complet » IC A Mille 2012 14 Acquérir les connaissances ? Techniques de recueil des « données » pour construire une description de l’expertise Méthodes informelles : interviews, résolutions à « haute voix », observations, enregistrements, recueil de documents, examen de bases de données, etc… Méthodes formelles : grilles, questionnaires etc… Méthodes statistiques : fouille de données, analyse de données, etc… IC A Mille 2012 15 Modélisation conceptuelle Doit permettre : D’exprimer comment va être effectuée une tâche. Utilise les connaissances du domaine. D’exprimer les connaissances du domaine  concepts manipulé + relations / tâche dans le domaine considéré IC A Mille 2012 16 Exemple de Kads Comportements de résolution de problème Modèle conceptuel Transformation Modèle de conception Système à base de connaissances Cadre d’interprétation = vocabulaire, composants génériques Techniques IA, Méthodes Représentation IC A Mille 2012 17 Kads : les quatre couches du modèle d’expertise Le niveau Stratégie / Plans, métarègles Contrôle Le Niveau Tâche / Buts, description de tâches Exploite Le Niveau Inférence / Sources de connaissances, Métaclasses Décrit Le Niveau Domaine / Concepts et relations IC A Mille 2012 18 KADS : modèle d’expertise IC A Mille 2012 19 Kads : Structure d’inférence du diagnostic Descriptions des symptômes Sélectionner Modèle du système Décomposer Hypothèses Observations Décomposer Spécifier Valeur variable Norme Comparer Différence IC A Mille 2012 20 La structure de tâche de diagnostic systématique TASK SYSTEMATIC DIAGNOSIS Goal : Trouver le plus petit composant démontrant un comportement incohérent. Control Terms : differential = ensemble des hypothèses actives en cours inconsistent_subsystem = subpart …. Task-structure : Systematic_diagnosis (symptoms-> inconsistent_sub_system) = Select (symptoms->system_model) generate_hypothesis (system_model -> differential) REPEAT test_hypothesis (differential-> inconsistent_subsystem) generate_hypothesis (inconsistent_subsystem-> differential) UNTIL differential est vide IC A Mille 2012 21 Les sous-tâches de génération et de test d’hypothèse TASK GENERATE_HYPOTHESIS Goal : générer un nouvel ensemble d’hypothèses par décomposition du système Task_structure : Generate(system_model -> differential) = decompose (system_model -> differential) TASK TEST_HYPOTHESIS Goal : tester si une hypothèse de differential est contredite par une observation Task_structure : test (differential -> hypothesis) = DO for EACH hypothesis in differential specify (hypothesis -> norme) select (hypothesis -> observable) OBTAIN (observable -> variable value) compare (norm + variable value -> difference) UNTIL difference = true IC A Mille 2012 22 KADS : bibliothèque de modèles d’interprétation IC A Mille 2012 23 Kads : bibliothèque de composants réutilisables Modèles et guides modélisation Livre CommonKads, chapitre 6 INRIA -> webCOKACE Méthodes de résolution de problèmes Inventaire de méthodes de résolution, d’opérateurs et de rôles dans une méthode dans le livre CommonKads, chapitre 13 Modèles de méthode Voir http://www.commonkads.uva.nl/ IC A Mille 2012 24 Gestion de connaissances : gérer des abstractions partageables Lexiques Thésaurus Ontologies Modèles du domaine Modèles de cas Décomposition en tâches récurrentes Méthodes de résolution de problème Tâches applicatives abstraites IC A Mille 2012 25 Focus sur la démarche de construction d’ontologies Nombreuses « ontologies » pour un système du monde Impossibilité de délivrer une ontologie universelle fusionnant les différents points de vue Une ontologie porte la trace des tâches pour lesquelles elles ont été construites et du raisonnement sous-jacent pour cette tâche IC A Mille 2012 26 Exemple IC A Mille 2012 27 Différentes classes d’ontologie Ontologies de « représentation » Primitives de représentation ( par exemple ONTOLINGUA ) Ontologies génériques (« haut » réutilisable) Ontologies d’un domaine Ontologie d’une méthode de résolution de problème (ou de tâche) Ontologie d’application = spécialisation d’une ontologie de domaine + ontologie de méthode IC A Mille 2012 28 Ontologie pour représenter les connaissances => ajouter la sémantique Il s’agit de définir sans ambiguïté les fonctions et les relations qui correspondent à la représentation proposée -> quels calculs/inférences peuvent être faits à partir de l’énoncé d’une fonction/relation ontologique Ontologie  graphe conceptuel par exemple. ENGAGEMENT ONTOLOGIQUE ? IC A Mille 2012 29 Exemple IC A Mille 2012 30 Exemple IC A Mille 2012 31 Méthodologie pour construire une ontologie (Bachimont) Hypothèse : domaines se formalisant peu et dont l’accès se fait par la langue naturelle (documents) Existence de corpus et d’outils terminologiques pour modéliser le modèle IC A Mille 2012 32 Méthode Analyser le corpus Extraire des candidats-termes, des relations, des verbalisations -> base de connaissances terminologique Normalisation sémantique en fonction de la tâche -> arbre de concepts (sorte-de) -> engagement ontologique -> treillis formel -> opérationalisation dans un langage de représentation (graphes conceptuels, owl, …) IC A Mille 2012 33 Utiliser des principes différentiels pour faciliter l’engagement ontologique Principe 1 de communauté avec le « père » Principe 2 de différence avec le « père » Principe 3 de différence avec les « frères » Principe 4 de communauté avec les frères IC A Mille 2012 34 Pour en savoir plus… Une liste étonnante de liens vers des documents, des systèmes, des groupes de recherche (anglo- saxon)… http://www.cs.utexas.edu/users/mfkb/related.html LE site français sur le sujet de l’ingénierie des connaissances http://www.irit.fr/GRACQ/index-bib.html Une série de cours d’initiation sur le sujet (et sur quelques autres par un collègue de Nice) http://www.irit.fr/GRACQ/COURS/CoursFabienGand on.htm IC A Mille 2012 35 …………………………………. …………… Modèle du système Décomposer …………… ……………… ……………. ………… Valeur variable Norme Comparer ………….. uploads/Philosophie/ ic-am-2012.pdf

  • 19
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager