Détermination automatique des relations sémantiques entre les concepts d’une on

Détermination automatique des relations sémantiques entre les concepts d’une ontologie Mohamed Ben Ahmed MHIRI*, Faïez GARGOURI*, Djamal BENSLIMANE** *Laboratoire MIRACL Institut supérieur d’informatique et du multimédia de Sfax BP 3030 - 3018 Sfax TUNISIE {mohamed.mhiri, faiez.gargouri}@fsegs.rnu.tn ** Laboratoire LIRIS Université Claude Bernard Lyon 1 djamal.benslimane@liris.cnrs.fr RÉSUMÉ. Les systèmes d’information (SI) actuels sont de plus en plus complexes nécessitant un énorme travail de modélisation, utilisant une quantité énorme des données. Par conséquent, les concepteurs sont confrontés à un ensemble de problèmes liés à la méconnaissance du domaine à modéliser et à la difficulté de déterminer les concepts et leurs relations. Comme solution, nous proposons l’utilisation des ontologies comme moyen d’assistance aux concepteurs pendant leur tâche de modélisation. En effet, Le rôle principal de l’ontologie est d'avoir un consensus sur le vocabulaire à utiliser pour un domaine donné. Dans cette article, nous présentons une approche de construction des ontologies pour la conception des SI en insistant sur la détermination automatisée des différentes relations sémantiques entre les concepts composant une ontologie. ABSTRACT. The current information systems (IS) are increasingly complex requiring an enormous work of modelling, using an enormous quantity of the data. Consequently, the designers are confronted with a set of problems concerned in their ignorance of the modelled field and the difficulty with the determination of the concepts and their relations. As solution, we propose the use of ontologies like assistance to the designers during their modelling task. Indeed, the principal role of ontology is to have a consensus on the vocabulary to use for a given field. In this paper, we propose an automated approach for building IS’ ontologies by determining the various semantic relations between the concepts composing an ontology. . MOTS-CLÉS : conception des systèmes d’information, ontologie, représentation conceptuelle, relations sémantiques. KEYWORDS: Information systems design, ontology, conceptual representation, semantic relationships. 1. Introduction De nos jours, les systèmes d'information (SI) sont de plus en plus complexes, nécessitant un énorme travail de modélisation. Les concepteurs sont souvent confrontés à un ensemble de difficultés liées à la méconnaissance du champ d¶étude et à la multitude des concepts utilisés. Ces problèmes sont principalement dus au manque d'un consensus sur les vocabulaires utilisés pour un champ d¶étude donné. En conséquence, les concepteurs peuvent, dans certains cas, commettre des erreurs syntaxiques, structurelles et/ou sémantiques. Ces erreurs auront des conséquences sur la cohérence des représentations conceptuelles (RC) résultats. '¶un autre côté, la tâche d¶analyse des besoins devient aussi très fastidieuse en raison, en particulier, de la nouvelle orientation des applications actuelles, utilisant massivement les nouvelles technologies (e-commerce, entrepôt de données...). Ces applications se basent sur une énorme quantité de concepts provenant de sources hétérogènes. Une telle hétérogénéité entraîne souvent des ambiguïtés sémantiques au niveau des RC résultats. Les AGL actuels ne permettent pas la détection ni la résolution de toutes les ambiguïtés énoncées. En effet, en raison de leur aspect sémantique et du fait que les AGL ne disposent pas d¶informations précises sur le domaine d¶étude, ces erreurs ne sont pas détectables. Les AGL se limitent actuellement à la vérification de certaines erreurs syntaxiques relatives aux spécificités des diagrammes utilisés. Par exemple, ils peuvent vérifier que le nom d’une classe soit unique dans un diagramme donné. Paradoxalement, dans une RC donnée, un concepteur peut indiquer qu’une voiture hérite d’une personne, sans que cette erreur ne soit détectée. Cette limitation est due au manque de sémantique liée aux divers termes utilisés dans la RC. Un travail préliminaire doit donc être ainsi effectué pour représenter la sémantique explicite d¶un domaine de discours. Plusieurs approches (mots-clés, dictionnaires, taxonomies) ont été proposées, dans la littérature, pour la représentation des connaissances durant le processus de modélisation d¶un domaine donné. Cependant, elles ne permettent pas de représenter toutes les relations sémantiques et conceptuelles entre les concepts. Comme solution, nous proposons l'utilisation des ontologies comme moyen d¶assistance aux concepteurs pendant leur tâche de modélisation. Le rôle principal de l¶ontologie est d'avoir un consensus sur le vocabulaire à utiliser pour un domaine donné. En effet, une ontologie vise à représenter, d'une manière générique et réutilisable, la sémantique d'un domaine donné (Guarino et al, 1995). Cette ontologie permet la compréhension du domaine à modéliser, fournir les concepts caractérisant ce domaine et vérifier la sémantique des RC. Le cadre général de ces travaux de recherche, qui couplent deux domaines: la conception des SI et les ontologies, concerne la proposition d¶une approche de construction automatisée des ontologies pour la conception des SI. L¶ontologie permet la détermination et la représentation des concepts d¶un domaine donné ainsi que leurs relations conceptuelles et sémantiques. Cela nécessite évidemment O¶utilisation d¶un langage de représentation des ontologies dédié pour la conception des SI, que nous avons appelé UMLOnto. Dans ce papier, nous nous limitons à la présentation de la détermination automatique des relations sémantiques entre concepts d¶une ontologie. Cet article est organisé comme suit. La section 2 décrit brièvement notre démarche pour la construction d¶une ontologie dédiée à la modélisation des SI. La section 3 présente la démarche de détermination automatique des relations sémantiques entre les concepts de l¶ontologie. La section 4 présente notre prototype, intitulé OntoBuilder de construction automatique d¶ontologies dédiées aux SI en illustrant ses principales fonctionnalités. L¶automatisation concerne la détermination des relations sémantiques en utilisation leur formalisation en langage Z. La section 5 conclut ce travail et présente ses perspectives. 2. approche proposée pour la construction de l’ontologie De nombreux travaux ont été proposés pour la construction des ontologies pour un domaine donné. Nous pouvons citer comme exemple, les travaux de (Assadi et al, 2000) qui propose une démarche de construction d¶une ontologie µ¶texte¶¶ pour transformer une spécification en langage naturel en un langage formel tout en choisissant un contexte de référence, en structurant et en organisant les concepts. '¶un autre côté, il existe d¶après (Benslimane et al, 2003), deux approches pour la construction d¶une ontologie. Elle peut débuter soit à partir de zéro ou à partir des bases des données déjà existantes. Ces dernières permettent de capturer une certaine réalité des concepts et d¶expliciter le contenu des sources d¶information. Autrement dit, une ontologie représente un contexte de référence entre les systèmes coopératifs. Par contre selon (Bachimont et al, 2005), les ontologies sont des systèmes conceptuels, comprenant les concepts d¶un domaine et les relations les mettant en jeu dans ce domaine. Pour cela, les ontologies peuvent se fonder sur une terminologie structurée, à formaliser et à traduire dans un langage interprétable par un ordinateur. Une analyse des travaux de (Gandon et al, 2001) (Leclère et al, 2002) sur les ontologies nous a permis de dégager un consensus sur le processus de conception G¶une ontologie exploitable dans un système à base de connaissances. La figure1 illustre ce consensus qui repose sur un enchaînement de trois étapes permettant de passer des données brutes à l¶ontologie opérationnelle. Figure 1. Processus général de construction d’une ontologie Données Brutes Modèle Conceptuel Ontologie Représentation Formelle Conceptualisation Ontologisation Opérationalisation Informelle e Semi-formelle Formelle Pour construire une ontologie, il faut tout d¶abord recueillir son corpus. La nature du corpus dépend du domaine d¶application de l¶ontologie. En effet, un corpus peut être sous forme de documents textuels, des interviews, des représentations conceptuelles, de sites Web, etc., ... Une fois le corpus est prêt, la première étape de construction de l¶ontologie peut être déclanchée. /¶étape de conceptualisation consiste à identifier et à extraire les connaissances contenues dans un domaine particulier (Leclère et al, 2002). Ces connaissances sont représentées par des concepts et des relations entre ces concepts. Les différentes tâches (non nécessairement ordonnées) relevant de cette étape sont: - l¶identification du vocabulaire conceptuel ; cette activité peut être effectuée à O¶aide d¶outils d¶extraction automatique de termes et de liens entre termes dans des corpus; ± l¶association des différents termes synonymiques se rapportant à chaque élément du vocabulaire conceptuel; ± l¶association des données d¶origine (document, image, interview, etc.) aux éléments qu¶elles illustrent; ± la rédaction d¶annotations fournissant de manière la moins ambiguë possible, ± la sémantique des différents éléments du vocabulaire, ± l¶explicitation des connaissances implicites des éléments du vocabulaire. Dans notre cas, les données brutes sont sous forme de représentations conceptuelles (RC) exprimées avec des diagrammes de classes UML, que nous supposons validés par leurs concepteurs. Nous sous-entendons par validation, les classes et leurs liens conceptuels sont conformes aux spécifications des utilisateurs. Cependant, nous pouvons avoir des erreurs conceptuelles dues à la méconnaissance du domaine et utilisant des termes non conformes au domaine. Une étude approfondie est réalisée sur ces diagrammes afin de cerner la sémantique véhiculée à travers les différents concepts utilisés et les relations existantes entre ces classes. /¶étape d’ontologisation consiste à modéliser, dans un langage générique, les propriétés formelles du domaine considéré (Leclère et al, 2002). (Gruber, 1993) propose cinq critères permettant de guider le processus d¶ontologisation : ± la clarté et l¶objectivité des définitions, qui doivent être indépendantes de tout choix d¶implémentation ; ± la cohérence (consistance logique) des axiomes ; ± l¶extensibilité d¶une ontologie, c¶est-à-dire la possibilité de l¶étendre sans modification ; ± la minimalité des postulats d¶encodage, ce qui assure une bonne portabilité uploads/Philosophie/ a603c1nbocnlucbz6-pdf.pdf

  • 26
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager