LES ONTOLOGIES Antécédents, aspects techniques et limites Jacques Chaumier A.D.

LES ONTOLOGIES Antécédents, aspects techniques et limites Jacques Chaumier A.D.B.S. | « Documentaliste-Sciences de l'Information » 2007/1 Vol. 44 | pages 81 à 83 ISSN 0012-4508 DOI 10.3917/docsi.441.0081 Article disponible en ligne à l'adresse : -------------------------------------------------------------------------------------------------------------------- https://www.cairn.info/revue-documentaliste-sciences-de-l- information-2007-1-page-81.htm -------------------------------------------------------------------------------------------------------------------- Distribution électronique Cairn.info pour A.D.B.S.. © A.D.B.S.. Tous droits réservés pour tous pays. La reproduction ou représentation de cet article, notamment par photocopie, n'est autorisée que dans les limites des conditions générales d'utilisation du site ou, le cas échéant, des conditions générales de la licence souscrite par votre établissement. Toute autre reproduction ou représentation, en tout ou partie, sous quelque forme et de quelque manière que ce soit, est interdite sauf accord préalable et écrit de l'éditeur, en dehors des cas prévus par la législation en vigueur en France. Il est précisé que son stockage dans une base de données est également interdit. Powered by TCPDF (www.tcpdf.org) © A.D.B.S. | Téléchargé le 30/10/2021 sur www.cairn.info (IP: 129.45.63.104) © A.D.B.S. | Téléchargé le 30/10/2021 sur www.cairn.info (IP: 129.45.63.104) Documentaliste - Sciences de l’information 2007, vol. 44, n° 1 • 81 Définition et structure Historiquement, l’ontologie est une discipline de la philosophie qui a pour objet l’étude systématique de la nature et de l’organisation de l’être. Apparu dans son acception informationnelle il y a une dizaine d’années, dans le domaine de l’ingénierie des connaissances et de l’intelligence artificielle, ce terme désigne les « artefacts » élaborés dans le cadre d’une modélisation conceptuelle apte à jouer un rôle de référentiel conceptuel. Les travaux sur les ontologies se sont plus particulièrement dévelop- pés dans un contexte informatique et ont pris leur essor avec le web sémantique6. Une ontologie fournit le vocabulaire spécifique à un domaine de la connaissance et, selon un degré de formalisation variable, fixe le sens des concepts et des relations qui les unissent. L ’article publié en 1996 par M. Uschold et M. Gruninger7 reste à notre sens le texte fondateur sur les ontologies. On y trouve cette définition : « Il s’agit du terme utilisé se référant à la compréhen- sion partagée [a shared understanding] d’un domaine d’intérêt qui peut être utilisé comme cadre unificateur pour résoudre les problèmes de communication entre les gens et d’interopérabilité entre les systèmes. » Les composantes d’une ontologie sont les sui- vantes : une ou plusieurs taxinomies ordonnées en classes et sous-classes composées d’instances repré- sentant les individus ou objets; les types d’attributs ou propriétés qui peuvent être attachés à ces objets; les types de relations entre les concepts d’une taxi- nomie; des axiomes ou des règles d’inférence per- D epuis plus de cent ans, tout au long de l’évo- lution des systèmes d’information, on s’est ingénié à concevoir des outils de description du contenu des documents à des fins de recherche documentaire. Ces outils ont pris de nombreuses formes, évoquées à plusieurs reprises dans ce numéro : taxinomies, classifications, thésaurus. Les systèmes de gestion de connaissances, qui se sont développés après les systèmes de gestion documentaire, ont apporté de nouveaux outils (et de nouvelles dénominations). Les réseaux séman- tiques sont de ceux-là, et les plus usités. Ils propo- sent une mise en œuvre des relations de sens entre des catégories de termes par l’expression des liens sémantiques décrivant les composants de la connaissance. Dans ces réseaux, les nœuds sont des concepts et les arcs des relations entre ces concepts. Au début des années soixante, déjà, on avait vu apparaître nombre de langages documentaires dont l’ambition était un développement de la syntaxe avec une grammaire s’ajoutant à la partie morpho- logique du langage. Le SYNTOL de Jean-Claude Gardin1, l’Analyse codée de Robert Pagès2, le Semantic Code de Kent et Perry3 en faisaient par- tie. En 1966, Maurice Coyaud en citait une dizaine4. Aucun de ces langages n’a survécu. La nécessité d’un enrichissement des langages purement morphologiques reste cependant un élé- ment essentiel dans le développement des systèmes de connaissance. Ce qu’ont bien relevé Bachimont et Malaisé5 : « L ’inconvénient principal des langages documentaires à mots clés reste l’impossibilité de pré- ciser la sémantique de l’association des mots de la requête, dès qu’il s’agit de dépasser les opérateurs boo- léens classiques. » Cet inconvénient avait déjà été perçu par Jean- Claude Gardin et était à l’origine du SYNTOL, « un langage artificiel […] conçu pour l’expression des informations trouvées dans les documents scientifiques […], comportant un ensemble de règles d’ordre à la fois logique et linguistique, visant différentes manières d’exprimer les informations trouvées dans la docu- mentation scientifique. » L ’extraordinaire développement du Web a encore accru le besoin d’outils de description des contenus des documents ou des ressources. La fin des années quatre-vingt-dix a ainsi vu apparaître une nouvelle famille d’outils linguistiques : les ontologies. LES ONTOLOGIES ANTÉCÉDENTS, ASPECTS TECHNIQUES ET LIMITES 1 René-Charles Cros, Jean-Claude Gardin, Francis Lévy. L'automatisation des recherches documentaires. Un modèle général : le SYNTOL. Paris : Gauthier-Villars, 1964. 2 André Demailly. « Robert Pagès et l'analyse codée ». Documentaliste - Sciences de l’information, 1992, vol. 29, n° 2, p. 59-64. 3 James Whitney Perry, Allen Kent, Madeline M. Berry. Machine literature searching. New York : Interscience Publishers, 1956. 4 Maurice Coyaud. Introduction à l'étude des langages documentaires. Paris : Klincksieck, 1966. 5 Bruno Bachimont, Véronique Malaisé, Pierre Zweigenbaum. « Vers une combinaison de méthodologies pour la structuration de termes en corpus : premier pas vers des ontologies dédiées à l’indexation de documents audiovisuels ». In : L'organisation des connaissances : approches conceptuelles, conférence ISKO France, Grenoble, 3-4 juillet 2003. Paris : L’Harmattan, 2005. 6 Voir les propos de Bruno Menon sur ce sujet, pages 23-26. Normes, standards et interopérabilité © A.D.B.S. | Téléchargé le 30/10/2021 sur www.cairn.info (IP: 129.45.63.104) © A.D.B.S. | Téléchargé le 30/10/2021 sur www.cairn.info (IP: 129.45.63.104) APPLICATION 82 • Documentaliste - Sciences de l’information 2007, vol. 44, n° 1 of, range ou domain. Dans le cadre du web séman- tique, le W3C travaille sur le langage OWL (Onto- logy Web Language) et l’ISO, de son côté, propose TOPIC Maps. Issu de DAML+OIL, lui-même né du rappro- chement du langage OIL (Ontology Interchange Language), créé dans le cadre du projet européen Ontoknowledge, et de DAML (Darpa Agent Mark- up Language), projet de la Défense américaine, le langage OWL se décline en plusieurs niveaux : OWL-Lite, OWL-DL et OWL-FULL, qui s’emboî- tent les uns dans les autres. La construction des ontologies se fonde sur des schémas proches de ceux de la construction des thésaurus. Ainsi, selon Bruno Bachimont12, les étapes de la construction d’une ontologie sont les suivantes : normalisation des termes d’un corpus, conduisant à la création d’une « ontologie différen- tielle »; puis phase de formalisation pour la création d’une « ontologie formelle »; enfin traduction en langage interprétable par la machine pour une « ontologie computationnelle ». Encore plus proches de la construction des thé- saurus sont les phases de construction des ontolo- gies proposées par Jean-Marie Pinon13 : construc- tion d’un corpus de documents; analyse linguistique du corpus (acquisition et validation des termes); normalisation sémantique et défini- tion des relations; et élaboration de l’ontologie opé- rationnelle. Outils de développement Les outils informatiques – éditeurs ou outils de développement d’ontologies – sont relativement nombreux mais tous ou presque sont issus d’insti- tuts de recherche ou de laboratoires d’universités. Aucun de ces outils n’est encore parvenu au stade de développement industriel et de la commerciali- sation. Parmi les plus connus, on peut citer ONTOEDIT (Ontology Editor), Protege 2000 du Stanford Research Institute, ONTOLINGUA, OILED de l’Université de Manchester, WEBODE du Laboratoire d’intelligence artificielle de Madrid, Dif- ferential Ontology Editor (DOE) de l’Institut natio- nal de l’audiovisuel. Ces outils utilisent des extracteurs de termino- logie (à partir d’un corpus spécifique) qui sont eux- mêmes des produits universitaires comme NOMINO, TERMINO ou LEXTER. Selon Gilles Balmisse, de Knowledge Consult, « les outils permettant de créer ou de gérer les ontolo- gies ne sont pas encore assez matures pour permettre l’"industrialisation" de l’utilisation des ontologies dans les entreprises. Ils ne sont pas d’accès facile et il n’existe pas encore de véritables standards. » Mais, comme le souligne Frédéric Fürst14 « la définition d’une métho- dologie unifiée de construction et de validation des ontologies est nécessaire, en particulier pour faciliter la fusion des ontologies. Cette unification doit porter mettant de définir les propriétés de ces relations. Le développement des ontologies s’est fait paral- lèlement à celui de la notion de métadonnée. Pour être susceptibles d’être exploitées automatiquement, les métadonnées doivent être entièrement explicites et exprimées dans un vocabulaire clairement et for- mellement défini. Les ontologies sont le réceptacle de ces définitions. On y représente les « valeurs » que l’on peut donner aux métadonnées et l’inter- prétation que les systèmes peuvent en faire, c’est-à- dire les concepts d’un domaine, les relations qu’ils entretiennent, la sémantique de ces relations et les règles de raisonnement qui leur sont applicables. Formalisation et construction Mais avant de considérer l’expression des rela- tions dans les ontologies, en particulier avec le lan- gage OWL, il n’est peut-être pas inutile de rappeler que, dans le cadre des uploads/Philosophie/ lesontologies-jacquechaumier2007.pdf

  • 35
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager