E.N.S.S.I.B ECOLE NATIONALE SUPERIEURE DES SCIENCES DE L'INFORMATION ET DES BIB

E.N.S.S.I.B ECOLE NATIONALE SUPERIEURE DES SCIENCES DE L'INFORMATION ET DES BIBLIOTHEQUES UNIVERSITE CLAUDE BERNARD LYON I DESS en INFORMATIQUE DOCUMENTAIRE Rapport de recherche bibliographique Les applications de l’intelligence artificielle à l’assistance ou l’automatisation du catalogage Jérôme GUTMAN Sous la direction de Madame Danielle ROGER E.N.S.S.I.B Année 1995-1996 Les applications de l’intelligence artificielle à l’assistance ou l’automatisation du catalogage Jérôme GUTMAN RESUME Les techniques d'intelligence artificielle peuvent aider à automatiser le catalogage descriptif dans les bibliothèques et centres de documentation. Nous présentons les différentes applications concernées autour de trois catégories : les conseillers, les créateurs d'enregistrements et les systèmes totalement automatiques. DESCRIPTEURS CATALOGAGE, BASE CONNAISSANCE, DESCRIPTION BIBLIOGRAPHIQUE, INTELLIGENCE ARTIFICIELLE, SYSTEME EXPERT ABSTRACT Artificial intelligence methods can help to automate descriptive cataloguing in libraries and documentation centers. This work deals with various AI applications in three categories : advisors, record generators and automatic systems. KEYWORDS CATALOGING, KNOWLEDGE BASE, BIBLIOGRAPHIC DESCRIPTION, ARTIFICIAL INTELLIGENCE, EXPERT SYSTEM Les applications de l’intelligence artificielle à l’assistance ou l’automatisation du catalogage Table des matières Table des matieres 1ERE PARTIE : METHODE DE TRAVAIL I DESCRIPTION .......................................................................................................................1 1. Le demandeur................................................................................................................1 2. Le sujet.........................................................................................................................1 3. La démarche générale......................................................................................................2 4. Le choix des descripteurs.................................................................................................3 5. Le choix des sources........................................................................................................4 II RECHERCHES......................................................................................................................6 1. Personnes ressources (entretiens et courriers électroniques)...................................................6 1.1. Contact direct..................................................................................................................................................................6 1.2. Courriers électroniques................................................................................................................................................6 1.2.1. Adresses personnelles.........................................................................................................................................6 1.2.2. Les listes de discussion......................................................................................................................................7 1.3. Bilan...................................................................................................................................................................................9 2. Recherche à la bibliothèque de l'ENSSIB............................................................................10 2.1. L’OPAC.........................................................................................................................................................................11 2.2. Les monographies........................................................................................................................................................11 2.3. Les périodiques............................................................................................................................................................12 3. Les sources électroniques................................................................................................12 3.1. Recherches sur CD-Rom.............................................................................................................................................12 3.1.1. PASCAL...............................................................................................................................................................13 3.1.2. LISA.......................................................................................................................................................................13 3.1.3. DOCTHESES.......................................................................................................................................................14 3.2. Recherche "en-ligne"....................................................................................................................................................14 3.2.1. PANCATALOGUE...........................................................................................................................................14 3.2.2. DIALOG...............................................................................................................................................................14 3.2.2.1. Présentation des bases.............................................................................................................................15 3.2.2.2. Stratégie d’interrogation........................................................................................................................16 3.2.2.3. Résultats......................................................................................................................................................20 3.3. Internet............................................................................................................................................................................23 III ELABORATION DU RAPPORT .................................................................................................24 1. Bibliographie................................................................................................................24 1.1. Sélection et lecture des informations......................................................................................................................24 1.2. Présentation des références........................................................................................................................................25 2. Synthèse.......................................................................................................................26 2.1. Acquisition des documents.................................................................................................................................26 2.2. Plan et rédaction...........................................................................................................................................................26 3. Démarche.....................................................................................................................27 4. Outils de recherche........................................................................................................27 IV COUTS ET TEMPS DE TRAVAIL ..............................................................................................28 Les applications de l’intelligence artificielle à l’assistance ou l’automatisation du catalogage Table des matières 1. Temps passé.................................................................................................................28 2. Coût............................................................................................................................28 CONCLUSION ........................................................................................................................29 2EME PARTIE : SYNTHESE DES DOCUMENTS...............................................................30 INTRODUCTION .....................................................................................................................31 1. Présentation générale.....................................................................................................31 2. Les projets, prototypes et produits développés....................................................................33 2.1. Les conseillers..............................................................................................................................................................33 2.2. Les créateurs d'enregistrements................................................................................................................................35 2.3. Les systèmes experts automatiques.........................................................................................................................36 2.3.1. Reconnaissance de documents (OCR, SGML, ...).......................................................................................37 2.3.2. Contrôle d'autorité.............................................................................................................................................39 2.3.3. Nettoyage et dédoublonnage des catalogues.............................................................................................39 2.3.4. Etudes théoriques...............................................................................................................................................39 CONCLUSION ........................................................................................................................41 3EME PARTIE : BIBLIOGRAPHIE....................................................................................42 1. Présentation.................................................................................................................43 2. Projets, prototypes et produits développés..........................................................................52 2.1. Conseillers.....................................................................................................................................................................53 HEADS.......................................................................................................................................................................53 CATALYST...............................................................................................................................................................53 BIBLIOTHEQUE NATIONALE AMERICAINE DE MEDECINE.........................................................53 MAPPER....................................................................................................................................................................54 CONFER.....................................................................................................................................................................56 AACR2EXPERT......................................................................................................................................................56 2.2. Créateurs d'enregistrements.......................................................................................................................................57 ESSCAPE...................................................................................................................................................................57 BIBLIOTHEQUE DU CONGRES (USA)........................................................................................................58 2.3. Systèmes experts automatiques.................................................................................................................................59 2.3.1. Reconnaissance de documents (OCR, SGML, ...).......................................................................................59 OCLC...........................................................................................................................................................................59 BIBLIOTHEQUE UNIVERSITAIRE DE TUBINGEN (ZURICH)...........................................................60 MORE..........................................................................................................................................................................60 LAURA.......................................................................................................................................................................61 CAROL.......................................................................................................................................................................62 RIDDLE......................................................................................................................................................................62 GRAPHEIN...............................................................................................................................................................64 2.3.2. Contrôle d'autorité.............................................................................................................................................66 QUALCAT.................................................................................................................................................................66 2.3.3. Nettoyage et dédoublonnage des catalogues.............................................................................................66 KARIN........................................................................................................................................................................66 2.3.4. Etudes théoriques...............................................................................................................................................67 MOLTO et SVENONIUS.......................................................................................................................................68 Les applications de l’intelligence artificielle à l’assistance ou l’automatisation du catalogage Table des matières RESEAUX NEURONAUX...................................................................................................................................68 JENG............................................................................................................................................................................69 MEADOR et WITTIG.............................................................................................................................................71 ABRERA et SHAW.................................................................................................................................................72 INDEX...............................................................................................................................73 1ère partie : Méthode de travail Les applications de l’intelligence artificielle à l’assistance ou l’automatisation du catalogage Méthode de travail 1 I Description Nous présentons ici la démarche de recherche qui, de la prise de connaissance du sujet à la quête d’informations, a conduit à établir une liste de références et leur synthèse. Enfin, nous apprécierons les moyens qui ont été nécessaires, puis rendront compte de quelques remarques qui ont émergées de cette expérience. 1. Le demandeur Madame Danielle ROGER est conservateur de bibliothèque à l’ENSSIB. Elle a proposé aux étudiants du DESS "Informatique Documentaire" plusieurs sujets pour ce rapport. Je l’ai rencontré plusieurs fois lors de mon travail, au cours desquelles nous nous sommes entretenus dans l’ordre : première approche du sujet ; précisions et sources à parcourir ; interrogation DIALOG ; présentation d’une première bibliographie ; remise du rapport. 2. Le sujet Il semble que des informations sur le domaine des systèmes experts en catalogage aient été demandées à madame Roger, qui a donc présenté ce sujet pour en savoir plus. L’intitulé de départ était celui-ci : "Les applications de l’intelligence artificielle à l’assistance ou l’automatisation du catalogage" ; avec les indications suivantes : "Techniques évoluées pour l’automatisation du catalogage : utilisation d’outils linguistiques, de systèmes experts ou d’aide à la décision. A titre indicatif, parmi les applications possibles, on pourra rechercher des exemples de reconnaissance des caractères et de la structure d’une notice pour des opérations de rétroconversion, d’extraction et de traitement d’informations provenant des pages de titre, de reconnaissance de la structure de sommaires de périodiques, etc..." J’ai une formation en linguistique, avec des connaissances en informatique et sciences cognitives. J’ai choisi ce thème de travail, car il abordait des notions qui m’étaient familières : la linguistique, l’intelligence artificielle, l’informatique. La Les applications de l’intelligence artificielle à l’assistance ou l’automatisation du catalogage Méthode de travail 2 connaissance du catalogage m’a été donnée pendant cette année de cours en DESS et s’est avérée suffisante pour traiter le sujet. L’idée de départ était donc de rechercher des applications concrètes en catalogage, faisant intervenir l’intelligence artificielle. La période de recherche devait être assez récente, la date butoir de 1989 (jusqu’à aujourd’hui) a donc été choisie. 3. La démarche générale Ce rapport est le fruit de trois mois et demi de travail (30 novembre 1995 - mi-mars 1996). Le point de départ de toutes les recherches a été la définition du sujet par le demandeur, puis sa précision au fur et à mesure de l’avancée des travaux. Ceux-ci ont suivis une orientation "en entonnoir", du général au particulier : la réflexion sur les sources à consulter, vague au départ, s’est précisée lorsque de nouvelles données ont, au fil du temps, donné un sens plus précis à la démarche. Après une première rencontre avec madame Roger, une base a été élaborée sur papier quant aux produits de recherches disponibles. Une première requête sur les CD- Rom de la base PASCAL ont permis de se faire une idée plus précise, ainsi que sur DOCTHESE et LISA. Une orientation plus précise du travail est apparue. J’ai ensuite parcouru certains rayons de la bibliothèque de l’ENSSIB. Arrivé fin décembre, une partie des documents a alors pu être rassemblé puis traité aux vacances de Noël. Ce premier mois peut être donc considéré comme une approche du sujet. 30 Nov 95 mi-mars 96 CD-ROM PASCAL, LISA et DOCTHESES Bibliothèque ENSSIB Lecture des premiers documents CD-ROM PASCAL, LISA et DOCTHESES Internet DIALOG PANCATALOGUE Recueil et lecture de documents Rédaction du rapport Jan 96 Fev 96 Les applications de l’intelligence artificielle à l’assistance ou l’automatisation du catalogage Méthode de travail 3 A la rentrée 1996, une nouvelle interrogation des CD-Rom Pascal, LISA et DOCTHESES a été traitée plus en profondeur. Le reste du mois a été consacré a un bref parcours sur Internet, l’accès au PANCATALOGUE et au serveur DIALOG. Quinze jours ont suivis pour regrouper les références, puis une durée équivalente pour leur lecture, et enfin quinze derniers jours pour la rédaction du rapport. 4. Le choix des descripteurs Les descripteurs sont présentés ici selon leur forme d’entrée sur la base PASCAL1. Les premiers m’ont été fournis par madame Roger : catalogage, intelligence artificielle, système expert. Puis, plus tard, base connaissance (base de connaissance). Par la suite, d’autres mots-clés ont été trouvés dans les documents obtenus, les notices indexées des bases de données ou après réflexion sur les champs sémantiques susceptibles d’être impliqués dans ce domaine. La pertinence des descripteurs a pu être testée lors de l’interrogation des CD-Rom, en consultation gratuite à l’ENSSIB, avant de passer au serveur DIALOG, pour lequel de mauvais choix auraient ramené du bruit et donc des dépenses inutiles. En fait, seul un petit nombre a été utilisé, et ce sont les premiers "ressentis" qui se sont avérés les plus adaptés. Les mots généraux (bibliothèque, documentation, sciences de l’information, logiciel, informatique) n’ont pas été d’un grand secours, surtout dans des bases spécialisées (sciences de l’information dans LISA !). Tous les termes possibles concernant la linguistique (sémantique, morphologie, syntaxe, etc...) n’ont fait que produire du bruit. Enfin, l’équivalent du mot français catalogage s’écrit avec un u en anglais (cataloguing) et sans en américain (cataloging). J’ai commencé à utiliser ce mot avec un 1 Voir le dictionnaire des CD-Rom Pascal ou la référence suivante : INIST. - Pascal Lexique [Sciences exactes et technologies. Sciences de la vie. Lexique français-anglais-espagnol]. - Vandoeuvre-lès-Nancy, ed. INIST, 1991. - ISBN 2904975638. - ENSSIB U025.49 CEN Les applications de l’intelligence artificielle à l’assistance ou l’automatisation du catalogage Méthode de travail 4 opérateur de troncature après le g (catalog?), ce qui aurait regroupé les deux orthographes, mais l’ai abandonné d’après les conseils de madame Roger (provoquait trop de bruit : catalogne, catalogue d’oeuvres d’art, etc...). Du coup, toutes les références en anglais m’ont échappé (interrogation sans u), avant de m’en rendre compte et de refaire le travail : on ne m’y reprendra plus... ! 5. Le choix des sources La partie Recherches présente les sources qui ont été effectivement parcourues. Nous ne les aborderons donc pas ici. La liste des chemins suivis a été un assemblage des conseils du demandeur, de mes propres

  • 29
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Oct 25, 2021
  • Catégorie Administration
  • Langue French
  • Taille du fichier 0.3059MB