Mémoire de fin d'étude / décembre 2014 Diplôme de Conservateur des Bibliothèque

Mémoire de fin d'étude / décembre 2014 Diplôme de Conservateur des Bibliothèques Faire parler les données des bibliothèques : du Big Data à la visualisation de données Raphaëlle Lapôtre Sous la direction de Julien Velcin Maître de Conférence en informatique – Université Lumière Lyon 2 Remerciements Mes remerciements vont en premier lieu à mon directeur de mémoire, Julien Velcin pour sa patience, son dévouement et sa compréhension : ce travail est largement redevable tant aux précieux conseils qu'il m'a prodigués qu'à la liberté d'actions qu'il m'a laissée tout au long de sa rédaction. Ils s'adressent ensuite à Bertrand Calenge, qui a bien voulu faire confiance à ce projet pourtant complexe et qui l'a accompagné de sa bienveillance tout au long de son élaboration. Je remercie également Véronique Poirier, Jean-Pierre Berthon, Valérie Bouissou et Denis Cordazzo pour l'enthousiasme qu'ils avaient manifesté lors de mes premières et modestes expériences avec les données de la Bibliothèque Publique d'Information. Enfin, un grand merci à Florent Derex, Dominique et Didier Lapôtre, Morgane Spinec, Louise Daguet et Marc Bruchet qui ont supporté quotidiennement mes états d'âmes et mes doutes depuis le premier jour de cette entreprise. Lapôtre Raphaëlle | DCB | Mémoire | décembre 2014 - 3 - Droits d’auteur réservés. OU Résumé : Cette étude se penche sur les enjeux de la réutilisation des données des bibliothèques à l'ère du Big Data. En ce qui concerne la production de connaissances sur le monde des bibliothèques et de l'information, les technologies d'analyse du Big Data, contrairement à ce que prétendent les discours qui peuvent parfois les accompagner, ne réduisent pas les biais et présupposés inhérents aux statistiques traditionnelles. Cependant, la visualisation de données, telle que revue et critiquée par les Humanités Numériques, pourrait permettre de prendre en compte d'une manière beaucoup plus centrale la nature fondamentalement politique des bibliothèques. Regardant le pilotage des établissements documentaires, certains auteurs appellent à fonder les décisions non sur les données et chiffres mais sur l'analyse de données. De fait, l'ouverture de la profession de bibliothécaire sur la science des données pourrait être un bon moyen de faire évoluer les méthodes d'évaluation et de pilotage. La visualisation est un moyen ludique d'apprendre l'analyse de donnée et permet de communiquer efficacement sur l'activité de l'établissement. En dernier lieu, les discours actuels accompagnant l'ère du numérique font l'apologie d'un accès individualisé et fragmenté à l'information qui permettrait de se passer des biais inhérents à toute classification universelle. Néanmoins, ces biais sont transposé dans les algorithmes de recherche de l'information. Dès lors, il devient nécessaire de penser un système de navigation qui exprime ce biais et le soumette davantage à une discussion : transformer un catalogue de bibliothèque en data game pourrait être une solution pour exprimer de manière ludique la métaphore sous-jacente à toute organisation des connaissances. Descripteurs : Big Data, visualisation, interface de navigation, classification, métaphore, évaluation, communication, Patron-Driven Acquisition. Abstract : This work is about the issues raised by the re-use of library data at the age of Big Data. Regarding the production of knowledge about libraries and their users, the new analysis technologies are not reducing inherent bias of traditional statistics. Nevertheless, data visualization as considered by the Digital Humanities is a very interesting tool, because it make the human subjectivity implied by such technologie a central element through which we can consider the library more as a political object. LAPOTRE Raphaëlle | DCB | Mémoire d'étude | décembre 2014 4 As for library management, authors are calling for analysis-driven rather than data-driven decisions. Thus, training librarians in data analysis could be a good solution, in the context of open data and open research data. Data visualization is a funny way to learn data analysis and is a very effective way of communicating about the library activities. Lastly, if it can be read that access to information at the digital age is now more individual and can allow to circumvent the bias of traditional classification, we claim that those bias are transposed in the algorithms that allow this access today. Thus, it is important to consider a way of navigating into the information that make obvious and submit for discussion those bias. In this respect, a library catalog conceived as a data game is a metaphoric and funny way to explore library collections while not taking too seriously such an knowledge organisation. Keywords : Big Data, library data, data visualization, Patron Driven Acquisition, Evaluation, Communication, browsing interface, metaphore, classification. Droits d’auteurs Droits d’auteur réservés. Toute reproduction sans accord exprès de l’auteur à des fins autres que strictement personnelles est prohibée. OU Cette création est mise à disposition selon le Contrat : Paternité-Pas d'Utilisation Commerciale-Pas de Modification 2.0 France disponible en ligne http://creativecommons.org/licenses/by-nc-nd/2.0/fr/ ou par courrier postal à Creative Commons, 171 Second Street, Suite 300, San Francisco, California 94105, USA. LAPOTRE Raphaëlle | DCB | Mémoire d'étude | décembre 2014 - 5 - Droits d’auteur réservés. OU Sommaire SIGLES ET ABRÉVIATIONS....................................................................................9 INTRODUCTION........................................................................................................11 LES DONNÉES, UNE RÉVOLUTION ÉPISTÉMOLOGIQUE POUR LES BIBLIOTHÈQUES ?...................................................................................................19 Les données parlent-elles d'elles-mêmes ?..........................................................19 Des études de publics aux acteurs du Big Data.................................................19 La prétention à l'objectivité.................................................................................21 Les algorithmes au regard critique de la sociologie.........................................24 L'exemple de l'Online Computer Library Center (OCLC)............................27 Une section consacrée à l'extraction et à l'analyse de données.......................27 L'algorithme « Work-Set FRBR »........................................................................28 Une des publications de l'OCLC : « Livres sans frontières »...........................31 Une manière innovante de produire des connaissances sur les bibliothèques : la visualisation de données........................................................32 La visualisation au regard critique des humanités numériques.......................32 Un changement épistémologique.........................................................................33 L'exemple de l'Observatoire Bibliothèque..........................................................34 Conclusion : De la connaissance à la décision...................................................38 LES DONNÉES, UN ATOUT POUR LA GESTION D'UNE BIBLIOTHÈQUE ?.....................................................................................................41 S'appuyer sur l'analyse de données pour évaluer la bibliothèque.................41 De la macro- à la micro-évaluation....................................................................42 Quelques exemples innovants d'analyse des données en bibliothèque............45 Penser les données des bibliothèques non comme des indicateurs mais comme des symboles de son activité.................................................................................47 DST4L : un exemple de formation spécialement conçue pour des bibliothécaires..........................................................................................................49 Contexte et objectifs de la formation...................................................................49 « Comment dompter les données bibliographiques » ?.....................................51 L'apport de la visualisation pour la communication........................................53 Séduire...................................................................................................................54 Illustrer..................................................................................................................55 Synthétiser.............................................................................................................56 Comparer...............................................................................................................58 De la politique documentaire à la navigation dans les collections.................60 LES DONNÉES, UN OUTIL DE NAVIGATION DANS LES COLLECTIONS ?.......................................................................................................63 De la classification à la navigation.......................................................................64 « De l'Arbre au Labyrinthe »...............................................................................65 De l'universalité de la classification à l'individualité de la navigation..........67 La Classification Décimale Universelle (CDU) à la recherche d'une métaphore visuelle..................................................................................................69 La nécessité d'une métaphore..............................................................................70 De l'arbre... à la galaxie.......................................................................................71 Rendre visible la bibliothèque sur Internet.......................................................76 Les bibliothèques dans l'économie de l'attention...............................................76 Lapôtre Raphaëlle | DCB | Mémoire | décembre 2014 - 7 - Droits d’auteur réservés. OU De la monumentalité au geste visuel...................................................................77 Un data game stellaire ?......................................................................................79 Nouveau modèle de bibliothèque ou renouvellement d'un modèle de bibliothèque ?...........................................................................................................81 CONCLUSION : DONNÉES ET POLITIQUE......................................................83 BIBLIOGRAPHIE.......................................................................................................87 Articles encyclopédiques........................................................................................87 Mémoires..................................................................................................................88 Monographies..........................................................................................................88 Revues........................................................................................................................91 Sites Internet............................................................................................................92 Vidéographies..........................................................................................................96 TABLE DES ANNEXES.............................................................................................97 TABLE DES ILLUSTRATIONS............................................................................112 TABLE DES MATIÈRES........................................................................................115 LAPOTRE Raphaëlle | DCB | Mémoire d'étude | décembre 2014 8 Sigles et abréviations ADS : Astrophysics Data System API : Application Programming Interface BIUSJ : Bibliothèque Interuniversitaire Scientifique de Jussieu BnF : Bibliothèque Nationale de France Bpi : Bibliothèque Publique d'Information BUPMC : Bibliothèque Universitaire Pierre et Marie Curie CSV : Comma Separated Values DPLA : Digital Public Library of America DST4L : Data Scientist Training For Librarians EMEA : Europe Middle East Africa EVR : Extension Visuelle de Requête FRBR : Functional Requirement for Bibliographic Records JPEG : Joint Photographic Expert Group JSON : Javascript Object Notation K-NN : k-Nearest Neighbors NASA : National Aeronautics and Space Agency OCLC : Online Computer Library Center OPAC : Online Public Access Catalog PDF : Portable Document Format PEB : Prêt Entre Bibliothèques SICD : Service Interétablissement de Coopération Documentaire VIAF : Virtual International Authority File XML : Extensible Markup Language Lapôtre Raphaëlle | DCB | Mémoire | décembre 2014 - 9 - Droits d’auteur réservés. OU INTRODUCTION De mars à juin 2013, j'ai eu l'opportunité d'effectuer un stage d'observation à la Bibliothèque Publique d'Information, à l'occasion duquel Véronique Poirier, déléguée à la politique documentaire de l'établissement, m'avait demandé de réfléchir à l'approfondissement des critères de désherbage afin de pouvoir éliminer de manière plus importante certains ouvrages imprimés, notamment dans les domaines cumulatifs que sont les lettres et sciences humaines. En pleine réorganisation, l'établissement envisageait en effet le déménagement de ses collections et se posait avec acuité la question de la saturation de certaines de ses étagères, la Bpi ne disposant pas de magasins permettant de stocker le surplus éventuel de ses collections. Dans un premier temps, j'ai donc exploré le catalogue en ligne en espérant assez naïvement repérer quelques zones sensibles, des endroits où la collection était peut-être trop ancienne (si tant est que ce critère puisse être valable en lettre et sciences humaines), peut-être trop spécialisée par rapport au grand public de la Bpi (mais de ce point de vue, une thèse d'université peut parfois se révéler plus accessible qu'un manuel de premier cycle universitaire), peut-être trop redondante dans les sujets couverts uploads/Litterature/ avoiir-faire-parler-les-donnees-des-bibliotheques-du-big-data-a-la-visualisation-de-donnees 1 .pdf

  • 24
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager