Introduction à l’Archivage électronique Sébastien SOYEZ, Archiviste-Chef de tra

Introduction à l’Archivage électronique Sébastien SOYEZ, Archiviste-Chef de travaux Service DIGI-P@T (Préservation & Accès numériques) Archives générales du Royaume - Présenté dans le cadre du cours d’Archivistique de P.-A. TALLIER 27/10/2017 Notions fondamentales Enjeux juridiques Aspects organisationnels Défis techniques Plan stratégique de préservation numérique Synthèse Q&R PLAN NOTIONS FONDAMENTALES Archivage électronique ? L’archivage électronique c’est archiver des données / de l’information numérique = des objets numériques de manière pérenne, afin d’assurer leur intégrité, authenticité, lisibilité dans le temps Archivage électronique ? Modèle hiérarchique de l’information Données - Faits, observations, éléments bruts - Peu de signification (si pas traitées) Informations - Données interprétées, porteuses de sens, contextualisées - Qui ? quoi ? quand ? où ? Connaissances - Informations comprises / assimilées - Pourquoi ? comment ? Sagesse - Stade ultime de l’évolution cognitive - L’archivage électronique c’est archiver Sagesse Connaissances Informations Données Archivage électronique ? De l’information numérique, c’est : Un contenu Enregistré sur un support Présenté sous une certaine forme Contenu Forme Support Archivage électronique ? De l’information numérique, c’est : Un contenu - des Bits & Bytes Unité de mesure = byte ou octet (1 byte = 8 bits) (bits = quantité de données) Archivage électronique ? De l’information numérique, c’est : Un contenu Enregistré sur un support - Magnétiques (Disques, Disquettes, Bandes) - Optiques (CD, DVD, Blu-Ray) - Semi-conducteurs (Clés USB, Cartes mémoires) Archivage électronique ? De l’information numérique, c’est : Un contenu Enregistré sur un support Présenté sous une certaine forme - Documents bureautiques, Images, Sons, Vidéos, Données scientifiques, Documents multimédia, … Archivage électronique ? Source : Chabin, 2006 Source : Novarchive, 2016 Archivage électronique ? Organisationnel Technique Juridique Conserver de l’information numérique n’est pas qu’un problème technique, c’est avant tout un problème transversal Archivage électronique ? Juridique Cadre légal : Archives & Connexe Organisationnel Normes & Standards Technique Supports, Formats, Métadonnées  à mettre en œuvre à l’aide d’une stratégie globale ENJEUX JURIDIQUES Cadre légal générique Loi sur les Archives (fédéral + entités fédérées) Loi qui encadre l’archivage électronique globalement Loi sur les services de confiance (21/07/2016) Plus spécifique en matière d’archivage électronique, de signature/cachet/horodatage électronique, + valeur probante copie numérique  Mise en œuvre du règlement européen e-IDAS  = DIGITAL ACT (Livre XII « Economie électronique », < Code de Droit économique) http://arch.arch.be/index.php?l=fr&m=actualites&r=toutes-les-actualites&a=2016-10-27-digital-act-une-avancee-belge-dans-le-domaine-de-l-archivage-electronique Projet de plateforme fédérale d’archivage électronique = « Archiving-as-a-Service – AaaS » Un des services du catalogue G-Cloud (< août 2017) (https://www.gcloud.belgium.be/fr/index.html) Cadre légal générique Loi sur les services de confiance (21/07/2016) = « DIGITAL ACT » Introduction d’un « service de confiance d’archivage électronique » Comprend deux volets : Numérisation de documents papier ET/OU Conservation numérique Prévoit deux niveaux : Non qualifié = en conformité avec les exigences légales mais non certifié Qualifié = en conformité avec les exigences ET certifié sur base d’un audit Cadre légal connexe Législation « Publicité de l’administration » Réf. sur le site internet des Archives de l’Etat < directive européenne du Public Sector Information – PSI -Directive 2003/98/EC : ”Since 2013 content held by museums, libraries and archives falls within the scope of application as well” . + cadre européen de l’Open-Data Cadre légal connexe Législation « Vie privée » Réf. sur le site internet des Archives de l’Etat Libertés fondamentales versus surveillance des communications électroniques, contrôle et rétention de l’information !!! Nouveau règlement européen GDPR (entrée en vigueur en mai 2018) Cadre légal connexe Législation « Confidentialité » Réf. sur le site internet des Archives de l’Etat Sécurité des données, Criminalité informatique, Secret Cadre légal connexe Législation « Droit d’auteur » Réf. sur le site du SPF Economie (étude avec le CRIDS/UNamur) Susceptible de concerner une œuvre protégée + d’autres législations spécifiques Sectorielles, Droit des contrats, Marchés publics, … ASPECTS ORGANISATIONNELS Normes & Standards Pourquoi utiliser des normes / des standards? Obligation légale? Automatiser et normaliser des processus Faciliter l’interopérabilité Aider dans la préparation d’un cahier des charges Normes en présence 15489 30300 Normes managériales Normes fonctionnelles 16175 NF Z 42 013 14641-1 Normes conceptuelles et organisationnelles 14721 Reference Model for an Open Archival Information System (OAIS) 20652 Producer- Archive Interface Methodology Abstract Standard (PAIMAS) Normes & Standards techniques / metadata 23081 15836 NF Z 44 022 MEDONA (ex-SEDA) … ISAD-G, ISAAR-CPF, ISDIAH… EAD, EAC, EAG… Paysage normatif Source : Chabin, 2012 RM SAE Les 2 normes essentielles « Record Management » ISO 15489 - Information et Documentation – Records Management (< méthodologie pour mise en œuvre) + MoReq = Modular Requirements for Records Systems « Conservation électronique » ISO14721 (OAIS) - Open Archival Information System = guide orientant la réflexion (modèle fonctionnel) et ce qu’il faut faire pour préserver des données/informations numériques, mais pas comment RM versus SAE Distinction courante entre « Record Management » et « Conservation électronique » Distinction intéressante mais fonctionnellement peu pertinentes : les systèmes sont quasi similaires Même dans un système de Record Management, des données doivent être conservées plus de 10 ans de manière intègre, lisible et intelligible Distinction tenant plus aux rédacteurs et cercles gravitant autour des normes RM versus SAE Source : Lappin, 2011 SMURF PRESERVATION PLANNING ADMINISTRATION VERSEMENT INGEST ACCÈS ACCESS MANAGEMENT PRODUCTEUR ARCHIVES PRODUCER UTILISATEUR CONSUMER AIPAIP DIPDIPDIP IndexationRepérage MétadonnéesConditionnement diffusion Conditionnement conservation Source : www.digitalbevaring.dk GESTION DE DONNÉES DATA MANAGEMENT STOCKAGE STORAGE SIP = Submission Information Package AIP = Archival Information Package DIP = Diffusion Information Package Schéma fonctionnel OAIS Notion de « paquet d’informations » Création d’un paquet distinct à chaque étape de manipulation au sein du système - Versement, Description, Stockage, Communication Paquet = unité de base pour la préservation - Dans OAIS, on ne parle plus de document! Paquets à verser Paquets archivés Paquet diffusé AIP DIPDIPDIP Les normes & standards Sont à un stade de maturité même si certaines questions restent encore en suspens surtout d’un point de vue organisationnel Contribuent à améliorer la crédibilité, l’efficacité, l’efficience et la productivité des organisations (et la vôtre) si elles font l’objet d’un consensus et de l’aval de la direction DÉFIS TECHNIQUES Enjeux techniques Enjeu générique de la conservation = pourquoi conserve-t-on de l’information ? A court terme, l’horizon « dynamique » = Utilité primaire de l’information < raisons administratives, juridiques, financières A long terme, l’horizon « statique » = Utilité secondaire de l’information < raisons historiques, patrimoniales Enjeux techniques Enjeu de l’indépendance des systèmes de gestion et de préservation par rapport à l’information Contenant versus Contenu Fin de l’indissociabilité entre support d’information et son contenu avec comme enjeu majeur - de conserver à travers le temps tout contenu d’information - de le garder intelligible en toute indépendance par rapport à l’appareillage technologique (logiciels, matériels, périphériques, systèmes d’exploitation) Enjeux techniques Enjeu du sens = contextualiser l’information Métadonnées – Classement - Description -> métadonnées Ex : DublinCore = 15 éléments descriptifs -> contenu (Title, Subject, Description, Source, Language, Relation, Coverage), -> propriété intellectuelle (Creator, Contributor, Publisher, Rights) -> instanciation (Date, Type, Format, Identifier) Répercussions sur authenticité, compréhension Risques techniques Risques technologiques (obsolescence) Supports de stockage - Dégradation naturelle, équipements de lecture indisponibles Logiciels et systèmes - Écrit numérique lisible SSI la chaîne complète qui va du support à sa restitution est compatible - Problème : évolution différente des médias, hardware, systèmes d’exploitation et logiciel Risques techniques Risques technologiques (obsolescence) Formats de représentation - Absence d’une documentation descriptive complète < lecture par un seul logiciel = formats propriétaires, < protection engendrant perte temporaire ou définitive d’information - Problème : corruption possible des données lors de transformation de format (migration) - Complexité des formats composites (ex. PDF) ou cryptés : entraînant difficulté de migration ou d’émulation voire de perte PLAN STRATÉGIQUE DE PRÉSERVATION NUMÉRIQUE Plan de préservation numérique Stratégies de migration, de recopie et de sécurité de l’information Critères de choix des supports et des formats adaptés en fonction de la finalité (gestion/préservation) Plan de préservation numérique Stratégie de migration Veille technologique pour anticiper migrations - Transfert -> nouveau support - Indépendance des données (formats ouverts) Traduction d’un encodage en un autre - « équivalent de traduire L’Iliade du grec ancien à l’anglais, en passant par langues intermédiaires < 2500 ans » (J. Rothenberg) Coûteuse, laborieuse, susceptible d’erreur, perte d’info (forme) - Mais seule solution actuelle praticable à large échelle Ex. : le NARA a converti 30 millions d’e-mails < administration Clinton vers le format XML Plan de préservation numérique Stratégie de recopie de l’information Plusieurs types de supports - Supports de nature différente (disques + bandes) Dupliquer l’information - Au minimum sur 2 sites distants Plan de préservation numérique Stratégie de sécurité de l’information Redondance des équipements (+ alimentations électriques) Accès, applications, données Sauvegarde Réversibilité Plan de préservation numérique Critères pour bien choisir son support de stockage (1) Capacité de stockage - Besoins actuels et prévisionnels (croissance future) ƒ Stabilité du support - Quelle est sa robustesse (résistance aux agressions) et la durée de vie annoncée par le fabricant / réelle? Existence d’outils de contrôle du support Caractère plus ou moins répandu de la technologie - Offre multi-constructeurs Technologie reposant sur des normes publiques Disponibilité d’équipements - Permet de stocker et uploads/Philosophie/ cours.pdf

  • 28
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager