Entrepôt de données / Data Warehouse Préparé par: Dr. Olfa DRIDI FSB – Départem
Entrepôt de données / Data Warehouse Préparé par: Dr. Olfa DRIDI FSB – Département Informatique GLSI2 - 2021 © OD - 2021 2 Plan 1. Introduction : Le marché du décisionnel 2. Les entrepôts de données (ED) 3. Alimentation d’un ED 4. Modélisation d’un ED 5. Les datamarts © OD - 2021 3 Objectifs Ø Le cours Entrepôt de données est destiné aux administrateurs des bases de données ou futurs data scientist, ou tout autre acteur mené à structurer et/ou analyser , jouer avec les données volumineuses © OD - 2021 4 Références bibliographiques Ø Le data warehouse : Guide de conduite de projet- Ralph Kimball, 2005. Ø Modélisation des Systèmes d'Information Décisionnels : Techniques de modélisation conceptuelle et relationnelle des entrepôts de données - Emmanuel Ferragu, 2013. Introduction aux systèmes d’information FSB – Département Informatique GLSI2 - 2021 © OD - 2021 6 6 Notion d’information Ø Une information, c’est une donnée qui a un sens pour celui qui en a besoin. Le modèle est connu, l’interprétation donne du sens aux données Le modèle est inconnu, le sens est plus difficile à percevoir ou incomplet © OD - 2021 7 Définitions Bien distinguer : Donnée-Information-Connaissance Ø Donnée : Fait Ø Information : Fait qui a un sens pour quelqu’un Ø Connaissance : L’information devient connaissance quand elle est traitée dans le cerveau des individus. Ø Connaissance : C’est de l’information combinée avec l’expérience, le contexte, l’interprétation et la réflexion. © OD - 2021 8 Donnée, information et connaissance © OD - 2021 9 9 L’information est un facteur de production presque comme les autres Ø L’information a une valeur, variable selon son importance, son ancienneté… Ø L’information doit être extraite, stockée, traitée, maintenue… à c’est la tâche du système d’information ! © OD - 2021 10 Définition SI En informatique et en télécommunications, et plus généralement dans le monde de l'entreprise, le terme système d'information (ou SI) possède les significations suivantes : 1. Un ensemble organisé de ressources (personnel, données, procédures, matériel, logiciel, …) permettant d'acquérir, de stocker, de structurer et de communiquer des informations sous forme de textes, images, sons, ou de données codées dans des organisations. Selon leur finalité principale, on distingue : a. des systèmes d'information supports d'opérations (traitement de transaction, contrôle de processus industriels, supports d'opérations de bureau et de communication) b. des systèmes d'information supports de gestion (aide à la production de rapports, aide à la décision…). 10 © OD - 2021 11 2. Un système ou sous-système d'équipements, d'informatique ou de télécommunication, interconnectés dans le but de l'acquisition, du stockage, de la structuration, de la gestion, du déplacement, du contrôle, de l'affichage, de l'échange (transmission ou réception) de données sous forme de textes, d'images, de sons, et/ou, faisant intervenir, du matériel et des logiciels. Le système d'information coordonne grâce à l'information les activités de l'organisation et lui permet ainsi d'atteindre ses objectifs. Il est le véhicule de la communication dans l'organisation. De plus, le SI (système d'information) représente l'ensemble des ressources (les hommes, le matériel, les logiciels) organisées pour : collecter, stocker, traiter et communiquer les informations. Définition SI 11 © OD - 2021 12 Définition SI 12 © OD - 2021 13 Le système d’information Ø Différentes missions du SI • Collecter (sources externes et internes) Saisie, numérisation Extraction • Stocker Supports divers et multiples Indexation, mots clés, thésaurus… Maintenir en état d’utilisation sur une période longue • Traiter Produire des informations sous la forme appropriée aux besoins de l’utilisateur • Restituer, diffuser (sous différentes formes) Électronique ou papier Importance des formats de fichiers Supports de communication (filaire, non-filaire…) © OD - 2021 14 14 Notion de système d’information Système opérationnel Entrées Sorties Flux de décisions Flux d’informations contraintes Système de pilotage Système d’information Activité : Générer des informations Mémoriser Diffuser Traiter Activité : Transformer Produire Activité : ØRéfléchir : adaptation à l’environnement, conception ØDécider : prévisions, planification ØContrôler © OD - 2021 15 Le système de pilotage Ø Appelé également système de décision Ø Exploite les informations qui circulent Ø Organise le fonctionnement du système Ø Décide des actions à conduire sur le système opérant Ø Raisonne en fonction des objectifs et des politiques de l’entreprise 15 © OD - 2021 16 Le système opérant Ø Reçoit les informations émises par le système de pilotage Ø Se charge de réaliser les tâches qui lui sont confiées Ø Génère à son tour des informations en direction du système de pilotage Ø Il englobe toutes les fonctions liées à l’activité propre de l’entreprise : Facturer les clients, régler les salaires, gérer les stocks, … © OD - 2021 17 17 SI et nouveaux métiers Ø Directeur de SI Ø Intégrateur : chargé d’adapter une solution logicielle à la réalité de l’entreprise Ø Architecte, urbaniste de SI Ø Chef de projet sécurité des SI Ø …. © OD - 2021 18 Évolution des systèmes d’information au cours des 40 dernières années Ø «Quel que soit son métier, une organisation doit pour réussir maîtriser un tripode formé des RH, de la finance et des systèmes d’information» • Accélération de la vie des organisations et des affaires • Environnement de plus en plus large (notion d’entreprise étendue) • Évolution permanente et rapide des technologies • Complexité plus grande à gérer • Tendance à l’externalisation des services informatiques • Accroissement des risques 18 © OD - 2021 19 Problématique Ø Pourquoi un entrepôt de données? Améliorer les performances décisionnelles de l’entreprise. Ø Comment? En répondant aux demandes d’analyse des décisdeurs. Ø Exemples: Clientèle: Qui sont mes clients? Pourquoi sont-ils mes clients? Comment les conserver ou les faire revenir (préférenced’achat, habitudes, …) ? Ces clients sont-ils vraiment intéressants pour moi? Marketing, actions commerciales: Où placer ce produit dans des rayons? © OD - 2021 20 Problématique Ø Comment les décideurs prennent-ils les décisions? 20 © OD - 2021 21 Contexte Ø Aujourd’hui, les entreprises produisent et stockent d’énormes quantités de données. Ces données, qui constituent un extraordinaire gisement d’informations sur ses activités et son positionnement dans le contexte économique, sont souvent insuffisamment exploitées. 21 © OD - 2021 22 Types de données u Données détaillées: u courantes ou anciennes u données opérationnelles (de production) u Données opérationnelles archivées u Données agrégées u Faiblement ou fortement u Pour mieux répondre aux questions des gestionnaires u Données sur les données : u règles d’extraction, de conversion, d’agrégation, ... 22 © OD - 2021 23 Informatique Décisionnelle (ID) Ø L’informatique décisionnelle ou la Business intelligence est l’ensemble des moyens, des outils et des méthodes qui permettent de collecter, intégrer, distribuer et de restituer les informations en vue d’offrir une aide à la décision. Ø L’informatique décisionnelle permet la collecte, l’organisation et le stockage des données ainsi que l’extraction et la restitution des informations pertinentes. Ø Elle permet aux responsables de la stratégie d’une entreprise d’avoir une vision synthétique de leurs activités, les aidant ainsi à orienter leurs décisions. Ø 23 © OD - 2021 24 Informatique Décisionnelle (ID) Ø L’Informatique Décisionnelle (ID) ou la Business Intelligence (BI), est l'informatique à l'usage des décideurs et des dirigeants des entreprises Ø Les systèmes de ID/BI sont utilisés par les décideurs pour obtenir une connaissance approfondie de l'entreprise et de définir et de soutenir leurs stratégies d'affaires, par exemple : d’acquérir un avantage concurrentiel, d’améliorer la performance de l’entreprise, de répondre plus rapidement aux changements, d’augmenter la rentabilité, et d’une façon générale la création de valeur ajoutée de l'entreprise. 24 © OD - 2021 25 BI Ø Informatique décisionnelle (business intelligence) : à l’usage des décideurs • Accéder rapidement et simplement aux informations stratégiques • Donner du sens aux données • Donner une vision transversale des données d’une organisation • Extraire, grouper, organiser, agréger corréler les données Qui sont mes meilleurs clients ? Quelle est l’évolution du taux d’occupation des chambres ? Quelle est l’efficacité des politiques publiques en matière d’écologie ? Introduction aux entrepôts de données © OD - 2021 27 Les fondateurs © OD - 2021 28 Définition d’un entrepôt de données Ø Un entrepôt de données est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le support d'un processus d'aide à la décision. W.H. Inmon, 1991 Ø « Un entrepôt de données ne s’achète pas, il se construit... » © OD - 2021 29 Définition d’un entrepôt de données u Un entrepôt de données (ED) est une base de données construite par copie et réorganisation de multiples sources (dont principalement le système transactionnel de l'entreprise), afin de servir de source de données à des applications décisionnelles : u il agrège de nombreuses données de l'entreprise (intégration) ; u il mémorise les données dans le temps (historisation) ; u il les organise pour faciliter les requêtes de prise de décision (optimisation). (Goglin, 2001) 29 © OD - 2021 30 Données orientées sujets Ø Organisé autour d’un sujet bien précis, ex: client, produit, ventes. Ø S’intéresse à la modélisation et l’analyse des données pour aider les décideurs, non pas pour des activités quotidiennes ou traitement transactionnel Ø Fournit uploads/s1/chap1-amp-2.pdf
Documents similaires










-
44
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Fev 13, 2021
- Catégorie Administration
- Langue French
- Taille du fichier 6.7692MB