Séquence 3: Système Décisionnel et Entrepôts de Données Bases de Données Avancé
Séquence 3: Système Décisionnel et Entrepôts de Données Bases de Données Avancées Guidedi KALADZAVI •Introduction •Système Décisionnel- Business Intelligence •Entrepôt de Données – Data Warehouse •Conclusion Séquence 3: Système Décisionnel et Entrepôts de Données Introduction Dirigeants, Entreprise, informatique décisionnelle Information en Entreprise ● Informations noyées sous de nombreuses données, éparses, déstructurées et hétérogènes ● Ces décideurs ont besoin qu'on leur expose les faits importants, base de leurs décisions. informatique décisionnelle. ● Elle permet une sélection des informations opérationnelles pertinentes pour l'entreprise ● Elle doit produire des indicateurs et des rapports à l'attention des analystes. ● Elle doit également proposer des outils de navigation, d'interrogation et de visualisation de l'entrepôt. Introduction Entrepôt de données – Data Warehouse ● Entrepôt de données est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour la prise de décision ❏ orienté sujets ❏ données intégrées ❏ Données non volatiles ❏ Données historisées Introduction OLTP vs. OLAP ● OLTP : On Line Transaction Processing ❏ Exemple : Le 15/01/2012 à 13h12, le client X a retiré 500fCFA du compte Y ● OLAP : On Line Analytical Processing ❏ Exemple : Quel est le volume des ventes par produit et par région durant le deuxième trimestre de 2012? Introduction OLAP et Modélisation dimensionnelle ● Les BD relationnelles ne sont pas adaptées à l'OLAP ❏ Pas les mêmes objectifs ❏ Pas les mêmes données: ❏ Pas les mêmes traitements et requêtes: ● Nécessité d'une structure de stockage adaptée à l'OLAP ❏ représenter les données dans plusieurs dimensions, ❏ manipuler les données facilement et efficacement. Introduction Représentation multidimensionnelle : ‘Cube’ Système Décisionnel Séquence 3: Système Décisionnel et Entrepôts de Données Reporting Exemple d’un reporting imprécis Reporting En fait, l’important est dans la variation Reporting Mais une information peut en cacher une autre... Enjeux du Décisionnel Le système d'information décisionnel La prise de décisions stratégiques dans une organisation nécessite le recours et le croisement de multiples informations qui concernent tous les départements : production, RH, DAF, achats, ventes,marketing, service après-vente, maintenance, R&D.. Finalité : Transformation des données de production en informations stratégiques Exploitation des données Les données agrégées dans un système décisionnel servent à trois grandes catégories d'usage : •production de rapport récurrents ( reporting ) • exploration manuelle •analyse de données (descriptive ou prédictive) Système Décisionnel Systèmes Opérationnels • Analyse Appelés OLTP (On-Line Transaction Processing) ou systèmes de gestion • Dédiés aux métiers de l’entreprise pour les assister dans leurs tâches de gestion Quotidiennes • Utilisation des PGI (ou ERP) pour la gestion des données Système Décisionnel Systèmes Décisionnels • Appelés OLAP (On-Line Analytical Processing) • Dédiés à la gestion de l’entreprise pour l’aider au pilotage de l’activité pour une vision transversale de l’entreprise • Utilisation des Entrepôts de données Systèmes Opérationnels vs Systèmes Décisionnels Système Décisionnel Architecture Système Décisionnel sources de données ● Types de sources : ○ données internes ○ données externes ● Données complexes ○ technologies ○ environnements ● principes de sécurité ○ mécanismes réseaux ○ authentifications Architecture Système Décisionnel Extract Transform Load ● filtrage ● dédoublonnage ● formatage ● dénormalisation ● synchronisation ● agrégation ● Deux familles : ● open source : Talend Open Studio ● Propriétaires : Business Object, Microsoft BI, etc Architecture Système Décisionnel Types de stockage ● L'entrepôt (data warehouse): ● Le marché de données (data mart) focalise sur une partie du métier, comme les relations clients, par exemple. Architecture Système Décisionnel Outils de visualisation ● facilité de manipulation ● temps acceptable (de l'ordre de quelques secondes) ● prise en main rapide, intuitive et convivial Architecture Système Décisionnel 1- Étude des besoins et de l'existant ● Étude des besoins utilisateurs ● Étude des données existantes 2. Modélisation et conception ● Modélisation dimensionnelle ● Architecture technique ● Spécification des outils d'exploitation 3. Implémentation du data warehouse ● Implémentation du DW et des DM ● Mise en place de l'ETL 4. Implémentation des outils d'exploitation ● Implémentation des outils de reporting ● Implémentation des outils d'exploration ● Implémentation des outils de prédiction Conception d'un système décisionnel Entrepôt de Données – Data Warehouse Séquence 3 : Système Décisionnel et Entrepôts de Données •Introduction •Système Décisionnel- Business Intelligence •Entrepôt de Données – Data Warehouse •Conclusion Séquence 3: Système Décisionnel et Entrepôts de Données Entrepôts de Données Entrepôt de donnée ou concept central du BI ●Quelle structure permet-elle d'avoir les fonctionnalités requises pour un entrepôt de données ? ●Quelles sont les techniques utilisées pour bien concevoir ? ● Quels sont les indicateurs d'une bonne conception ? Entrepôts de Données Concepts fondamentaux Data Mart, ou magasin de données Entrepôts de Données Concepts fondamentaux ●Dimension ■ client, ■ produit, ■ géographie ■ UEs ■ etc. ●Fait ■ note ■ montants commandés, ■ quantités facturées, ■ quantités retournées ■ volumes des ventes ■ etc. Entrepôts de Données Implémentation d'un Data Warehouse / Data Mart ● Relational OLAP (ROLAP) ● Multidimensional OLAP (MOLAP) ● Hybrid OLAP (HOLAP) Entrepôts de Données ROLAP Idée: ● Données stockées en relationnel. ● La conception du schéma est particulière: schéma en étoile, schéma en flocon ● Des vues (matérialisées) sont utilisées pour la représentation multidimensionnelle ● Les requêtes OLAP (slice, rollup...) sont traduites en SQL. ● Utilisation d'index spéciaux: bitmap ● Administration (tuning) particulier de la base Avantages/inconvénients ● Souplesse, évolution facile, permet de stocker de gros volumes. ● Mais peu efficace pour les calculs complexes Entrepôts de Données Multi-Dimensional OLAP Idée ● Modélisation directe du cube ● Ces cubes sont implémentés comme des matrices à plusieurs dimensions ● CUBE [1:m, 1:n, 1:p...] (mesure) ● Le cube est indexé sur ses dimensions Avantages/inconvénients: ● rapide ● formats propriétaires ● ne supporte pas de très gros volumes de données Entrepôts de Données HOLAP . Idée ● MOLAP + ROLAP ● Données stockées dans des tables relationnelles ● Données agrégées stockées dans des cubes. ● Les requêtes vont chercher les données dans les tables et les cubes Entrepôts de Données Modèles de représentation des données ● Cubes ● Relationnelle ■ Étoile ■ Flocon ■ Constellation Entrepôts de Données Hyper Cube Hypercube : BD multidimensionnelle ● Axes: dimensions (date, type de produits, région), ● Chaque cellule de l'hypercube contient une mesure calculée (vente de produit) Entrepôts de Données Opérations sur la structure des cubes Entrepôts de Données Opérations sur le contenu des cubes Entrepôts de Données Opérations entre cubes 158 Représentation en Étoile Avantages: ●Facilité de navigation ●Nombre de jointures limité Inconvénients: ●Redondance dans les dimensions ●Toutes les dimensions ne concernent pas les mesures Entrepôts de Données Entrepôts de Données Représentation en Flocon Modéliser existence des hiérarchies de dimensions et qu'elles sont reliées au faits, ça fait comme un flocon Entrepôts de Données Représentation Constellation Constellation Une constellation est une série d'étoiles ou de flocons reliées entre eux par des dimensions. Entrepôt de Données = constellation des étoiles ou des flocons 161 Approche de Conception d'entrepôts de données Top-Down : Elle consiste en la conception de tout l'entrepôt (ie : toutes les étoiles), puis en la réalisation de ce dernier. Lourde, contraignante et la plus complète . Bottom-Up : Elle consiste à créer les étoiles/flocons une par une, puis les regrouper par des niveaux intermédiaires jusqu'à obtention d'un véritable entrepôt pyramidal avec une vision d'entreprise. Middle-Out : c'est l'approche hybride, . Elle consiste en la conception totale de l'entrepôt de données (ie : concevoir toutes dimensions, tous les faits, toutes les relations), puis créer des divisions plus petites et plus gérables et les mettre en œuvre. Conseillée par les professionnels du BI Entrepôts de Données 1. Michael Tranchan, Qu'est-ce que l'informatique décisionnelle ? https://business-intelligence.developpez.com/tutoriels/quest-ce-que-la-bi/ 2. Yazid Grim, Conception d'un entrepôt de données (Data Warehouse), http://grim.developpez.com/cours/businessintelligence/concepts/conception-datawarehouse/ 3. Didier Donsez. Janvier 2006. Principes et architectures des entrepôts de données 4. georges gardarin, Bases de données, eyrolles, 2003 5. Yazid Grim, OLAP, les fondamentaux, http://grim.developpez.com/articles/concepts/olap/ 6. Silvera David, Utilisation de BIRT, http://dsilvera.developpez.com/tutoriels/Business-Intelligence/utilisation-birt/ uploads/Finance/ chapitre-4-systeme-decisionnel-et-entrepots-de-donnees.pdf
Documents similaires
-
18
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Aoû 23, 2022
- Catégorie Business / Finance
- Langue French
- Taille du fichier 5.9468MB