Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 1 Entrepôts de donn
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 1 Entrepôts de données : Systèmes ROLAP, MOLAP et HOLAP (5) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Décembre 2015 • Introduction aux systèmes OLAP • Systèmes ROLAP • Systèmes MOLAP • Systèmes HOLAP Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 2 1. Introduction aux systèmes OLAP 2. Systèmes ROLAP ! Introduction à la technologie ROLAP ! Techniques d’indexation ROLAP ! Sélection et matérialisation de vues ! Fragmentation de tables ! Forces et faiblesses de la technologie ROLAP ! Quelques produits de technologie ROLAP 3. Systèmes MOLAP ! Introduction à la technologie MOLAP ! Techniques de stockage ! Densité et compression ! Agrégation et calcul des agrégats ! Forces et faiblesses de la technologie MOLAP ! Quelques produits de technologie MOLAP 4. Systèmes HOLAP ! Introduction à la technologie HOLAP ! Quelques produits de technologie HOLAP Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 3 Ouvrages : ! Benitez-Guerrero E., C. Collet, M. Adiba, « Entrepôts de données : Synthèse et analyse », Rapport de recherche IMAG N°IMAG-RR - 99-1017-I, 1999. ! Vaisman A., Zimányi E., « Data Warehouse Systems: Design and Implementation », Springer-Verlag, 2014, ISBN 978-3-642-54654-9. ! Golfarelli M., Rizzi S., « Data Warehouse Design : Modern Principles and Methodologies », McGrawHill, 2009. ! Kimball R., Ross, M., « Entrepôts de données : guide pratique de modélisation dimensionnelle », 2°édition, Ed. Vuibert, 2003, ISBN : 2-7117-4811-1. Cours : ! Cours de F. Bentayeb, O. Boussaid, J. Darmont, S. Rabaseda, Univ. Lyon 2 ! Cours de P. Marcel, Université de Tours ! Cours de G. Gardarin, Université de Versailles ! Cours de M. Adiba et M.C. Fauvet, Université Grenoble ! Cours de H. Garcia-Molina, Stanford University. Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 4 1 1 1 – – – I I In n nt t tr r ro o od d du u uc c ct t ti i io o on n n a a au u ux x x s s sy y ys s st t tè è èm m me e es s s O O OL L LA A AP P P ! Caractéristiques des produits OLAP ! Différents types de systèmes OLAP Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 5 En 1993 Codd définit les bases du modèle OLAP : 12 règles de Codd définissent l’évaluation des produits OLAP : 1. Vue multidimensionnelle : Une base OLAP offre une vue multidimensionnelle des données 2. Transparence: éléments techniques mis en œuvre invisibles pour l’utilisateur 3. Accessibilité: la complexité et l’hétérogénéité des données sont masquées par les outils OLAP 4. Stabilité: performances stables indépendamment du contexte d’analyse 5. Architecture Client/Serveur : le coté serveur a en charge l’homogénéisation des données, les clients se connectent simplement au serveur 6. Traitement générique des dimensions : une seule structure logique pour toutes les dimensions. Tout calcul effectué sur une dimension peut l’être sur les autres 7. Gestion dynamique des matrices creuses : gestion dynamique de la mémoire physique nécessaire pour stocker les données non nulles 8. Support multi-utilisateurs : gestion des accès concurrents aux données 9. Croisement des dimensions 10. Manipulation intuitive des données 11. Flexibilité des restitutions 12. Nombre illimité de niveaux d’agrégations et de dimensions Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 6 L’acronyme FASMI (Fast Analysis of Shared Multidimensional Information) permet de résumer la définition des produits OLAP (http ://www.olapreport.com/fasmi.htm, The OLAP Report - 2004) : • Fast : temps de réponse aux demandes des utilisateurs entre 1 et 20 secondes : utilisation dans les produits OLAP de pré-calculs pour réduire les durées des requêtes, • Analysis : faire face à toutes les logiques d’affaire et de statistiques, ainsi que fournir la possibilité aux utilisateurs de construire leurs calculs et leurs analyses sans avoir à programmer : outils fournis avec les produits OLAP • Shared : le système doit créer un contexte où la confidentialité est préservée et doit gérer les cas où plusieurs utilisateurs ont des droits en écritures (plutôt une faiblesse des produits OLAP actuels) • Multidimensional : caractéristique majeure, les produits OLAP doivent fournir des vues conceptuelles multidimensionnelles des données et supporter des hiérarchies de dimensions • Informations : ensemble des données et les informations nécessaires pour un produit OLAP. Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 7 3 principales stratégies d’implémentation d’ED et d’analyse OLAP possibles dans les produits OLAP : 1 - Systèmes ROLAP (Relational OLAP) : • utilisent un SGBD relationnel classique avec des adaptations spécifiques à l’OLAP • la base relationnelle de l’entrepôt est organisée pour réagir comme une base OLAP • lents et peu performants mais sans limites de taille 2 – Systèmes MOLAP (Multidimensionnal OLAP) : • utilisent un SGBD multidimensionnel (MOLAP), ils sont l'application physique du concept OLAP (réellement d'une structure multidimensionnelle) • très rapides et performants mais limité au gigaoctet. 3 – Systèmes HOLAP (Hybrid OLAP) : • c’est un compromis : ! une base MOLAP pour les données souvent consultées (la minorité selon Pareto), ! une base ROLAP pour les autres (la majorité). 4 – Base DOLAP (Desktop OLAP) : base OLAP très limitée en taille, hébergée sur le poste client, et très rapide 5 - Base OOLAP (Object OLAP) : utilise un SGBD Orienté Object : peu utilisé. Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 8 Nom Editeur Technologie DB2 UDB Server IBM ROLAP Oracle9i Oracle ROLAP SQL Server 2000 Microsoft ROLAP DSS Microstrategy ROLAP TeraData Teradata Corporation ROLAP massivement parallèle Informix Metacube Informix MOLAP Essbase Arbor Software/Hyperion MOLAP SAS OLAP Server SAS MOLAP Metacube Informix ROLAP SQL Server Microsoft HOLAP MDDB SAS Institute MOLAP/ROLAP Oracle Express-server Oracle MOLAP/ROLAP DB2 OLAP Server IBM MOLAP/ROLAP Crystal Seagate Software Serveur d'application OLAP unique pour tous les déploiements PowerPlay Cognos idem Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 9 2 2 2 – – – S S Sy y ys s st t tè è èm m me e es s s R R RO O OL L LA A AP P P ! Stratégie ROLAP d’implantation d’un ED ! Modèles logiques d’un ED « ROLAP » ! Introduction à la technologie ROLAP ! Techniques d’indexation ROLAP ! Sélection et matérialisation des vues en Rolap ! Fragmentation des tables ! Forces et faiblesses de la technologie ROLAP ! Quelques produits de technologie ROLAP Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 10 ! les SGBD relationnels représentant plus de 80% des SGBD : c’est la stratégie la plus couramment utilisée pour implanter un ED ! les SGBD relationnels doivent cependant être adaptés car ils n’ont pas les caractéristiques adéquates pour répondre aux besoins des ED : ! Extensions du langage SQL à de nouveaux opérateurs ! Usage de vues matérialisées ! Indexation binaire pour améliorer les performances ! … ! ils réalisent des calculs de données dérivés et agrégations à différents niveaux ! ils génèrent des requêtes adaptées au schéma relationnel de l’ED et tirent profit des vues matérialisées existantes (facteur principal de performance) Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 11 Le modèle multidimensionnel est traduit ainsi : • chaque fait correspond à une table, appelée table de fait, • chaque dimension correspond à une table, appelée table de dimension. Ainsi : • la table de fait est constituée : ! d'attributs représentant les mesures d'activité et ! les attributs clés étrangères de chacune des tables de dimension. • les tables de dimension contiennent : ! les paramètres et ! une clé primaire permettant de réaliser des jointures avec la table de fait. Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 12 Soit le schéma en étoile : Modélisation logique ROLAP : • VENTE(CleTps#,CleGeo#,CleCat#,Quantite,Montant) - table des faits • TEMPS(CleTps,Annee,Trimestre,Saison,Mois,Jour) ) - table de dimension • GEOGRAPHIE(CleGeo,Region,Departement,Ville) - table de dimension • CATEGORIE(CleCat,TypeProd,Gamme,NomProd,Couleur) - table de dimension TEMPS année trimestre saison mois jour GEOGRAPHIE région département ville CATEGORIE typeProduit gamme nomProduit couleur VENTE année région typProduit quantité montant F Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 13 ! un SGBR relationnel est utilisé pour stocker l’ED (en étoile ou flocon) ! le moteur OLAP est un élément complémentaire qui : ! fournit une vision multidimensionnelle de l’ED, ! fait des calculs de données dérivés et des agrégations à différents niveaux ! génère des requêtes SQL adaptées au schéma relationnelle de l’ED en profitant de vues matérialisées existantes Bases de données Sources externes OLAP Réponse Requête intégration SGBD Relationnel moteur OLAP Interface OLAP Sources de données Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 14 ! Systèmes ROLAP = technologie de stockage relationnelle ! Le modèle relationnel demande des extensions pour supporter les requêtes d’analyses multidimensionnelles du niveau d’application : ! Extensions du langage SQL : ! de nouveaux opérateurs uploads/Marketing/5-systemesolap-4p.pdf
Documents similaires










-
35
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Nov 04, 2021
- Catégorie Marketing
- Langue French
- Taille du fichier 4.4595MB