Bases de Données OLAP Hiver 2013/2014 Melanie Herschel melanie.herschel@lri.fr

Bases de Données OLAP Hiver 2013/2014 Melanie Herschel melanie.herschel@lri.fr Université Paris Sud, Groupe Bases de Données, LRI Bases de Données OLAP | Hiver 2013/14 | Melanie Herschel | Université Paris Sud Europe North America Systèmes Opérationnels vs. Entrepôts de Données Requêtes BD opérationnelles Entrepôt de données • Requêtes transactionnelles • INSERT, UPDATE, DELETE, SELECT • Requêtes portant sur quelques tuples • Optimisation de requêtes “classique” • Requêtes analytiques • Bulk-Insert et SELECT • Requêtes typiques (drill down, slice, dice, ...) • Techniques d’optimisation de requêtes spécialisées Requêtes Produktgruppe Region Jahr Asia ... 2002 2003 2004 2005 2006 2007 Books CDs DVDs ... UPDATE Order SET amount = amount + 1 WHERE OrderID = 1 AND BookID = 204 2 Bases de Données OLAP | Hiver 2013/14 | Melanie Herschel | Université Paris Sud Exemple d’un modèle multidimensionnel (cube et hiérarchies dimensionnelles) Donné un Modèle Multidimensionnel Produit romans enfants sciences CD DVD BlueRay Temps Lieu Berlin Stuttgart Paris Lyon ... jan. fev. mars avr mai ... 5 3 5 4 4 ... 2 2 5 2 2 3 3 2 ... 2 2 2 2 ... 3 5 4 4 ... 2 3 3 2 ... 2 2 ... Cube (granularité la plus fine) hiérarchies dimensionnelles Produit type catégorie année trimestre mois Temps ville Lieu 3 Bases de Données OLAP | Hiver 2013/14 | Melanie Herschel | Université Paris Sud Objectif: Répondre à des Requêtes Analytiques • Rappel: Le DW intègre des données pour obtenir une vue d’ensemble des processus d’entreprise faisant l’objet d’analyses. • Contrairement aux requêtes sur des données relationnelles “classiques”, les requêtes analytiques suivent souvent un même schéma. • On distingue ainsi entre des requêtes OLTP (Online Transaction Processing) posées à des systèmes opérationnels et des requêtes OLAP (Online Analytical Processing) posées à des entrepôts de données. 4 Bases de Données OLAP | Hiver 2013/14 | Melanie Herschel | Université Paris Sud Exemples de Requêtes OLAP • Navigation dans un cube “Nombre de livres d’enfants vendu en janvier, indépendamment du lieu” • Navigation à travers les niveaux de différente granularité “CD par type de produit (musique, film, ...) par trimestre et ville” • Navigation à travers plusieurs cubes corrélés “Ventes totales en magasin et en ligne”, partant de deux cubes (Produit/ Temps/Lieu) et(Produit/Temps/Client). • Requêtes de ranking “Les 10 livres les plus populaires en 2009 par pays”. • Dans ce chapitre, nous allons discuter les schémas typiques de requêtes OLAP et les langages développés afin de les spécifier. 5 Chapitre 4 Requêtes OLAP Opérateurs OLAP •Dans un cube •Sur plusieurs cubes Extensions SQL MDX 6 6 Bases de Données OLAP | Hiver 2013/14 | Melanie Herschel | Université Paris Sud • Nous admettons dans cette première partie du chapitre qu’il n’existe qu’un seul cube dans l’entrepôt de données (plus précisément dans sa BD dispositive). • Pour une représentation simplifiée, nous montrons uniquement des cubes à trois dimensions maximum. Les concepts présentés s’appliquent néanmoins à des cubes de dimensionnalité quelle conque. • Pour une représentation simplifiée, nous n’utilisons qu’une seule mesure. En général, un nombre de mesures plus élevé peut exister. Hypothèses 7 Bases de Données OLAP | Hiver 2013/14 | Melanie Herschel | Université Paris Sud • Les requêtes abordées dans cette partie du chapitre permettent la navigation dans le modèle multidimensionnel (MDDM – multi-dimensional data model). • Roll-up / Consolidate: naviguer vers une granularité plus grossière • Drill-down: naviguer vers une granularité plus fine • Drill-out / Split: ajouter une ou plusieurs dimension • Drill-in / Merge: réduire le cube d’une ou de plusieurs dimensions • Slice: sélectionner des données en appliquant un critère de sélection à une dimension. • Dice: sélectionner des données en appliquant une sélection à plusieurs dimensions. Vue d’Ensemble des Requêtes OLAP 8 Bases de Données OLAP | Hiver 2013/14 | Melanie Herschel | Université Paris Sud • Un roll-up correspond donc à un zoom-out du cube actuel, ce qui entraine un résultat de granularité réduite. Par exemple roll-up du cube (catégorie/ mois/ ville) vers(type/ mois/ ville). • Cette opération peut porter sur une ou plusieurs dimensions à la fois Par exemple roll-up du cube (catégorie / mois / ville) vers (type/ trimestre/ ville). • Il est également possible de naviguer vers la racine TopD d’une ou de plusieurs dimensions. Appliquée à toutes les dimensions, cette opération résulte en un cube n’ayant plus qu’un seul fait. Roll-Up Définition Roll-Up (aussi: consolidate) Soit un cube à n dimensions C = (DS, M) = ({D1, ..., Dn}, {M1, ..., Mp}) ayant pour granularité des dimensions G = {l1, l2, ...,ln}, où le niveau li du schéma {D1, ..., Dm, TopD; ➝} appartient à la dimension Di,1 ≤ li ≤ m+1. Une opération roll-up (nommée également consolidate) navigue d’un ensemble DSup ⊆ DS vers une granularité plus grossière, c.a.d. ∀ Di ∈ DSup, Dj ∈ DS, i = j, j < m + 1: lj < li ≤ m+1 et ∀ Di ∉ DSup, Dj ∈ DS, i = j: li = lj 9 Bases de Données OLAP | Hiver 2013/14 | Melanie Herschel | Université Paris Sud Roll-Up Exemple- Roll-up d’une seule dimension Roll-up d’une seule dimension Produit (type) livres médias Temps (mois) Lieu (ville) Berlin Stuttgart Paris Lyon ... jan. fev. mars avr mai ... Roll-Up de la dimension Produit: (catégorie/ mois/ ville) ➔ (type/ mois / ville) Produit (catégorie) romans enfants sciences CD DVD BlueRay Temps (mois) Lieu (ville) Berlin Stuttgart Paris Lyon ... jan. fev. mars avr mai ... 5 3 5 4 4 ... 2 2 5 2 2 3 3 2 ... 2 2 2 2 ... 3 5 4 4 ... 2 3 3 2 ... 2 2 ... 10 Bases de Données OLAP | Hiver 2013/14 | Melanie Herschel | Université Paris Sud Roll-up de plusieurs dimensions Roll-Up Exemple- Roll-up de plusieurs dimensions Produit (type) Bücher Medien Temps (trimestre) Lieu (ville) Berlin Stuttgart Paris Lyon ... Q1 Q2 Roll-Up des dimensions Produit et Temps: (catégorie / mois / ville) ➔ (type/ trimestre / ville) Produit (catégorie) romans enfants sciences CD DVD BlueRay Temps (mois) Lieu (ville) Berlin Stuttgart Paris Lyon ... jan. fev. mars avr mai ... 5 3 5 4 4 ... 2 2 5 2 2 3 3 2 ... 2 2 2 2 ... 3 5 4 4 ... 2 3 3 2 ... 2 2 ... 11 Bases de Données OLAP | Hiver 2013/14 | Melanie Herschel | Université Paris Sud Roll-up vers la racine de toutes les dimensions Roll-Up vers la racine de toutes les dimensions: (catégorie/ mois / ville) ➔ (Produit / Temps / Lieu) Roll-Up Exemple- Roll-up vers la racine de toutes les dimensionen Produit (Produit) Produit Temps Temps (Temps) Lieu (Lieu) Lieu Produit (catégorie) romans enfants sciences CD DVD BlueRay Temps (mois) Lieu (ville) Berlin Stuttgart Paris Lyon ... jan. fev. mars avr mai ... 5 3 5 4 4 ... 2 2 5 2 2 3 3 2 ... 2 2 2 2 ... 3 5 4 4 ... 2 3 3 2 ... 2 2 ... 12 Bases de Données OLAP | Hiver 2013/14 | Melanie Herschel | Université Paris Sud • Rappel: • Une mesure appartient à un fait, et ce fait possède une certaine granularité. • Deux propriétés d’une mesure: • Valeur numérique • Fonction pouvant dériver la mesure á partir d’autres mesures. • Lors d’une opération roll-up, nous passons d’une granularité G1 des faits vers une granularité plus grossière des faits, dénotée G2. • La fonction définie pour les faits de granularité G2 (si celle-ci est définie) est utilisée pour calculer la valeur de la mesure de granularité G2. • Cependant, il faut prendre en compte la propriété de l’additivité de la mesure (additive, semi-additive ou non-additive). • Dans le cas d’une mesure semi-additive ou non-additive, il se peut que la valeur de la mesure ne soit calculable qu’à partir des mesures des données à plus fine granularité (de toutes les dimensions). Roll-Up Valeurs de Mesures 13 Bases de Données OLAP | Hiver 2013/14 | Melanie Herschel | Université Paris Sud Dérivez les valeurs des mesures du résultat de l’opération roll-up représentée ci-dessous (en utilisant les valeurs montrées uniquement) Roll-Up Valeurs de mesures Produit (type) Bücher Medien Temps (trimestre) Lieu (ville) Berlin Stuttgart Paris Lyon ... Q1 Q2 Roll-up des dimensions Produit et Temps: (catégorie / mois / ville) ➔ (type/ trimestre / ville) Produit (catégorie) romans enfants sciences CD DVD BlueRay Temps (mois) Lieu (ville) Berlin Stuttgart Paris Lyon ... jan. fev. mars avr mai ... 5 3 5 4 4 ... 2 2 5 2 2 3 3 2 ... 2 2 2 2 ... 3 5 4 4 ... 2 3 3 2 ... 2 2 ... médias livres 14 Bases de Données OLAP | Hiver 2013/14 | Melanie Herschel | Université Paris Sud Drill-Down Drill-down Soit un cube à n dimensions C = (DS, M) = ({D1, ..., Dn}, {M1, ..., Mp}) ayant les granularités G = {l1, l2, ...,ln}, où li correspond au niveau du schéma {D1, ..., Dm, TopD; uploads/Litterature/ 04-requetes-pdf.pdf

  • 28
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager