2021/2022 Système d’Information Décisionnels et Big Data Chapitre 3: Cube OLAP

2021/2022 Système d’Information Décisionnels et Big Data Chapitre 3: Cube OLAP Dr. Fatma Siala Kallel Mr. Bilel Marzouki Master: Business Analytics Entrepôt de données • Unentrepôt de données contient des données nombreuses, homogènes, exploitables, multidimensionnelles et consolidées. • Analyser les données d’un entrepôt de données c’est : Résumer Observer Appliquer des formules statistiques Synthétiser des données selon plusieurs dimensions. • Comment exploiter ces données à des fins d’analyse ? € traditionnellement : les requêtes OLTP sont e x é c u t é e s sur les données. 2 Exemples d’analyses d’un entrepôt 3 • Analyse des ventes de divers produits : SELECT modele, SUM(montant) FROM ventes, produits WHERE ventes.codeProduit = produits.codeProduit GROUP BY modele; Exemples d’analyses d’un entrepôt • Les ventes de vis sont plus faibles que prévu... quelles couleurs sont responsables ? SELECT couleur, SUM(montant) FROM ventes, produits WHERE ventes.codeProduit = produits.codeProduit AND modele = “vis” GROUP BY couleur ; 4 • Les ventes de vis sont plus faibles que prévu... quelles années sont responsables ? SELECT couleur, annees, SUM(montant) FROM ventes, produits, temps WHERE ventes.codeProduit = produits.codeProduit AND ventes.date = temps.jour AND modele = “vis” GROUP BY couleur, annees ; • Les ventes de vis sont plus faibles que prévu... Quels trimestres sont responsables ? SELECT couleur, trimestre, SUM(montant) FROM ventes, produits, temps WHERE ventes.codeProduit = produits.codeProduit AND ventes.date = temps.jour AND modele = “vis” GROUP BY couleur, trimestre ; Exemples d’analyses d’un entrepôt 5 • Quels sont les résultats cumulés des vendeurs par mois ? SELECT vendeur, mois, CSUM(resultat,vendeur,mois) as cumul FROM ( SELECT vendeur, mois, Sum(montant) as resultat FROM ventes, produits, temps WHERE ventes.codeProduit = produits.codeProduit AND ventes.date = temps.jour AND modele = “vis” AND couleur = “rose” GROUP BY mois, vendeurs) ORDER BY mois ; • Quelle est lʼévolution de la moyenne des ventes pour une fenêtre de 2 jours ? SELECT date, montant, MAVG(montant,2,date) as moy FROM ventes, temps WHERE ventes.date = temps.jour AND annee = 2001 ORDER BY date ; Exemples d’analyses d’un entrepôt 6 • Supporter des opérations “tableur” sur des BD de plusieurs Go !!! • Besoins spécifiques : • langages de manipulation • organisation des données • fonctions d'agrégation • Organisation des données proche des abstractions de l'analyste : • selon plusieurs dimensions • selon différents niveaux de détail • en ensemble • Donnée = point dans l'espace associé à des valeurs Exemples d’analyses d’un entrepôt 7 OLAP • Acronyme : On-line Analytical Processing • C’est une représentation abstraite d'informations multidimensionnelles exclusivement numérique. Cette structure est prévue à des fins d'analyses interactives par une ou plusieurs personnes (souvent ni informaticiens ni statisticiens) du métier que ces données sont censées représenter. • Cube OLAP présente les avantages suivants: Obtenir des informations déjà agrégées selon les besoins d’utilisateur. Simplicité et rapidité d’accès. données agrégées selon différentes 8 Capacité à manipuler les dimensions. Temps de réponse très court. Pas de jointure. OLAP on parle de technologie OLAP mais aussi connu sous le nom de Cube OLAP, ceci à cause du design de sa structure de donnée comparable à un tableau croisé dynamique (TCP) mais en bien mieux. Un cube OLAP est une base de données à plusieurs dimensions, optimisée pour les applications d'entrepôt de données et de traitement analytique en ligne (OLAP , OnLine Analytical Processing). Un cube OLAP est une méthode de stockage de données sous forme multidimensionnelle, généralement à des fins de génération de rapports. 9 OLAP 10 OLAP versus OLTP 11 OLAP Un cube OLAP est une représentation abstraite d'informations multidimensionnelles exclusivement numérique utilisé par l'approche OLAP (acronyme de On-line Analytical Processing). Cette structure est prévue à des fins d'analyses interactives par une ou plusieurs personnes (souvent ni informaticiens ni statisticiens) du métier que ces données sont censées représenter. 12 OLAP Les cubes OLAP ont les caractéristiques suivantes : 1obtenir des informations déjà agrégées selon les besoins de l’utilisateur. 2 simplicité et rapidité d’accès 3capacité à manipuler les données agrégées selon différentes dimensions 4 un cube utilise les fonctions classiques d’agrégation : min, max, count, sum, avg, mais peut utiliser des fonctions d’agrégations spécifiques. 13 Exemple de cube OLAP nous allons nous intéresser aux ventes de tous les magasins "XXX". 14 Exemple de cube OLAP Vue n° 1 : On s'intéresse à toutes les ventes du magasin d'ANNECY (toutes catégories confondues durant toute l'année) 15 Exemple de cube OLAP Vue n° 2 : On s'intéresse aux ventes de la catégorie "vêtements pour enfants« (tous les magasins durant toute l'année) 16 Exemple de cube OLAP Vue n° 3 : On s'intéresse à toutes les ventes durant le mois de Février (toutes catégories confondues et dans tous les magasins) 17 Exemple de cube OLAP Vue n° 4 : On s'intéresse aux ventes du magasin d'ANNECY dans la catégorie "vêtements pour enfants" durant le mois de Février 18 3 catégories d'opérations élémentaires : • Restructuration : concerne la représentation, permet un changement de points de vue selon différentes dimensions : opérations liées à la structure, manipulation et visualisation du cube : • Rotate/pivot • Switch • Granularité : concerne un changement de niveau de détail : opérations liées au niveau de granularité des données : • roll-up • drill-down • Ensembliste : concerne l'extraction et l'OLTP classique : • slice, dice • Selection • Projection • jointure (drill-across) Opérations OLAP 19 Exemple de cube OLAP Ces différentes vues correspondent à différentes opérations. Voici la liste des opérations OLAP : 1 Pivoter (pivot, swap) : interchanger 2 dimensions. 2Forage vers le bas (drill-down) : descendre dans la hiérarchie de la dimension (Ex. visualiser les ventes par mois au lieu de par année). 3Forage vers le haut (drill-up, roll-up) : remonter dans la hiérarchie de la dimension (Ex. visualiser les ventes par année au lieu de par mois). 4Forer latéralement (drill-across) : Permet de passer d’un membre de dimension à un autre (Ex. visualiser les ventes d’ANNECY au lieu de celles de P ARIS). 20 Techniques d’implémentation 21 Systèmes ROLAP = technologie de stockage relationnelle : • Le modèle relationnel demande des extensions pour supporter les requêtes d'analyses multidimensionnelles du niveau d'application • Le moteur ROLAP traduit dynamiquement le modèle logique de données multidimensionnel M en modèle de stockage relationnel R (en étoile ou en flocon). • Techniquement, le moteur ROLAP transforme une requête multidimensionnelle requête relationnelle L'efficacité du résultat de la requête est le facteur dominant pour la performance et le passage à l'échelle global du système choix de technique/stratégies d'optimisation spécifiques Systèmes ROLAP 22 Techniques d’implémentation R-OLAP se définit par Relational OLAP . La base ROLAP est en fait une classique base relationnelle organisée pour fonctionner comme une base OLAP . Les bases ROLAP sont bien plus lentes et nettement moins performantes que les bases MOLAP . Mais, immense avantage, elles sont sans limite de taille. M-OLAP se définit par Multidimensional OLAP . La base MOLAP est l'application physique du concept OLAP . Il s'agit réellement d'une structure multidimensionnelle. Les bases MOLAP sont rapides et performantes. Elles proposent des fonctionnalités particulièrement évoluées. Les bases de type MOLAP restent limitées au gigaoctet. C'est de cet fonctionnalité que vient le Cube OLAP pour sa faculté multi-dimensionnel. 23 Techniques d’implémentation H-OLAP se définit par Hybrid OLAP . Le modèle HOLAP , propose de cumuler les avantages des deux modèles précédents. Les données agrégées sont stockées sous formes multi-dimensionnelles, alors que les données détaillées sont stockées dans des structures relationnelles. D-OLAP se définit par Desktop OLAP . La base DOLAP est une base OLAP très limitée en taille, hébergée sur le poste client. Elle est bien entendu très rapide. 24 uploads/Marketing/chap-3 2 .pdf

  • 28
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Mai 30, 2021
  • Catégorie Marketing
  • Langue French
  • Taille du fichier 0.4923MB