See discussions, stats, and author profiles for this publication at: https://ww
See discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/220438873 Langage pour bases multidimensionnelles : OLAP-SQL Article in Ingénierie des Systèmes D Information · June 2002 DOI: 10.3166/isi.7.3.11-38 · Source: DBLP CITATIONS 3 READS 566 3 authors: Some of the authors of this publication are also working on these related projects: k-means optimization by pre-aggregation and pre-computation View project Constraints and multidimensional model View project Franck Ravat IRIT : Institut de Recherche en Informatique de Toulouse 158 PUBLICATIONS 1,025 CITATIONS SEE PROFILE Olivier Teste Institut de Recherche en Informatique de Toulouse 199 PUBLICATIONS 1,357 CITATIONS SEE PROFILE Gilles Zurfluh Institut de Recherche en Informatique de Toulouse 123 PUBLICATIONS 795 CITATIONS SEE PROFILE All content following this page was uploaded by Olivier Teste on 10 December 2020. The user has requested enhancement of the downloaded file. Langage pour bases multidimensionnelles : OLAP-SQL Franck Ravat — Olivier Teste — Gilles Zurfluh Université Paul Sabatier IRIT / SIG 118, Route de Narbonne 31062 Toulouse cedex 04 {ravat, teste, zurfluh}@irit.fr RÉSUMÉ. Cet article présente un langage dédié aux bases de données décisionnelles implantées en relationnel OLAP. L'approche proposée permet de définir, de contrôler et de manipuler les données d'une base multidimensionnelle organisée en constellation. Ce langage repose sur l'extension multidimensionnelle du standard SQL. Le langage de définition permet de spécifier simplement les composants (faits, dimensions, hiérarchies) du schéma multidimensionnel avec une abstraction complète des tables relationnelles. Le langage de contrôle permet de définir de manière uniforme des droits sur tout ou partie du schéma. Enfin, le langage de manipulation offre un mécanisme unique de consultation reposant sur l'extension de la commande SELECT. Notre langage OLAP-SQL fait l'objet d'un développement basé sur le SGBD Oracle 9i. ABSTRACT. This paper presents a language dedicated to relational OLAP databases. The solution we provide permits to define, to control and to manipulate constellation multidimensional databases. This language is based on a multidimensional extension of SQL. The definition language facilitates component specifications (facts, dimensions, hierarchies) of a multidimensional schema independently of tables. The control language allows in a uniform way the definition of privileges on whole or part of a multidimensional schema. Finally, the manipulation language provides a single querying mechanism based on the SELECT command extension. The OLAP-SQL language we presented is implementing with Oracle 9i. MOTS-CLÉS : base multidimensionnelle, schéma en constellation, langage OLAP (définition, contrôle, manipulation). KEYWORDS: multidimensional database, constellation schema, OLAP language (definition, control, manipulation). 1 Introduction Les années 90 ont vu le développement de systèmes d'analyse de données de type OLAP (On-Line Analytic Processing). Basés sur les systèmes transactionnels existants (OLTP), les systèmes OLAP sont mis en place pour optimiser les coûts, accroître la réactivité des entreprises face à la concurrence, mieux cerner les marchés émergeants, anticiper les besoins des clients,… Dans ce contexte, les bases de données multidimensionnelles connaissent un important essor en raison de leur adéquation dans la manipulation et l'exploitation rapide, efficace et performante des données à des fins décisionnelles. Nos travaux se situent dans le cadre des systèmes OLAP exploitant une base de données multidimensionnelles. Plus particulièrement, nous nous focalisons sur les langages dédiés à ces bases de données. Dans les sections suivantes, nous précisons les concepts inhérents au modèle multidimensionnel et les caractéristiques des langages d’accès aux bases de données multidimensionnelles ; nous terminons cette section en présentant les objectifs de notre langage. 1.1 Modèle multidimensionnel Les systèmes OLTP assurent une gestion optimisée des données (notamment en limitant la redondance des données). Dans les systèmes OLAP, une base de données multidimensionnelles est organisée pour faciliter l'analyse des données par des utilisateurs finaux, les décideurs. Les informations d’une base multidimensionnelle sont organisées sous la forme de faits à analyser selon différents axes d’analyses (dimensions). Par exemple, on peut analyser les ventes selon les dimensions clients, produits et temps. Les faits sont composés de mesures d'activité et les dimensions comportent des paramètres d'activité (Gray et al., 1996) (Kimball, 1996) (Gyssen et al., 1997). Certaines solutions proposent une définition explicite de la hiérarchisation des paramètres d’une dimension (Agrawal et al., 1995) (Li et al., 1996) (Cabibbo et al., 1998) (Lehner, 1998). Ces éléments conceptuels peuvent être implantés selon différents modèles : Multidimensional-OLAP (Cabibbo et al., 1997), Relational-OLAP (Agrawal et al., 1995) (Kimball, 1996) ou Object-OLAP (Trujillo et al., 1998) (Pedersen et al., 1999). Cependant, la majorité des outils du marché (Oracle Warehouse Builder, SAS Warehouse…) proposent une modélisation Relational-OLAP. Dans ces systèmes, chaque dimension est implantée sous la forme d’une table relationnelle. Chaque fait est défini au travers d'une table et son identifiant est une clé primaire composée des clés étrangères correspondantes aux dimensions liées. L'approche R-OLAP apparaît comme prépondérante aussi bien dans le monde industriel que dans la recherche scientifique. Dans ce contexte, nous proposons un nouveau langage facilement exploitable par l'ensemble des utilisateurs des bases multidimensionnelles. Plus précisément, notre langage permet de manipuler mais également de contrôler et définir les composants d'une base multidimensionnelle. 1.2 Les langages dédiés aux BD multidimensionnelles Langage de définition. De nombreux travaux ont apporté une solution pour la modélisation de bases de données multidimensionnelles mais peu se sont focalisés sur les langages de définition. Nous classons les travaux sur les langages en deux catégories : les langages graphiques (Golfarelli et al., 1998) (Tryfona et al., 1999) (Trujillo et al., 2000) (Hahn et al., 2000) et les langages algèbriques (Gyssen et al., 1997) (Lehner, 1998) (Mendelzon et al., 2000). Ces travaux ne proposent qu'une définition partielle et non standard des schémas intégrant plusieurs faits. Certains SGBD commerciaux ont récemment introduit de nouvelles commandes visant à définir quelques composants spécifiques aux bases multidimensionnelles. Par exemple, le SGBD Oracle (depuis le version 8i) propose une commande de définition des dimensions permettant la caractérisation de hiérarchies multiples sur une table représentant une dimension. Cependant, la définition des faits est fastidieuse car elle nécessite la définition d'une table avec la spécification des contraintes (clés étrangères, clés primaires composées) et d'index spécifiques à la structuration des schémas en étoile (index bitmap étendus). Les propositions actuelles des SGBD tel que Oracle ne font pas abstraction des tables relationnelles et rendent la définition du schéma multidimensionnel complexe ; les concepts manipulés (tables, dimensions, index) sont de niveaux d'abstraction différents. Langage de contrôle. A notre connaissance, aucune recherche n'aborde la gestion de droits dans les bases multidimensionnelles. Parmi les offres commerciales, la gestion de droits ne donne pas lieu à une proposition spécifique liée au contexte multidimensionnel. Par exemple, il n'est pas proposé de mécanismes permettant de gérer l'accès aux hiérarchies. Langage de manipulation. Dans ce domaine, la communauté scientifique a effectué de nombreux travaux. Une proposition importante est l'opérateur cube (Gray et al., 1996). (Agrawal et al., 1995) propose différents opérateurs algébriques dans le contexte ROLAP et (Cabibbo et al., 1998) définit plusieurs opérateurs dans un langage algébrique et un langage graphique. D'autres recherches visent à intégrer des fonctionnalités avancées telle que la gestion du temps ; (Mendelzon et al., 2000) définit le langage TOLAP qui intègre plusieurs fonctionnalités de TSQL2. Dans le domaine commercial, de nombreux outils de manipulation ont été développés. Nous distinguons différentes catégories d'outils : – les requêteurs graphiques (Crystal Report, Discoverer d'Oracle, Explorer de Business Objects), très utilisés par les décideurs, permettent de manipuler et restituer les données sous forme de tableaux et de graphiques, – les outils spécifiques OLAP (Explorer d'Oracle Express), manipulent directement les concepts de l'approche multidimensionnelle (fait, dimension, mesure,…) et visualisent les données sous forme de tranches de cube de données ("briefing" avec Oracle Express) sur lesquelles des opérateurs multidimensionnels peuvent s'appliquer, – les SGBD relationnels (Oracle, MS SQL Server…), étendent le langage d'interrogation SQL. Oracle étend l'opérateur GROUP BY en intégrant les commandes CUBE et ROLL UP qui permettent l'expression de calculs de sous- totaux. MS SQL Server propose une extension de la clause SELECT permettant l'affichage et la navigation des données en colonne et en ligne. Les requêteurs graphiques sont simples et facilitent l'accès aux informations, mais ils restent limités pour un processus d'analyse complexe. Les outils spécifiques OLAP offrent de nombreuses possibilités de manipulation multidimensionnelle mais ils sont difficiles d'accès pour les non informaticiens. Enfin, les SGBD relationnels tendent à intégrer les concepts inhérents à l'approche OLAP mais ils restent incomplets et ne profitent pas de la puissance des concepts multidimensionnels. 1.3 Contributions - organisation de l'article Contributions. Notre objectif est de proposer un langage dédié aux bases multidimensionnelles implantées sous une forme Relationnal-OLAP ; ce langage intégre les commandes de définition, de contrôle et de manipulation. Le langage assertionnel standard des bases relationnelles (SQL (Iso, 1992)) n'est pas adapté et manque d'expressivité pour la définition d’une base multidimensionnelle. Aussi, nous proposons une extension de ce langage afin de conserver ses avantages (déclaratif, standard, puissant, reconnu) tout en facilitant la définition et la manipulation des concepts multidimensionnels : – manipulation aisée des concepts multidimensionnels avec abstraction complète des tables relationnelles d'implantation, – non définition des jointures implicites entre le fait et les dimensions liées, – définition standard des faits, dimensions et hiérarchies, – consultation aisée avec une seule commande, – uploads/Management/article-versionfinale 1 .pdf
Documents similaires










-
24
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Jan 06, 2023
- Catégorie Management
- Langue French
- Taille du fichier 0.3577MB