Business Intelligence (BI) Noura Azaiez Noura.azaiez@gmail.com Business Intelli
Business Intelligence (BI) Noura Azaiez Noura.azaiez@gmail.com Business Intelligence —L’informatique décisionnelle —Métiers du BI —Architecture décisionnelle —Les Cubes OLAP —Manipulation Multidimensionnelle —Conclusion —Exercice 17/03/2021 3 • L’informatique décisionnelle (en anglais business intelligence (BI) ou decision support system (DSS)): • obtenir une connaissance approfondie de l’entreprise et de définir et de soutenir leurs stratégies d’affaires. • mettre en forme et présenter les informations clés afin de faciliter la prise de décision. • par exemple : d’acquérir un avantage concurrentiel, d’améliorer la performance de l’entreprise, d’augmenter la rentabilité, et d’une façon générale la création de valeur ajoutée de l’entreprise. L’informatique Décisionnelle 17/03/2021 4 Métiers du BI Data Integration: •Combiner des informations hétérogènes venants de sources différentes Data Analysis : •Nettoyage, transformation et modélisation des données. •Data Visualisation •Rendre la donnée compréhensible •Communiquer à partir de la donnée 17/03/2021 5 Métiers du BI Data Science: •disposer de compétences de haut niveau en matière d’analyse de données ométhodes statistiques oconnaissances telles que la linguistique, la sémantique... Data Steward – Data Governance : •spécifier les exigences sur les données et d’en contrôler la qualité •Avoir une parfaite connaissance de son environnement • organiser le lac de données en requalifiant un par un chaque élément afin d’obtenir une donnée sûre et qualitative et dont l’utilisation sera optimisée. 17/03/2021 6 Architecture décisionnelle Extraction des données •Les données opérationnelles sont extraites périodiquement de sources hétérogènes : fichiers Excel, base de données (Oracle, SQL Server, etc…) Structuration des données •Les données sont restructurées, enrichies, agrégées, reformatées, nomenclaturées pour être présentées à l’utilisateur sous une forme sémantique (vues métiers ayant du sens). Ce qui permet aux décideurs d’interagir avec ces données présentées en schémas en étoile composés des faits et mesures selon des dimensions hiérarchisées (Modélisation multidimensionnelle). Présentation des données •Les outils d’analyse OLAP permettent de naviguer dans les différentes dimensions (Drill-down, Roll-up…) des données déjà affichées sous forme de cubes multidimensionnels. •Visualisation et la restitution des résultats • Une grande masse de données – Distribuées – Hétérogènes – Très détaillées • à traiter – Synthétiser – Résumer – Visualiser – Analyser • pour une utilisation par – des Experts / analystes d’un métier – Non informaticiens – Non statisticiens 17/03/2021 7 Architecture décisionnelle Nous avons donc: 17/03/2021 8 Rappel de la chaîne de la valeur décisionnelle •Des SGBD relationnels et d'autres systèmes qui contiennent les données d'exploitation. •Un ETL extrait les données pertinentes et les charge dans l'ODS (Operating Data Store) du datawarehouse •Les données sont structurées dans le datawarehouse •Des datamarts qui exploitent une technologie OLAP (On-line Analytical Processing) sont mis à jour à partir du datawarehouse •Des rapports sont générés sur ces données Architecture décisionnelle Transformer des données de production en informations stratégiques 17/03/2021 9 Architecture décisionnelle 17/03/2021 10 Les cubes OLAP • Un cube OLAP est une méthode de stockage de données sous forme multidimensionnelle. Cette représentation structurelle est prévue à des fins d'analyses et de génération de rapports. • Les cubes OLAP ont les caractéristiques suivantes : 1- obtenir des informations déjà agrégées selon les besoins de l’utilisateur. 2- simplicité et rapidité d’accès 3- capacité à manipuler les données agrégées selon différentes dimensions 4- un cube utilise les fonctions classiques d’agrégation : min, max, count, sum, avg, mais peut utiliser des fonctions d’agrégations spécifiques 17/03/2021 11 Les cubes OLAP Dimensions Fait Paramètres Paramètres Paramètres Mesures 17/03/2021 12 Les cubes OLAP 17/03/2021 13 Les cubes OLAP Dans cet exemple, nous allons nous intéresser aux ventes de tous les magasins. 17/03/2021 14 Les cubes OLAP Comment peut-on utiliser ce cube? Nous allons nous intéresser aux différentes vues de ce cube. Vue n° 1 : On s'intéresse à toutes les ventes du magasin d'ANNECY (toutes catégories confondues durant toute l'année) Vue n° 2 : On s'intéresse aux ventes de la catégorie "vêtements pour enfants" (tous les magasins durant toute l'année) 17/03/2021 15 Les cubes OLAP Vue n° 3 : On s'intéresse à toutes les ventes durant le mois de Février (toutes catégories confondues et dans tous les magasins) Vue n° 4 : On s'intéresse aux ventes du magasin d'ANNECY dans la catégorie "vêtements pour enfants" durant le mois de Fevrier 17/03/2021 16 Les cubes OLAP Le cube de données est formé d’arêtes représentants les axes d’observations d’indicateurs placés dans les cellules. Sur chaque arête, une graduation est choisie afin d’observer les données à un niveau adéquat de granularité. La mesure Nombre est dimensionnée par Mois, Modèle et Magasin. Evolution des ventes de chaussures Chaque cellule du cube représente une valeur. Les dimensions sont indiquées sur les arêtes du cube. 17/03/2021 Manipulation Multidimensionnelle • Principe : Requête SQL => Relation Totaux des ventes des produits de catégorie ‘C2’ par année et pays de clients SELECT annee, pays, SUM(qte) qte, SUM(montant) montant FROM VENTES, TEMPS, CLIENTS, PRODUITS WHERE VENTES.codeT = TEMPS.codeT AND VENTES.codeC = CLIENTS.codeC AND VENTES.codeP = PRODUITS.codeP AND categorie = 'C2' GROUP BY annee, pays; annee pays qte montant 2001 Liban 9 200 2001 France 15 400 2001 Italie 12 350 2000 Liban 7 150 2000 France 12 310 2000 Italie 10 240 1999 Liban 7 120 1999 France 10 250 1999 Italie 8 190 CLIENTS codeC nom prenom ville pays TEMPS codeT num_mois lib_mois annee VENTES codeP# codeT# codeC# qte montant PRODUITS codeP description prix_unit sous_categ categorie PRIX_PROD codeT# codeP# prix_unit CLIENTS codeC nom prenom ville pays CLIENTS codeC nom prenom ville pays TEMPS codeT num_mois lib_mois annee TEMPS codeT num_mois lib_mois annee VENTES codeP# codeT# codeC# qte montant PRODUITS codeP description prix_unit sous_categ categorie PRODUITS codeP description prix_unit sous_categ categorie PRIX_PROD codeT# codeP# prix_unit 17 17/03/2021 Manipulation Multidimensionnelle • Principe : Relation => Table dimensionnelle pays Liban France Italie annee 2001 (9, 200) (15, 400) (12, 350) 2000 (7, 150) (12, 310) (10, 240) 1999 (7, 120) (10, 250) (8, 190) VENTES (qte, montant) CLIENTS TEMPS PRODUITS.categories = 'C2' annee pays qte montant 2001 Liban 9 200 2001 France 15 400 2001 Italie 12 350 2000 Liban 7 150 2000 France 12 310 2000 Italie 10 240 1999 Liban 7 120 1999 France 10 250 1999 Italie 8 190 => Vision tabulaire des informations (tranche du cube) 18 17/03/2021 Manipulation Multidimensionnelle • Opérations de changement de la granularité des données – Forage vers le bas • Ajout d'un (ou plusieurs) paramètre(s) en ligne ou en colonne pour visualiser les données suivant un niveau de détail plus fin (hiérarchie courante) • Le contexte de calcul des données avec les fonctions count, sum, avg, min et max reste homogène entre les niveaux de détail • Drill-Down(S, D, p) = S' – S schéma initial – D dimension – p paramètre qui caractérise le niveau de détail 19 17/03/2021 Manipulation Multidimensionnelle • Exemple pays Liban Italie ville Beyrouth Toulouse Paris Rome annee num_mois 2001 1 (1, 150) (3, 50) (1, 40) (1, 30) 2 (2, 20) (1, 10) (2, 80) (2, 50) … … ,,, ,,, ,,, 2000 1 (2, 50) (1, 60) (6, 150) (10, 240) 2 (1, 25) (2, 80) (6, 150) (10, 240) … ,,, ,,, ,,, ,,, 1999 1 (3, 70) (0, 0) (0, 0) (4, 100) 2 (0, 0) (0, 0) (0, 0) (1, 20) … ,,, ,,, ,,, ,,, France CLIENTS PRODUITS.all TEMPS VENTES (qte, montant) pays Liban France Italie annee 2001 (9, 200) (15, 400) (12, 350) 2000 (7, 150) (12, 310) (10, 240) 1999 (7, 120) (10, 250) (8, 190) VENTES (qte, montant) CLIENTS TEMPS PRODUITS.all Drill-Down(S, CLIENTS, ville) = S' Drill-Down(S', TEMPS, num_mois) = S" 20 17/03/2021 Manipulation Multidimensionnelle • Opérations de changement de la granularité des données – Forage vers le haut • Suppression d'un (ou plusieurs) paramètre(s) en ligne ou en colonne pour visualiser les données suivant un niveau de détail moins fin • Le contexte de calcul des données avec les fonctions count, sum, avg, min et max reste homogène entre les niveaux de détail • Roll-Up(S, D, p) = S' – S schéma initial – D dimension – p paramètre qui caractérise le niveau de granularité souhaité 21 17/03/2021 Manipulation Multidimensionnelle • Exemple pays Liban Italie ville Beyrouth Toulouse Paris Rome annee 2001 (9, 200) (10, 250) (5, 150) (12, 350) 2000 (7, 150) (6, 160) (6, 150) (10, 240) 1999 (7, 120) (5, 125) (5, 125) (8, 190) PRODUITS.all VENTES (qte, montant) TEMPS France CLIENTS pays Liban Italie ville Beyrouth Toulouse Paris Rome annee mois_num 2001 1 (1, 150) (3, 50) (1, 40) (1, 30) 2 (2, 20) (1, 10) (2, 80) (2, 50) … … ,,, ,,, ,,, 2000 1 (2, 50) (1, 60) (6, 150) (10, 240) 2 (1, 25) (2, 80) (6, 150) (10, 240) … ,,, ,,, ,,, ,,, 1999 1 (3, 70) (0, 0) (0, 0) (4, 100) 2 (0, 0) (0, 0) (0, 0) (1, 20) … ,,, ,,, ,,, ,,, France CLIENTS PRODUITS.all TEMPS VENTES (qte, montant) Roll-Up(S", TEMPS, annee) = S' 22 17/03/2021 Manipulation Multidimensionnelle • Opération transformant la structure des données – Calcul d'agrégations • Ajout d'une ligne et d'une colonne contenant l'agrégation des valeurs affichées • Cube(S, fncagreg) = S' – S schéma initial – fncagreg uploads/Management/bi-partie1-2021.pdf
Documents similaires
-
13
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Fev 28, 2022
- Catégorie Management
- Langue French
- Taille du fichier 1.5307MB