Business Intelligence Chp3 – Modélisation des Données Décisionnelles Dr. Lilia

Business Intelligence Chp3 – Modélisation des Données Décisionnelles Dr. Lilia SFAXI GL5 - 2013-2014 Institut National des Sciences Appliquées et de Technologie 1 Modélisation des Données Décisionnelles  Utilisation de concepts pour : o Optimiser la restitution de données selon les axes métiers de l’entreprise o Gérer et visualiser les données de manière rapide et intuitive o Retrouver et analyser rapidement les données à partir de diverses sources o Intégrer plusieurs bases de données o Extraire, grouper, organiser et corréler et transformer les données  Deux types de modélisations: Entité-Relation et Multidimensionnelle 2 27/02/2014 Business Intelligence 3 Modèles de Données 27/02/2014 Business Intelligence Plan du Chapitre  Modélisation Entité-Relation  Modélisation Multidimensionnelle  Conception des Data Warehouses : Etapes et Exemple  Modèles d’un Data Warehouse  Aspects Fondamentaux de la Modélisation Multidimensionnelle 27/02/2014 Business Intelligence 4 Modélisation Entité-Relation CHP3: MODÉLISATION DES DONNÉES DÉCISIONNELLES 27/02/2014 Business Intelligence 5 Modélisation Entité-Relation  Discipline permettant d’éclairer les relations microscopiques entre les données o Supprimer la redondance des données o Simplifier le traitement des transactions o Aider le concepteur dans la répartition des propriétés entre les entités  Principes o Notion d’identifiant o Dépendance fonctionnelle o Décomposition o Formes normales 27/02/2014 Business Intelligence 6 Normalisation dans les BDR  Forme normale : o Type de relation particulier entre les entités o Permet d’éviter les anomalies transactionnelles dues à une mauvaise modélisation des données o Permet de vérifier la robustesse de la conception des modèles de données pour éviter les problèmes de redondance et de mise à jour du contexte  Dans le modèle OLTP, il existe 8 formes normales o Elles s’emboitent les unes dans les autres o Le respect d’une FN de niveau supérieur implique le respect des FN des niveaux inférieurs o On va présenter les 3 premières (les plus utilisées) 27/02/2014 Business Intelligence 7 Première Forme Normale (1FN)  Relation dont tous les attributs : o Contiennent une valeur scalaire (les valeurs ne peuvent pas être divisées en plusieurs sous- valeurs dépendant également individuellement de la clé primaire) o Contiennent des valeurs non répétitives (le cas contraire consiste à mettre une liste dans un seul attribut). o Sont constants dans le temps (utiliser par exemple la date de naissance plutôt que l'âge). 27/02/2014 Business Intelligence 8 Produit Fournisseur Téléviseur Vidéo SA, Hitek LTD Produit Fournisseur Téléviseur Vidéo SA Téléviseur Hitek LTD Problème Solution Deuxième Forme Normale (2FN)  Les attributs d'une relation sont divisés en deux groupes : o Le premier groupe est composé de la clé (une ou plusieurs). o Le deuxième groupe est composé des autres attributs (éventuellement vides).  Tout attribut du deuxième groupe ne peut pas dépendre que d'un sous-ensemble (strict) d'attribut(s) du premier groupe. o « Un attribut non clé ne dépend pas que d'une partie de la clé » 27/02/2014 9 Pdt Fournisseur Adresse Fournisseur Télé Vidéo SA 13 rue Midi Ecran Vidéo SA 13 rue Midi Télé Hitek LTD 25 rue Bond Produit Fournisseur Télé Vidéo SA Ecran Vidéo SA Télé Hitek LTD Fournisseur Adresse Vidéo SA 13 rue Midi Hitek LTD 25 rue Bond Problème Solution Troisième Forme Normale (3FN)  Les attributs d'une relation sont divisés en deux groupes : o Le premier groupe est composé de la clé (une ou plusieurs). o Le deuxième groupe est composé des autres attributs (éventuellement vides).  Tout attribut du deuxième groupe ne peut pas dépendre que d'un sous-ensemble (strict) d'attribut(s) du deuxième groupe. o « Un attribut non clé ne dépend pas d'un ou plusieurs attributs ne participant pas à la clé ». 27/02/2014 Business Intelligence 10 Fournisse ur Adresse Ville Pays Vidéo SA 13 rue Midi Paris France Hitek LTD 25 rue Bond London England Fournisse ur Adresse Ville Vidéo SA 13 rue Midi Paris Hitek LTD 25 rue Bond London Ville Pays Paris France London England Problème Solution Modélisation Entité-Relation  Le succès du traitement des transactions dans les BDR est essentiellement dû à l’apport de la modélisation entité/relation  Exemple o une simple recherche dans une table principale d'adresses clients. o Cette recherche est contrôlée par une clé d'adresse client, qui définit l'unicité de l'enregistrement et permet une recherche indexée extrêmement rapide. o Le respect des formes normales fait que cette mise à jour soit faite en une itération, sans risque d’oublier des enregistrements 27/02/2014 Business Intelligence 11 Limites de la Modélisation E/R  Modèle complexe o Plusieurs tables et jointures mises en œuvre  Risque de dégradation des performances  Pas de compréhension pour l’utilisateur  Données historiques difficilement représentées  Contraire aux objectifs du DW 27/02/2014 Business Intelligence 12 Modélisation Multidimensionn elle CHP3: MODÉLISATION DES DONNÉES DÉCISIONNELLES 27/02/2014 Business Intelligence 13 Modélisation Multidimensionnelle : Notions de Base  Méthode de conception logique qui vise à présenter les données sous une forme standardisée, intuitive et qui permet des accès hautement performants  Permet de considérer un sujet analysé comme point dans un espace à plusieurs dimensions  Les données sont organisées de manière à mettre en évidence: o Le Sujet  Le Fait o Les perspectives de l’analyse  La table des dimensions 27/02/2014 Business Intelligence 14 Faits – Table des Faits  Fait o Sujet d’analyse o Grain de mesure de l’activité o Résultat d’une opération d’agrégation des données o Exemple: Chiffre d’affaires, nombre de vente, gain, nombre de transaction…en général : une valeur numérique o Les mesures sont stockées dans la table des faits  Table des faits o Clé composite référencent des clés primaires des tables de dimensions o Contient les valeurs des mesures et des clefs vers les tables de dimensions traduit une relation (n,m) entre les dimensions o Plusieurs tables de fait dans un DW o Les faits les plus utiles d’une table des faits sont numériques et additifs 27/02/2014 Business Intelligence 15 Faits – Table des Faits  Exemple: o Fait: Montant des ventes, chaque jour pour chaque produit dans chaque magasin  A en général plusieurs lignes et peu de colonnes 27/02/2014 Business Intelligence 16 Ventes Journalières Clé Date Clé Produit Clé Magasin Quantité vendue Montant des ventes Date Produit Magasin Faits Table des Faits Dimensions Table des Dimensions  Contient une clé primaire unique qui correspond à l’un des composants de la clé multiple de la table des faits  Les tables dimensionnelles sont les points d’entrée de l’entrepôt de données  Les dimensions o Thème (ou axe) selon lequel les données sont analysées o En général sous forme textuelle o Parfois discrète (ensemble limité de valeurs): couleurs, parfums  A en général plusieurs colonnes et peu de lignes 27/02/2014 Business Intelligence 17 Produit Clé Produit Description produit Description marque Description catégorie Description type emballage Taille emballage Poids Unité de mesure du poids Type de stockage Type de durée rayon Largeur sur étagère Hauteur sur étagère Profondeur sur étagère Vue  Représentation d’une ou plusieurs requêtes de l’utilisateur du SID o À une requête correspond une et une seule vue o À une vue peuvent correspondre plusieurs requêtes  Une vue correspond également à un hyper-cube dont : o Chaque dimension est décrite par une entité dont le contenu est décrit par l’association de ces entités o Les propriétés de l’association sont des faits ou mesures o Les propriétés des entités intervenant dans la vue sont des conditions  Les combinaisons des conditions sont les coordonnées qui déterminent des valeurs de faits, comme une combinaison de valeurs numériques peut déterminer la position d’un point dans l’espace  Un fait n’est pas seulement un élément du résultat de la requête, mais il doit être déterminé par l’association des conditions 27/02/2014 Business Intelligence 18 Vue  Exemple 1: o Requête: Quels sont les frais de déplacement et le kilométrage des commerciaux de la région nord ayant des véhicules de 10 à 14 CV en avril 2004? o Vue: Frais de déplacement Kilométrage Par Employé (fonction) Par Véhicule (puissance) Par Région Par Mois 27/02/2014 Business Intelligence 19 Faits Clé Employé Clé Véhicule Clé Région Clé Mois Frais de déplacement Kilométrage Employé Véhicule Région Mois Nom Fonction Marque Puissance Vue  Exemple 2: o Requête: Quelles ont été les marges sur les ventes du produit ‘P023’ pour le client Ben Salah Ahmed à Hammamet durant le mois de Janvier? o Vue: Marge Produit Client Région Mois 27/02/2014 Business Intelligence 20 Région Mois Client Nom Fonction Produit Nom Marge Vue 1 Vue  Exemple 3: o Requête: Quels ont été les revenus sur les ventes de la marque ‘Teams’ en Tunisie durant l’année 2011? o Vue: Revenu Marque Pays Année 27/02/2014 Business Intelligence 21 Année Marque Pays Revenu Vue 2 Vue  Exemple 4: o Requête: Quels ont été les quantités vendues de la gamme ‘G006’ durant le Trimestre 2 pour la région du nord ? o Vue: Quantité Gamme Trimestre Région 27/02/2014 Business Intelligence 22 Trimestre Gamme Région Quantité Vue 3 Domaine et Contexte  Domaine o Concerne un utilisateur ou un ensemble cohérent d’utilisateurs o Implique un vocabulaire commun et une manière commune d’appréhender l’information  Contexte o Ensemble de faits et dimensions assemblées uploads/Industriel/chp3-140227090832-phpapp01.pdf

  • 12
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager