Cours bi seance 3 Mastère I T Chapitre OLAP et l ? analyse multidimensionnelle Dr Sinda Elghoul COURS BUSINESS INTELLIGENCE CIntroduction CIntroduction CTables de faits ? Correspondent à un événement d'a ?aires ? Ex achat d ? un produit par un client envo

Mastère I T Chapitre OLAP et l ? analyse multidimensionnelle Dr Sinda Elghoul COURS BUSINESS INTELLIGENCE CIntroduction CIntroduction CTables de faits ? Correspondent à un événement d'a ?aires ? Ex achat d ? un produit par un client envoi du produit au client commande de matériaux auprès d ? un fournisseur etc ? Contiennent deux types de colonnes ? Des métriques associées à l ? événement d ? a ?aire ? Ex total des ventes nombre d ? items commandés etc ? Des clés étrangères vers les tables de dimension ? Ex ID du client qui fait la commande ID du produit commandé etc ? Contiennent typiquement un très grand nombre de lignes ? Jusqu'à plusieurs milliards de lignes ? Souvent plus de des données du modèle CTables de dimension ? Ensemble hautement corrélé d'attributs jusqu'à plusieurs dizaines regroupés selon les objets clés d'une entreprise ? Ex produits clients employés installations etc ? Propriétés des attributs ? Descriptif ex cha? nes de caractères ? De qualité ex aucune valeur manquante obsolète erronée etc ? Valeurs discrètes ex jour ? ge d'un client ? Rôles des attributs ? Filtrer agréger les données ex ville catégorie produit etc ? Étiqueter les résultats ex champs descripteurs CExemple CHiérarchies dimensionnelles ? Ensemble d'attributs d ? une table de dimension ayant une relation hiérarchique x est inclus dans y ? Correspondent à des relations de type à plusieurs ? Dé ?nissent les chemins d'accès dans les données drill-down paths ? Peuvent être simples ? Produit tous ? catégorie ?marque ?produit ? Lieu tous ? pays ? province ? ville ?code postal ? Ou multiples CDimension temporelle ? Problème avoir un grain trop ?n dans la dimension temporelle ex temps du jour peut causer l'explosion du nombre de rangées ? Ex secondes di ?érentes dans une année ? Solution mettre le temps du jour dans une dimension séparée ? Dimension Date année ?mois ?jour ? Dimension TimeOfDay heure ? minute ? secondes ? lignes au lieu de lignes ? La dimension TimeOfDay est souvent modélisée comme un simple champs dans la table de faits CDimensions à évolution lente SCD ? Slowly Changing Dimensions SCD ? Même si elles sont plus statiques que les tables faits les dimensions peuvent également changer ? Ex adresse d'un client catégorie d'un produit etc ? Stratégies d'historisation ? SCD Type Écraser l'ancienne valeur avec la nouvelle ? SCD Type Ajouter une ligne dans la table de dimension pour la nouvelle valeur ? SCD Type Avoir deux colonnes dans la table de dimension correspondant à l'ancienne et la nouvelle valeur CStratégie SCD Type ? Impossible de faire des analyses sur l'ancienne valeur ? À utiliser seulement lorsque l'ancienne valeur n'est pas signi ?cative pour les besoins d'a ?aires ? Exige de mettre à jour les données agrégées avec l'ancienne valeur CStratégie SCD Type ? Permet de faire des analyses historiques ? Demande l'ajout d'une nouvelle ligne par changement ? À utiliser lorsque l'ancienne valeur a une signi ?cation analytique ou si le

  • 31
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise
Partager