Conception d'un entrepôt de données (Data Warehouse) Par Yazid Grim - Fleur-Ann

Conception d'un entrepôt de données (Data Warehouse) Par Yazid Grim - Fleur-Anne.Blain Date de publication : 2 mars 2005 Nous avons vu dans mes articles précédents ce qu'était le BI, ce que comprenait un environnement décisionnel et qu'il avait comme concept central l'entrepôt de données ou le Data Warehouse. Intéressons-nous maintenant à comment concevoir un entrepôt de données. Quelle structure permet-elle d'avoir les fonctionnalités requises pour un entrepôt de données ? Quelles sont les techniques utilisées pour bien concevoir ? Quels sont les indicateurs d'une bonne conception ? Ce mini cours commencera par introduire (ou réintroduire) les concepts fondamentaux de l'informatique décisionnelle (nécessaires pour la compréhension de cet article), continuera par l'explication des méthodes de conception d'entrepôt de données via une étude de cas, et terminera par une critique de ces techniques et une conclusion mentionnant les indicateurs d'une bonne conception d'entrepôt. ♪ Conception d'un entrepôt de données (Data Warehouse) par Yazid Grim - Fleur-Anne.Blain I - Introduction..............................................................................................................................................................3 II - Concepts fondamentaux........................................................................................................................................ 3 II-A - Entrepôt de données (Data Warehouse)......................................................................................................3 II-B - Data Mart, ou magasin de données.............................................................................................................3 II-C - Dimension..................................................................................................................................................... 3 II-D - Fait................................................................................................................................................................ 4 II-E - ETL, ou ETC pour les francophiles.............................................................................................................. 4 II-F - Étoile..............................................................................................................................................................4 II-G - Flocon........................................................................................................................................................... 4 III - Modélisation en étoile, un cas..............................................................................................................................4 III-A - Le cas...........................................................................................................................................................4 III-B - L'analyse...................................................................................................................................................... 5 III-C - La solution....................................................................................................................................................6 IV - Modélisation en flocon, un cas.............................................................................................................................7 V - Conception d'entrepôts de données......................................................................................................................8 V-A - Constellation................................................................................................................................................. 9 V-B - Construire un entrepôt de données, un vrai !.............................................................................................. 9 VI - Critique des méthodes de conception d'entrepôts...............................................................................................9 VII - Conclusion......................................................................................................................................................... 10 VIII - Remerciements.................................................................................................................................................10 - 2 - Ce document est issu de http://www.developpez.com et reste la propriété exclusive de son auteur. La copie, modification et/ou distribution par quelque moyen que ce soit est soumise à l'obtention préalable de l'autorisation de l'auteur. https://grim.developpez.com/cours/businessintelligence/concepts/conception-datawarehouse/ Conception d'un entrepôt de données (Data Warehouse) par Yazid Grim - Fleur-Anne.Blain I - Introduction Nous avons vu dans mes articles précédents ce qu'était le BI, ce que comprenait un environnement décisionnel et qu'il avait comme concept central l'entrepôt de données ou le Data Warehouse. Intéressons-nous maintenant à comment concevoir un entrepôt de données. • Quelle structure permet-elle d'avoir les fonctionnalités requises pour un entrepôt de données ? • Quelles sont les techniques utilisées pour bien concevoir ? • Quels sont les indicateurs d'une bonne conception ? Ce mini cours commencera par introduire (ou réintroduire) les concepts fondamentaux de l'informatique décisionnelle (nécessaires pour la compréhension de cet article), continuera par l'explication des méthodes de conception d'entrepôt de données via une étude de cas, et terminera par une critique de ces techniques et une conclusion mentionnant les indicateurs d'une bonne conception d'entrepôt. II - Concepts fondamentaux II-A - Entrepôt de données (Data Warehouse) J'estime en avoir assez parlé ici et ici : mais un peu de répétition ne fait pas de mal !!! Un entrepôt de données, ou data Warehouse, est une vision centralisée et universelle de toutes les informations de l'entreprise. C'est une structure (comme une base de données) qui a pour but, contrairement aux bases de données, de regrouper les données de l'entreprise pour des fins analytiques et pour aider à la décision stratégique. La décision stratégique étant une action entreprise par les décideurs de l'entreprise et qui vise à améliorer, quantitativement ou qualitativement, la performance de l'entreprise. En gros, c'est un gigantesque tas d'informations épurées, organisées, historisées et provenant de plusieurs sources de données, servant aux analyses et à l'aide à la décision. L'entrepôt de données est l'élément central de l'informatique décisionnelle à l'heure où j'écris ce tutoriel. En effet, l'entrepôt de données est le meilleur moyen que les professionnels ont trouvé pour modéliser de l'information pour des fins d'analyse, et il ne serait pas étonnant que d'ici quelques années un nouveau concept apparaisse pour révolutionner l'informatique décisionnelle… Mais intéressons-nous à ce qui existe pour l'instant… II-B - Data Mart, ou magasin de données Les Data Warehouses étant, en général, très volumineux et très complexes à concevoir, on a décidé de les diviser en bouchées plus faciles à créer et entretenir. Ce sont les Data Marts. On peut faire des divisions par fonction (un data mart pour les ventes, pour les commandes, pour les ressources humaines) ou par sous-ensemble organisationnel (un data mart par succursale). Nous verrons plus tard comment organiser les data marts pour créer un entrepôt proprement dit. II-C - Dimension Lorsqu'on fait un schéma de BD pour un système d'information classique, on parle en termes de tables et de relations, une table étant une représentation d'une entité et une relation une technique pour lier ces entités. Et bien en BI, on parle en termes de Dimension et de Faits. C'est une autre approche des données, on entend par dimensions les axes avec lesquels on veut faire l'analyse. Il peut y avoir une dimension client, une dimension produit, une dimension géographie (pour faire des analyses par secteur géographique), etc. Une dimension est tout ce qu'on utilisera pour faire nos analyses. - 3 - Ce document est issu de http://www.developpez.com et reste la propriété exclusive de son auteur. La copie, modification et/ou distribution par quelque moyen que ce soit est soumise à l'obtention préalable de l'autorisation de l'auteur. https://grim.developpez.com/cours/businessintelligence/concepts/conception-datawarehouse/ Conception d'un entrepôt de données (Data Warehouse) par Yazid Grim - Fleur-Anne.Blain II-D - Fait Les faits, en complément aux dimensions, sont ce sur quoi va porter l'analyse. Ce sont des tables qui contiennent des informations opérationnelles et qui relatent la vie de l'entreprise. On aura des tables de faits pour les ventes (chiffre d'affaire net, quantités et montants commandés, quantités facturées, quantités retournées, volumes des ventes, etc.) par exemple ou sur les stocks (nombre d'exemplaires d'un produit en stock, niveau de remplissage du stock, taux de roulement d'une zone, etc.), ou peut être sur les ressources humaines (performances des employés, nombre de demandes de congés, nombre de démissions, taux de roulement des employés, etc.). Un fait est tout ce qu'on voudra analyser. II-E - ETL, ou ETC pour les francophiles L'ETL, dont j'ai expliqué les fondements dans cet article, sert à transposer le modèle entité-relation des bases de données de production ainsi que les autres modèles utilisés dans les opérations de l'entreprise, en modèle à base de dimensions et de faits (nous verrons ces modèles dans les deux prochaines définitions). II-F - Étoile Une étoile est une façon de mettre en relation les dimensions et les faits dans un entrepôt de données. Nous le verrons plus tard, mais le principe est que les dimensions sont directement reliées à un fait (schématiquement, ça fait comme une étoile). II-G - Flocon Un autre modèle de mise en relation des dimensions et des faits dans un entrepôt de données. Le principe étant qu'il peut exister des hiérarchies de dimensions et qu'elles sont reliées aux faits, ça fait comme un flocon :) Note : les flocons et les étoiles peuvent être vus comme une manière de diviser les entrepôts de données et les magasins de données. On peut les voir comme l'atome de l'informatique décisionnelle : le plus petit élément avec lequel ont peut faire des analyses et avec lequel ont peut faire des magasins de données qui, mis ensemble, forment un entrepôt de données. III - Modélisation en étoile, un cas Nous allons utiliser un exemple pour expliquer la modélisation en étoile. L'important en BI est de toujours garder à l'esprit que ce que nous faisons est différent des bases de données traditionnelles. Le schéma créé sera accessible par les utilisateurs et doit donc être le plus simple et explicite possible ! III-A - Le cas On vous demande de créer un data Mart (une étoile) pour l'analyse de l'activité des représentants d'une entreprise de vente d'imprimantes. Le chef d'entreprise veut savoir ce qui se passe pour ses vendeurs. Les employés font ils leur travail, quelle est la zone de couverture des vendeurs, ou sont les endroits où les vendeurs sont le moins efficaces, quelle est la moyenne de ventes des représentants, etc., etc. L'entreprise possède un système de gestion de ressources humaines, un système de gestion des ventes et des feuilles de route avec des informations concernant les vendeurs : kilomètres parcourus, litres d'essence utilisée, frais de voyage, ventes, promesses de vente, etc. - 4 - Ce document est issu de http://www.developpez.com et reste la propriété exclusive de son auteur. La copie, modification et/ou distribution par quelque moyen que ce soit est soumise à l'obtention préalable de l'autorisation de l'auteur. https://grim.developpez.com/cours/businessintelligence/concepts/conception-datawarehouse/ Conception d'un entrepôt de données (Data Warehouse) par Yazid Grim - Fleur-Anne.Blain III-B - L'analyse Note : cette méthode m'a été apprise à l'université Sherbrooke par Monsieur R. Laurin. Notre objectif est d'analyser l'activité des représentants. Il semble que nous ayons toutes les informations pour ce faire… Mais dans différents systèmes. Commençons l'analyse. Le but du jeu est de déceler les axes d'analyses (les dimensions) avec leurs attributs ainsi que les éléments à analyser (les faits). La meilleure façon de ce faire, selon moi, est l'étude approfondie de ce qui se passe dans l'entreprise : documents uploads/Management/ conception-datawarehouse.pdf

  • 18
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Oct 09, 2021
  • Catégorie Management
  • Langue French
  • Taille du fichier 0.2042MB