Data Warehouse Mme Sara SAHNOUN Sommaire : Chapitre 1 : Business Intelligence C
Data Warehouse Mme Sara SAHNOUN Sommaire : Chapitre 1 : Business Intelligence Chapitre 2 : Architecture du système d’information décisionnel Chapitre 3 : Modélisation d’un DataWarehouse Chapitre 4 : Etude de cas 2 Chapitre 1 Business Intelligence 3 La Business Intelligence (BI), également connue sous le nom d’informatique décisionnelle, est l’ensemble des outils et méthodes visant à transmettre les informations pertinentes aux managers d’entreprise. Son but est de les aider à comprendre leur environnement et de les accompagner dans leurs prises de décisions stratégiques. Les besoins de l’utilisateur sont donc au cœur d’une Business Intelligence efficace. Qu’est ce que la Business Intelligence ? 4 Objectif de la Business Intelligence L'objectif de la Business Intelligence est d'optimiser les processus décisionnels en transformant les données de l'entreprise en informations pertinentes : • Rendre les données utiles accessibles au décideur • Rendre le décideur autonome • Transformer la « donnée » en « information » pertinente • Permettre au décideur de prendre des décisions rapidement Pour les entreprises, l'enjeu est important car une prise de décision plus rapide permet une meilleure réactivité aux évolutions de leur écosystème. 5 6 Objectif de la Business Intelligence Décisions et actions Liste des « bons clients » Données de caisse Données Texte, fichier son, image message … Information Base de données rapport, tableau Connaissance Résultats d’une analyse sur l’information BI Toute l’information sur un client BI Data Warehouse Sources de données Restitution • Requêtes • Analyses • Tableaux de bord • … Entrepôt de données Architecture Générale des systèmes décisionnels 7 Exemples Quelques questions stratégiques : • Comment l’entreprise peut augmenter sa part du marché de 5% ? • Quel produit n’est pas bien vendu ? • Quel agent a le moins de ventes ? • Quelle est la qualité de service fournit aux clients ? Quels sont les points d’améliorations ? 8 Chapitre 2 Architecture du système d’information décisionnel 9 Outil d'alimentation - ETL Consolidation Stockage Data Warehouse Data Warehouse Zone de travail ODS ODS Mainframe Spécifique Bases externes ERP Fichiers Plats Sources Dictionnaire de données Référentiel Dictionnaire de données Référentiel Métadonnées Garde la trace des données, de leur origine et de l'exploitation faite Métadonnées Garde la trace des données, de leur origine et de l'exploitation faite Datamart 1 Datamart 1 Datamart n Datamart n Architecture Détaillées des systèmes décisionnels Analyse Restitution Consultation/ Interrogation Tableaux de bord Tableur Requêteurs Simulation/ Prédiction Statistiques Datamining 10 E T L E T L E T L OLAP OLAP Outils d'analyse OLAP MOLAP, ROLAP, HOLAP Outil d'alimentation - ETL Consolidation Stockage Data Warehouse Data Warehouse Zone de travail ODS ODS Dictionnaire de données Référentiel Dictionnaire de données Référentiel Métadonnées Garde la trace des données, de leur origine et de l'exploitation faite Métadonnées Garde la trace des données, de leur origine et de l'exploitation faite Datamart 1 Datamart 1 Datamart n Datamart n Architecture Détaillées des systèmes décisionnels Analyse Restitution Consultation/ Interrogation Tableaux de bord Tableur Requêteurs Simulation/ Prédiction Statistiques Datamining 11 E T L E T L E T L OLAP OLAP Outils d'analyse OLAP MOLAP, ROLAP, HOLAP Mainframe Spécifique Bases externes ERP Fichiers Plats Sources • Le système transactionnel est développé pour gérer les transactions quotidiennes. • Très souvent plusieurs de ces systèmes existent indépendamment les uns des autres. • Il permettent la saisie, stockage, la mise à jour des données en respectant l’intégrité des données. • Le contenu est fait de données actuelles, pas d’archives • Les données sont très détaillées (détails de chacune des transactions). 12 Outils sources : Systèmes transactionnels Système transactionnel (OLTP) Système décisionnel Généralités Informations très détaillées Pas d’historisation des données Données non figées de temps Informations synthétiques ou détaillées Historisation des données Données figés dans le temps : Archivage. Structure Structure statique Structure normalisée Structure flexible Structure dénormalisée Utilisateurs Maj autorisées Requêtes prédéfinies Employés de bureau Pas de maj de la part des utilisateurs Requêtes ouvertes/prédéfinies Analystes / Managers/Décideurs Système transactionnel Vs Système décisionnel 13 Données opérationnelles Données décisionnelles Orientées application, détaillées, précises au moment de l’accès Orientée activité (thème, sujet), condensées, représentes des données historiques Mise à jour interactive possible de la part des utilisateurs Pas de mise à jour interactive de la part des utilisateurs Accédées de façon unitaires par une personne à la fois Utilisées par l’ensemble des analystes, gérées par sous-ensemble Haute disponibilité en continu Exigence différente, haute disponibilité ponctuelle Uniques (pas de redondance en théorie) Peuvent être redondantes Structure statique, contenu variable Structure flexible Petite quantité de données utilisées par un traitement Grande quantité de données utilisée par les traitements Forte probabilité d’accès Faible probabilité d’accès Données opérationnelles Vs données décisionnelles 14 Outil d'alimentation - ETL Consolidation Stockage Data Warehouse Data Warehouse Zone de travail ODS ODS Mainframe Spécifique Bases externes ERP Fichiers Plats Sources Dictionnaire de données Référentiel Dictionnaire de données Référentiel Métadonnées Garde la trace des données, de leur origine et de l'exploitation faite Métadonnées Garde la trace des données, de leur origine et de l'exploitation faite Datamart 1 Datamart 1 Datamart n Datamart n Architecture Détaillées des systèmes décisionnels Analyse Restitution Consultation/ Interrogation Tableaux de bord Tableur Requêteurs Simulation/ Prédiction Statistiques Datamining 15 E T L E T L E T L OLAP OLAP Outils d'analyse OLAP MOLAP, ROLAP, HOLAP ETL est un progiciel voué au transfert de données d’un source quelconque vers une cible quelconque. 1. Extraction : • Récupération des données depuis différents systèmes de gestion. • Stratégies d’extraction : • Extraction totale • Extraction partielle (Delta) avec notification de MAJ (prendre tout le delta de toutes les données) • Extraction partielle (Delta) sans notification de MAJ (ne prendre que les données de la veille) • L’extraction des données ne doit pas affecter les performances du système source. ETL : Extract,Transform and Load 16 2. Transformation : Les données extraite dans l’ODS ne sont pas exploitables en l’état, des nettoyages, mapping et transformation s’imposent ! Taches de transformations basiques : • Sélection • Matching (lookup) • Nettoyage et enrichissement des données ETL : Extract,Transform and Load 17 2. Transformation (suite) : Types de transformation majeurs : • Homogénéisation des nomenclatures des différentes sources • Changement d’encodage de données • Calcul de nouveaux champs ( indicateurs) • Duplication des données • Split et fusion de champs • Conversion de données en de nouvelles unités de mesures • Consolidation , aggregation et regroupement de données • Restructuration des clés ETL : Extract,Transform and Load 18 3. Chargement : Il s’agit du chargement des données dans le Data Warehouse. • Types de chargements : • Chargement initial des données , se fait en mode FULL au démarrage du Datawarehouse. • Chargement incrémental des données: se fait d’une manière périodique, pour la prise en compte des changements (se fait aux heures creuses) • Automatisation de la planification • Suivi des exécutions des chargements ETL : Extract,Transform and Load 19 Outil d'alimentation - ETL Consolidation Stockage Data Warehouse Data Warehouse Zone de travail ODS ODS Mainframe Spécifique Bases externes ERP Fichiers Plats Sources Dictionnaire de données Référentiel Dictionnaire de données Référentiel Métadonnées Garde la trace des données, de leur origine et de l'exploitation faite Métadonnées Garde la trace des données, de leur origine et de l'exploitation faite Datamart 1 Datamart 1 Datamart n Datamart n Architecture Détaillées des systèmes décisionnels Analyse Restitution Consultation/ Interrogation Tableaux de bord Tableur Requêteurs Simulation/ Prédiction Statistiques Datamining 20 E T L E T L E T L OLAP OLAP Outils d'analyse OLAP MOLAP, ROLAP, HOLAP Zone tampon permettant d’accéder à l’ensemble des données sources (dans un modèle physique très proche de leur modèle d’origine) au sein d’une base de données unique. Objectifs de l’ODS est de : • Limiter les impacts performances sur les bases transactionnelles. • Se détacher du format d’échange (aujourd’hui fichier plat, demain DB Link). • Effectuer des agrégations multi-source performantes. Caractéristiques de l’ODS : • Données destinées à l’aide à la décision ou au reporting. • Organisation souvent très proche de celle des bases opérationnelles. • Répond au besoins de capture d’informations volatiles ou de synchronisation de flux. • Peu ou pas d'historique. ODS : Operational Data Store 21 Outil d'alimentation - ETL Mainframe Spécifique Bases externes ERP Fichiers Plats Sources Dictionnaire de données Référentiel Dictionnaire de données Référentiel Métadonnées Garde la trace des données, de leur origine et de l'exploitation faite Métadonnées Garde la trace des données, de leur origine et de l'exploitation faite Datamart 1 Datamart 1 Datamart n Datamart n Architecture Détaillées des systèmes décisionnels Analyse Restitution Consultation/ Interrogation Tableaux de bord Tableur Requêteurs Simulation/ Prédiction Statistiques Datamining 22 E T L OLAP OLAP Outils d'analyse OLAP MOLAP, ROLAP, HOLAP Zone de travail ODS ODS E T L Consolidation Stockage Data Warehouse Data Warehouse E T L Data WareHouse « A data warehouse is a copy of transaction data specifically structured for querying and reporting. » (Kimball/Greenfield) Un entrepôt de données, ou data Warehouse, est une base de données spécialisée dont l’objectif est d’améliorer la capacité d’une organisation à prendre des décisions basées sur l’ensemble des informations disponibles. Ces uploads/Industriel/cours-datawarehouse-v1.pdf
Documents similaires










-
32
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Mar 12, 2022
- Catégorie Industry / Industr...
- Langue French
- Taille du fichier 1.4892MB