28/01/2019 1 Introduction aux Systèmes d'Information Décisionnels Janvier(2019
28/01/2019 1 Introduction aux Systèmes d'Information Décisionnels Janvier(2019 Omar(Boussaid 2019 Plan : 1. Généralités 1.1. Les systèmes d’information décisionnels 1.2. Les différentes phases du processus décisionnel 2. Modélisation des entrepôts de données 2.1. Modèles en étoile 2.2. Modèles en flocons de neige 2.3. Modèles en étoile en constellation 2.4. Représentation des données 2.5. Les différentes approches (ROLAP, MOLAP, HOLAP) 2.6. Alimentation des entrepôts de données 3. L'analyse en ligne (OLAP) 3.1. Approche OLTP contre Approche OLAP 3.2. L’analyse en ligne : principes 3.3. Les magasins et les cubes de données 3.5. Les différentes opérations d'OLAP 28/01/2019 2 Les entreprises passent à l'ère de l'information. ! Défi : Transformer leur système d'information qui avait une vocation de production en un SI décisionnel dont la vocation de pilotage devient majeure. " Le décisionnel ? ! Système de production " Transaction fréquentes des données sous forme de modifications (Écriture/Lecture) " Les systèmes de production (OLTP) garantissent la cohérence des données " Les systèmes de production sont conçus pour les tâches répétitives et planifiées Les Systèmes d’informations Décisionnels 28/01/2019 3 • Un système d'information décisionnel est un ensemble de données organisé de façon spécifique, approprié à la prise de décision. Outils : Data warehouses (Entrepôt de données) OLAP (Analyse en ligne) • Connaître l'environnement dans lequel on évolue • Finalité d'un système décisionnel : pilotage de l'entreprise Les Systèmes d’informations Décisionnels Entrepôt de Données Système d'Info. de Production Orientation : Gestion Système d'Info. Décisionnel Orientation : Pilotage BD Magasins BD Clients BD Produits BD Compta BD DRH BD Marketing BD Fournisseurs Flux de données externes Flux de données externes 28/01/2019 4 Les bases de production : toutes les sources de données (légales, juridiques, fiscales, politiques, techniques, marketing…) Comment organiser ces différentes données dans un ensemble cohérent afin de procéder à toutes les analyses nécessaires pour construire les indicateurs indispensables au pilotage de l'entreprise ? Par un processus d'entreposage de données Entreposage de données (Data Warehousing) Les Systèmes d’informations Décisionnels ! Qu'est ce qu'un Entrepôt de Données ? D'après BILL Inmon : “Un ED est une collection de données thématiques, intégrées, non volatiles et historisées, organisées pour la prise de décision.” Thématiques : thèmes par activités majeures ; Intégrées : divers sources de données ; Non volatiles : ne pas supprimer les données de l’ED ; Historisées : trace des données, suivre l'évolution des indicateurs. Pb de volumétrie, de stockage, d'accès. Les Systèmes d’informations Décisionnels 28/01/2019 5 ! Architecture d’un SID Entrepôt de données Méta donnée s Data Marts Administrateur OLAP Data Mining Analyses statistiques Bases de production OLAP Reporting E T L Les Systèmes d’informations Décisionnels Data Mining Analyses statistiques OLAP Reporting Phase OLAP Entrepôt de données Méta donnée s Data Marts Administrateur OLAP Phase Structuration Les différentes phases Bases de production E T L Phase ETL Les Systèmes d’informations Décisionnels ! Architecture d’un SID 28/01/2019 6 Phase ETL Phase Structuration Phase OLAP ! Conception ! Modélisation ! Structuration ! Administration ! Extraction ! Transformation ! Alimentation ! Administration ! Analyse ! Restitution ! Administration " Architecture)d’un)SID Les Systèmes d’informations Décisionnels Les différentes phases !Qu'est ce que l'Entreposage des données ? " Structuration et Stockage " ETL " Analyse & Restitution Les 3 phases : Les Systèmes d’informations Décisionnels 28/01/2019 7 Il s'agit de définir la finalité de l'ED : ! Piloter quelle activité de l'entreprise ; ! Déterminer et recenser les données à entreposer ; ! Définir les aspects techniques de la réalisation ; ! Construire les modèles de données ; ! Mettre au point les démarches d'alimentation (ETL) ; ! Définir les stratégies d'administration ; ! Définir des espaces d'analyse ; ! Définir le mode de restitution… ! Conception Les Systèmes d’informations Décisionnels Travail technique. ! Extraction des données des différentes BD de production (internes ou externes) ! Nettoyage des données, règles d'homogénéisation des données sous formes de métadonnées. ! Techniques d'alimentation : ! Chargement des données dans l'ED ! Fréquences de rafraîchissement : " par applications d' interfaces entre les sources de données et l'ED " par serveurs de réplication du SGBD ou par outils spécialisés # E. T. L. Les Systèmes d’informations Décisionnels 28/01/2019 8 ! C'est le but du processus d'entreposage des données. ! Elle conditionne le choix de l'architecture de l'ED et de sa construction. ! Elle doit permettre toutes la analyses nécessaires pour la construction des indicateurs recherchés. ! Analyse et Restitution Les Systèmes d’informations Décisionnels Elle est constituée de plusieurs tâches pour assurer : ! la qualité et la pérennité des données aux différents applicatifs ; ! la maintenance ; ! la gestion des configurations ; ! les mises à jour ; ! l'organisation, l'optimisation du SI ; ! la mise en sécurité du SI. ! Administration Les Systèmes d’informations Décisionnels 28/01/2019 9 Proportions)de)la)charge)du)projet)décisionnel Fabriquer 15% Alimenter 50% Administrer 15% Restituer 20% Les Systèmes d’informations Décisionnels MODELISATION 28/01/2019 10 COMMANDE N Cde Date Cde PRODUIT Code produit Nom Produit Description Produit Catégorie Description catégorie Prix unitaire CLIENT N Client Nom Client Adresse Client Ville DATE Clef date Date Mois Année VENDEUR Code vendeur Nom Vendeur Ville Vendeur Quota VILLE Nom Ville Région Pays TABLE DE FAITS Quantité Prix total N Cde Code vendeur N Client Clef date Code produit Nom Ville ! Modélisation des ED : Le modèle en étoile Qté vendue Montant_Ventes Dim$TEMPS Temps_ID Jour Mois Année … Dim$REGION Région_ID Région Pays … Dim$PRODUIT Produit_ID Désignation_P Description_P Catégorie Description_C Prix=unitaire Fournisseur Conditionnement … Dim$CLIENT Client_ID Nom_C Adresse_C Tph_C Mail_C … Dim$MAGASIN Magasin_ID Enseigne Type Superficie Ville … Fait VENTES ! Schéma en étoile " Modélisation des ED : Le modèle en étoile 28/01/2019 11 Le modèle en étoile ! Une table de faits : identifiants des tables de dimension ; une ou plusieurs mesures . ! Plusieurs tables de dimension : descripteurs des dimensions. ! Une granularité définie par les identifiants dans la table des faits. Avantages : ! Facilité de navigation ! Performances : nombre de jointures limité ; gestion des données creuses. ! Gestion des agrégats ! Fiabilité des résultats Inconvénients : ! Toutes les dimensions ne concernent pas les mesures ! Redondances dans les dimensions ! Alimentation complexe. Additivité : somme sur toutes les dimensions Exemple : CA ; Quantité vendue, ... Semi-additivité : somme sur certaines dimensions : Exemple : nbre de contacts clients, Etats des stocks... Non-additivité : pas de somme, recalculer Exemple: encours moyen fin de mois, plus grand CA pour l'ensemble des magasins Propriétés des mesures 28/01/2019 12 Dans la grande distribution : Quelques tables de faits : détaillées et volumineuses Tables de dimensions : Classiques : produits, fournisseurs, temps, établissements (structure géographique, fonctionnelle)... Stratégiques : Clients, Promotions, .... Rq : Obtenir le plus d'enregistrements possibles. Dans le secteur des banques : Tables de faits : nombreuses, dédiées à chaque produit, peu détaillées et peu volumineuses. Tables de dimensions : Classiques : produits, temps, établissement (structure géographique, fonctionnelle), ... Stratégiques : Clients, .... Rq : Obtenir le plus de données (champs) possibles. Exemples de modèles Le modèle de l'ED doit être simple à comprendre. On peut augmenter sa lisibilité en regroupant certaines dimensions. On définit ainsi des hiérarchies. Celles-ci peuvent être géographiques ou organisationnelles. Le modèle en flocons de neige Exemple : Commune, Département, Région, Pays, Continent Client Commune Département Region Pays Continent Pepone Lyon 1° Rhône Rhône-Alpes France Europe Testut Lyon 2° Rhône Rhône-Alpes France Europe Soinin Lyon 3° Rhône Rhône-Alpes France Europe Vepont Paris 1° Paris Ile-de-France France Europe Martin Paris 2° Paris Ile-de-France France Europe Elvert Versailles Yvelines Ile-de-France France Europe 28/01/2019 13 Produit_ID Désignation_P Description_P Catégorie SSCat_ID Prix6unitaire … Dim$PRODUIT Qté vendue Montant_Ventes Dim$TEMPS Temps_ID Jour Mois_ID … Dim$CLIENT Client_ID Nom_C Adresse_C Tph_C Mail_C … Dim$MAGASIN Magasin_ID Enseigne Superficie Type_ID … Fait VENTES Dim$REGION Région_ID Région Pays … Dim$MOIS Mois_ID Année_ID … Dim$ANNEE Année_ID … Dim$TYPE Type_ID Ville_ID … Dim$TYPE Type_ID Ville_ID … Dim$SS_CATEGORIE SSCat_ID Catégorie_ID … Dim$CATEGORIE Catégorie_ID Description_C Fourniss_ID … Dim$FOURNISSEUR Fourniss_ID … Le modèle en flocons de neige ! Avant normalisation ! Après normalisation Lorsque les tables sont trop volumineuses Avantages : • réduction du volume, • permettre des analyse par pallier (drill down) sur la dimension hiérarchisée. Inconvénients : • navigation difficile ; • nombreuses jointures. Modèle en flocons de neige = Modèle en étoile + normalisation des dimension Le modèle en flocons de neige 28/01/2019 14 Le modèle en constellation (Fact-flaked) La modélisation en constellation consiste à fusionner plusieurs modèles en étoile qui utilisent des dimensions communes. Un modèle en constellation comprend donc plusieurs tables de faits et des tables de dimensions communes ou non à ces tables de faits. Le modèle en constellation (ou en flocons de faits) 28/01/2019 15 Le modèle en constellation (ou en flocons de faits) Autre représentation Calculer ou estimer le nombre d'enregistrements Prendre en compte : ! La table des faits ! Les dimensions significatives ! Les agrégats ! Les index ! Saisonnalité des ventes ! Croissance du CA, des encours, du nombre de points de ventes Estimer le volume du DW 28/01/2019 16 Exemples : Grandes distribution : CA annuel : 80 uploads/Industriel/cours-sid2019.pdf
Documents similaires
-
16
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Dec 08, 2021
- Catégorie Industry / Industr...
- Langue French
- Taille du fichier 9.1741MB