Système d’information Décisionnel Dalel Ayed Lakhal Année universitaire : 2020-

Système d’information Décisionnel Dalel Ayed Lakhal Année universitaire : 2020-2021 Chapitre 1 : Concepts de base Objectifs du Cours : Data Warehouse 2 - L’étudiant(e) apprendra les concepts de base des data warehouses. Le processus ETL (Extraction, Transformation & Loading) ainsi que les techniques de nettoyage des données nécessaires pour la construction d’un DWH seront étudiés. La représentation multidimensionnelle et le stockage des données sous forme de Cube de données seront aussi traités ainsi que les opérateurs multidimensionnels OLAP associés. -La conception des DWH sera aussi abordée à travers l’étude des modèles en étoile, en flocons et en constellation. Plan 3 Introduction Les entrepôts de données Les datamart Architecture Modélisation Alimentation Contexte 4 Besoin: prise de décisions stratégiques Pourquoi: besoin de réactivité / Améliorer les performances décisionnelles de l’entreprise Qui: les décideurs (non informaticiens) Comment: répondre aux demandes d’analyse des données, dégager des informations qualitatives nouvelles Qui sont mes meilleurs clients? A combien s’élèvent mes ventes journalières? Pourquoi et comment le chiffre d’affaire a baissé? Les données utilisables par les décideurs 5 Données opérationnelles (de production) Bases de données (Oracle, SQL Server) Fichiers, … Paye, gestion des RH, gestion des commandes… Caractéristiques de ces données: Distribuées: systèmes éparpillés Hétérogènes: systèmes et structures de données différents Détaillées: organisation des données selon les processus fonctionnels, données surabondantes pour l’analyse Peu/pas adaptées à l’analyse : les requêtes lourdes peuvent bloquer le système transactionnel Volatiles: pas d’historisation systématique Problématique 6 Une grande masse de données : » Distribuée » Hétérogène » Très Détaillée A traiter : » Synthétiser / Résumer » Visualiser » Analyser Pour une utilisation par : » des experts et des analystes d'un métier » NON informaticiens » NON statisticiens 7 Problématique Inconvénient : Analyse de l ’activité par un non-informaticien Problématique 8 Besoin des entreprises (décideurs) accéder à toutes les données de l’entreprise regrouper les informations disséminées analyser et prendre des décisions rapidement (OLAP) Comment répondre aux demandes des décideurs? En donnant un accès rapide et simple à l’information stratégique En donnant du sens aux données Problématique 9 Prise de décisions Mettre en place un système d’information dédié aux applications décisionnelles : un data warehouse Entrepôt de données un data warehouse En Aval des bases de production (ie bases opérationnelles) En Amont des prises de décision Comment faciliter la prise de décision ? 10 Exploiter efficacement de grandes quantités d’information •utiliser les données produites par l'entreprise dans la gestion quotidienne (BD existantes, applications de production, … ) • produire régulièrement des données nécessaires au processus de décision (résumés, synthèses etc...) • disposer d'outils d'analyse de données Une des solutions : Construire et Exploiter un DW 11 Raisons d’être d’un entrepôt de données 12 Rassembler les données de l’entreprise dans un même lieu sans surcharger les BD (systèmes opérationnels) Permettre un accès universel à diverses sources de données et assurer la qualité des données Extraire, filtrer, et intégrer les informations pertinentes, à l’avance, pour des requêtes ultérieures Dégager des connaissances et faire un apprentissage sur l’entreprise, le marché et l’environnement Le processus de prise de décision 13 Temps de prise d’une décision : enchaînement des phases Définir le problème Rassembler les données Analyser les données Établir des solutions Décider Champs d’application des systèmes décisionnels Le processus de prise de décision 14 Bases de production Data warehouse Base multi - dimensionnelle Prédiction / simulation Prise de décision Domaines d’utilisation des DW 15 Banque : prime plus précise Santé : Risque alimentaire Commerce : Ciblage de clientèle, Déterminer des promotions Assurance : Risque lié à un contrat d’assurance (voiture) Logistique : Adéquation demande/production Grande distribution : marketing, maintenance, ... produits à succès, modes, habitudes d’achat préférences par secteurs géographiques Déterminer des promotions Télécommunications : pannes, fraudes, mobiles, ... classification des clients, détection fraudes … Quelques métiers du décisionnel 16 Strategic Performance Management Déterminer et contrôler les indicateurs clé de la performance de l’entreprise Finance Intelligence Planifier, analyser et diffuser l’information financière. Mesurer et gérer les risques Human Capital Management (gestion de la relation avec les employés) Aligner les stratégies RH, les processus et les technologies. Customer Relationship Management (gestion de la relation client) Améliorer la connaissance client, identifier et prévoir la rentabilité client, accroitre l’efficacité du marketing client Supplier Relationship Management (gestion de la relation fournisseur) Classifier et évaluer l’ensemble des fournisseurs. Planifier et piloter la stratégie Achat. Besoins à l’origine des SI décisionnels 17 Optimisation/automatisation de certaines activités : exemples Optimisation des stocks, de la production, de la logistique Contrôle qualité, diagnostic de panne Octroi de crédits, risque client (banque, assurance) Détection de fraude (carte bancaire, télécoms) Marketing et gestion de la relation client (CRM) Analyse des ventes dans les grandes surfaces Utilisateurs de la partie décisionnelle du SI Direction de l’entreprise Responsables des différentes unités de l’entreprise Responsables marketing (stratégique et opérationnel) Plan 18 Introduction Les entrepôts de données Les datamart Architecture Modélisation Définition d’un DW 19 W. H. Inmon (1996): « Le data Warehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le support d’un processus d’aide à la décision » Principe: mettre en place une base de données utilisée à des fins d’analyse Définition d'un data warehouse " Un data warehouse est un référentiel (repository) de données historiques orientées sujet et évolutives dans le temps, utilisé pour l'extraction d'informations et l'aide à la décision. Il peut contenir des données atomiques et des données récapitulatives." - Oracle Data Warehouse Method Définition d’un DW 21 Une base de données d’aide à la décision qui est entretenue de manière séparée de la base de données opérationnelle de l’organisation. Aide au traitement de l’information en fournissant une plateforme de données historiques consolidées pour l’analyse. Data warehousing : Le processus de construction et d’utilisation du data warehouse Les 4 caractéristiques des data warehouse 22 1. Données orientées sujet:  Regroupe les informations des différents métiers  Ne tiens pas compte de l’organisation fonctionnelle des données Ass. Vie Ass. Auto Ass. Santé Client Police Données orientées sujet : 23 Organisées autour de sujets majeurs comme consommateur, produit, ventes Données pour l’analyse et la modélisation en vue de l’aide à la décision, et non pas pour les opérations et transactions journalières Vue synthétique des données selon des sujets intéressant les décideurs Les 4 caractéristiques des data warehouse 24 2. Données intégrées :  Normalisation des données  Définition d’un référentiel unique h,f 1,0 homme, femme h,f D CHF USD EUR 25 Construit en intégrant des sources de données multiples et hétérogènes BD relationnelles, fichiers, enregistrements de transactions Nettoyage et intégration des données Consistence dans les noms des champs, le codage des données issues de plusieurs sources La conversion se fait quand les donnés sont transférées dans le DW Données intégrées : Les 4 caractéristiques des data warehouse 26 3. Données non volatiles  Traçabilité des informations et des décisions prises  Copie des données de production Ajout Modification Suppression Accès Chargement Bases de production Entrepôts de données Données non volatiles : 27 Stockage indépendant des BD opérationnelles Pas de mises à jour des données dans le DW 2 actions sur le DW Alimentation du DW à partir des données des BD opérationnelles Accès (lecture) de ces données Les 4 caractéristiques des data warehouse 4. Données datées  Les données persistent dans le temps  Mise en place d’un référentiel temps Nom Ville Ali Paris Mohamed Lyon Nom Ville Ali Marseille Mohamed Lyon 28 Image de la base en Mai 2005 Image de la base en Juillet 2006 Code Année Mois 1 2005 Mai Base de production Entrepôt de données Calendrier Code Nom Ville 1 Dupont Paris 1 Durand Lyon Répertoire Répertoire Répertoire Code Année Mois 1 2005 Mai 2 2006 Juillet Code Nom Ville 1 Ali Paris 1 Mohamed Lyon 2 Ali Marseille Données datées L’échelle de temps dans le DW est beaucoup plus longue que dans les BD BD opérationnelle: valeur courante des données DW: information dans une perspective historique (ex: les 5 dernières années) Chaque structure dans le DW contient un élément décrivant le temps 29 SGBD & Datawarehouse 30 Basés sur deux systèmes différents : • OLTP • OLAP « We are data rich … » SGBD traditionnels  applications commerciales  importants volumes (Mo/Go)  Fondements mathématiques  processus transactionnels en ligne (On-Line Transactional Processing) OLTP Exemple : Le 15/01/2013 à 13h12, le client X a retiré 500DT du compte Y 31 OLTP (On Line Transaction Processing ) 32 • Utilisé par les SGBD. • Insérer, modifier, interroger rapidement. • Accès par plusieurs utilisateurs. • Faibles quantité d’informations. Les Processus OLTP Sont • interactifs et concurrents • nombreux • répétitifs et structurés • simples Et concernent • la mise à jour des données • un nombre de tuples restreint • des données détaillées et à jour 33 OLAP « …but information poor » Nourrir les systèmes d’aide à la décision (DSS) avec un ensemble de BD • Exploration et analyse de données historiques • Énormes volumes de données (To) • Processus analytiques en ligne (On-Line Analytical Processing) Exemple : Quel est le volume des ventes par uploads/Management/cours-dw-p1.pdf

  • 24
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Mar 12, 2021
  • Catégorie Management
  • Langue French
  • Taille du fichier 1.4078MB