Chapitre1 Business Intelligence Introduction 1 2 Plan • Définitions & Problémat

Chapitre1 Business Intelligence Introduction 1 2 Plan • Définitions & Problématique • L’état de l’art du décisionnel • Les entrepôts de données/ Data Warehouse • Les datamarts • Fouille de données (Data Mining) • Architecture d’un Data Warehouse • Modélisation d’un DW • Alimentation d’un DW • Les bases de données multidimensionnelles • L hé d dé i i l Définitions • Business Intelligence : L’informatique décisionnelle • Processus technologique qui: – Analyse les données – Présente des informations exploitables par les dirigeants, les cadres commerciaux, …  Prendre les bonnes (ou meilleures) décisions 3 Définitions • Outils • Applications • Méthodologies  • Collecter • Préparer • Prendre des décisions 4 Problématique: Contexte • Besoin ? • Pourquoi ? • Qui ? • Comment ? 5 Problématique: Contexte • Besoin: Prise de décision stratégique • Pourquoi: Besoin de réactivité • Qui: Utilisé par les décideurs et analystes • Comment: répondre aux demandes d’analyse des données, dégager des informations qualitatives nouvelles 6 Qui sont mes meilleurs clients? A combien s’élèvent mes ventes journalières? Quels Tunisens consomment beaucoup de poisson? Pourquoi et comment le chiffre d’affaire a baissé? 7 Datawarehouse: Définition • Base de Données dédiée au stockage de Données • Alimentée depuis une Base de production • Grace aux outils ETL: Extract Transform Load 8 Besoin des entreprises • accéder à toutes les données de l’entreprise • regrouper les informations disséminées • Analyser et prendre des décisions rapidement Règle d’or Construire un DWH à partir des besoins des clients et non pas à partir des Données! 9 Exemples d'applications concernées • Grande distribution : marketing, maintenance, ... – produits à succès, modes, habitudes d’achat – préférences par secteurs géographiques • Bancaire : suivi des clients, gestion de portefeuilles – mailing ciblés pour le marketing • Télécommunications : pannes, fraudes, mobiles, ... – classification des clients, détection fraudes, fuites de clients 10 Objectifs décisionnels 1. Historisation: Conserver : ne pas effacer 2. Centralisation: DWH 3. Analyser: mieux comprendre ce qui se passe Achats Ventes RH 11 12 Les étapes 1. Préparation: ETL (Extract Transform Load) – Extraction – Nettoyage – Stockage • Archivage (format CSV) • Historisation (Comparer avec les chiffres de l’année dernière) 13 Métaphore du restaurant: En cuisine: Préparer, transformer Caractéristiques: Rigueur et constance 14 2. Présentation: – Analyse – Reporting A la salle à manger: Consommer Caractéristiques: Beau et bon! Métaphore du restaurant: 15 Le décisionnel 1. Mesurer : – Température – Temps – Distance 2. Les dimensions (les attributs): – Quand? Où? 16 3. Faits (fact) Exemple : Les ventes Table de faits: Ventes Date Magasin Pdt Quantité PU D1 M1 X 3 10 D2 M2 Y 25 2.5 17 Problématique1 • Les dimensions ont des attributs! La date D1: – Date – Jour – Jour de la semaine – Mois – Trimestre – Année 18 Problématique2 • Les dimensions sont réutilisables! On retrouve les mêmes produits : – Achats – Ventes – Inventaire "Les Données se conjuguent au pluriel" 19 20 Les données utilisables par les décideurs • Données opérationnelles (de production) – Bases de données (Oracle, SQL Server) – Fichiers, … – Paye, gestion des RH, gestion des commandes… • Caractéristiques de ces données: – Distribuées: systèmes éparpillés – Hétérogènes: systèmes et structures de données différents – Détaillées: organisation des données selon les processus fonctionnels, données surabondantes pour l’analyse – Peu/pas adaptées à l’analyse : les requêtes lourdes peuvent bloquer le système transactionnel – Volatiles: pas d’historisation systématique Production • orientation service (ventes, comptabilité, marketing…) • volatiles Stockage • orientation analyse • non-volatiles • historisées • agrégats 21 22 Plan • Problématique • L’état de l’art du décisionnel • Les entrepôts de données/ Data Warehouse • Les datamarts • Fouille de données (Data Mining) • Architecture d’un Data Warehouse • Modélisation d’un DW • Alimentation d’un DW • Les bases de données multidimensionnelles • L hé d dé i i l Définitions – Vocabulaire (à ordonner) • ODS (Operating Data Store) – Lieu où vont être effectuées les transformations, les croisements, etc. C’est l’étape juste avant l’alimentation du Datawarehouse et il utilise, comme source la Staging Area. – Le modèle de données de l'ODS est un modèle relationnel classique assez proche des modèles de production – Ce « sas » assure l'isolation des mondes "opérationnel" et "décisionnel" (performances, exploitabilité...) • Infocentre = Base de données dédiée à l’analyse d’une application  A l’origine des “copies” de base de production • Staging Area : Espace de stockage temporaire des données provenant des différentes sources. C’est un lieu où l’on va pouvoir stocker des données qui arrivent à des moments différents. C’est une zone d’attente, une “salle d’embarquement”. • Data Mart : Entrepôt de données dédié à un métier particulier. Il est situé en aval du Datawarehouse • Datawarehouse = Entrepôt de données, destiné à centraliser, nettoyer, et uniformiser les données de l’entreprise à des fins de reporting et d’analyse. Il stocke l’historique des données avec la granularité la plus fine, Les données utilisables par les décideurs L’état de l’art du décisionnel 25 26 Plan • Problématique • L’état de l’art du décisionnel • Les entrepôts de données/ Data Warehouse • Les Datamarts • Fouille de données (Data Mining) • Architecture d’un Data Warehouse • Modélisation d’un DW • Alimentation d’un DW • Les bases de données multidimensionnelles • Le marché du décisionnel 27 Définition d’un DW • W. H. Inmon (1996): « Le data Warehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le support d’un processus d’aide à la décision » • Principe: mettre en place une base de données utilisée à des fins d’analyse 28 Les 4 caractéristiques des data warehouse 1. Données orientées sujet: – Regroupe les informations des différents métiers – Ne tiens pas compte de l’organisation fonctionnelle des données Comptabilité Clients Ventes Marketing 29 Les 4 caractéristiques des data warehouse 2. Données intégrées: – Normalisation des données – Définition d’un référentiel unique h,f 1,0 homme, femme h,f 30 Les 4 caractéristiques des data warehouse 3. Données non volatiles – Traçabilité des informations et des décisions prises – Copie des données de production Ajout Modification Suppression Accès Chargement Bases de production Entrepôts de données 31 Les 4 caractéristiques des data warehouse 4. Données datées ou historisées – Les données persistent dans le temps – Mise en place d’un référentiel temps Nom Ville Foulen Sfax Falten Sousse Nom Ville Foulen Tunis Falten Sousse Image de la base en Mai 2018 Image de la base en Juillet 2019 Code Année Mois 1 2018 Mai Base de production Entrepôt de données Calendrier Code Année Mois 1 Dupont Paris 1 Durand Lyon Répertoire Répertoire Répertoire Code Année Mois 1 2018 Mai 2 2019 Juillet Code Nom Ville 1 Foulen Sfax 1 Falten Sousse 2 Foulen Tunis 32 SGBD et DW Service commercial Service Financier Service livraison BD prod BD prod BD prod Clientèle Data Warehouse Clientèle H I S T O R I Q U E OLTP: On-Line Transactional Processing OLAP: On-Line Analitical Processing OLTP • Orienté transaction • Orienté application • Données courantes • Données détaillées • Données évolutives • Utilisateurs nombreux, administrateurs/opérationnels • Temps d’exécution: court 33 OLAP • Orienté analyse • Orienté sujet • Données historisées • Données agrégées • Données statiques • Utilisateurs peu nombreux, manager • Temps d’exécution: long 34 35 OLTP VS OLAP OLTP OLAP Orienté transaction Orienté analyse Orienté application Orienté sujet Données courantes Données historisées Données détaillées Données agrégées Données évolutives Données statiques Utilisateurs nombreux, administrateurs/opérationnels Utilisateurs peu nombreux, manager Temps d’exécution: court Temps d’exécution: long 36 Plan • Problématique • L’état de l’art du décisionnel • Les entrepôts de données/ Data Warehouse • Les Datamarts • Fouille de données (Data Mining) • Architecture d’un Data Warehouse • Modélisation d’un DW • Alimentation d’un DW • Les bases de données multidimensionnelles • Le marché du décisionnel Datamart • Sous-ensemble d’un entrepôt de données • Destiné à répondre aux besoins d’un secteur ou d’une fonction particulière de l’entreprise • Point de vue spécifique selon des critères métiers 37 Datamarts du service Marketing Datamart du service Ressources Humaines Intérêts des Datamarts • Nouvel environnement structuré et formaté en fonction des besoins d’un métier ou d’un usage particulier • Moins de données que DW – Plus facile à comprendre, à manipuler – Amélioration des temps de réponse • Utilisateurs plus ciblés: DM plus facile à définir 38 Data Mining • C’est l'exploration et l'analyse de grandes quantités de données afin de découvrir des formes et des règles significatives en utilisant des moyens automatiques ou semi-automatiques. 39 Crédit Accordé (Oui/Non) Statut Age Sexe Basé sur des méthodes mathématiques +/- complexes : • Méthodes de tri : Les algorithmes de Data Mining • Technique: Statistique • Résultat: Prédiction, estimation, classification Exemple: les emails et les spams qui sont filtrés Exemple: Data Mining • Entreprise : banque • Activité : prêts hypothécaires • Problème : accepter ou refuser une demande de crédit ? • Solution: Analyser les données historiques : solvabilité observée lors des anciens crédits pour prévoir uploads/Industriel/ chap1-bi 1 .pdf

  • 26
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager