Maryem Rhanoui Datawarehouse & Reporting Plan de cours Module : Business Intell

Maryem Rhanoui Datawarehouse & Reporting Plan de cours Module : Business Intelligence – Charge 32h Contenu – Cours théorique – Etude de cas – TP (Microsoft SQL Server) Evaluation – Modélisation / Développement – Projet – Etude de cas ? Introduction Décision Data Warehouse? Entrepôt de données Data Mining? Exploration de données Technologie de l’Information Papier • organiser les données dans des formes papiers dans des classeurs Système personnalisé • mieux organiser les données des organismes Base de données • stocker les données pour fournir un historique détaillé de l'activité Décision • utiliser les données pour la prise de décision Motivations ■ L'information est une ressource de valeur croissante, pour planifier et surveiller efficacement les activités de l'entreprise. ■ L'information est la première matière qui est transformée par les systèmes d'information décisionnels, comme les matières premières sont transformées par les systèmes de fabrication. Matières Premières Produits Finis Information Décision Système d’information décisionnel Système de fabrication Motivations ■Nous collectons des tonnes de données, mais nous ne pouvons pas y accéder ■Nous avons besoin de découper les données dans tous les sens ■Nous avons besoin de d'obtenir les données facilement ■Montrez-moi ce qui est important Nous voulons utiliser l'information pour appuyer la prise de décisions plus fondées sur des faits Décision Quels sont mes meilleurs clients? Qui sont mes clients? Quels produits achètent- ils? Qui sont les clients insatisfaits? Pourquoi? Quelles sont les promotions les plus efficaces ? Quelle est la période la plus lucrative? Système d’Information Décisionnel Le Décisionnel est le processus visant à transformer les données en informations et, par l'intermédiaire d'interrogations successives, transformer ces informations en connaissances Connaissance Information Donnée Système d’Information Décisionnel Data Information Connaissance Decision Action analyse produit est utilisée pour déclenche génère est transformé en Business Intelligence ■ Business Intelligence ( H.P.Luhn - IBM) « the ability to apprehend the interrelationships of presented facts in such a way as to guide action towards a desired goal » La capacité d'appréhender les interrelations des faits présentés de manière à guider l'action vers un but souhaité Business Intelligence L’ informatique décisionnelle (Business Intelligence (BI)), également appelée « intelligence d'affaires » , désigne les solutions informatiques apportant une aide à la décision avec, en bout de chaîne, des rapports et des tableaux de bord à la fois analytiques et prospectifs. Le but est de consolider les informations disponibles au sein des bases de données de l'entreprise. ■L'analyse multidimensionnelle consiste à modéliser des données selon plusieurs axes Datawarehouse ■L'analyse prédictive exploite un ensemble d'événements observés et historisés afin de prévoir l'évolution d'une activité Datamining Business Intelligence ■ La Business Intelligence (BI) est – Une discipline pour comprendre le passé et prédire l'avenir – une large catégorie de technologies permettant ■ collecte, stockage, accès et analyse des données pour aider les utilisateurs métier à prendre de meilleures décisions – une large catégorie d'applications : ■ systèmes d'aide à la décision ■ requêtage et reporting ■ traitement analytique en ligne (OLAP) ■ analyse statistique, prévision et exploration de données. Key Performance Indicator ■ Une fois qu'une organisation – a analysé sa mission – identifié toutes ses parties prenantes – défini ses objectifs ■ elle a besoin d'un moyen de mesurer les progrès accomplis dans la réalisation de ces objectifs ■ Key Performance Indicator (KPI) Key Performance Indicator L'objectif principal de la Business Intelligence est de donner des informations sur les performances et d'améliorer les performances d'un processus métier – Mesure de la performance par des indicateurs clés de performance (KPI) ■ KPI est une mesure métier utilisée pour évaluer les facteurs qui sont essentiels au succès d'une organisation. ■ Les KPI sont conçus pour fournir des informations sur le processus métier – Facteur d'influence: Attributs du processus qui influencent la performance Pour améliorer le processus métier, il faut formuler la relation entre les KPI et les facteurs influents en termes d'objectifs analytiques Typologie des objectifs analytiques ■ Objectifs descriptifs – Reporting (KPI) – Segmentation (clustering) – Détection des comportements intéressants ■ Objectifs prédictifs – Régression: trouver un modèle pour la relation entre les KPI et les facteurs influents – Classification: trouver des règles qui permettent d'affecter des instances de processus observées à l'une des classes possibles ■ Objectifs de compréhension – Identification du processus: trouver des règles qui déterminent les relations entre les événements du processus – Analyse de processus : étudier la conformité de l'instance de processus avec un processus défini Business Intelligence Collecte de données Nettoyage des données Stockage de données Analyse des données Présentation des données La collecte de données brutes provenant de différentes sources par différents moyens et sous différents formats L'organisation et la transformation des données en modèles et formats propres et communs Les données raffinées seront modélisées et stockées dans un endroit particulier et prêtes pour l'analyse L’utilisation de composants analytiques, tels que l'analyse dimensionnelle, l'analyse statistique, l'exploration de données et d'autres analyses avancées pour extraire des informations et des connaissances Les résultats sont présentés et livrés dans différents formats compréhensibles par l'homme, pour aider les décisions Business Intelligence Nouveaux Défis ■ Meilleure compréhension des processus, des considérations de flux de travail et de l'exploration de processus ■ Applications aux nouvelles structures organisationnelles ■ Intégration des nouvelles sources de données (données web, données semi-structurées, données texte) ■ Nouvelles méthodes pour de nouveaux types de données (text mining, opinion mining) ■ Utilisation des infrastructures informatiques actuelles: Cloud, Big Data ■ Appareils mobiles, aide à la décision en temps réel, …. Business Intelligence ■Traitement opérationnel: Les opérations quotidiennes comme la capture, le stockage et la manipulation des données. ■Traitement de l'information: L'analyse de ces données ou d'autres formes d'informations pour appuyer la prise de décision Business Intelligence Product Database Customer Database Promotion Database Ajouter un produit Modifier le prix d’un produit Ajouter un nouveau client Changer la catégorie d’un client Modifier la période de la promotion Augmenter le budget des publicités Data Warehouse Combien de produits dont les ventes ont augmentés de 30% suite aux publicités? Si le prix d’un produit augmente de 10%, quels sont les clients qui risquent de partir? Online Analytical Processing Online Transaction Processing Quels sont les produits qui se vendent le mieux parmi les jeunes? Business Intelligence Online Analytical Processing Online Transaction Processing Différentes exigences de performance • Requêtes complexes qui consomment beaucoup de ressources • Vue en temps non réel des données Différentes exigences de modélisation des données • Modèle de données plus simplifié • Modèle dénormalisé • Moins de jointure → Amélioration des performances des requêtes • Moins de tables → Le schéma est plus facile à comprendre Données hétérogènes • Intégrer des données provenant de différents processus métier • Utiliser des données historiques Différentes exigences de performance • Le temps de réponse rapide • Les données doivent être à jour, cohérentes à tout moment Différentes exigences de modélisation des données • Des modèles de données complexes • Nombreuses tables • Schéma normalisé Données non hétérogènes • Cible un processus spécifique Business Intelligence ■ OLTP et OLAP – Différentes exigences de performance – Différentes exigences de modélisation des données – Les requêtes d'analyse nécessitent des données provenant de nombreuses sources ■ Construire un "entrepôt de données" – Extraire les données des différents systèmes OLTP – Optimiser l'organisation des données – Optimiser les performances des grandes requêtes d'analyse – Mettre à jour périodiquement les données dans l'entrepôt Datawarehouse Datawarehouse - Définition ■ Un Datawarehouse est une collection de données conçue pour l'interrogation et l'analyse plutôt que le traitement de transactions. Il contient généralement des données historiques dérivées de données transactionnelles, mais il peut comprendre des données d'autres origines. ■ Les Datawarehouses séparent la charge d'analyse de la charge transactionnelle. Ils permettent aux entreprises de consolider des données de différentes origines. Au sein d'une même entité fonctionnelle, le datawarehouse joue le rôle d'outil analytique Oracle Datawarehouse - Propriétés ■ Un Datawarehouse est une collection de données intégrées, orientées sujet, historisées et non variables, susceptibles d’appuyer le processus décisionnel dans une entreprise ou organisation Oracle Subject Oriented Integrated Non Volatile Time Variant Datawarehouse Subject Oriented Les entrepôts de données sont conçus pour aider à analyser les données. L'information est présentée selon un sujet ou un domaine d'intérêt spécifique, pas simplement comme des enregistrements informatiques. Les données fournissent ainsi des informations sur un sujet particulier. Ventes ■ Qui était notre meilleur client pour ce produit l'année dernière? Subject Oriented Production Réclamation Facturation Commande Produit Vente Client Base de données opérationnelle Datawarehouse Integrated Intégration de données provenant de multiples sources hétérogènes dans un format cohérent ■ Base de données relationnelle ■ Fichier ■ Enregistrement de log L’intégration doit résoudre les problèmes suivants ■ Conflits de noms ■ Incohérences entre les unités de mesure. Integrated m,f 0,1 Male, female m,f EUR USD MD EUR Non volatile Les données, une fois intégrées dans le datawarehouse, ne devraient pas changer. Le but d'un datawarehouse est de permettre d'analyser ce qui s'est passé. Le datawarehouse ne permet que deux opérations : le chargement initial des données et l'accès aux données. Les données non volatiles sont donc ■Stable & non modifiables uploads/Ingenierie_Lourd/ dw-final-e.pdf

  • 21
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager