1 1 Cours d’aide à la décision : Du datawarehouse au datamining L. Jourdan Laet

1 1 Cours d’aide à la décision : Du datawarehouse au datamining L. Jourdan Laetitia.jourdan@lifl.fr 2 L. Jourdan – Aide à la décision Plan Partie 1 : Introduction aux SI et Besoins liés aux SI décisionnels Partie 2 : Focus sur les entrepôts de données Partie 3 : Focus sur la fouille de données (data mining) 3 L. Jourdan – Aide à la décision Le contexte Besoin: prise de décisions stratégiques et tactiques Pourquoi: besoin de réactivité Qui: les décideurs (non informaticiens) Comment: répondre aux demandes d’analyse des données, dégager des informations qualitatives nouvelles Qui sont mes meilleurs clients? A combien s’élèvent mes ventes journalières? Quels français consomment beaucoup de poisson? Pourquoi et comment le chiffre d’affaire a baissé? 4 L. Jourdan – Aide à la décision Le contexte 5 L. Jourdan – Aide à la décision 6 6 Introduction au SI 7 L. Jourdan – Aide à la décision Le processus de prise de décision Bases de production Data warehouse Base multi - dimensionnelle Prédiction / simulation Prise de décision 8 L. Jourdan – Aide à la décision Utilisation Mailing • amélioration du taux de réponse Banque, Assurance • déterminer les profils client – Risque d'un Prêt, Prime plus précise Commerce • ciblage de clientèle • déterminer les promotions • aménagement des rayons (2 produits en corrélation) 9 L. Jourdan – Aide à la décision Utilisation Logistique • adéquation demande / production Santé • épidémiologie (VIH, Amiante, ...) Econométrie • prédiction de trafic autoroutier Ressources Humaines • adéquation activité / personnel 10 L. Jourdan – Aide à la décision Déclinaisons métiers du Décisionnel SPM (Strategic Performance Management) • Déterminer et contrôler les indicateurs clé de la performance de l’entreprise FI (Finance Intelligence) • Planifier, analyse et diffuser l’information financière. Mesurer et gérer les risques. HCM (Human Capital Management) • Aligner les stratégies RH, les processus et les technologies. Modéliser la carte des RH (Ressources Humaines) CRM (Customer Relationship Management) • Améliorer la connaissance client, Identifier et prévoir la rentabilité client. Accroître l’efficacité du marketing client. SRM (Supplier Relationship Management) • Classifier et évaluer l’ensemble des fournisseurs. Planifier et piloter la stratégie Achat. 11 L. Jourdan – Aide à la décision Rentabilisation Constat: orientation marché (client, techno,produit) • Stratégies proactives meilleures que des stratégies réactives D’après une enquête de l’IDC auprès de 45 organisations ayant un Data Warehouse en fonctionnement : • 90% des entreprises ont un RSI au moins égal à 40% • 50% ont un RSI supérieur à 160% • 25% ont un RSI supérieur à 600% RSI : Retour sur Investissement 12 L. Jourdan – Aide à la décision Valorisation 13 13 Entrepôt de données (Datawarehouse) 14 L. Jourdan – Aide à la décision L'Entrepôt de Données (Data Warehouse) Définition de Bill Inmon (1996) «Le Data Warehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées,organisées pour le support d’un processus d’aide à la décision.» Principe • Base de Données utilisée à des fins d’analyse. • Caractéristiques : – orientation sujets («métiers») – données intégrées – données non volatiles – données datées 15 L. Jourdan – Aide à la décision L'Entrepôt de Données Objectif • Retrouver une information historique et transversale à l’entreprise Comment • Fédérer/Regrouper l'ensemble des données de l'entreprise 16 L. Jourdan – Aide à la décision Définition Système de base de données séparé des systèmes (transactionnels) basés sur les données opérationnelles • couvrant un horizon temporel plus grand • contenant des données plus uniformisées • optimisés pour répondre à des questions complexes (des gestionnaires et analystes) • séparé pour des raisons de performances, d ’accès, de format et de qualité 3 variantes: • data warehouse : entrepôt pour toute l’entreprise • data mart : un entrepôt miniature pour une unité de gestion ou un département • organizational data store : techniques d’entrepôt appliquées aux systèmes transactionnels • + 1 : virtual data warehouse : non séparé des bases de données opérationnelles 17 L. Jourdan – Aide à la décision Les 4 caractéristiques des data warehouse 1. Données orientées sujet: • Regroupe les informations des différents métiers • Ne tiens pas compte de l’organisation fonctionnelle des données Ass. Vie Ass. Auto Ass. Santé Client Police 18 L. Jourdan – Aide à la décision Les 4 caractéristiques des data warehouse 2. Données intégrées: • Normalisation des données • Définition d’un référentiel unique h,f 1,0 homme, femme h,f GBP CHF USD EUR 19 L. Jourdan – Aide à la décision Les 4 caractéristiques des data warehouse 3. Données non volatiles • Traçabilité des informations et des décisions prises • Copie des données de production Ajout Modification Suppression Accès Chargement Bases de production Entrepôts de données 20 L. Jourdan – Aide à la décision Les 4 caractéristiques des data warehouse 4. Données datées • Les données persistent dans le temps • Mise en place d’un référentiel temps Nom Ville Dupont Paris Durand Lyon Nom Ville Dupont Marseille Durand Lyon 20 Image de la base en Mai 2005 Image de la base en Juillet 2006 Code Année Mois 1 2005 Mai Base de production Entrepôt de données Calendrier Code Année Mois 1 Dupont Paris 1 Durand Lyon Répertoire Répertoire Répertoire Code Année Mois 1 2005 Mai 2 2006 Juillet Code Année Mois 1 Dupont Paris 1 Durand Lyon 2 Dupont Marseille 21 L. Jourdan – Aide à la décision Entrepôts vs BDR BD opérationelle : • Flux, Temps réel . . . • cohérence, requêtes rapides BD décisionnelle : • Vue historique. • Sources multiples. • Données standardisées. Service commercial Service Financier Service livraison BD prod BD prod BD prod Clientèle Data Warehouse Clientèle H I S T O R I Q U E OLTP: On-Line Transactional Processing OLAP: On-Line Analitical Processing 22 L. Jourdan – Aide à la décision Données Données opérationnelles Données décisionnelles Orientées application, détaillées, précises au moment de l’accès Orientée activité (thème, sujet), condensées, représentes des données historiques Mise à jour interactive possible de la part des utilisateurs Pas de mise à jour interactive de la part des utilisateurs Accédées de façon unitaires par une personne à la fois Utilisées par l’ensemble des analystes, gérées par sous-ensemble Cohérence atomique Cohérence globale Haute disponibilité en continu Exigence différente, haute disponibilité ponctuelle Uniques (pas de redondance en théorie) Peuvent être redondantes Structure statique, contenu variable Structure flexible Petite quantité de données utilisées par un traitement Grande quantité de données utilisée par les traitements Réalisation des opérations au jour le jour Cycle de vie différent Forte probabilité d’accès Faible probabilité d’accès Utilisées de façon répétitive Utilisée de façon aléatoire 23 L. Jourdan – Aide à la décision Ethique Protection de la vie privée les 8 principes de l ’OCDE • pour mettre en place une législation dans un pays Limitation des données privées Qualité des données Objectifs clairs Limitation de l'usage Sécurité assurée Ouverture (commission) Participation des fichés Responsabilité • données médicales, religieuses … • garantie par l ’entreprise • l’objectif de la collecte est précisé • les données ne servent qu ’à cet objectif • garantie par l ’entreprise • vérification possible • les fichés ont accès et peuvent réagir • des entreprises 24 L. Jourdan – Aide à la décision Objectifs I Rendre les données facilement accessibles • Lecture facile. • Manipulation aisée, outils conviviaux. • Rapidité . . .? ? ? II Présentation cohérente • Données nettoyées, vérifiées, crédibles. • Codage et représentation documentés. • Assurer la qualité des données. III Architecture évolutive • Compatible avec les nouvelles requêtes. • Résistance aux changements. • Compatibilité ascendante. • Modifications documentées. IV L'entrepôt de données doit servir à la prise de décision Il doit être accepté par les utilisateurs . . . et utilisé ! Les utilisateurs peuvent se passer de l'entrepôt de données. . .pas de l'information opérationnelle. . . 25 L. Jourdan – Aide à la décision Travail du concepteur • Ecouter les utilisateurs : besoins, décisions . . . • Cibler les « meilleurs » utilisateurs. • Sélectionner les données pertinentes. • Concevoir des outils de visualisation/interrogation simples. • Contrôler la validité des données présentées. • Enrichir constamment la base. • Faire de la pub ! 26 L. Jourdan – Aide à la décision Recueil des besoins OBJECTIF PRINCIPAL • Qu’attendez-vous principalement du Data Warehouse ? DECISIONS • Quelles décisions avez-vous à prendre ? (Quoi ?) • Quels sont les critères qui influencent la prise de décision ? (Comment ?) • Dans quel(s) but(s) les décisions sont-elles prises ? (Pourquoi ?) DIFFICULTES ACTUELLES • Quelles sont les difficultés actuellement rencontrées dans la prise de décision, difficultés en rapport avec les données ? • précision des données (détails, actualisation, vérification) • • synthèse des données (regroupements) • évolution (temps) • autres... ACTUALISATION DES INFORMATIONS • Quels sont les besoins concernant la fréquence de mise à jour des informations proposées par le Data Warehouse ? PRESENTATION DES INFORMATIONS • » Quelles sont vos préférences dans la présentation des informations • tableaux, graphiques, ? • » Type de graphiques : barres- graphes, “camemberts”, nuages de points ... ? • » Existe-t-il une présentation actuelle uploads/Management/du-datawarehouse-au-datamining.pdf

  • 26
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Apv 20, 2021
  • Catégorie Management
  • Langue French
  • Taille du fichier 10.6111MB