Année Académique 2009-2010 Cours & TD Datawarehouse Pr. A. ELOUARDIGHI 1 Suppor

Année Académique 2009-2010 Cours & TD Datawarehouse Pr. A. ELOUARDIGHI 1 Support Cours & TD Datawarehouse Pr. A. ELOUARDIGHI Année Académique 2009-2010 Cours & TD Datawarehouse Pr. A. ELOUARDIGHI 2 Chapitre 1: Notions et Architecture d’un DW Systèmes transactionnels vs Systèmes décisionnels Systèmes transactionnels  Les outils traditionnels de gestion et d’exploitation des données sont du type transactionnel ou OLTP (On-Line Transaction Processing)  L’exploitation de données tourné vers la saisie, le stockage, la mise à jour, la sécurité et l’intégrité des données.  Le système transactionnel est développé pour gérer les transactions quotidiennes  Ces bases de données supportent habituellement des applications particulières telles que les inventaires de magasins, les réservations d’hôtel, etc  Le contenu est fait de données actuelles, pas d’archives  Les données sont très détaillées (détails de chacune des transactions)  La mise à jour s’effectue par de nouvelles transactions  Très souvent plusieurs de ces systèmes existent indépendamment les uns des autres Opérations dans les systèmes transactionnels  Ajout  Effacement  Mise à jour des enregistrements  Requêtes simples  Interrogations et modifications fréquentes des données par de nombreux utilisateurs Systèmes décisionnels  Le terme décisionnel « Business Intelligence » couvre l'ensemble des technologies permettant en bout de chaîne d'apporter une aide à la décision.  SI capable d'agréger les données internes ou externes et de les transformer en information servant à une prise de décision rapide.  SI capable de répondre à certains types de questions: o Quelles sont les ventes du produit X pendant le trimestre A de l'année B dans la région C ? o Comment se comporte le produit X par rapport au produit Y? o Quel type de client peut acheter le produit X? o Est-ce qu'une baisse de prix de 10% par rapport à la concurrence ferait redémarrer les ventes du produit X ?  Ces exemples mettent en évidence les faits suivants: o Les questions doivent pouvoir être formulées dans le langage de l’utilisateur en fonction de son secteur d’activité:  Service marketing, Service économique, service relation clients… o La prévision des interrogations est difficile car elles sont du ressort de l’utilisateur. o Les questions vont varier selon les réponses obtenues:  Si le produit X s’est vendu moins bien que l’année précédente, il va être utile de comprendre les raisons: Détailler les ventes par région par type de magasin,… o Des questions ouvertes vont nécessiter la mise en place de méthodes d’extraction d’informations Année Académique 2009-2010 Cours & TD Datawarehouse Pr. A. ELOUARDIGHI 3 Des données aux décisions  Données : o Points de ventes, géographiques, démographiques, …  Informations : o I vit dans R, I est âgé de A, …  Connaissances : o Dans X%, le produit Y est vendu en même temps que le produit Z, …  Décisions o Lancer la promotion de Y & Z dans R auprès des clients plus âgés que A, ... Applications transactionnelles v.s Applications décisionnelles  Les applications transactionnelles sont constituées de traitements factuels de type OLTP (On Line Transaction Processing)  Les applications d'aide à la décision sont constituées de traitements ensembliste de type OLAP: On Line Analytical Processing Incompatibilités des deux activités  Les deux activités (OLTP & OLAP) ne peuvent co-exister sur des données dans le même système d’information: leurs objectifs de performance sont exactement opposés: o Les requêtes complexes et lourdes dégradent les performances des systèmes transactionnels, o Les données temporelles sont réparties entre données actuelles et données archivées, rendant la vue historique des données très difficile ou impossible,  Le support efficace d’une activité OLAP nécessite la constitution d’un système d’information propre: Le Datawarehouse Naissance du Datawarehouse Datawarehouse : Définition  « Collection de données orientées sujets, intégrées, non volatiles et historisées, organisées pour le support du processus d’aide à la décision »  Base de données dans laquelle sont déposées après nettoyage et homogénéisation les informations en provenance des différents systèmes de production de l’entreprise OLTP Année Académique 2009-2010 Cours & TD Datawarehouse Pr. A. ELOUARDIGHI 4 Caractéristiques des données d'un DW  Orientées sujet : o Organisées autour de sujets majeurs de l’entreprise o Données pour l’analyse et la modélisation en vue de l’aide à la décision, et non pas pour les opérations et transactions journalières o Vue synthétique des données selon les sujets intéressant les décideurs  Intégrées : o Construit en intégrant des sources de données multiples et hétérogènes  BD relationnelles, fichiers, enregistrements de transactions o Les données doivent être mises en forme et unifiées afin d’avoir un état cohérent o Phase la plus complexe (60 à 90 % de la charge totale d’un projet DW)  Historisées : o Fournies par les sources opérationnelles o Matière première pour l'analyse o Stockage de l'historique des données, pas de mise à jour o Un référentiel temps doit être associé aux données  Non volatiles : o Conséquence de l’historisation o Une même requête effectuée à intervalle de temps, en précisant la date référence de l’information donnera le même résultat o Stockage indépendant des BD opérationnelles o Pas de mises à jour des données dans le DW Données multidimensionnelles  Notion de dimension : C’est une catégorie linguistique selon laquelle les données sont organisées: o Nom d’un attribut o Valeur d’un attribut Représentation : Tableau simple Tableau croisé Année Académique 2009-2010 Cours & TD Datawarehouse Pr. A. ELOUARDIGHI 5 Graphique 3D Hyper cube: Notion de Datamart  Définition: o « C'est un sous-ensemble de données dérivées du DW ciblé sur un sujet unique».  Caractéristiques: o Orienté vers un sujet unique  Ex: comportement de la clientèle o Données fortement agrégées  Le DW joue le rôle de source et d'historique pour le Datamart o Organisation multidimensionnelle (cubique)  Dont l'une des dimensions indique souvent le temps o Lien dynamique avec le DW  Association entre valeur agrégée et valeur détaillée o Interfaces simples et conviviales Les domaines d’application du décisionnel  La gestion de la relation client (CRM) est l’un des premiers champs d’application de la Business Intelligence.  Le contrôle de gestion pour l’analyse des coûts, l’analyse de la rentabilité, l’élaboration budgétaire, les indicateurs de performance…  La direction marketing pour le ciblage, le pilotage de gamme, les applications de géomarketing, de fidélisation clients…  La direction commerciale pour le pilotage des réseaux, les prévisions des ventes, l’optimisation des territoires…  Les ressources humaines pour la gestion des carrières,  La direction de la production pour l’analyse qualité, la prévision des stocks, la gestion des flux, la fiabilité industrielle…  La direction générale pour les tableaux de bord, indicateurs de pilotage, gestion d’alertes… Année Académique 2009-2010 Cours & TD Datawarehouse Pr. A. ELOUARDIGHI 6 Exemple: un DW dans les télécoms  Sujets : o Suivi du marché: lignes installées/ désinstallées, services et options choisis, répartition géographique, répartition entre public et différents secteurs d'organisations o Comportement de la clientèle o Comportement du réseau  Historique o 5 ans pour le suivi du marché o 1 an pour le comportement de la clientèle o 1 mois pour le comportement du réseau  Sources o Fichiers clients élaborés par les agences o Fichiers de facturation  Requêtes o Comportement clientèle o Nombre moyen d'heures par client, par mois et par région o Durée moyenne d'une communication urbaine par ville o Durée moyenne d'une communication internationale Architecture d’un Datawarehouse Architecture centralisée  Il s’agit de la version centralisée et intégrée d’un entrepôt regroupant l’ensemble des données de l’entreprise. Les différentes bases de données sources sont intégrées et sont distribuées à partir de la même plate-forme physique Architecture fédérée  Il s’agit de la version intégrée d’un entrepôt où les données sont introduites dans les marchés de données orientés selon les différentes fonctions de l’entreprise Année Académique 2009-2010 Cours & TD Datawarehouse Pr. A. ELOUARDIGHI 7 Chapitre 2 : OLAP et Analyse multidimensionnelles OLAP :  « Il s’agit d’une catégorie de logiciels axés sur l’exploration et l’analyse rapide des données selon une approche multidimensionnelle à plusieurs niveaux d’agrégation ».  OLAP vise à assister l’usager dans son analyse en lui facilitant l’exploration de ses données et en lui donnant la possibilité de le faire rapidement. o L’usager n’a pas à maîtriser des langages d’interrogation et des interfaces complexes o L’usager interroge directement les données, en interagissant avec celles-ci Modèle conceptuel  Approche multidimensionnelle o Souvent représentés par une structure à plusieurs dimensions o Une dimension est un attribut ou un ensemble d’attributs:  Temps  Géographie  Produits  Clients o Les cellules contiennent des données agrégées appelées Faits ou Indicateurs:  Nombre d’unités vendues  Chiffre d’Affaire  Coût o Représentations:  Relations,  Cube de données,  hyper cube de données Vue multidimensionnelle Agrégation des données  Plusieurs niveaux d’agrégation o Les données peuvent être groupées à différents niveaux de granularité o Les regroupements sont pré-calculés,  Par exemple, le total des ventes pour le mois dernier calculé à partir de la somme de toutes les ventes du mois.  Granularité : niveau de détail des uploads/Management/ht-cours-et-td-dw-elouardighi-pdf.pdf

  • 30
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Oct 08, 2022
  • Catégorie Management
  • Langue French
  • Taille du fichier 3.2909MB