Année Académique 2009-2010 Cours & TD Datawarehouse Pr. A. ELOUARDIGHI 1 Suppor
Année Académique 2009-2010 Cours & TD Datawarehouse Pr. A. ELOUARDIGHI 1 Support Cours & TD Datawarehouse Pr. A. ELOUARDIGHI Année Académique 2009-2010 Cours & TD Datawarehouse Pr. A. ELOUARDIGHI 2 Chapitre 1: Notions et Architecture d’un DW Systèmes transactionnels vs Systèmes décisionnels Systèmes transactionnels Les outils traditionnels de gestion et d’exploitation des données sont du type transactionnel ou OLTP (On-Line Transaction Processing) L’exploitation de données tourné vers la saisie, le stockage, la mise à jour, la sécurité et l’intégrité des données. Le système transactionnel est développé pour gérer les transactions quotidiennes Ces bases de données supportent habituellement des applications particulières telles que les inventaires de magasins, les réservations d’hôtel, etc Le contenu est fait de données actuelles, pas d’archives Les données sont très détaillées (détails de chacune des transactions) La mise à jour s’effectue par de nouvelles transactions Très souvent plusieurs de ces systèmes existent indépendamment les uns des autres Opérations dans les systèmes transactionnels Ajout Effacement Mise à jour des enregistrements Requêtes simples Interrogations et modifications fréquentes des données par de nombreux utilisateurs Systèmes décisionnels Le terme décisionnel « Business Intelligence » couvre l'ensemble des technologies permettant en bout de chaîne d'apporter une aide à la décision. SI capable d'agréger les données internes ou externes et de les transformer en information servant à une prise de décision rapide. SI capable de répondre à certains types de questions: o Quelles sont les ventes du produit X pendant le trimestre A de l'année B dans la région C ? o Comment se comporte le produit X par rapport au produit Y? o Quel type de client peut acheter le produit X? o Est-ce qu'une baisse de prix de 10% par rapport à la concurrence ferait redémarrer les ventes du produit X ? Ces exemples mettent en évidence les faits suivants: o Les questions doivent pouvoir être formulées dans le langage de l’utilisateur en fonction de son secteur d’activité: Service marketing, Service économique, service relation clients… o La prévision des interrogations est difficile car elles sont du ressort de l’utilisateur. o Les questions vont varier selon les réponses obtenues: Si le produit X s’est vendu moins bien que l’année précédente, il va être utile de comprendre les raisons: Détailler les ventes par région par type de magasin,… o Des questions ouvertes vont nécessiter la mise en place de méthodes d’extraction d’informations Année Académique 2009-2010 Cours & TD Datawarehouse Pr. A. ELOUARDIGHI 3 Des données aux décisions Données : o Points de ventes, géographiques, démographiques, … Informations : o I vit dans R, I est âgé de A, … Connaissances : o Dans X%, le produit Y est vendu en même temps que le produit Z, … Décisions o Lancer la promotion de Y & Z dans R auprès des clients plus âgés que A, ... Applications transactionnelles v.s Applications décisionnelles Les applications transactionnelles sont constituées de traitements factuels de type OLTP (On Line Transaction Processing) Les applications d'aide à la décision sont constituées de traitements ensembliste de type OLAP: On Line Analytical Processing Incompatibilités des deux activités Les deux activités (OLTP & OLAP) ne peuvent co-exister sur des données dans le même système d’information: leurs objectifs de performance sont exactement opposés: o Les requêtes complexes et lourdes dégradent les performances des systèmes transactionnels, o Les données temporelles sont réparties entre données actuelles et données archivées, rendant la vue historique des données très difficile ou impossible, Le support efficace d’une activité OLAP nécessite la constitution d’un système d’information propre: Le Datawarehouse Naissance du Datawarehouse Datawarehouse : Définition « Collection de données orientées sujets, intégrées, non volatiles et historisées, organisées pour le support du processus d’aide à la décision » Base de données dans laquelle sont déposées après nettoyage et homogénéisation les informations en provenance des différents systèmes de production de l’entreprise OLTP Année Académique 2009-2010 Cours & TD Datawarehouse Pr. A. ELOUARDIGHI 4 Caractéristiques des données d'un DW Orientées sujet : o Organisées autour de sujets majeurs de l’entreprise o Données pour l’analyse et la modélisation en vue de l’aide à la décision, et non pas pour les opérations et transactions journalières o Vue synthétique des données selon les sujets intéressant les décideurs Intégrées : o Construit en intégrant des sources de données multiples et hétérogènes BD relationnelles, fichiers, enregistrements de transactions o Les données doivent être mises en forme et unifiées afin d’avoir un état cohérent o Phase la plus complexe (60 à 90 % de la charge totale d’un projet DW) Historisées : o Fournies par les sources opérationnelles o Matière première pour l'analyse o Stockage de l'historique des données, pas de mise à jour o Un référentiel temps doit être associé aux données Non volatiles : o Conséquence de l’historisation o Une même requête effectuée à intervalle de temps, en précisant la date référence de l’information donnera le même résultat o Stockage indépendant des BD opérationnelles o Pas de mises à jour des données dans le DW Données multidimensionnelles Notion de dimension : C’est une catégorie linguistique selon laquelle les données sont organisées: o Nom d’un attribut o Valeur d’un attribut Représentation : Tableau simple Tableau croisé Année Académique 2009-2010 Cours & TD Datawarehouse Pr. A. ELOUARDIGHI 5 Graphique 3D Hyper cube: Notion de Datamart Définition: o « C'est un sous-ensemble de données dérivées du DW ciblé sur un sujet unique». Caractéristiques: o Orienté vers un sujet unique Ex: comportement de la clientèle o Données fortement agrégées Le DW joue le rôle de source et d'historique pour le Datamart o Organisation multidimensionnelle (cubique) Dont l'une des dimensions indique souvent le temps o Lien dynamique avec le DW Association entre valeur agrégée et valeur détaillée o Interfaces simples et conviviales Les domaines d’application du décisionnel La gestion de la relation client (CRM) est l’un des premiers champs d’application de la Business Intelligence. Le contrôle de gestion pour l’analyse des coûts, l’analyse de la rentabilité, l’élaboration budgétaire, les indicateurs de performance… La direction marketing pour le ciblage, le pilotage de gamme, les applications de géomarketing, de fidélisation clients… La direction commerciale pour le pilotage des réseaux, les prévisions des ventes, l’optimisation des territoires… Les ressources humaines pour la gestion des carrières, La direction de la production pour l’analyse qualité, la prévision des stocks, la gestion des flux, la fiabilité industrielle… La direction générale pour les tableaux de bord, indicateurs de pilotage, gestion d’alertes… Année Académique 2009-2010 Cours & TD Datawarehouse Pr. A. ELOUARDIGHI 6 Exemple: un DW dans les télécoms Sujets : o Suivi du marché: lignes installées/ désinstallées, services et options choisis, répartition géographique, répartition entre public et différents secteurs d'organisations o Comportement de la clientèle o Comportement du réseau Historique o 5 ans pour le suivi du marché o 1 an pour le comportement de la clientèle o 1 mois pour le comportement du réseau Sources o Fichiers clients élaborés par les agences o Fichiers de facturation Requêtes o Comportement clientèle o Nombre moyen d'heures par client, par mois et par région o Durée moyenne d'une communication urbaine par ville o Durée moyenne d'une communication internationale Architecture d’un Datawarehouse Architecture centralisée Il s’agit de la version centralisée et intégrée d’un entrepôt regroupant l’ensemble des données de l’entreprise. Les différentes bases de données sources sont intégrées et sont distribuées à partir de la même plate-forme physique Architecture fédérée Il s’agit de la version intégrée d’un entrepôt où les données sont introduites dans les marchés de données orientés selon les différentes fonctions de l’entreprise Année Académique 2009-2010 Cours & TD Datawarehouse Pr. A. ELOUARDIGHI 7 Chapitre 2 : OLAP et Analyse multidimensionnelles OLAP : « Il s’agit d’une catégorie de logiciels axés sur l’exploration et l’analyse rapide des données selon une approche multidimensionnelle à plusieurs niveaux d’agrégation ». OLAP vise à assister l’usager dans son analyse en lui facilitant l’exploration de ses données et en lui donnant la possibilité de le faire rapidement. o L’usager n’a pas à maîtriser des langages d’interrogation et des interfaces complexes o L’usager interroge directement les données, en interagissant avec celles-ci Modèle conceptuel Approche multidimensionnelle o Souvent représentés par une structure à plusieurs dimensions o Une dimension est un attribut ou un ensemble d’attributs: Temps Géographie Produits Clients o Les cellules contiennent des données agrégées appelées Faits ou Indicateurs: Nombre d’unités vendues Chiffre d’Affaire Coût o Représentations: Relations, Cube de données, hyper cube de données Vue multidimensionnelle Agrégation des données Plusieurs niveaux d’agrégation o Les données peuvent être groupées à différents niveaux de granularité o Les regroupements sont pré-calculés, Par exemple, le total des ventes pour le mois dernier calculé à partir de la somme de toutes les ventes du mois. Granularité : niveau de détail des uploads/Management/ht-cours-et-td-dw-elouardighi-pdf.pdf
Documents similaires










-
30
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Oct 08, 2022
- Catégorie Management
- Langue French
- Taille du fichier 3.2909MB