Rapport du projet BI Entreprise Shiny Réalisé par : Kyle XY 2 Sommaire : I. Int
Rapport du projet BI Entreprise Shiny Réalisé par : Kyle XY 2 Sommaire : I. Introduction générale ………………………………………….....3 II. Concepts théoriques…………………………………..…….. …....4 III. Présentation des outils utilisés ……………… ……………...11 IV. Réalisation de la solution……………………………………....13 V. Difficultés rencontrées ……………………………………..……19 VI. Conclusion…………………………………. …………………………..20 VII. Annexe………………………………………………… ………………...21 3 I. Introduction générale : Le but de la BI est d’apporter une vision globale des données de l’entreprise, afin de répondre aux problématiques de celle-ci ou, tout simplement, afin de l’évaluer. Notre projet consiste en l’implémentation du décisionnel pour l’entreprise Shiny et principalement pour l’organisation de la gestion administrative. La première étape de ce projet BI est de créer un entrepôt de données pour avoir une vision globale des données de chaque service. Pour ce fait, on réalisera tout d’abord la modélisation MCD de l’entreprise, puis en passera à la modélisation du datawarehouse. La deuxième étape sera l’ETL ou l’intégration des données issues de l’ancienne base de données de l’entreprise. Une fois notre entrepôt de données réalisé et remplis on pourra passer à la partie reporting. La troisième étape concerne l’ERP SAP BusinessObject avec lequel on créera des univers afin de pouvoir faire du reporting et aidé l’entreprise Shiny dans son organisation administrative et dans le processus de prise de décision. Ce rapport sera constitué de trois parties ; tout d’abord on commencera par quelques concepts théoriques sur la chaîne décisionnelle éventuellement les parties ETL, OLAP et Reporting. Ensuite, on citera les différents outils utilisés durant le projet, pour enfin finir avec les différentes étapes de la réalisation du projet. 4 II. Concepts théorique 1. Chaîne BI ou chaîne décisionnelle Business Intelligence Business Intelligence ou BI : Collecter les données internes et externes et les transformer en informations, analysées par les utilisateurs, pour prendre de meilleures décisions et améliorer la performance de l’entreprise. Le Business Intelligence restitue une vision cohérente du fonctionnement de l’organisation : Assurer la cohérence entre les objectifs stratégiques et les actions du management opérationnel. Fournir une vision prospective : mesurer la performance de la stratégie choisie et agir en conséquence. Modéliser le business. La chaîne décisionnelle L’élément de base du système décisionnel est le datawarehouse ou entrepôt de données. C’est une base de données triée, classée, afin d’en sortir, grâce à des outils de restitution et d’analyse, une information stratégique. La mise en place d’un système décisionnel consiste donc à récupérer les données de la base opérationnelle de l’entreprise afin de constituer le datawarehouse (Phase d’alimentation) souhaité. Par la suite, il faudra traiter les données du datawarehouse par des phases de restitution et/ou d’analyse. 5 Il faut procéder par étapes pour mettre en place correctement le DataWareHouse. 6 • Interviews utilisateurs / Cerner les besoins utilisateurs : Le DataWareHouse est au centre de la chaîne décisionnelle, il faut donc le concevoir avec précaution. Une phase préalable d’interviews auprès des utilisateurs est nécessaire, même si un cahier des charges a été rédigé, afin de mettre en évidence les données qui leur sont vraiment utiles. • Modélisation du DataWareHouse : Après, les interviews auprès des utilisateurs, les données nécessaires sont connues. Il faut les organiser de manière à obtenir des modèles, de type étoile ou double étoile afin de pouvoir y accéder facilement. On définit les objets que l’utilisateur va pourvoir utiliser pour créer ses requêtes et ses tableaux. De plus, on met en place les cubes, systèmes de modélisation des données multidimensionnelles pour pouvoir gérer les agrégats. On définit les axes d’analyse qui peuvent être, entre autre, l’axe temporel (année, trimestre, mois, semaine), l’axe géographique (continent, pays, région, département, ville), … et les indicateurs. L’analyse multidimensionnelle permet d'étudier les indicateurs, comme le chiffre d’affaire ou la marge, en fonction des différents axes. L’avantage de ce système est qu’on peut passer d’un niveau à un niveau plus détaillé : du chiffre d’affaire par pays au chiffre d’affaire par région. • Constitution des Data Mart : Une fois le DataWareHouse créé, on peut mettre en place un système de Reporting et d’Analyse pour différents services : un pour le service Financier, un pour le service Marketing, un pour le service Client, … On va construire alors par service un « mini » DataWareHouse qui contiendra uniquement les données utilisées au sein du service ( on ne garde que les tables nécessaires ). Ce « mini » DataWareHouse est appelé DataMart qui donne une vision départementale ou métier des données. On le construit de la même façon qu’on met en place un DataWareHouse, c’est-à-dire qu’un DataMart se compose de plusieurs tables organisées le plus simplement possible. On retrouvera une ou plusieurs tables de faits au centre d’où partent différents axes d’analyse. Les étapes d’un projet décisionnel Comme tout projet, un projet décisionnel se décompose en trois grandes étapes : L’identification du projet La conception Le déploiement 7 L ’identification représente le pré-projet, l’étude préalable dans laquelle on définit le périmètre du projet, sa faisabilité, ses enjeux et où l’on détermine le planning à suivre et le cahier des charges. Suite à ces prémisses, on entre dans l’analyse ou conception du projet. La conception comprend les spécifications fonctionnelles et les spécifications détaillées. Chacune est très orientée décisionnel. Dans les spécifications fonctionnelles, suite aux interviews utilisateurs, on retrouve la modélisation avec la définition des axes et indicateurs et une première tentative de mise en place du modèle décisionnel. Les spécifications détaillées sont plus orientées techniques. On y retrouve les procédures d’alimentation, une maquette, la définition détaillée des tableaux de bord et la rédaction du cahier de recette. Nous y avons ajouté une partie "choix outils" qui nous paraissait intéressante comme prélude à la réalisation. La réalisation ou déploiement comprend, comme définies dans la chaîne décisionnelle, la phase d’alimentation, la phase de restitution et/ou la phase d’analyse. 2. ETL (Extract-Transform-Load ) Extract-T ransform-Load est connu sous le terme ETL (ou parfois : datapumping). Il s'agit d'une technologie informatique intergicielle permettant d'effectuer des synchronisations massives d'information d'une banque de données vers une autre. Selon le contexte, on traduira par « alimentation », « extraction », « transformation », « constitution » ou « conversion », souvent combinés. Elle est basée sur des connecteurs servant à exporter ou importer les données dans les applications (Ex : connecteur Oracle ou SAP...), des transformateurs qui manipulent les données (agrégations, filtres, conversions...), et des mises en correspondance (mappages). Le but est l'intégration de l'entreprise par ses données. A l'origine, les solutions d'ETL sont apparues pour le chargement régulier de données agrégées dans les entrepôts de données (ou datawarehouse), avant de se diversifier vers les autres domaines logiciels. Ces solutions sont largement utilisées dans le monde bancaire et financier, et en développement dans l'industrie. Actuellement il existe trois catégories d’outils ETL : 8 • Engine-based : les transformations sont exécutées sur un serveur ETL, disposant en général d’un référentiel. Ce genre de d’outil dispose d’un moteur de transformation ; • Database-embedded : les transformations sont intégrées dans la BD ; • Code-generators : les transformations sont conçues et un code est généré. Ce code est déployabe indépendamment de la base de données. Composantes de l’ETL • La transformation est la tâche la plus complexe et qui demande beaucoup de réflexion. Voici les grandes fonctionnalités de transformation : - Nettoyage des données - Standardisation des données. - Conformité des données. - gestion des tables de fait - gestion des dimensions - affectations des clés de substitution (surrogate key) - gestion de l'évolution lente (Slowly changing dimension) - gestion des faits arrivants en retard ( Late arriving fact)… • Le feedback concerne les deux aspects suivants : - Informer le système source du résultat de l'extraction : réussite, échec, date dernière extraction, date prochaine extraction... - T ransmettre de l'information aux systèmes sources ( parfois aussi à l'ODS). L'exemple le plus citée est celui lorsque l'entrepôt de données après analyse des click-streams de l'expérience de navigation d'un client (Que l'on reconnaît par son adresse IP) renvoie de l'information aux systèmes opérationnels dans le but d'afficher les bannières les plus appropriées ! 9 • L'extraction des données est la première étape dans les systèmes ETL. Elle permet de lire les données à partir des systèmes sources. Selon la nature de ces systèmes sources l'extraction peut s'avérer critique et très exigeante dans le sens où il faut la réaliser le plus rapidement souvent et ce en exploitant au minimum les ressources du système source. En général les extractions sont lancées la nuit durant ce l'on appelle un Extract Window sur lequel on s'est mis d'accord. La complexité de l'extraction n'est pas dans le processus de lecture, mais surtout dans le respect de l'extract window. C'est pour cette raison que l'on effectue rarement des transformations lors de l'extraction d'une part. D'autre part, on essaye au maximum d'extraire seulement les données utiles et pour ce faire on pourrait s'entendre avec le responsable du système source pour ajouter soit un flag ou encore des dates dans chacune des tables extraites, au moins deux dates : Date de création de l'enregistrement dans la table et la uploads/Management/ projet-bi.pdf
Documents similaires
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/CaOo1KQBx7EltF3GGIR7x4HLS4pOoBgeph2Nw4qUOJSKGZkPxwtbez6T8reWcoCmz5IBRftV1VxzehLqVzI4ipe6.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/WJ2KiplI37WdCTajaXNE2WjRwCJa13AYv68qMReSrjUhCdn7UqexBpYf4Tu2FB7vT6Q2bTpS7tv2TiA9YmdY2BoO.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/gHKYSjgKJd3YqsbgTWSOLfd5DjL2zpJ2opGU35dyEpAJzitbFwcmRPrhEg8aAwJX94DDfuF1A5FXWuUd0PrXoQMF.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/u8MvFv6AzUkSlZgQoABPu82NTxLgyleLXq93R0MTE2z7FswqYt6FJemDlVMkFvMKrjxTTpSmd5owDVxDNmr38E2a.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/gc9KRm0CKXpogfGJfFEextFt5jtqpfAtaNI8NWXep9gX9aLYhY7BwHxGEP8Qx4DwQnpTK1PZKqAZFNuVPr3s1Wtp.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/JlF4wiY3ip8NopElg2ZhiyaIpaoucK1k2rZ08xbrjmM1k3qvbxTU8NGufzx28dLO4JB1hu1Y47A95gFwoXKfBFxK.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/dhN8nX6SB3RolTCzFfrMzcXJY4wgL5fnqO4FwOR9cd09AyeSiftWkf5wF1vWBMqbmW6uxJh6dnsTZXB0F0DiHzuY.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/P8HZ4HTwg1OQPTADnaBDM7STsHG0kt3zjd2O1xQyIzT3fciqHfcVDxEqkb7Iu5qdDye9onpnSXUKQp6mQB4P6Dgg.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/puwMJwHnQPxb8uQOnaR6n1tplNcXRHz5S8CtLm5kYRsc9vkrNaJgeyMPNVJpMCBgzB3vwdbuk1bVfnXpDHBqiJ3D.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/LVRs8pADw9pCdaRkROKhDiYtAiuKuRK4wFz10qvl0G3hDh28vv7V8Fn4LFVy1H181Dm5UMNDDr9oYoHuiC8d6XZB.png)
-
23
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Sep 18, 2021
- Catégorie Management
- Langue French
- Taille du fichier 0.8896MB