Master Data Engineering La gestion des données & Exploitation de données N.ZIDA

Master Data Engineering La gestion des données & Exploitation de données N.ZIDANE SUPMIT/ISI 2012-2013 Gestion de données 1. Qu’est-ce qu’une base de Données ? 2. A quoi cela sert-il ? 3. Comment ça marche ? 4. Bénéfices / Contraintes pour l'entreprise 5. Impacts pour l'entreprise 6. Quelles sont les questions à se poser 7. Ecueils à éviter Plan du module: N. Zidane SUPMTI/ISI 2012-2013 1. Définitions Gestion des données N. Zidane SUPMTI/ISI 2012-2013 Définitions Une base de données est un ensemble structuré de données interdépendantes, rangées sans redondances inutiles, organisées de manière indépendante des programmes les exploitants, pour satisfaire un grand nombre d’utilisateurs. N. Zidane SUPMTI/ISI 2012-2013 Définitions Les bases de données hiérarchiques : le premier système de base de données a été conçu pour la gestion des données du programme Apollo de la NASA. Les données étaient structurées dans des hiérarchies, comparables à l'organisation des répertoires sur un PC. Mais certains problèmes de stockage ont mené à utiliser (et donc à inventer) des bases de données de type réseaux. Les bases de données réseaux : ce modèle permet d'établir des liaisons de type 1-n en définissant des associations entre tous les types d'enregistrements. N. Zidane SUPMTI/ISI 2012-2013 Définitions Les bases de données relationnelles : Inventé par E.F. Codd ce système propose de stocker des données hétérogènes dans des tables et permettant d'établir des relations entre elles. Depuis les années 80, cette technologie a mûri et a été adoptée par l'industrie. En 1987, le langage SQL, qui étend l'algèbre relationnelle, a été standardisé. À l'heure actuelle, les SGBDR (Système de Gestion de Base de Données Relationnelles) sont présents dans de nombreux logiciels, sont très utilisés dans les bases de données et représentent une industrie de plusieurs milliards de dollars. N. Zidane SUPMTI/ISI 2012-2013 Définitions Les bases de données orientées objet les données sont représentées sous forme d'objets persistants. Les bases de données semi-structurées Les données semi-structurées peuvent se voir comme une relaxation du modèle relationnel classique, un des fondements des bases de données traditionnelles, dans lequel on autorise une structure moins rigide et homogène des <<champs de données>>. Ce modèle de données c'est révélé très utile dans la représentation de familles de documents variés: multimédia, hypertexte, données scientifiques, .... N. Zidane SUPMTI/ISI 2012-2013 2. A quoi cela sert-il ? Gestion des données N. Zidane SUPMTI/ISI 2012-2013 A quoi cela sert-il ? Une base de données permet de mettre des données à la disposition d'utilisateurs pour une consultation, une saisie ou bien une mise à jour, tout en s'assurant des droits accordés à ces derniers. Cela est d'autant plus utile que les données informatiques sont de plus en plus nombreuses. Une base de données peut être locale, c'est-à-dire utilisable sur une machine par un utilisateur, ou bien répartie, c'est-à-dire que les informations sont stockées sur des machines distantes et accessibles par réseau. N. Zidane SUPMTI/ISI 2012-2013 A quoi cela sert-il ? L'avantage majeur de l'utilisation de bases de données est la possibilité de pouvoir être accédées par plusieurs utilisateurs simultanément. N. Zidane SUPMTI/ISI 2012-2013 3. Comment ça marche ? Gestion des données N. Zidane SUPMTI/ISI 2012-2013 Comment ça marche ? Les données sont enregistrées dans des tableaux à deux dimensions (lignes et colonnes) appelés table. La manipulation des données se fait selon la théorie mathématique des relations. Pour concevoir la base de données on va d ’abord décrire les données que l’on veut stocker sans se préoccuper de l’aspect technique du stockage. Cela correspond au modèle logique . Cette partie correspond à la modélisation des bases de données. De nombreux modèles existent. Le plus connu est Merise. Des outils permettent de concevoir les modèles plus facilement. Par exemple AMC*Designer. N. Zidane SUPMTI/ISI 2012-2013 Comment ça marche ? AEROPORT PAY_ID PAYS PAY_ID AER_ID AER_COD PAY_COD PAY_LIB Pour faciliter la maintenance et la consistance des données, on va stocker ces dernières de manière à éviter le maximum de redondances. N. Zidane SUPMTI/ISI 2012-2013 Comment ça marche ? Dans le schéma, la table AEROPORT ne contient pas les informations sur le pays. Elle ne contient qu’une référence sur la table PAYS qui contient les informations sur le pays. N. Zidane SUPMTI/ISI 2012-2013 Comment ça marche ? Pour manipuler la base de données, un langage déclaratif a été inventé (on précise ce qui est désiré sans précisé la manière à employer) , par opposition, aux langages classiques qui sont impératifs (on impose la méthode pour obtenir le résultat). On doit disposer d’un langage suffisamment riche pour permettre une programmation aisée, réduisant le nombre et la complexité des instructions de programmation. C ’est le langage SQL. N. Zidane SUPMTI/ISI 2012-2013 4. Bénéfices/Contraintes pour l’entreprise Gestion des données N. Zidane SUPMTI/ISI 2012-2013 Bénéfices/Contraintes pour l’entreprise Une base de données pertinente et très détaillée permet à l'entreprise de répondre plus rapidement aux attentes de ses clients existants ou potentiels. Maîtrise de la représentation de données complexes Permet de représenter des informations très diverses, très complexes, relevant de différents domaines (à l'intérieur de l'entreprise) et malgré tout interdépendantes. Maîtrise des accès personnalisés Permet de mettre à disposition des informations ciblées. N. Zidane SUPMTI/ISI 2012-2013 Maîtrise des traitements Dès lors que la masse d'information est riche, complexe, en constante évolution, accessible à de multiples intervenants; les traitements auxquels seront soumis ces informations auront tendance à être également riches et complexes. Alors que dans des contextes plus restreints, avec une moindre diversité de situations, les traitements seront souvent plus simples. Bénéfices/Contraintes pour l’entreprise N. Zidane SUPMTI/ISI 2012-2013 Nécessité d’avoir une personne compétente au sein de l’entreprise. Bénéfices/Contraintes pour l’entreprise N. Zidane SUPMTI/ISI 2012-2013 5. Impacts pour l’entreprise Gestion des données N. Zidane SUPMTI/ISI 2012-2013 Impacts pour l’entreprise Choisir un responsable qui devra : Mettre en place des conventions de nommage; Tenir à jour un référentiel des données; Être garant de la validité des sauvegardes; Être capable d'administrer la base de données; … N. Zidane SUPMTI/ISI 2012-2013 6. Quelles sont les questions à se poser ? Gestion des données N. Zidane SUPMTI/ISI 2012-2013 Quelles sont les questions à se poser ? Volume des données à gérer; Fréquence d'accès aux données, fréquence de consultation; Quelle interface de consultation ? Liens entre les différentes données à gérer; Quels sont les besoins en terme de reporting ? Les droits sur les données. N. Zidane SUPMTI/ISI 2012-2013 7. Écueils à éviter Gestion des données N. Zidane SUPMTI/ISI 2012-2013 N. Zidane Écueils à éviter Les utilisateurs ne doivent pas continuer à utiliser des fichiers décentralisés sur leur poste. Il faut changer les habitudes pour que le référentiel soit la seule source de données à jour; Ne pas négliger les procédures de sauvegarde; Ne pas négliger dans les coûts de mise en place des procédures de reprise des données existantes; Ne pas choisir un outil surdimensionné par rapport aux besoins. N. Zidane SUPMTI/ISI 2012-2013 Pause-réflexion sur cette 1ère partie Avez-vous des questions ? N. Zidane SUPMTI/ISI 2012-2013 Exploitation de données 1. Introduction: » Problématique- Le Système d’Information - La Suite Décisionnelle 2. L’Entrepôt de Données:» Extraction des données - Constitution de l’entrepôt - Modélisation 3. Les Bases Multidimensionnelles:» Analyse multidimensionnelle - OLAP - Data Marts 4. La Restitution des Informations:» Data Mining 5. La Gestion de Projet Data Warehouse 6. Les outils 7. Perspectives du Data Warehouse 8. Conclusion et Bibliographie Plan du module: N. Zidane SUPMTI/ISI 2012-2013 1. Introduction Exploitation de données N. Zidane SUPMTI/ISI 2012-2013 Objectif » Améliorer les performances décisionnelles de l'entreprise Comment ? » en répondant aux demandes d’analyse des décideurs Exemple » clientèle : Qui sont mes clients ? Pourquoi sont-ils mes clients ? Comment les conserver ou les faire revenir ? Ces clients sont-ils intéressants pour moi ? » marketing, actions commerciales : Où placer ce produit dans les rayons ? Comment cibler plus précisément le mailing concernant ce produit ? » ... Introduction - Problématique N. Zidane SUPMTI/ISI 2012-2013 Introduction - Problématique Une grande masse de données : » Distribuée » Hétérogène » Très Détaillée A traiter : » Synthétiser / Résumer » Visualiser » Analyser Pour une utilisation par : » des experts et des analystes d'un métier » NON informaticiens » NON statisticiens N. Zidane SUPMTI/ISI 2012-2013 Introduction – Le système d’information Moyen d’atteindre ces objectifs : Le Data Warehouse, un système d’information dédié aux applications décisionnelles En Aval des bases de production (ie bases opérationnelles) En Amont des prises de décision » basé sur des indicateurs (Key Business Indicators (KBI)) N. Zidane SUPMTI/ISI 2012-2013 Introduction – La Suite Décisionnelle N. Zidane SUPMTI/ISI 2012-2013 Introduction – Utilisation Mailing » amélioration du taux de réponse Banque, Assurance » déterminer les profils client Risque d'un Prêt, Prime plus précise Commerce » ciblage de clientèle » déterminer les promotions » aménagement des rayons (2 produits en corrélation) N. Zidane SUPMTI/ISI 2012-2013 Logistique » adéquation demande / production Santé » épidémiologie (VIH, Amiante, ...) Econométrie » prédiction de trafic autoroutier Ressources Humaines » adéquation activité / personnel Introduction – Utilisation N. Zidane SUPMTI/ISI 2012-2013 Déclinaisons métiers du Décisionnel SPM (Strategic Performance Management) » Déterminer et contrôler les indicateurs clé de la performance de uploads/Management/ dwh-introduction-et-generalites.pdf

  • 18
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Apv 23, 2021
  • Catégorie Management
  • Langue French
  • Taille du fichier 3.1460MB