Formation Informatica PowerCenter Page 1 SUPPORT DE FORMATION INFORMATICA POWER
Formation Informatica PowerCenter Page 1 SUPPORT DE FORMATION INFORMATICA POWERCENTER Formation Informatica PowerCenter Page 2 Table des matières 1. Introduction: .................................................................................................................................. 4 2. Principes d'un système décisionnel et ETL: ....................................................................... 5 2.1. Principes d'un système décisionnel: ............................................................................................... 5 2.2. ETL: ................................................................................................................................................. 6 2.3. Métadonnées: ................................................................................................................................ 7 2.4. Workflow: ....................................................................................................................................... 7 3. Architecture Informatica PowerCenter et concepts : ..................................................... 8 4. Installation et paramétrage d'Informatica PowerCenter : ......................................... 10 4.1. Pré-requis: .................................................................................................................................... 10 4.2. Installation d'Informatica PowerCenter: ...................................................................................... 12 4.2.1. Création des schémas et des comptes : .................................................................................. 12 4.2.2. Installation du Serveur PowerCenter :..................................................................................... 13 4.3. Installation du package client: ...................................................................................................... 24 4.4. Installation de la documentation Informatica: ............................................................................. 29 4.5. Console d'administration:............................................................................................................. 32 4.5.1. Gestion des utilisateurs: ........................................................................................................... 34 4.5.2. Création d'un service "Repository service": ............................................................................. 38 4.5.3. Création d'un service "Integration service": ............................................................................. 41 4.6. Paramétrage des clients: .............................................................................................................. 43 4.6.1. La procédure de paramétrage d'un client : .............................................................................. 43 4.6.2. Définition d'un dossier de stockage "Folder" : ......................................................................... 47 5. Les fondamentaux du mappage de données: ................................................................. 49 5.1. Cas N°1 :Définitions des Sources et Cibles à partir de bases de données relationnelles:.......................................................................................................................................... 49 5.2. Cas N°2:Source Fichier Plat et Cible base de données relationnelle: ............... 57 6. Les fondamentaux du Workflow: ......................................................................................... 63 Formation Informatica PowerCenter Page 3 6.1. Cas N°1 :Définitions des Sources et Cibles à partir de bases de données relationnelles:.......................................................................................................................................... 63 6.1.1. Méthode d'utilisation de l'assistant: .......................................................................... 63 6.1.2. Méthode manuelle : ......................................................................................................... 71 6.1.3. Lancement du Workflow: ................................................................................................ 74 6.2. Cas N°2:Source Fichier Plat et Cible base de données relationnelle ................. 75 6.2.1. Création et paramétrage du Workflow: ..................................................................... 75 6.2.2. Lancement du Workflow: ................................................................................................ 78 7. Présentation des transformations: ...................................................................................... 79 8. Transformation Source Qualifier: ........................................................................................ 81 9. Transformation Filter: .............................................................................................................. 92 10. Transformation Aggretator: ................................................................................................... 97 11. Transformation Expression: ................................................................................................. 106 12. Transformation Router ........................................................................................................... 111 13. Transformation Sorter: .......................................................................................................... 119 14. Transformation Joiner: .......................................................................................................... 124 15. Transformation Rank: ............................................................................................................ 130 16. Transformation UpdateStrategy: ....................................................................................... 135 17. Transformation LookUp:........................................................................................................ 140 17.1. Transformation LookUp en mode connecté: .......................................................................... 140 17.2. Transformation LookUp en mode non connecté: .................................................................. 148 18. Débogage: .................................................................................................................................. 155 18.1. Débogage de mapping: ..................................................................................................... 155 18.2. Log de session: ..................................................................................................................... 161 19. Bonnes pratiques:.................................................................................................................... 162 Formation Informatica PowerCenter Page 4 1. Introduction: Une des plus grandes richesses d'une entreprise est son information. Mais l' information pertinente est souvent noyée dans une masse volumineuse de données éparses, déstructurées et hétérogènes L’informatique décisionnelle ou "Business Intelligence" permet de répondre à cette problématique. Elle met à disposition un ensemble de technologies informatiques (ou systèmes d’intégration de données) permettant l’analyse des données de l’entreprise, afin d’en dégager des informations qualitatives nouvelles, qui seront la base d'aide aux décisions tactiques ou stratégiques. Les données sont collectées, consolidées, modélisées et restituées sous la forme la plus adaptée à la prise de décision. Ces technologies sont désignées par le terme ETL ( qui signifie Extract , Transform and Load )ou datapumping. Les outils ETL les plus connus sont : Informatica - Power Center IBM - Websphere DataStage (Anciennement connu sous le nom d' Ascential DataStage) SAP - BusinessObjects Data Integrator IBM - Cognos Data Manager (Anciennement connu sous le nom de Cognos DecisionStream) Microsoft - SQL Server Integration Services Oracle - Data Integrator (Anciennement connu sous le nom de Sunopsis Data Conductor) SAS - Data Integration Studio Oracle - Warehouse Builder AB Initio Information Builders - Data Migrator Pentaho - Pentaho Data Integration Embarcadero Technologies - DT/Studio IKAN - ETL4ALL IBM - DB2 Warehouse Edition Pervasive - Data Integrator ETL Solutions Ltd. - Transformation Manager Group 1 Software (Sagent) - DataFlow Sybase - Data Integrated Suite ETL Talend - Talend Open Studio Expressor Software - Expressor Semantic Data Integration System Elixir - Elixir Repertoire OpenSys - CloverETL Ils sont catégorisés en ETL payants comme Informatica PowerCenter ou ETL OpenSource comme SpagoBI ,Pentaho , JasperSoft BI , Jedox , Talend ou BIRT . La solution Informatica PowerCenter est reconnue comme la solution "Leader" dans le rapport " The Forrester Wave™: EnterpriseETL, Q1 2012" Formation Informatica PowerCenter Page 5 2. Principes d'un système décisionnel et ETL: 2.1. Principes d'un système décisionnel: Un système d'information décisionnel ( SID ) est basé sur un entrepôt de données ( "Datawarehouse") . Le "Datawarehouse" (entrepôt de données) est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le support d ’un processus d ’aide à la décision" (W.B.Inmon) Le "Datawarehouse" qui est une base de données de consolidation , peut être une base de données open source ( MySQL; PostgesSql...etc.) ou une base de données propriétaire (Oracle , SQL Serveur,...etc.) . La structure d'un "datawarehouse " est la suivante : Les données agrégées Les méta- données Les données détaillées Les données historisées Formation Informatica PowerCenter Page 6 2.2. ETL: ETL est une abréviation de trois mots Extract, Transform and Load . Il s'agit d'un processus pour extraire des données , à partir de différents types de systèmes , les transformer en une structure qui est plus appropriée pour le reporting et l'analyse , et enfin les charger dans des base de données L'ETL est basée sur une technologie informatique "intergicielle" (middleware) Elle repose sur des connecteurs servant à exporter ou importer les données dans les applications, des transformateurs qui manipulent les données(agrégations, filtres, conversions…), et des mises en correspondance (mappages). Mais , aujourd'hui , l'ETL est beaucoup plus que cela. Il couvre également le profilage des données, le contrôle de la qualité des données , la surveillance et le nettoyage , l'intégration des données en temps réel et à la demande dans une architecture orientée services (SOA), et la gestion des métadonnées . Les outils d'ETL (Extract , Transform and Load) ont en charge de collecter et de préparer des données. Extract (Extraire) : Accéder à la majorité des systèmes de stockage de données (SGBD, ERP, fichiers à plat...) afin de récupérer les données identifiées et sélectionnées. Prendre en compte les questions de synchronisation et de périodicité des rafraîchissements. Les données proviennent de différentes sources internes et externes, structurées et / ou non structurées. Les données provenant de différents systèmes sources sont converties en un format d'entrepôt de données consolidée qui est prêt pour le traitement de transformation Transform (Transformer) : Toutes les données ne sont pas utilisables telles qu'elles. Elle méritent d'être vérifiées, reformatées, nettoyées afin d'éliminer les valeurs aberrantes et les doublons, et consolidées... Load (Charger) :Le chargement des données dans un référentiel d'autres applications de reporting de données ou de data warehouse Formation Informatica PowerCenter Page 7 2.3. Métadonnées: Les métadonnées sont des données à propos de d'autres données. Ce sont des informations structurées qui servent à : Décrire Expliquer Rechercher et localiser Identifier des ressources Dans un système d'information décisionnel ,toutes les informations sur les données sont contenues dans un référentiel global : le référentiel de métadonnées (Meta Data ).Les métadonnées fournissent des indications sur la définition des données (sémantique), leurs sources (date, origine), la façon dont elles ont été calculées, agrégées (règles de calcul), les règles métier qui s'y rapportent, les processus d'extraction, de transformation et de chargement qui ont été mis en œuvre pour les mettre à disposition.. 2.4. Workflow: Un "workflow" est la modélisation et la gestion informatique de l'ensemble des tâches à accomplir et des différents acteurs impliqués dans la réalisation d'un processus métier C'est une représentation sous forme de flux des opérations à réaliser pour accomplir l'ensemble des tâches ou des activités regroupées en un seul processus métier dans un format interprétable par la machine. Il décrit: Le circuit de validation des flux, Les tâches à accomplir entre les différents acteurs d'un processus, Les délais à respecter, Les modes de validation Il permet ainsi d'automatiser les flux d'informations entre différents processus au sein de l'entreprise. Le workflow est composé d'activités, correspondant à des tâches ou fonctions à réaliser pour compléter une étape du processus BPMN (Business Process Modeling Notation) est en train de s'imposer comme la référence pour la modélisation des procédures métiers.( http://www.bpmn.org) Formation Informatica PowerCenter Page 8 3. Architecture Informatica PowerCenter et concepts : Informatica PowerCenter utilise une architecture client-serveur contenant plusieurs composants comme illustré sur la figure suivante Formation Informatica PowerCenter Page 9 Les composants d'Informatica PowerCenter sont: Domaine Informatica : unité principale de gestion et d'administration des services dans PowerCenter Nœud: représentation logique d'une machine dans un domaine. Le nœud qui héberge le domaine est la principale passerelle du domaine. Services Informatica : service qui lance le gestionnaire de services sur un nœud. Gestionnaire de services : démarre et exécute les services de l'application sur un ordinateur dans un domaine. Service d'intégration (Integration service): lit les informations du flux d'activités à partir du répertoire PowerCenter, et exécute des sessions et des flux d'activités qui extraient, transforment et chargent des données. Service uploads/s3/ formation-informatica-powercenter.pdf
Documents similaires










-
29
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Sep 19, 2021
- Catégorie Creative Arts / Ar...
- Langue French
- Taille du fichier 13.7133MB