BEST Analyse de données pour Hadoop 2.X Hortonworks avec Pig, Hive et Spark For
BEST Analyse de données pour Hadoop 2.X Hortonworks avec Pig, Hive et Spark Formation Hadoop officielle Hortonworks "HDP Developer: Apache Pig and Hive" Stage pratique HADOOP HORTONWORKS Code : HWAPH Durée : 4 jours (28 heures) Certification : 280 € HT Exposés : 40% Cas pratiques : 50% Échanges d'expérience : 10% Sessions à venir : 11 - 14 sept. 2017 Paris / 2 550 € HT 27 - 30 nov. 2017 Paris / 2 550 € HT 12 - 15 déc. 2017 Genève / 3 000 CHF Tarif & dates intra : Sur demande DESCRIPTION Cette formation présente les grands outils de l’écosystème Hadoop en se focalisant plus spécifiquement sur Pig et Hive. Le principal objectif est le développement de compétences de data analyst orientées accès et traitement des données sans nécessairement avoir un fort background technique. OBJECTIFS PÉDAGOGIQUES Identifier et définir les différents composants de l’écosystème Hadoop Appréhender l’architecture de Hadoop 2.X Expérimenter les outils d’exploration et d’analyse avancée de données PUBLIC CIBLE Analyste Statisticien Développeur PRÉ-REQUIS • Connaissances de base en scripting (SQL, Python, R) ou en programmation. MÉTHODE PÉDAGOGIQUE Formation mêlant des apports théoriques à de nombreux travaux pratiques sous forme d’exercices d’application et d’analyse de uses cases métier complétés des retours d’expérience du formateur. PROFILS DES INTERVENANTS Toutes nos formations sont animées par des consultants-formateurs expérimentés et reconnus par leurs pairs. MODALITÉS D’ÉVALUATION L’évaluation des acquis se fait tout au long de la session au travers des ateliers et des mises en pratique. Une évaluation à chaud est réalisée systématiquement en fin de session. POUR ALLER PLUS LOIN : • Site internet Hortonworks • Livre blanc "Hadoop, feuille de route" • Toutes nos formations Hadoop • Formation officielle Hortonworks "Administrer la plateforme Hadoop 2.X Hortonworks 1" (HDP Operations: Hadoop Administration 1) (HWADM) • Formation officielle Hortonworks "Administrer la plateforme Hadoop 2.X Hortonworks : niveau avancé" (HDP Administrator: Hadoop Administration 2) (HWAD2) Programme formation Date d'impression : 28/07/2017 academy@octo.com - www.octo.academy - +33 (0)1 70 36 18 67 OCTO Academy est une marque d’OCTO Technology – N° DA 11 75 48 936 75 1 • Formation officielle Hortonworks "Administrer la plateforme Hadoop 2.X Hortonworks : sécurité" (HDP Operations: Security) (HWADS) • Formation officielle Hortonworks "Développer des applications pour Apache Spark avec Python ou Scala" (HDP Developer: Enterprise Spark 1) (HWSPK) • Toutes nos formations Data Science • Formation "Fondamentaux de la Data Science" (DSFDX) • Formation "Data Science : niveau avancé" (DSNVA) Programme formation "Analyse de données pour Hadoop 2.X Hortonworks avec Pig, Hive et Spark" Date d'impression : 28/07/2017 academy@octo.com - www.octo.academy - +33 (0)1 70 36 18 67 OCTO Academy est une marque d’OCTO Technology – N° DA 11 75 48 936 75 2 Programme pédagogique détaillé par journée Jour 1 COMPRENDRE HADOOP 2.X • L ’architecture de Hadoop 2.X • The Hortonworks Data Platform (HDP) LE SYSTÈME DE FICHIERS DISTRIBUÉ HDFS • Architecture fonctionnelle de HDFS - Exercice d’interaction en ligne de commande avec HDFS ALIMENTER HDFS EN DONNÉES • Prise en main de l’outil Flume • Prise en main de l’outil Sqoop - Application de ces deux outils d’import et d’export des données LE FRAMEWORK MAPREDUCE • Architecture et fonctionnement général de MapReduce - Exemples d’utilisation d’un job MapReduce • Présentation de Hadoop Streaming Jour 2 INTRODUCTION À PIG • Types et mots-clés dans Pig - Exploration de données avec Pig PROGRAMMATION PIG AVANCÉE • Mots-clés et fonctionnalités avancées dans Pig • Jointures dans Pig • Astuces d’optimisation de scripts Pig - Analyse de cas d’usages métier divers avec Pig Jour 3 PROGRAMMATION HIVE • Types et mots-clés dans Hive • Concept de table et base de données dans Hive • Présentation et explication des types de jointures - Démonstration de jointures - Analyse de cas d’usages métier UTILISER HCATALOG • Fonctionnement et utilisation de HCatalog - Démonstration du fonctionnement de HCatalog Programme formation "Analyse de données pour Hadoop 2.X Hortonworks avec Pig, Hive et Spark" Date d'impression : 28/07/2017 academy@octo.com - www.octo.academy - +33 (0)1 70 36 18 67 OCTO Academy est une marque d’OCTO Technology – N° DA 11 75 48 936 75 3 Jour 4 PROGRAMMATION HIVE AVANCÉE • Les vues dans Hive • Les différents formats de stockage des tables Hive • Optimisation de scripts Hive - Illustration des fonctions avancées HADOOP 2.X ET YARN • Architecture de YARN - Démonstration d’une application YARN APACHE SPARK • Introduction à Spark • Programmation Spark (RDD, programmation fonctionnelle) - Ecriture d’un job Spark en Python • Spark SQL et les DataFrames - Utilisation de Spark SQL et des DataFrames sur des tables Hive et des fichiers HDFS CRÉER ET UTILISER UN WORKFLOW OOZIE • Workflow et coordinateur Oozie • Actions possibles avec Oozie Programme formation "Analyse de données pour Hadoop 2.X Hortonworks avec Pig, Hive et Spark" Date d'impression : 28/07/2017 academy@octo.com - www.octo.academy - +33 (0)1 70 36 18 67 OCTO Academy est une marque d’OCTO Technology – N° DA 11 75 48 936 75 4 uploads/Management/ analyse-de-donnees-pour-hadoop-2-x-hortonworks-avec-pig-hive-et-spark.pdf
Documents similaires










-
27
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Apv 28, 2021
- Catégorie Management
- Langue French
- Taille du fichier 0.0870MB