Big data analytics sqoop cdh 4 7

Big Data Analytics Workshop Apache Sqoop ERP-BI DS I- Objectifs Ce workshop permet d ? exploiter les di ?érents outils de Big data Hive MySQL Sqoop HDFS Avro pour importer les données d ? une base de données relationnelle MySQL et d ? un ?chier log vers HDFS avec CDH Cloudera Distribution Including Apache Hadoop et les manipuler sous HIVE II- Introduction La ?gure ci-dessous décrit l ? extraction et le chargement des données dans HDFS Les données structurées sont importées depuis les sources transactionnelles et certaines tables dimensions peuvent être récupérées depuis le datawarehouse existant Les données non structurées sont aussi importées dans leur état brut Dans ce qui suit on va se focaliser sur l ? importation des données à partir de la base de données relationnelle MySQL vers HDFS et manipulation des données dans HIVE Esprit - CBig Data Analytics ERP-BI DS III- Contexte des scénarios Dans les scénarios de ce workshop on se focalise sur les données relatives à l ? entreprise DataCo Le schéma relationnel de la base de données correspondante est présenté à travers la ?gure ci-dessous Pour analyser ces données nous avons besoin de les migrer dans le système Hadoop Distributed File System HDFS Pour cette raison nous avons besoin de trouver un outil qui permet de transférer facilement des données structurées à partir d'un SGBDR à HDFS tout en préservant leur structure Cela nous permet d'interroger les données sur HDFS sans a ?ecter les données du SGBDR Cet outil est Apache Sqoop qui fait partie du CDH Il permet de charger automatiquement nos données relationnelles de MySQL en HDFS tout en préservant la structure Les données sur HDFS peuvent être stockées sous une forme binaire ou une forme textuelle nous visons exploiter le type de ?chier Avro qui représente un format de ?chier optimisé dans Hadoop Esprit - CBig Data Analytics ERP-BI DS IV- Installation MySQL pour CDH Pour pouvoir importer les données on commence par installer MySQL dans Cloudera Pour ce faire on doit exécuter les instructions suivantes sudo sed -i s mirrorlist https mirrorlist http etc yum repos d epel repo sudo yum install mysql-server sudo service mysqld start Une fois le service mysql démarré on se connecte à mysql et on importe la base de données à mysql -u root -p mysql create database retaildb mysql use retaildb mysql source retaildb sql mysql show tables partir du ?chier retaildb sql V- Scénario Importation de la base de données retaildb de MYSQL dans HIVE sans métadonnées Dans ce scénario on se propose d ? importer la totalité des la base de données retaildb dans HIVE Il faut suivre les étapes suivantes On crée la base de données hretaildb hive create database hretaildb Véri ?cation de la création du dossier correspondant sous HDFS hretaildb db Hadoop fs -ls user hive warehouse Pour importer la base de données retail db on exécute le script suivant dans un nouveau terminal sqoop import-all-tables --connect jdbc mysql localhost retail db -- username root --warehouse- dir

Documents similaires
Grindelire cp activites de lecture pack n02 pdf telecharger lire 0 0
Texte expose ExposéJe vais vous parlez du poème Les roses de Saadi ? écrit par Marceline Desbordes-Valmore Il est paru en dans le recueil Poésies Inédites Marcelines Desbordes-Valmore est née le à juin dans le Nord de la France A ans elle part vivre en Gu 0 0
Activite d x27 evaluation 2 0 0
La vie des élèves au lycée Création Graphique et Impression : Groupe Renard - 1 0 0
Arthur 1 LA VOCATION DE L ? ARBRE D ? OR est de partager ses admirations avec les lecteurs son admiration pour les grands textes nourrissants du passé et celle aussi pour l ? ?uvre de contemporains majeurs qui seront probablement davantage appréciés demai 0 0
Yacoubou benjamin lth2 pasteur baparape issiaka yacoubou mathias lth2 0 0
C12semaphoresb 1 pdf Contrôle de concurrence par sémaphores NFP Cours CRappel du concept de sémaphore Dé ?nition Dijkstra- Un sémaphore S est un objet partagé constitué de - un entier E initialisé à une valeur ? - une ?le d ? attente F des processus bloqu 0 0
Cheminement DEC-BAC en Génie aérospatial avec Polytechnique Montréal aussi disp 0 0
Synthese romantisme Le Romant me S ?rances et exaltation de l'? me solitaire Synthèse Le Romantisme français Les générations romantiques Le romantisme trouve son origine dans les bouleversements de la sensibilité au XVIIIe siècle Parallèlement au courant 0 0
Td1 corrige 20 Algorithmique ?? Travaux Dirigés Master ??Technologie et Handicap ? Intensifs Corrigé Exercice ?? A ?ectations Considérons les algorithmes ci-dessous a Quel sera le contenu des variables a b et éventuellement c après leur exécution b Dans c 0 0
  • 30
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise
Partager