Big data analytics sqoop cdh 4 7

Big Data Analytics Workshop Apache Sqoop ERP-BI DS I- Objectifs Ce workshop permet d ? exploiter les di ?érents outils de Big data Hive MySQL Sqoop HDFS Avro pour importer les données d ? une base de données relationnelle MySQL et d ? un ?chier log vers HDFS avec CDH Cloudera Distribution Including Apache Hadoop et les manipuler sous HIVE II- Introduction La ?gure ci-dessous décrit l ? extraction et le chargement des données dans HDFS Les données structurées sont importées depuis les sources transactionnelles et certaines tables dimensions peuvent être récupérées depuis le datawarehouse existant Les données non structurées sont aussi importées dans leur état brut Dans ce qui suit on va se focaliser sur l ? importation des données à partir de la base de données relationnelle MySQL vers HDFS et manipulation des données dans HIVE Esprit - CBig Data Analytics ERP-BI DS III- Contexte des scénarios Dans les scénarios de ce workshop on se focalise sur les données relatives à l ? entreprise DataCo Le schéma relationnel de la base de données correspondante est présenté à travers la ?gure ci-dessous Pour analyser ces données nous avons besoin de les migrer dans le système Hadoop Distributed File System HDFS Pour cette raison nous avons besoin de trouver un outil qui permet de transférer facilement des données structurées à partir d'un SGBDR à HDFS tout en préservant leur structure Cela nous permet d'interroger les données sur HDFS sans a ?ecter les données du SGBDR Cet outil est Apache Sqoop qui fait partie du CDH Il permet de charger automatiquement nos données relationnelles de MySQL en HDFS tout en préservant la structure Les données sur HDFS peuvent être stockées sous une forme binaire ou une forme textuelle nous visons exploiter le type de ?chier Avro qui représente un format de ?chier optimisé dans Hadoop Esprit - CBig Data Analytics ERP-BI DS IV- Installation MySQL pour CDH Pour pouvoir importer les données on commence par installer MySQL dans Cloudera Pour ce faire on doit exécuter les instructions suivantes sudo sed -i s mirrorlist https mirrorlist http etc yum repos d epel repo sudo yum install mysql-server sudo service mysqld start Une fois le service mysql démarré on se connecte à mysql et on importe la base de données à mysql -u root -p mysql create database retaildb mysql use retaildb mysql source retaildb sql mysql show tables partir du ?chier retaildb sql V- Scénario Importation de la base de données retaildb de MYSQL dans HIVE sans métadonnées Dans ce scénario on se propose d ? importer la totalité des la base de données retaildb dans HIVE Il faut suivre les étapes suivantes On crée la base de données hretaildb hive create database hretaildb Véri ?cation de la création du dossier correspondant sous HDFS hretaildb db Hadoop fs -ls user hive warehouse Pour importer la base de données retail db on exécute le script suivant dans un nouveau terminal sqoop import-all-tables --connect jdbc mysql localhost retail db -- username root --warehouse- dir

Documents similaires
Fiche de progression 3e 2019 2020 0 0
Bellec dominique 3 Apprentissages par enseignement à partir d ? environnements complexes e ?ets de l ? isolement des éléments en interaction et du séquencement de la présentation Dominique Bellec To cite this version Dominique Bellec Apprentissages par en 0 0
Les adjectifs La description adjectivale d ? Emma Bovary dans le roman Madame Bovary Mémoire de licence Marianne Puustinen Université de Jyv? skyl? Institut des langues modernes et classiques Philologie romane CTable des matières Introduction Cadre du tra 0 0
Une fois la pâte pétrie elle va être divisée et les pâtons seront mis en forme, 0 0
4028 57 georges didi huberman quand les images prennent position l oeil de l histoire 1 0 0
Sakhi Séquence Activité Objets des apprentissages Volume horaire En présentiel En autonomie En En présentiel Au t Mise en Présentation de Consignes de recherche contexte de la nouvelle à aborder l ? époque et du courant littéraire cadres de Aux Champs per 0 0
1 Lutte antimicrobienne Lutte antimicrobienne La lutte antimicrobienne est indi 0 0
Voltaire lecteur du cantique des cantiqu pdf 0 0
Loi binomiale 1 Probabilités Loi Binomiale Productique des alliages moulés Une machine fabrique en série des pièces métalliques de forme cylindrique On admet que la machine fabrique pièces par heure et on suppose que la probabilité qu'une pièce prélevée a 0 0
G I Université Sidi Mohammed Ben Abdellah Faculté des Sciences et Techniques ww 0 0
  • 24
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise
Partager