Rapport data processing in distributed systems

Tanger Med Port Authority Traitement de données dans des systèmes distribués Rapport de stage de ?n d ? année Encadré par M EDDOUJAJI ELKHATTABI Kaoutar Ecole Nationale des Sciences Appliquées de Tanger CTable des matières I- Introduction Préambule Présentation de l ? entreprise II- Traitement de données dans les systèmes distribués Systèmes distribués Bases de données distribuées III-Benchmarking Apache Spark vs Hadoop Hadoop MapReduce HDFS YARN Spark Spark vs Hadoop Problème des petits ?chiers dans Hadoop Spark IV-Big Data et IoT IoT IoT et RoRo Navires Rouliers Hadoop et IoT V- Mise en place d ? un cluster multi-n ?uds de Hadoop VI- WordCount programme dans Hadoop VII-Conclusion VIII-Bibliographie CI- Introduction Dans le cadre de sa formation l ? Ecole Nationale des Sciences Appliquées de Tanger exige un stage de ?n d ? année à travers lequel les étudiants ingénieurs peuvent concrétiser leurs connaissances acquises durant l ? année et ainsi découvrir les di ?érents métiers et faire le pas dans le monde de l ? entreprise Le stage e ?ectué est un projet de recherche au sein de l ? autorité portuaire de Tanger Med qui concerne le traitement des Big Data dans des systèmes distribués Ce rapport décriera les di ?érentes phases du projet à savoir la recherche l ? installation et le test Cependant il couvrira les concepts abordés les di ?érents outils existants et en ?n les atouts du projet Préambule Le Big Data représente un ensemble de données volumineux qui ne peuvent pas être traités avec des outils de gestion de bases de données classiques Ceux sont des données qui ne peuvent pas être contenues par lignes et colonnes dans un ?chier Excel Elles ne peuvent pas être analysées avec des méthodes analytiques traditionnelles Le Big Data répond aux problématiques posées par l ? augmentation du volume d ? informations de ces dernières années ? Volume Quantité d ? informations à collecter et traiter ? Vélocité Supporter une grande fréquence de collecte d ? information ? Variété et la compatibilité avec plusieurs sources d ? informations structurées non structurées photos vidéos ? Le volume de données étant en constante évolution il nous faut stocker lire et traiter une large quantité de données en temps réel Nous avons donc besoin d'un moyen de paralléliser le traitement de ces données lecture écriture tout en garantissant sa disponibilité en cas de panne matérielle Le Framework Hadoop est un des outils Big Data Open Source qui permet de répondre à cette problématique Il permet en e ?et un traitement massif de données en parallèle en proposant un nouveau système de stockage distribué inspiré du système GFS de Google tout en garantissant la haute disponibilité des données Hadoop est utilisé par la plupart des grandes entreprises IT devant au quotidien traiter une large quantité d ? informations Yahoo Facebook Twitter Amazon Net ix ? CPrésentation de l ? entreprise TMSA L ? Agence Spéciale Tanger Méditerranée est chargée de l ? aménagement du développement et de la gestion du complexe

Documents similaires
Corrige dissert dm th sophocle marivaux anouilh koltes 0 0
Accueil securite 1 ACCUEIL HSE QHSE METABOIS FILIALE MULTIPRINT SERIGRAPHIE SA Février COBJECTIF DE LA FORMATION Se familiariser aux concepts HSE Hygiène Sécurité Environnement Etre capable d ? identi ?er des situations dangereuses dans nos fonctions et d 0 0
Cycle Ingénieur Filière Génie Industriel : Textile-Habillement Semestre Liste d 0 0
Tp e commerce TP E-commerce sur Odoo Créer une nouvelle base de donnée avec l ? application e commerce Saisir les informations lié à la société Installer module E-commerce Modi ?er le site web Ajouter du text Modi ?er un contenu existant Créer une page we 0 0
8/5/2020 Phosphogypse — Wikipédia https://fr.wikipedia.org/wiki/Phosphogypse 1/ 0 0
Le projet deroule 3ap n04 2008 2009 0 0
Reperes 28 2003 - Sommaire SP Page REPÈRES n L ? OBSERVATION RÉFLÉCHIE DE LA LANGUE ? À L ? ÉCOLE Sommaire Présentation L ? observation ré échie de la langue ? à l ? école Francis Grossmann université Grenoble III LIDILEM et Danièle Manesse université Par 0 0
Cours logistique 2 INTRODUCTION GÉNÉRALE À LA LOGISTIQUE La Logistique une fonction et une démarche essentielle à l ? entreprise CIntroduction générale à la logistique ? Le rôle et la place des ux dans l ? entreprise ? L ? importance des ux d ? informatio 0 0
Corpus paulinien Corpus johannique Généralités sur la littérature épistolaire Les ép? tres Di ?érents des Evangiles et des Actes - Moins long - Écrits de circonstances - Genre littéraire particulier - Apportent dans certains cas des réponses concrètes à d 0 0
Rapport bouchra PROJET INDUSTRIEL DE FIN D ? ETUDES Présenté Pour l ? obtention du titre Ingénieur d ? Etat Arts et Métiers Par Bouchra ABOU EL ANOUAR Titre Caractérisation Etude des défauts des ressorts à lames Jury M R KABIRI ? ? ? ? ? ? ? ? ? ? ? ? ? D 0 0
  • 49
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise
Partager