Lecture 3 1 fr Nom et Prénom EL AMINE MEHDI Apache Hadoop est un framework open source évolutif et tolérant aux pannes écrit en Java Il traite e ?cacement de grands volumes de données sur un cluster de hardware Hadoop n'est pas seulement un système de sto
Nom et Prénom EL AMINE MEHDI Apache Hadoop est un framework open source évolutif et tolérant aux pannes écrit en Java Il traite e ?cacement de grands volumes de données sur un cluster de hardware Hadoop n'est pas seulement un système de stockage mais aussi une plateforme pour le stockage et le traitement de grandes quantités de données Dans cette lecture nous allons voir comment Apache Hadoop fonctionne Under The Hood Ainsi lorsque Apache Hadoop reçoit un énorme ?chier le framework divise ce gros morceau de données en plus petits morceaux et les stocke sur plusieurs machines pour être traités en parallèle c'est pourquoi Hadoop relie une armée de machines largement disponibles et relativement peu coûteuses qui forment un Hadoop cluster Et une chose importante quelle que soit la taille du ?chier que l'utilisateur transmet à Hadoop chacun de ses clusters accueille trois couches fonctionnelles Hadoop distributed ?le systems pour le stockage des données Hadoop MapReduce pour le traitement et Hadoop Yarn pour la gestion des ressources Ensuite nous avons une brève introduction à HDFS un système de ?chiers distribué qui suit une architecture master slave Il se compose d'un seul NameNode et de nombreux DataNode Dans l'architecture HDFS un ?chier est divisé en un ou plusieurs blocs de Mo la taille peut être modi ?ée ultérieurement dans les con ?gurations et stocké dans des DataNode séparés Les DataNodes sont responsables des opérations telles que la création la suppression et la réplication des blocs selon les instructions du NameNode En plus de cela ils sont chargés d'e ?ectuer des opérations de read-write sur les systèmes de ?chiers NameNode joue le rôle de serveur master et de contrôleur central pour HDFS Il contient les métadonnées et maintient le namespace du système de ?chiers il aussi supervise l'état du DataNode et coordonne l'accès aux données C
Documents similaires










-
31
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Jul 04, 2022
- Catégorie Creative Arts / Ar...
- Langue French
- Taille du fichier 22.3kB