Tdbd part1 1 Traitement distribué pour les Big Data Master Ingénierie des Systèmes d'Information M Jean-Marie PREIRA jmpreira gmail com Juin CSOMMAIRE I Introduction à l'informatique parallèle II Big Data et analyse de données III Le paradigme MapReduce I
Traitement distribué pour les Big Data Master Ingénierie des Systèmes d'Information M Jean-Marie PREIRA jmpreira gmail com Juin CSOMMAIRE I Introduction à l'informatique parallèle II Big Data et analyse de données III Le paradigme MapReduce IV L'écosystème Hadoop V Apache Hive VI Apache Spark CTraitement distribué pour les Big Data I Introduction à l'informatique parallèle CIntroduction à l'informatique parallèle Technologie des architectures distribuées ?? Le processeur multi-coeur ?? Le n ?ud de calcul ?? Le cluster de calcul ?? Les processeurs graphiques ?? Le multithreading ?? Outils de parallèlisation Problématique du déploiement ?? Performance ?? Tolérance aux pannes ?? Passage à l'échelle Apache ZooKeeper ?? Origines ?? Objectifs CTechnologie des architectures distribuées Le processeur multi-coeur ?? Loi de Moore Le nombre de transistors sur une puce doublerait tous les ans ? ?? Conséquence problème de surchau ?e CTechnologie des architectures distribuées Le processeur multi-coeur ?? Solution Implémenter plusieurs processeurs c ?urs sur un même circuit intégré On parle de processeur muli-c ?urs ?? Un coeur est un petit processeur autonome qui peut exécuter un code di ?érent de ceux des autres coeurs à une fréquence d ? horloge éventuellement di ?érente CTechnologie des architectures distribuées Le processeur multi-coeur ?? Exemples Intel Xeon Westmere-Ex c ?urs processeur Sun Sparc T c ?urs processeur Intel Core i c ?urs processeur IBM Power c ?urs processeur CTechnologie des architectures distribuées Le n ?ud de calcul Un noeud de calcul est un ordinateur avec ?? son ses processeurs sa mémoire RAM ?? son ses accès réseau un des disques locaux CTechnologie des architectures distribuées Le n ?ud de calcul CTechnologie des architectures distribuées Le cluster de calcul ?? Conceptuellement un cluster de calcul n ? est qu ? un ensemble de noeuds de calculs installés dans des baies et reliés par un réseau local d ? interconnexion performant haut débit de type In ?niband avec des débits allant de à Gbits s CTechnologie des architectures distribuées Les processeurs graphiques ?? Les GPU Graphics Processing Units sont très utilisés pour paralléliser des calculs de Machine Learning ou de Deep Learning VS CTechnologie des architectures distribuées Le multithreading ?? Du point de vue processus la programmation parallèle peut se faire de deux manières Par un ensemble de processus distincts Par un ensemble de threads à l'intérieur d'un même processus CTechnologie des architectures distribuées Le multithreading ?? Un processus peut créer plusieurs threads et par défaut tous les threads de ce processus partagent son espace mémoire et ses données CTechnologie des architectures distribuées Outils de parallèlisation ?? Le calcul parallèle ou High Performance Computing HPC se fait à l'aide de bibliothèques développées dans des langages compilés car plus rapides comme le Fortran le C ou le C ?? Les bibliothèques les plus standards sont OpenMP Open Multi-Processing pour le développement multithreads au sein de PC multi-coeurs MPI Message Passing Interface pour le calcul distribués sur PC multi-processeurs ou un cluster de PCs CUDA Compute Uni ?ed Device Architecture pour le calcul sur GPU CProblématique du déploiement A
Documents similaires
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/uFKyABtZDJu3I2jD51Rajw9vgLoehFyiISh7wt2snU8w6iXv1fLnSkHbkm4HVRrxKiApVWsDAidEs7mYOOEtRsjc.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/MXrmYMuGdjoV0vmsrQZvpjPBdJqIHOIk49lIKebFtTm4g8UDBxWJsLvsP1A6ZjDtlK3ospRDxdwnTXBrCBIJ1YRd.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/11705195942wszywcyovvrmnlovjnl3vvbgrsy8nbyzzibtfdepmfsonzow6yxfmpewkq1exyqxviknyo3dsdtljqep89tyw8vnbgbtbfns9trd.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/98XZEEhBfgY33LKwRuuDphqv39f6JhIqOKbDq3dBq0ykPUZtkTXZiBJJuIcGUHonRSwu5t3cfnaSlXwz87MtVFgb.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/Sw6iLgeJjnpYb7u6d5FLuVt9BQhlCY0gqGbLfSQfmJPqfYqgY4BaH6ui4UUqCEcNWTO2wLo54dYSM6mZWRr4sYKr.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/11705219633iam6rghuosnkame1whcxn8zcddw0xw5ebhrcjkfftlch9gkrwukdimkvcef5nl8ckdwnmo12wg75goperpwifzgc5fu8lzsqpgsr.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/mwbxIKNfrIPW3ETpJpuxd9hgjMjwIE317kVVnQFpCNMo30GonXoPwinnrHwTC4OmtZCiZfzNLaZY6kFkVRpDkIDu.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/11705223134tj62jhbflsdvaesebcgileutezvxpbyrupuk1cqsukyg69x4rrva0ynogwbynk4a5ptputx7djjjxasyq5vsc7pyh05tqtgdydum.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/bIcHtl69sGbGTkOiI6NndeKjXIeCQ7cvHKABZCvPXIRyCIX3cGLIYD1Wfn0t7MvxVofYmghTmqkVL5aOr30k9b41.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/11705306695kdozvrful4rohqrptydkikueqeaicswshdyhdvgnqkfb1lnszzidqlv2a4aunrfnjfktgat3yrwef91cv31cjuli5lrcdjeoe0kd.png)
-
25
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise- Détails
- Publié le Mai 28, 2021
- Catégorie Science & technolo...
- Langue French
- Taille du fichier 40.2kB