Fiche de TD corrigé d’ingénierie de donnée I. BASE DE DONNEE NoSQL 1- Le NoSQL

Fiche de TD corrigé d’ingénierie de donnée I. BASE DE DONNEE NoSQL 1- Le NoSQL c'est une base de données qui : Attention, plusieurs réponses sont possibles. a) Permet la tolérance aux pannes b) la gestion des transactions concurrentielles c) Permet la distribution des données et des requêtes d) Permet de distribuer des calculs lourds 2- Lequel de ces couples est faux : a) MongoDB - orienté document b) Neo4j - orienté graphe c) Redis - orienté clé/valeur d) Cassandra - orienté graphe 3- Laquelle de ces propriétés ne fait pas partie du théorème de CAP : a) Partition Tolerance b) Consistency c) Atomicity d) Availability 4- MongoDB est un SGBDNR orienté : a) Graphe b) Document c) Clé valeur d) Colonne 5- Lequel des éléments suivants est un type de base de données nosql? a) SQL b) JSON c) Bases de données de documents d) Aucune de ces réponses 6- Lesquelles des bases de données NoSQL suivantes sont les plus simples? a) Clé-Valeur b) Document c) Colonne large d) Tout ce qui précède 7- MongoDB est système de gestion de bases de données a - SQL b - Les deux réponses sont correctes c - NoSQL d- Les deux réponses sont incorrectes EXERCICES RESOLUS SUR DES QCM SUR MAPREDUCE GROUPE 2: 1) Choisissez la bonne réponse: a) MapReduce essaie de placer les données et le calcul le plus proche dans le temps b) La tâche Map du MapReduce est exécutée à l'aide de la fonction Mapper () c) Réduire la tâche dans MapReduce est effectuée en utilisant la fonction Map() d) Toutes les réponses précédentes 2) _________est responsable de la consolidation des résultats produits par chacune des fonctions / tâches Map (). a) Reduce b) Map c) Reducer d) Toutes les réponses précédentes 3) Le nombre de Maps est généralement déterminé par la taille totale des: a) Entrées b) Sorties c) Tâches d) Aucune des réponses précédentes 4) L’entrée du _______ est la sortie triée des Mappers. a) Reducer b) Mapper c) Shuffle d) Toutes les réponses précédentes 5) Lesquelles des phases suivantes se produisent simultanément ? a) Shuffle & Sort b) Reduce & Sort c) Shuffle & Map d) Toutes les réponses précédentes 6) L'interface _________ réduit un ensemble de valeurs intermédiaires qui partagent une clé avec un ensemble plus petit de valeurs. a) Mapper b) Reducer c) Writable d) Readable 7) YARN signifie : a) Yahoo’s another resource name b) Yet another resource negotiator c) Yahoo’s archived Resource names d) Yet another resource need. 8) Elasticsearch est … a) un serveur de bases de données b) un outil de traitement de données c) un outil de visualisation de données d) un serveur de pages Web 9) __________ peut-être décrit comme un modèle de programmation utilisé pour développer des applications basées sur Hadoop qui peuvent traiter des quantités massives de données. a) MapReduce b) Mahout c) Oozie d) Toutes les réponses précédentes 10) Un nœud ________ sert d'esclave et est responsable de l'exécution d'une tâche qui lui est assignée par le JobTracker. a) MapReduce b) Mapper c) TaskTracker d) JobTracker II. HADOOP 1- Apache Hadoop atteint la fiabilité en répliquant les données sur plusieurs hôtes et ne nécessite donc pas de stockage sur les hôtes. a. Système de fichiers b. RAID (Redundant Arry of Independent Disks) en français regroupement redondant des disques indépendants c. FS local d. Système opérateur 2- Devrions-nous utiliser RAID avec le cluster Hadoop en production? a. Oui b. Non c. Oui sur NameNode, Non sur DataNode d. Oui sur DataNode, Non sur NameNode 3- Laquelle des commandes suivantes sont utilisée pour entrer en mode de sécurité? a. hadoop dfsadmin –safemode get b. bin dfsadmin –safemode get c. hadoop dfsadmin –safemode enter d. Aucune de ces réponses 4- HDFS permet à un client de lire un fichier qui est déjà ouvert pour l'écriture? a. Faux b. Vrai 5- Laquelle des affirmations suivantes est vraie à propos de Hadoop? a. Un petit fichier occupe un bloc complet (128 Mo) en HDFS b. Master divise le fichier en petits morceaux, c'est-à-dire des blocs c. HDFS Master (NameNode) est le point de défaillance unique d. Nous ne pouvons pas éditer un fichier une fois écrit en HDFS 6- Laquelle des affirmations suivantes est vraie à propos de Hadoop? a. Un petit fichier occupe un bloc complet (128 Mo) en HDFS b. Master divise le fichier en petits morceaux, c'est-à-dire des blocs c. HDFS Master (NameNode) est le point de défaillance unique d. Nous ne pouvons pas éditer un fichier une fois écrit en HDFS 7- Lequel des énoncés ci-dessous est vrai à propos du DataNode? a. DataNode stocke les données réelles b. DataNode peut être déployé sur du matériel de base en production c. DataNode répond aux demandes de lecture et d'écriture d. Tout ce qui précède 8- Pendant Safemode, le cluster Hadoop est dans: a. Lecture seulement b. Écriture seule c. Lire écrire d. Aucune de ces réponses 9- Pendant Safemode, le cluster Hadoop est dans: a. Lecture seulement b. Écriture seule c. Lire écrire d. Aucune de ces réponses 10- fichiers HDFS dans Hadoop fait laquelle des actions suivantes? a. Obtient uniquement les emplacements de bloc du NameNode b. Obtient les données du NameNode c. Obtient à la fois les données et l'emplacement du bloc à partir du NameNode d. Obtient l'emplacement du bloc à partir du DataNode 11- Laquelle des propositions suivantes convertissent les requêtes SQL en tâches MapReduce? a. Ruche b. Percer c. Oozie d. Buse 12- Hadoop peut être déployé sur des serveurs de base, ce qui permet un traitement à faible coût ainsi que le stockage d'énormes volumes de données non structurés. a. Vrai b. Faux 13- Lequel des éléments suivant sont utilisé pour ingérer des données en streaming dans des clusters Hadoop? a. Buse b. Sqoop c. Les deux ci-dessus d. Aucune de ces réponses 14- Zookeeper est a. Moteur de synchronisation et de coordination b. Base de données No SQL c. Système de collecte et d'agrégation de données d. Moteur de traitement des données 15- Dans quelles langues pouvez-vous coder dans Hadoop? a. Java b. Python c. C ++ d. Tout ce qui précède 16- Commande Hadoop pour lister tous les blocs correspondant à chaque fichier dans le hdfs? a. hadoop fsck / -files -blocks b. hadoop fsck / -blocks -fichiers c. hadoop ls / -blocks -fichiers d. hadoop fchk / -files –blocks 17- Par rapport au SGBDR, Apache Hadoop a. A une meilleure intégrité des données b. Est-ce que les transactions ACID c. Convient à la lecture et à l'écriture plusieurs fois d. Fonctionne mieux sur les données non structurées et semi-structurées 18- Tous les fichiers d'un répertoire dans HDFS peuvent être fusionnés en utilisant lequel des éléments suivants? a. mettre fusionner b. obtenir la fusion c. remerge d. fusionner tout 19- HDFS permet à un client de lire un fichier qui est déjà ouvert pour l'écriture? a. Faux b. Vrai 20- Les fichiers HDFS dans Hadoop fait laquelle des actions suivantes? a. Obtient uniquement les emplacements de bloc du NameNode b. Obtient les données du NameNode c. Obtient à la fois les données et l'emplacement du bloc à partir du NameNode d. Obtient l'emplacement du bloc à partir du DataNode III. CASSANDRA 1. Cassandra est un projet lancé par quelle entreprise ? a. Google b. Yahoo c. Apache d. Facebook 2. Relevez la fausse assertion a. Cassandra est une base de données SQL b. Cassandra est présentement un projet open source c. Cassandra est une base de données distribuées. d. Cassandra est utilisée par Twitter 3. Lequel des éléments suivants est la commande pour exécuter les requêtes dans CQLSH. a. Execute() b. Run() c. Execute query() d. Run query() 4. Quelle base de donnes convient le mieux pour gérer les données en petits volumes a. Base de données relationnelle b. Base de données NoSQL c. Les deux, a et b d. Aucun d’eux 5. Lequel des éléments suivants ne fait pas partie de l’architecture Cassandra a. Colonne b. Journal c. MemTable d. Filtre Bloom 6. Quel est le principal prérequis pour l’installation de Cassandra dans un environnement Windows ? a. CQLSH b. Mémoire c. Java d. Windows script host 7. Lequel des éléments suivants n’est pas une propriété de Cassandra ? a. Operations ACID b. Déploiements décentralisés c. Transactions simples d. Prend en charge tous les types de données 8. La distribution des données dans les nœuds des clusters est effectuée suivant un protocole appelé______ ? a. Quick spread b. Gossip c. Map Reduce d. Hach 9. Identifiez la séquence d’écriture des données dans le système Cassandra a. Mem-table, Sstable, Commitlog b. Commitlog, Sstable, Mem-table c. Sstable, Mem-table, Commitlog, d. Commitlog, Mem-able, Sstable 10. Que signifie l’acronyme Sstable ? a. Sorted String Table b. Structured String Table c. Structured Sampled data d. Sample Structured Table 11. Laquelle de ces structures de données réside en mémoire ? a. Sstable b. Commitlog c. Mem-table d. Aucune bonne réponse 12. Lesquelles de ces structures de données résident sur le disque ? uploads/Litterature/ fiche-de-td-inf-356.pdf

  • 32
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager