Sujet TPE Ingénierie des données Problème : Un moteur de recherche souhaite ind

Sujet TPE Ingénierie des données Problème : Un moteur de recherche souhaite indexer des millions de pages Web contenues dans des bases de données distribuées. L’indexation permettra de représenter pour chaque, les concepts importants décrits dans celle-ci. A l’issue de l’opération, les pages seront regroupés en fonction du concept le plus important traiter dans chaque page. Le concept le plus important dans une page sera considéré comme le concept ayant le plus grand nombre d’occurrence dans la page. En utilisant un algorithme MapReduce, definir le mode opératoire en précisant ce que fait chaque fonction (Split, Map, shuffle, Reduce). Date limite pour remettre le devoir : Samedi 23 Avril 2022 avant minuit uploads/Philosophie/ devoir-tpe-inf-356-et-ige-356.pdf

  • 28
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager