Bigdata technologies avancees

Big Data et ses technologies DSI ISET NABEUL ?? Ines Ghorbel CPlan Introduction Big Data Une dé ?nition Pourquoi Applications Outils et technologies Systèmes de ?chiers distribués Algorithmes distribués Systèmes de base de données distribués Systèmes d ? orchestration Conclusion CIntroduction Ingénieur informatique - Université de Sherbrooke Plus de ans d ? expérience architecture logiciel réseaux systèmes distribués traitement automatique du langage naturel génomique bioinformatique consultation ??big data ? Ingénieur senior chez Hopper Utilisons les données pour aider nos utilisateurs à prendre des décisions éclairées en matière de voyage CBig Data - Une dé ?nition CBig Data Dé ?nition ??Le Big Data ou mégadonnées représente les collections de données caractérisées par un volume une vélocité et une variété si grands que leur transformation en valeur utilisable requiert l ? utilisation de technologies et de méthodes analytiques spéci ?ques CBig Data D éfVionluitmioe n- pas d'échantillonnage on observe et mesure tout Vélocité - les données et les résultats sont souvent disponibles en temps réel Variété - puise dans les données textuelles les photos audio vidéo et complète généralement les pièces manquantes en fusionnant plusieurs sources C CBig Data Pourquoi CBig Data P ouDr ? oq? uvioeni t ce concept du ??big data ? Est-ce seulement le ??petit ? data qui est devenu ??big ? Simplement plus de data Quelques pistes Explosion de la disponibilité des données Augmentation de la capacité de stockage Augmentation de la capacité d ? analyse CBig Data - Disponibilité des données ??There was exabytes of information created between the dawn of civilization through but that much information is now created every days and the pace is increasing ? -- Eric Schmidt PDG Google C CDonnées structurées vs non structurées CBig Data Capacité de stockage Entre et la capacité des disques a augmenté par x alors que le prix par Gb a chuté du même ratio Une augmentation de x à prix constant CBig Data Capacité d ? analyse La loi de Moore en action pendant environ ans Plus récemment la capacité d ? analyse augmente gr? ce à l ? ajout de coeurs dans les unités centrales CBig Data P ouAurqgmueontia tion exponentielle de la quantité de données non structurées Email chat blog web musique photo vidéo etc Augmentation de la capacité de stockage et d ? analyse L ? utilisation de plusieurs machines en parallèle devient accessible Les technologies existantes ne sont pas conçues pour ingérer ces données Base de données relationnelles tabulaires mainframes tableurs Excel etc De ??nouvelles ? technologies et techniques d ? analyse sont nécessaires ??Google File System ? - Google ??MapReduce Simpli ?ed Data Processing on Large Clusters ? Google Hadoop circa D ? o? le ??Big Data ? pas strictement plus de data CBig Data - Les applications CApplications Recherche - PageRank Santé Éducation MOOC Commerce de détail Amazon WallMart Génomique High- throughput sequencing Science recherche fondamentale LHC Machine Learning Deep Learning Recommendation Net ix Hopper Urbanisme Gouvernements Média journalisme de données Fraude détection prévention IoT CLes techniques et les technologies

  • 40
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise
Partager