pdf Big Data et ses technologies ETS - Philippe La amme CPlan Introduction Big Data Une dé ?nition Pourquoi Applications Outils et technologies Systèmes de ?chiers distribués Algorithmes distribués Systèmes de base de données distribués Systèmes d ? orche

Big Data et ses technologies ETS - Philippe La amme CPlan Introduction Big Data Une dé ?nition Pourquoi Applications Outils et technologies Systèmes de ?chiers distribués Algorithmes distribués Systèmes de base de données distribués Systèmes d ? orchestration Conclusion CIntroduction Ingénieur informatique - Université de Sherbrooke Plus de ans d ? expérience architecture logiciel réseaux systèmes distribués traitement automatique du langage naturel génomique bioinformatique consultation ??big data ? Ingénieur senior chez Hopper Utilisons les données pour aider nos utilisateurs à prendre des décisions éclairées en matière de voyage CBig Data - Une dé ?nition CBig Data - Dé ?nition ??Le Big Data ou mégadonnées représente les collections de données caractérisées par un volume une vélocité et une variété si grands que leur transformation en valeur utilisable requiert l ? utilisation de technologies et de méthodes analytiques spéci ?ques CBig Data - Dé ?nition Volume - pas d'échantillonnage on observe et mesure tout Vélocité - les données et les résultats sont souvent disponibles en temps réel Variété - puise dans les données textuelles les photos audio vidéo et complète généralement les pièces manquantes en fusionnant plusieurs sources C CBig Data - Pourquoi CBig Data - Pourquoi D ? o? vient ce concept du ??big data ? Est-ce seulement le ??petit ? data qui est devenu ??big ? Simplement plus de data Quelques pistes Explosion de la disponibilité des données Augmentation de la capacité de stockage Augmentation de la capacité d ? analyse CBig Data - Disponibilité des données ??There was exabytes of information created between the dawn of civilization through but that much information is now created every days and the pace is increasing ? -- Eric Schmidt PDG Google C CDonnées structurées vs non structurées CBig Data - Capacité de stockage Entre et la capacité des disques a augmenté par x alors que le prix par Gb a chuté du même ratio Une augmentation de x à prix constant CBig Data - Capacité d ? analyse La loi de Moore en action pendant environ ans Plus récemment la capacité d ? analyse augmente gr? ce à l ? ajout de coeurs dans les unités centrales CBig Data - Pourquoi Augmentation exponentielle de la quantité de données non structurées Email chat blog web musique photo vidéo etc Augmentation de la capacité de stockage et d ? analyse L ? utilisation de plusieurs machines en parallèle devient accessible Les technologies existantes ne sont pas conçues pour ingérer ces données Base de données relationnelles tabulaires mainframes tableurs Excel etc De ??nouvelles ? technologies et techniques d ? analyse sont nécessaires ??Google File System ? - Google ??MapReduce Simpli ?ed Data Processing on Large Clusters ? - Google Hadoop circa D ? o? le ??Big Data ? pas strictement plus de data CBig Data - Les applications CApplications Recherche - PageRank Santé Éducation MOOC Commerce de détail Amazon WallMart Génomique High- throughput sequencing Science recherche fondamentale LHC Machine Learning Deep Learning Recommendation Net ix Hopper Urbanisme Gouvernements Média journalisme de données Fraude détection prévention

  • 29
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise
Partager