0 0 5 0 6 3 0 4 2 0 1 8 0 6 7 0 5 6 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 5 0 6 3 0 4 2 0 1 8 0 6 7 0 5 6 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3 5 0 1 4 0 9 5 0 8 3 01 11 01 10 01 10 11 11 01 10 10 01 01 11 00 10 00 10 00 00 01 10 11 00 00 10 01 11 01 10 01 01 01 10 01 00 01 10 10 01 01 11 01 00 01 10 11 11 DATA SCIENTISTS ! Les métiers qui façonnent les transitions vers demain 2 0 1 9 2 e é d i t i o n DATA Sommaire L'ère numérique guidée par la donnée 2 L'enjeu des données de santé 4 Objectif Data Driven 2020 5 Explorer les données de transport 6 Des métiers en évolution 10 La formation inséparable de la recherche 13 La data peut-elle tout résoudre ? 22 S’éduquer à la donnée 23 Maîtriser les algorithmes 24 Boîte à outils d'algos 26 Quantique : vers l’hyper calcul ? 29 Rendre les données visibles 30 De man of science à scientist 32 L’hybridation des compétences 33 Des data scientists au quotidien 35 Déployer une charte data 36 Protéger les données personnelles 37 Data Scientist ou Data Engineer ? 39 Les banques & assurances bougent 40 Les missions des CDO 45 Des données sous haute protection 50 Assurer à l’ère des big data 51 Libérer l’énergie des données 54 La ville, terrain de jeux de données 56 De l’open data à l’open innovation 58 Quelles IA demain ? 59 Vers la transition cognitive 60 L’IA en France : les enjeux santé et emploi 61 Intelligence artificielle : nouvelles formations 62 La Recherche en Data Science 68 Une thèse en machine learning 72 Les nouveaux paradigmes scientifiques 74 Des start-up de la donnée 77 Des données et des humains 79 Piloter un datalab 80 La cybersécurité étend ses ailes 81 Un journalisme qui redonne du sens 83 Naviguer en données complexes 84 Faire voler les data 85 Le quotidien des data scientists 94 Les compétences des data scientists 96 Fiches Métiers Data & marketing 8 Data analyst 20 Data manager 21 Ingénieur big data 28 Expert Data visualisation 31 Data Scientist 34 Chief Data Officer 44 Head of Data 46 Chef de projet data 47 Architecte Big Data 48 Chief Technology Officer 49 Expert sécurité 52 Data protection officer 53 Machine Learning Engineer 64 Ingénieur IA 65 Machine learning specialist 66 Chercheur en data science 67 Data entrepreneur 76 Consultant Data & Analytics 78 Data journalist 82 Fiches pratiques Paroles de data scientists 88 Faire son CV de data scientist 90 Se réorienter vers la donnée 91 Grand groupe ou start-up ? 92 Se former en continu 93 Avant-propos Chère lectrice, cher lecteur Je suis heureux que vous teniez ce guide entre vos mains, heureux à double titre. Tout d’abord, car il s’agit de la seconde édition, enrichie et mise à jour, de cet ouvrage. Cela prouve l’importance toujours plus grande de la science des données dans notre société et le besoin croissant de former des professionnels capables de saisir à bras-le-corps nombre de nouveaux défis. Je suis également heureux que vous lisiez ces phrases, que votre intérêt, voire votre curiosité, vous ait incité.e à ouvrir ce guide. De toutes les découvertes scientifiques et technologies issues des laboratoires de recherche, rares sont celles qui irriguent autant notre quotidien. Connaître l’existence de cette discipline et de ses enjeux est presque devenu une nécessité pour tout citoyen désireux de comprendre la marche du monde moderne. Il est difficile de compter le nombre de services, d’outils et de pratiques actuelles ou d’un futur proche qui vont reposer sur un traitement massif d’informations, la mise en œuvre d’algorithmes d’apprentissage statistique ou de dispositifs apprenants en interaction constante avec leur environnement. Sans doute serait-il plus aisé d’identifier ceux qui ne seront pas affectés ! Si l’intelligence artificielle suscite autant d’espoirs chez les uns que de craintes chez les autres, la ligne de conduite de Télécom ParisTech sur ce sujet est claire et repose sur deux principes. Le premier est que, parce que l’avènement de l’IA est incontournable, il est d’importance stratégique que la France forme ses propres docteurs et ingénieurs à même de concevoir des dispositifs « intelligents » et qu’elle possède ses propres start-up et infrastructures souveraines. L’autre principe est celui de l’impératif de la présence permanente, dans nos enseignements comme au sein de notre recherche, du regard porté par les sciences humaines sur les impacts socio-économiques des nouvelles technologies. Science et conscience ne doivent pas cesser de se répondre et j’espère que cette lecture saura y encourager plus d’un et plus d’une ! Yves Poilane Directeur de Télécom ParisTech 1 3 De l’acquisition à l’utilisation, les données subissent de nombreux traitements S’il existe un domaine qui a provoqué, puis accéléré, la transition numérique en cours, ce n’est pas tant le déploiement des réseaux ou la convergence des mé dias au début des années 2000, mais bien l’abondance de la donnée, produite par notre utilisation effrénée des réseaux et des objets connectés. Depuis 2012, année où le « big data » a été choisi comme terme tendance dans le monde du numérique, la situation a fortement évolué. L’utilisation de telles données massives n’était cepen dant pas inconnue auparavant des direc tions des systèmes d’information, et c'est la soudaine production de nouvelles don nées de toute nature, la mise à disposition en open data de nombreuses sources de données externes et la facilité avec les quelles il était possible de les manipuler, les assembler, et effectuer des calculs avec, qui a provoqué la création de ser vices innovants. La transition numérique de la société a pu commencer sérieuse ment, guidée par les sciences de la don née. Le terme data-driven economy faisait son apparition. Nature des données Il est habituel de présenter les données massives à travers quelques-unes de leurs caractéristiques fondamentales, qui commencent toutes par la lettre V. Les trois principales et immédiates sont leur volume, la vitesse à laquelle elles sont produites, captées, consommées, et leur variété, les données à traiter étant souvent non structurées, composées de textes, d'images, de suites de chiffres… Leur variabilité caractérise leur propension à changer de format ou de structure au cours du temps, par l'ajout de nouveaux champs ou par l’intégration de données similaires améliorant leur diversité. Les données en soi sont des faits bruts, et pour créer de l'information, puis de la connaissance, elles doivent être interpré tées. L'intérêt des données réside alors dans leur valeur intrinsèque qui émerge des traitements qu'on leur fait subir, des simples statistiques à l'apprentissage machine (machine learning) plus évolué. L'ère numérique guidée par la donnée acquérir extraire intégrer aggréger nettoyer transformer convertir affiner géocoder contextualiser décrire classer indexer sérialiser anonymiser protéger traiter interpréter apprendre analyser présenter visualiser partager rafraîchir archiver effacer stocker 2 3025500 Déverrouiller la valeur tapie au cœur des données ne sert cependant pas à grand- chose si leur mise en contexte n'est pas respectée et si ce qu'elles ont à dire n'est pas bien mis en lumière. Valoriser, rendre visibles et permettre de visualiser les données sont une même démarche qui consiste à rendre les données com préhensibles, interprétables, utiles, par tageables, vivantes. Reste une condition : que ces données et leurs conséquences soient conformes à la vérité et aux faits. Ce souci de véracité des données est un mar queur fort à préserver. Ajoutons que les données ne sont jamais neutres : de nou velles combinaisons de données peuvent créer de nouvelles connaissances aux conséquences difficilement prévisibles. Culture de la donnée Les data scientists – un terme large qui se décline en une multitude de métiers, évo lutifs – sont les femmes et les hommes qui naviguent dans les données au quo tidien. Le volume de ces dernières n’est pas toujours leur caractéristique majeure. Les open data, ces informations publiques librement accessibles et réutilisables, dé signant également des données d’acteurs privés qu’ils libèrent dans les mêmes conditions, sont un type de données vec teur d’innovations et d’enrichissement des données que chaque acteur produit. Le caractère personnel de certaines données est une qualité qui nécessite une attention particulière et une éthique de tous les ins tants. La place déterminante qu’elles ont prise dans nos sociétés rend le dévelop pement de la culture des données –com prendre leur rôle et se donner les moyens d’agir avec – essentiel à double titre : l’examen critique de leur place au cœur de nos échanges et de nos décisions, et le renouvellement de nos façons d’agir et d’interagir. Moteur de la transition numé rique et des autres transitions en cours, porteuse d’enjeux juridiques et sociétaux, non bridée par la technologie pour l’ins tant, la donnée est à la fois une affaire de technicité et d’humains, et les data scien tists en sont les artisans et le liant. Une stratégie uploads/Science et Technologie/ livret-datascience-2019.pdf
Documents similaires
-
24
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Jul 21, 2022
- Catégorie Science & technolo...
- Langue French
- Taille du fichier 6.4743MB