Wahiba Ben Abdessalem Institut Supérieur de Gestion de Tunis Data Science Funda
Wahiba Ben Abdessalem Institut Supérieur de Gestion de Tunis Data Science Fundamentals Cours de Mastère (S1) : Intelligent DEcision mAking Strategies (IDEAS) Chapitre 1 : Introduction à la Science des données Data Science Fundamentals 2 Data Science Fundamentals Introduction à la Science des données Plan du cours Objectifs Ce module est introductif et a pour objectif la familiarisation des étudiants avec les concepts relatifs à la Science des données et à la compréhension de son utilité à travers des exemples. Chapitres : Chapitre 1 : Introduction à la Science des données Chapitre 2 : Méthodologie de Science des données (processus) Chapitre 3 : Outils de la Science des données ( langages et algorithmes) Chapitre 4 : Applications de la Science des données Chapitre 5 : la Science des données et le Big data Chapitre 6 : La Visualisation dans la Science des données Chapitre 7 : Ethiques des Sciences des données 3 Références bibliographiques - Morand, Elisabeth. "Data science: fondamentaux et études de cas, Machine learning avec Python et R by Eric Biernat and Michel Lutz." Population, English edition 73.2 (2018): 386-387. 4 Dietrich, David. "Data Science & Big Data Analytics." (2015). KELLEHER, JOHN D. "Data science/John D. Kelleher and Brendan Tierney. Description: Cambridge, MA: The MIT Press, 2018 Laura, Igual, and Seguí Santi. "Introduction to Data Science: A Python Approach to Concepts, Techniques and Applications." (2017). Ozdemir, Sinan. Principles of data science. Packt Publishing Ltd, 2016. Références bibliographiques Kotu, Vijay, and Bala Deshpande. Data science: concepts and practice. Morgan Kaufmann, 2018. 5 Wagh, Sanjeev J., Manisha S. Bhende, and Anuradha D. Thakare. Fundamentals of Data Science. Chapman and Hall/CRC, 2021. Grus, Joel. Data science par la pratique: fondamentaux avec Python. Eyrolles, 2020. 6 Data science is a compilation of techniques that extract value from data. Some of the techniques used in data science have a long history and trace their roots to applied statistics, machine learning, visualization, logic, and computer science (Kotu, Vijay, and Bala Deshpande. Data science: concepts and practice. Morgan Kaufmann, 2018.) Introduction à la Data Science Qu’est-ce qu’on entend par « Data Science » ? Data science is commonly defined as a methodology by which actionable insights can be inferred from data…. Performing data science is a task with an ambitious objective: the production of beliefs informed by data and to be used as the basis of decision-making. Laura, Igual, and Seguí Santi. "Introduction to Data Science: A Python Approach to Concepts, Techniques and Applications." (2017). Introduction à la Data Science Qu’est-ce qu’on entend par « Data Science » ? « La data science (ou science des données) est un domaine interdisciplinaire, qui emprunte au business, aux statistiques et à l’informatique diverses méthodes, processus et algorithmes pour extraire des informations des données. » 01 Définition 7 Selon le Bureau of Labor Statistics des États-Unis, les opportunités d'emploi dans le domaine de la science des données devraient augmenter de 31,4 % entre 2020 et 2030. Les data scientists peuvent également s'attendre à gagner un salaire de 100, 480 USD. (https://www.bls.gov/emp/tables/fastest-growing-occupations.htm) Introduction à la DataScience Un peu d’histoire… Même si le domaine s’est beaucoup démocratisé ces 10 dernières années, la data science est en réalité beaucoup plus âgée qu’elle n’y parait… 01 1 9 5 9 Première apparition de l’expression “datascience” (Peter Naur) 1 9 9 1 1er cas concret de machine learning :un programme apprend à jouer aux dames Un algorithme de Machine Learning (Deeper Blue) bat 1 9 9 7 le champion du monde d’échecs 2 0 1 6 Un algorithme de Deep Learning (AlphaGo) bat le champion du monde de Go 8 Introduction à la DataScience Un peu d’histoire… 9 La data science existe depuis des décennies... Alors pourquoi ce nouvel élan ? Explosion de la quantité des données produites et collectées (big data…) Stockage des données plus économique Augmentation exponentielle des capacités de calcul des ordinateurs Amélioration d’accessibilité aux algorithmes 01 Introduction à la Data Science Qu’est-ce qu’on entend par « Data Science » ? Lorsqu’on parle de Data Science, on englobe beaucoup de domaines d’application possibles. Les domaines les plus courants sont : 10 Introduction à la Data Science AI, MACHINE LEARNING, AND DATA SCIENCE • L'intelligence artificielle, l'apprentissage automatique et la science des données sont tous liés les uns aux autres. ils sont souvent confondus les uns avec les autres dans les médias populaires et la communication commerciale. • Cependant, ces trois domaines sont distincts selon le contexte : • L'intelligence artificielle consiste à donner aux machines la capacité d'imiter le comportement humain, en particulier les fonctions cognitives. Exemples : reconnaissance faciale, conduite automatisée, tri du courrier en fonction du code postal. Dans certains cas, les machines ont largement dépassé les capacités humaines (trier des milliers de courriers postaux en quelques secondes) • Il existe toute une gamme de techniques relevant de l'intelligence artificielle : traitement du langage naturel, science de la décision, robotique, planification, etc. 11 Introduction à la Data Science AI, MACHINE LEARNING, AND DATA SCIENCE • L'apprentissage est une partie importante de la capacité humaine. • L'apprentissage automatique peut être considéré comme un sous-domaine ou l'un des outils de l'intelligence artificielle, il fournit aux machines la capacité d'apprendre de l'expérience • L'expérience des machines se présente sous la forme de données. • Les données utilisées pour enseigner aux machines sont appelées données de formation (training data). 12 Introduction à la Data Science AI, MACHINE LEARNING, AND DATA SCIENCE • L'apprentissage automatique bouleverse le modèle de programmation traditionnel: • Un programme, un ensemble d'instructions pour un ordinateur, transforme les signaux d'entrée en signaux de sortie en utilisant des règles et des relations prédéterminées. • Algorithmes d'apprentissage automatique, également appelés "apprenants", prennent à la fois l'entrée et la sortie connues (données de formation) pour déterminer un modèle pour le programme qui convertit l'entrée en sortie. 13 Introduction à la Data Science AI, MACHINE LEARNING, AND DATA SCIENCE Comment fonctionne l’apprentissage automatique: • Par exemple, de nombreuses organisations telles que les plateformes de médias sociaux, les sites d'évaluation ou les forums sont tenues de modérer les publications et de supprimer le contenu abusif. • Comment apprendre aux machines à automatiser la suppression des contenus abusifs ? 14 Introduction à la Data Science AI, MACHINE LEARNING, AND DATA SCIENCE Comment apprendre aux machines à automatiser la suppression des contenus abusifs ? • Les machines doivent recevoir des exemples de messages abusifs et non abusifs avec une indication claire de celui qui est abusif. • Les apprenants généraliseront un modèle basé sur certains mots ou séquences de mots afin de conclure si le message global est abusif ou non. • Le modèle peut prendre la forme d'un ensemble de règles "si - alors". • Une fois que les règles ou le modèle de science des données sont développés, les machines peuvent commencer à catégoriser la nature de tout nouveau message. 15 Introduction à la Data Science AI, MACHINE LEARNING, AND DATA SCIENCE • La science des données est l'application métier de l'apprentissage automatique, de l'intelligence artificielle et d'autres domaines quantitatifs tels que les statistiques, la visualisation et les mathématiques. • C'est un domaine interdisciplinaire qui extrait la valeur des données. • Elle s'appuie fortement sur l'apprentissage automatique et est parfois appelée exploration de données. • Des exemples de cas d'utilisation de la science des données sont : les moteurs de recommandation qui peuvent recommander des films pour un utilisateur particulier, un modèle d'alerte à la fraude qui détecte les transactions frauduleuses par carte de crédit, trouver les clients qui vont très probablement se désabonner le mois prochain ou prédire les revenus pour le prochain trimestre.. 16 Introduction à la Data Science AI, MACHINE LEARNING, AND DATA SCIENCE • La science des données commence par des données, qui peuvent aller d'un simple tableau de quelques observations numériques à une matrice complexe de millions d'observations avec des milliers de variables. La science des données utilise certaines méthodes de calcul spécialisées afin de découvrir des structures significatives et utiles dans un ensemble de données. • La discipline de la science des données coexiste et est étroitement associée à un certain nombre de domaines connexes tels que les systèmes de bases de données, l'ingénierie des données, la visualisation, l'analyse des données, et l'intelligence d'affaires (BI). 17 Introduction à la Data Science AI, MACHINE LEARNING, AND DATA SCIENCE Nous pouvons définir plus précisément la science des données en étudiant certaines de ses principales caractéristiques et motivations telles que : 1- Extraction de patterns significatifs 2- Construire des modèles représentatifs 3- Combinaison de statistiques, d'apprentissage automatique et L'informatique 4- Learning Algorithms (Algorithmes d'apprentissage) 5- D’autres champs associés 18 Introduction à la Data Science Principales caractéristiques et motivations du data science 1- Extraction de patterns significatifs La science des données implique l'inférence et l'itération de nombreuses hypothèses différentes. L'un des aspects clés de la science des données est le processus de généralisation des patterns (motif, patron ou modèles) à partir d'un ensemble de données. La généralisation doit être valide, non seulement pour l'ensemble de données utilisé pour uploads/Science et Technologie/ chapitre-1-introduction-a-la-science-des-donnaes.pdf
Documents similaires
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/8tDTQoJ05RmLVmuJWPJE0ltLpLeNRt33oIdY6anKg7pCe2PccTySHQMvUtovZW2oSXtHeNoU102VB50cBAV8cSHc.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/ZUWaMEtKBF8jUvHqpa7Rqmyrdm8zMZmjQuiY9n6fgg7bDoT2iycxk1mLscY0ndrYcoVnJB6XUjMil82kwbnkKD96.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/FWOCaEdxgAZn1j9JDyKF2fi4DudKHSBI3prqJeLkCjzGZG0mJOjmrlIqNx2fpE3HQrNWOSGK9jQo2AvfWk0d2BVw.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/K9Wx2OWeo6jn65VafQdi8XiU5uldk6KS8cgNwPKxeQIZCqAGC2X8XZxuQimDE7nT2hZ2j58gS4onGrPpzcEvD6Os.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/SCYdh2GT2NudItn4vccdEUzhX7H1nJ6thG5RNVajatltY9agT0MVGzVWD74IC7tfNLVjiSKl0FzoU36Ww7Njb73e.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/a0wW6JwGX7kPeaIiVImV1GOps7WctqgxKJVCQLqvNzmYtCIm7VImkxDJCnMnCOhX4pQqMhhjev3EbrIocUsZNpVj.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/qaArCXZaNQueWBJLQbtm9JJNZaWd0PaU9AS8RhfaV2oZ7O6VihXi22TmXhEUqE7FhiUtuA3tLvNEMJt59Otc07tZ.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/seUVUP320ixIcbpQ0ffkS5CX6m9k9FpS6Y9rd3TIVBthuX7Fo1RlwQuQYSc4eKBMU5hxetdht4XdEyetTVGPjK6f.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/DxIKe0EGse3ud8W6X08p4Xfg5S93hmfagOJKUHuF0CTBy0jtQGtDgNFPKZtj2vgIFpADgJEjZuplEO036Q4D8ZGM.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/6yZFtkBRHQWnJdzNEMEdPGYdvTsdyIwdknY5aNunB8wLdeD4SsYxZ0gNkQ0iNpwixyRvaCGXbWil5AyS91Oep3Px.png)
-
31
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Oct 21, 2022
- Catégorie Science & technolo...
- Langue French
- Taille du fichier 0.8082MB