Formation Data Science Ore des modules statistiques pour la Filière Data Scien
Formation Data Science Ore des modules statistiques pour la Filière Data Sciences INSEA 22 novembre 2018 Ore des modules statistiques pour la Filière Data Sciences Formation Data Science Modules de statistique dans le cadre de la lière DS Eléments d'enseignement et objectifs des modules proposés Objectif L'objectif des enseignements de la statistique dans le cadre de la lière Data Science INSEA est d'assurer une formation sur les techniques statistiques en rapport avec la préparation, l'exploration, l'analyse et la modélisation des données en particulier celles qui servent à élaborer les modèles prédictifs de Machine Learning. Machine Learning constitue le coeur du système Data Product dont le développement est le rôle principal d'un Data Scientist. Ore des modules statistiques pour la Filière Data Sciences Formation Data Science Modules de statistique dans le cadre de la lière DS Eléments d'enseignement et objectifs des modules proposés Répartition des modules de statistique selon les semestres 14 modules de statistique composé de 29 éléments d'enseignement dont 18 sont partagés avec les autres lières de l'INSEA et 11 sont spéci ques à la lière DS (parmi ces 14 modules, il y en a deux qui sont plutôt de Mathématiques : Processus stochastiques et Files d'attente ; Modèles de Markov Cachés et ltrage). 1 Cinq modules en première année : ⋆Semestre 1 : ∗Statistique descriptive ∗Probabilités ⋆Semestre 2 : ∗Inférence statistique ∗Processus stochastiques et Files d'attente ∗Logiciels statistiques Ore des modules statistiques pour la Filière Data Sciences Formation Data Science Modules de statistique dans le cadre de la lière DS Eléments d'enseignement et objectifs des modules proposés Répartition des modules de statistique selon les semestres 2 Sept modules en deuxième année : ⋆Semestre 3 : ∗Analyse de données ∗Modélisation statistique ∗Séries chronologiques ∗Statistiques multivariées et Analyse de la variance ⋆Semestre 4 : ∗Modèles de Markov Cachés et ltrage ∗Technique de sondage et méthodes de rééchantillonnage ∗Apprentissage statistique supervisé et Modèles GLM Ore des modules statistiques pour la Filière Data Sciences Formation Data Science Modules de statistique dans le cadre de la lière DS Eléments d'enseignement et objectifs des modules proposés Répartition des modules de statistique selon les semestres 3 Deux modules en troisième année : ⋆Semestre 5 : ∗Analyse de données de panel et Traitement des valeurs manquantes ∗Statistique pour le Big data Ore des modules statistiques pour la Filière Data Sciences Formation Data Science Modules de statistique dans le cadre de la lière DS Eléments d'enseignement et objectifs des modules proposés Lien des modules proposés avec le métier de Data Scientist Ore des modules statistiques pour la Filière Data Sciences Formation Data Science Modules de statistique dans le cadre de la lière DS Eléments d'enseignement et objectifs des modules proposés Module 1 en S1 Statistique descriptive ⋆Elément 1 : Statistique descriptive ⋆Elément 2 : Introduction aux logiciels statistiques Objectifs : ∗Maitriser les outils de la Statistique descriptive uni- et bi-variée (étude unidimensionnelle de variables quantitatives ou qualitatives, étude du lien entre deux variables, quelle que soit leur nature, représentations graphiques, interprétation des résultats). ∗Appliquer ces outils sous forme d'introduction aux logiciels statistiques. Ore des modules statistiques pour la Filière Data Sciences Formation Data Science Modules de statistique dans le cadre de la lière DS Eléments d'enseignement et objectifs des modules proposés Module 2 en S1 Probabilités ⋆Elément 1 : Calcul de probabilités ⋆Elément 2 : Théorie des probabilités Objectifs : ∗Le but de ce module est de reprendre les notions fondamentales de la théorie de la mesure en se concentrant sur les outils utilisés par les probabilistes. ∗Maitriser les caractéristiques usuelles des variables et des vecteurs aléatoires discrets et continus ainsi que la mise en évidence de certaines lois utilisées en Statistique. ∗Maitriser les notions d'indépendance, des lois conditionnelles, des couples gaussiens et des théorèmes de convergence. Ore des modules statistiques pour la Filière Data Sciences Formation Data Science Modules de statistique dans le cadre de la lière DS Eléments d'enseignement et objectifs des modules proposés Module 3 en S2 Inférence statistique ⋆Elément 1 : Inférence statistique 1 ⋆Elément 2 : Inférence statistique 2 Objectifs : ∗Maitriser les notions générales relatives à l'inférence statistique sur un échantillon. ∗Acquérir des connaissances théorique et pratique des méthodes d'estimation ainsi que la compréhension du cheminement de la construction des tests paramétriques et des enjeux de leur mise en oeuvre. Ore des modules statistiques pour la Filière Data Sciences Formation Data Science Modules de statistique dans le cadre de la lière DS Eléments d'enseignement et objectifs des modules proposés Module 4 en S2 Processus stochastiques et Files d'attente ⋆Elément 1 : Processus stochastiques ⋆Elément 2 : Files d'attente Objectifs : ∗Maitriser la théorie et la pratique des processus stochastiques. ∗S'initier aux techniques de modélisation probabiliste tout étant capable de les utiliser en pratique. Ore des modules statistiques pour la Filière Data Sciences Formation Data Science Modules de statistique dans le cadre de la lière DS Eléments d'enseignement et objectifs des modules proposés Module 5 en S2 (New) Logiciels statistiques ⋆Elément 1 : Programmation en R ⋆Elément 2 : Programmation en SAS Objectifs : ∗Maitriser les languages de programmation des logiciels R et SAS. ∗Apprendre les pratiques de programmation en R et SAS permettant d'obtenir des programmes plus rapides. Ore des modules statistiques pour la Filière Data Sciences Formation Data Science Modules de statistique dans le cadre de la lière DS Eléments d'enseignement et objectifs des modules proposés Module 6 en S3 Analyse de données ⋆Elément 1 : Méthodes de réduction de dimension ⋆Elément 2 : Méthodes de classi cation non supervisée (Clustering) Objectifs : ∗Maitriser des méthodes factorielles permettant de réduire la dimension de travail (ACP, AFC, ACM, ...). ∗Maitriser les principales tehniques de classifcation non supérvisée (CHA, K-means et ses variantes, algorithmes mixtes). ∗Savoir mettre en oeuvre les méthodes factorielles et les techniques de classi cation traitées dans ce module. Ore des modules statistiques pour la Filière Data Sciences Formation Data Science Modules de statistique dans le cadre de la lière DS Eléments d'enseignement et objectifs des modules proposés Module 7 en S3 Modélisation statistique ⋆Elément 1 : Modèle de régression linéaire ⋆Elément 2 : Régression sur variables catégorielles (New) Objectifs : ∗Maitriser les outils de la modélisation par régression linéaire relatives à la contruction du modèle et la validation de ce denier. ∗Apprendre à modéliser une variable qualitative ayant un nombre ni de modalités (modèle logistique, ...). ∗Savoir mettre en oeuvre les techniques de modélisation traitées dans ce module. Ore des modules statistiques pour la Filière Data Sciences Formation Data Science Modules de statistique dans le cadre de la lière DS Eléments d'enseignement et objectifs des modules proposés Module 8 en S3 Séries chronologiques ⋆Elément 1 : Séries chronologiques ⋆Elément 2 : Séries chronologiques avancées Objectifs : ∗Maitriser les fondements théoriques et pratiques de l'analyse des séries chronologiques. ∗Maitriser les méthodes de modélisation d'une série chronologique principalement la méthodologie de Box et Jenkins, tests de stationnarité. ∗Maitriser les outils de modélisation d'une série chronologique multivariées (VAR, VECM, Causalité au sens Grange, Co-intergration, ...). ∗Savoir mettre en oeuvre les techniques de modélisation de séries chronologiques traitées dans ce module. Ore des modules statistiques pour la Filière Data Sciences Formation Data Science Modules de statistique dans le cadre de la lière DS Eléments d'enseignement et objectifs des modules proposés Module 9 en S3 Statistiques multivariées et Analyse de la variance ⋆Elément 1 : Statistiques multivariées ⋆Elément 2 : Analyse de la variance Objectifs : ∗Maitriser l'inférence dans le cas multidimentionnel en particulier les modèles gaussiens multidimensionnels ainsi que l'utilisation de la loi de wishart et la statistique de Hotelling comme une extension de la loi Khi-deux du cas unidimensionnel pour tester diérentes hypothèses sur les moyennes puis sur les matrices de variance-covariance. ∗Apprendre à tester l'impact d'une ou plusieurs variables qualitatives sur une variable quantitative. Ore des modules statistiques pour la Filière Data Sciences Formation Data Science Modules de statistique dans le cadre de la lière DS Eléments d'enseignement et objectifs des modules proposés Module 10 en S4 (New) Modèles de Markov Cachés et ltrage ⋆Elément 1 : Filtrage de Kalman ⋆Elément 2 : Modèles de Markov Cachés Objectifs : ∗Maitriser les techniques de modélisation probabiliste et de l'inférence des chaînes de Markov. ∗Présentation des notions et dé nitions relatives aux Chaînes de Markov Cachées (CMC). ∗Apprendre à estimer l'état d'un système dynamique évoluant au cours du temps, à partir d'observations partielles, généralement bruitées. Ore des modules statistiques pour la Filière Data Sciences Formation Data Science Modules de statistique dans le cadre de la lière DS Eléments d'enseignement et objectifs des modules proposés Module 11 en S4 Technique de sondage et méthodes de rééchantillonnage ⋆Elément 1 : Technique de sondage ⋆Elément 2 : Méthodes de rééchantillonnage (New) Objectifs : ∗Maitriser les techniques de sélection d'un échantillon représentatif de la population ainsi que les méthodes d'estimation dans le cas de l'utilisation d'un plan de sondage complexe. ∗Présenter les principales méthodes de rééchantillonnage : les tests par permutations, la validation croisée, le jackknife, le bootstrap. ∗Savoir mettre en oeuvre les techniques d'échantillonnage et de rééchantillonnage traitées dans ce module. Ore des modules statistiques uploads/Science et Technologie/ offre-statistique-filiere-ds 1 .pdf
Documents similaires










-
35
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Mai 22, 2021
- Catégorie Science & technolo...
- Langue French
- Taille du fichier 0.3776MB