UBS - Université Bretagne Sud, Vannes, Morbihan UFR Sciences et Sciences de l’I

UBS - Université Bretagne Sud, Vannes, Morbihan UFR Sciences et Sciences de l’Ingénieur Département Mathématiques, Informatique, Statistique Campus de Tohannic - BP 573 - F-56017 Vannes cedex Livret Pédagogique Master Mention : Mathématiques Appliquées, Statistique Parcours : Data Science et Modélisation Statistique (DSMS) OBJECTIFS L’objectif du Master DSMS est de former des experts exerçant dans le domaine des statistiques et des sciences des données. Cette offre de formation orientée à la fois vers les entreprises et vers la recherche est particulièrement attractive, car elle permet de développer des compétences nécessaires à l’essor des technologies de l’information qui irriguent tous les secteurs de l’économie et qui intéressent les entre- prises de toutes tailles. L’analyse et le traitement de ces données hétérogènes, complexes et massives font de plus en plus appel aux derniers développements des mathématiques appliquées, de l’informa- tique et de la statistique. C’est pourquoi l’étroite imbrication d’enseignements dans ces disciplines permet aux étudiants d’acquérir des compétences transversales qui sont cruciales et d’allier des ca- pacités d’abstraction pour concevoir des modèles numériques appropriés et pour les mettre en œuvre au moyen de technologies logicielles avancées. La variété des domaines scientifiques, des approches technologiques et des entreprises engendre une grande diversité des métiers relevant du domaine des sciences des données. Le Master DSMS répond à cette diversité par une large palette de spécialités au sein d’un même ensemble offrant une identité unique et un socle commun de connaissances permet- tant des parcours pluridisciplinaires en lien avec les laboratoires de recherche et les entreprises. La formation se déroule en 4 semestres et s’appuie sur les enseignements de la Licence Sciences, Technologies, Santé (semestre 1 à semestre 6). Ces enseignements sont complétés chaque semestre par des enseignements de Sciences Humaines et Sociales (SHS), l’apprentissage par projets et des stages favorisant l’ouverture vers le monde extérieur, et donnant lieu à la délivrance de 30 ECTS par semestre. L’objectif des projets et des stages tout au long du parcours est d’offrir une formation ouverte sur la recherche scientifique et sur les besoins des entreprises. Les années M1 et M2 permettront d’acquérir des connaissances de haut niveau dans les domaines connexes aux activités des laboratoires IRISA (Institut de Recherche en Informatique et Systèmes Aléatoires), Lab-STICC (Laboratoire en Sciences et Techniques de l’Information, de la Communication et de la Connaissance) et LMBA (Laboratoire de Mathématiques de Bretagne Atlantique). Le Master DSMS intègre ainsi une initiation à la re- cherche au cœur des sciences des données, destinée à former des scientifiques capables de s’adapter à l’évolution rapide des technologies de l’information dans des environnements numériques complexes. SEMESTRE 1 Unités d’Enseignement Obligatoire — STA2105 : Modèles Linéaires Généralisés (Estimations et Prédictions) — STA2121 : Statistique Bayésienne et MCMC — INF1612 : Systèmes d’information opérationnels : base de données — STA2122 : Programmation et traitement statistique des données — STA2120 : Séries chronologiques et prévisions Enseignement Complémentaire (UEC) — SUCG401 — ANG2102 : Anglais — ECN2102 : Droit SEMESTRE 2 Unités d’Enseignement Obligatoire — STA2215 : Machine Learning et Big Data — INF2204 : Systèmes d’Information décisionnels et entrepôts de données — STA2123 : Modèles de durées et Analyse de Survie — MIS2251 : Projet Tutoré — STA2124 : Optimisation statistique et Business Intelligence Unités d’Enseignement Complémentaire (UEC) — SUCG402 — ANG2202 : Anglais — COM2202 : Techniques d’expression SEMESTRE 3 Unités d’Enseignement Obligatoire — STA2326 : Modélisation de données complexes — STA2328 : Intelligence Artificielle et Deep Learning — STA2325 : Statistique spatiale et Systèmes d’Information Géographique (SIG) — STA2329 : Challenge Kaggle & Big Data (Hadoop, Spark) — STA2321 : Machines à Vecteur Support et méthodes à noyaux Unités d’Enseignement Complémentaire (UEC) — CON2302 : Conférences et mini-cours — ANG2306 : Anglais SEMESTRE 4 — STA2324 (Unités d’Enseignement Obligatoire) : Stage long (10 semaines minimum) Contacts Scolarité Sandrine Steinmann (sandrine.steinmann@univ-ubs.fr) Directeur des Études : — Semestre 1 Master 1 DSMS : Professeur Ion Grama (ion.grama@univ-ubs.fr) — Semestre 2 Master 1 DSMS : Professeur Gilles Durrieu (gilles.durrieu@univ-ubs.fr) — Master 2 DSMS : Professeur François Septier (francois.septier@univ-ubs.fr) — Responsable des conférences du Master 2 DSMS : Jean-Marie Tricot (jean-marie.tricot@univ-ubs.fr) — Responsable des stages du Master 2 DSMS : Evans Gouno (evans.gouno@univ-ubs.fr) Site web : https://www.univ-ubs.fr/master-statistique UNITÉS D’ENSEIGNEMENT DU SEMESTRE 1 STA2105 Modèles linéaires généralisés (estimations et prédictions) Modalités pédagogiques Cours (20h) et TD (22h) en présentiel. ECTS : 5 Objectifs L’objectif de ce cours et de montrer comment on peut généraliser le modèle linéaire dans des situa- tions où il ne donne pas des résultats satisfaisants. Nous analysons en détails la régression logistique, les données de comptage et les tableaux de contingence. Contenu — Modèle linéaire. Condition d’utilisation. Les types des variables. Exemples. — Famille exponentielle et modèles linéaires généralisés. Information de Fisher. Exemples. — Estimation dans les modèles linéaires généralisés. Exemples. — Inférence statistique pour les modèles linéaires généralisés. EMV et sa loi limite. Déviance. Exemples. — Réponses binaires et régression logistique. Exemples. — Régression logistique nominale et ordinale. Exemples. — Données de comptage et modèle log - linéaire. Exemples. — Tables de contingence. Exemples. — Réduction de la dimension de l’espace des variables explicatives. Exemples. Prérequis Probabilités MTH1303. Statistique mathématique STA1512. Bibliographie — A. Doobson. An introduction to generalised linear models. Chapman and Hall 2002. — P. McCullagh and J.A. Nelder. Generalized linear models. Chapman and Hall 1989. — A. Antoniadis, J. Berruyer, R. Carmona. Régression non linéaire et applications. Economica 1992. — P.A. Cornillon, E.Matzner-Lober. Régression. Théorie et applications. Springer 2005. Fiche mise à jour le 08/10/2020 STA2121 Statistique Bayésienne et MCMC Modalités pédagogiques Cours (20h) et TD (22h) en présentiel. ECTS : 5 Objectifs Découvrir les bases de l’approche bayésienne des problèmes statistiques et s’initier aux outils de l’analyse bayésienne. Contenu — Introduction : Généralités : Fréquentistes / Bayésiens — Eléments de Théorie de la Décision - Modèle de décision - Règles de décision - Relation de préférence - Fonction de coût - Fonction de risque - Optimalité : minimaxité et admissibilité. — Analyse Bayésienne - Lois a priori - Lois conjuguées - Lois non informatives - Estimateur de Bayes - Tests et régions de confiance. Prérequis Statistique inférentielle, régression Bibliographie — Lehmann E. L., Theory of Point Estimation, Wiley, 1983. — Robert C., L’analyse statistique bayésienne, Economica, 1992. Fiche mise à jour le 08/10/2020 INF1612 Systèmes d’information opérationnels : bases de données Modalités pédagogiques Cours (20h) et TD (22h) en présentiel. ECTS : 5 Objectifs Dans le cadre de la conception de systèmes d’information, l’étudiant sera capable d’intervenir sur les différentes étapes du projet, depuis la re-documentation du cahier des charges jusqu’à la mise en production des bases de données, quelles qu’elles soient. Contenu — Modèles conceptuels des systèmes d’information — Merise — UML (cas d’utilisation, diagramme de classes et des séquences, diagramme d’activité, pro- files) — modèle logique, modèle physique — Modèle logique, modèle physique — Programmation avancée des bases de données — PL/SQL ou Transact SQL — Performance d’accès aux BD — indexation — optimisation de requêtes — tuning de bases de données — répartition Prérequis Bases de données relationnelles et langages associés. Bibliographie — Merise et UML pour la modélisation des systèmes d’information, Joseph Gabay. Dunod, 2004 — ORACLE 10g, guide du DBA, Kevin Loney, Bob Bryla. Oracle Press. 2005. — Oracle Performance Tuning for 10g, Gavin Powell. Elsevier, 2005 — Oracle 10g, optimisation d’une base de données, Claire Noiraud, ENI, 2006 — UML2 pour l’analyse d’un système d’information, Chantal Morley, Jean Hugues, Bernard Le- blanc. Dunod, 2006. — Microsoft SQL Server 2005, guide de l’administrateur, William Stanck, Microsoft Press, 2006 — SQL Server 2008, SQL, Transact SQL, Jérôme Gabillaud, ENI, 2008 Fiche mise à jour le 08/10/2020 STA2122 Programmation et traitement statistique des données Modalités pédagogiques Cours (20h) et TD (22h) en présentiel. ECTS : 5 Objectifs L’objectif de ce cours est de permettre aux étudiants de maîtriser les concepts de programmation R et SAS tout en approfondissant un ensemble de techniques statistiques. Contenu 1. Introduction aux logiciels R, Python et SAS 2. Programmation statistique sous R, Python et SAS 3. La proc SQL (SAS) 4. Le langage MACRO (SAS) 5. SAS IML Studio (SAS) 6. Simulation, modélisation et analyse de données sous R, Python et SAS 7. Exemples d’applications sur des données réelles (R, Python et SAS) Prérequis Eléments de programmation, Algorithmique. Bibliographie — H. Kontchou-Kouomegni, O. Decourt. SAS : Maîtriser SAS Base et SAS Macro, Dunod, 2006 — S. Ringuedé. SAS : Introduction au décisionnel - Méthode et maîtrise du langage, Pearson Edu- cation, 2008 — E. Duguet. Introduction à SAS, Economica, 2004 — F. Husson, S. Lê, J. Pagès (2009) Analyse de données avec R, Presse Universitaires de Rennes — G. Sawitzki (2009) Computational Statistics : an introduction to R; Chapman & Hall Fiche mise à jour le 08/10/2020 STA2120 Séries chronologiques et prévisions Modalités pédagogiques Cours (20h) et TD (22h) en présentiel. ECTS : 5 Objectifs Les techniques de décomposition des séries temporelles couramment utilisées dans la prévision des ventes, par exemple, et l’utilisation des processus stochastiques pour le traitement des séries chrono- logiques et, en particulier, les uploads/Science et Technologie/ livret-pedagogique-master-dsms.pdf

  • 32
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager