► NOTES DE LECTURE ET DE CONSULTATION Statistique et Enseignement, 6(2), 61-66,

► NOTES DE LECTURE ET DE CONSULTATION Statistique et Enseignement, 6(2), 61-66, http://www.statistique-et-enseignement.fr/ © Société Française de Statistique (SFdS), Décembre/December 2015 Note de consultation rédigée par Nathalie VILLA-VIALANEIX1 ANALYSE DES DONNÉES MULTIDIMENSIONNELLES François HUSSON, Jérôme PAGÈS et Magalie HOUÉE-BIGOT MOOC publié sur France Université Numérique (FUN) Numéro 40001 – 2 mars au 6 avril 2015 Avant-propos Cette note de consultation est un peu particulière dans le sens où elle fait le compte-rendu d’un support de cours non imprimé, un MOOC2. Ce type de moyen de formation se développant, il semble utile de faire une recension des expériences pédagogiques innovantes et réussies d’enseignement de la statistique au travers de ce type de média afin de les faire connaître et de permettre au plus grand nombre de profiter d’une session ultérieure du cours3 : en particulier, celles-ci peuvent servir à des étudiants souhaitant compléter leur compréhension d’un sujet, à des professionnels souhaitant approfondir leurs connaissances dans ce domaine ou des enseignants souhaitant s’appuyer sur un support de cours complet pour alimenter leurs propres enseignements. Cette note est organisée en deux parties : la première, classique, décrit le cours, son contenu et contient des retours d’expérience directs de professionnels non statisticiens ayant suivi le cours en auto-formation pour leurs besoins professionnels. La seconde partie présente 1 Chargée de Recherche, INRA de Toulouse, UR 0875 MIAT, nathalie.villa@toulouse.inra.fr 2 MOOC : Massive Online Open Courses (Cours en Ligne Ouverts et Massifs), voir le volume 5(1) de la revue Statistique et Enseignement, ou bien Villa-Vialaneix, N. (2013), J’ai testé pour vous… un MOOC, Statistique et Enseignement, 4(2), 3-17. 3 En particulier, une prochaine session de ce MOOC est programmée en mars 2016 : https://www.france- universite-numerique-mooc.fr/courses/agrocampusouest/40001S02/session02/about ► NOTES DE LECTURE ET DE CONSULTATION Note de consultation : « Analyse des données multidimensionnelles » (MOOC, F. Husson et al., 2015) Statistique et Enseignement, 6(2), 61-66, http://www.statistique-et-enseignement.fr/ © Société Française de Statistique (SFdS), Décembre/December 2015 62 une analyse plus macroscopique de la satisfaction des apprenants inscrits au cours, analyse qui a été rendue possible par les réponses collectées lors d’un sondage réalisé à la fin du cours. Les données et l’analyse ont été fournies par François Husson, l’un des créateurs du MOOC présenté ici. 1re partie – Note de consultation du MOOC « Analyse des données multidimensionnelles » Nathalie Villa-Vialaneix, à partir des retours d’expérience de Claire Hoede, Erika Sallet et Clément Delestre Le cours « Analyse des données multidimensionnelles » a été proposé sur la plateforme FUN4. Il est décrit à la page : https://www.fun-mooc.fr/courses/agrocampusouest/40001/Trimestre_1_2015/about Ce cours a commencé le lundi 2 mars 2015 pour une durée de 5 semaines (il s’est donc achevé le 6 avril 2015). Il a été créé et animé par François Husson (l’unique enseignant présent sur les vidéos du cours), Jérôme Pagès et Magalie Houée-Bigot, et il était porté par l’école d’ingénieurs Agrocampus Ouest5. L’objectif affiché du cours était de présenter des méthodes permettant « d’analyser, d’explorer, de visualiser des tableaux de données afin d’en extraire l’essentiel de l’information ». De manière concrète, le cours a été divisé en 4 grandes parties, plus une partie de synthèse. Chacune de ces parties était traitée sur une semaine entière et correspondait à une méthode particulière qui était décrite de manière détaillée et illustrée sur des exemples concrets. Les méthodes présentées lors du cours étaient : - Semaine 1 : l’Analyse en Composantes Principales (ACP) ; - Semaine 2 : l’Analyse Factorielle des Correspondances (AFC) ; - Semaine 3 : l’Analyse Factorielle des Correspondances Multiples (AFCM) ; - Semaine 4 : la classification. Chacune des 4 premières semaines est organisée de manière similaire : le support de cours est composé d’un diaporama global, qui est commenté au travers de courtes séquences vidéos d’une dizaine de minutes (3 séquences vidéos pour la semaine 1, 5 pour la semaine 2, 4 pour les semaines 3 et 4). Toutes les vidéos sont téléchargeables en divers niveaux de résolution et la transcription de l'audio est également disponible (ceci peut s'avérer très pratique pour les étrangers ne bénéficiant pas d'une connexion suffisante). Chaque vidéo de cours est suivie d’un court quizz récapitulatif de 5 questions. Chaque semaine, un didacticiel pour la mise en pratique des notions vues dans le cours conclut la semaine. La mise en pratique est effectuée par le logiciel libre R, avec le package FactoMineR6 dont le principal instigateur du cours, François Husson, est le mainteneur. Elle est illustrée dans une vidéo qui analyse deux jeux de données par semaine : les jeux de données ainsi que le script R au format texte et PDF (produit par RMarkdown7, ce fichier contient les commandes R, les 4 FUN : France Université Numérique ; http://www.france-universite-numerique.fr/sciences.html. 5 http://www.agrocampus-ouest.fr 6 http://factominer.free.fr 7 http://rmarkdown.rstudio.com : RMarkdown est un format de fichier qui permet la création de rapports avec R en combinant une syntaxe de mise en forme en simple texte très facile (langage Markdown) avec des morceaux de code R qui sont exécutés. Les résultats de l’exécution du code R sont inclus dans le document ► NOTES DE LECTURE ET DE CONSULTATION N. Villa-Vialaneix Statistique et Enseignement, 6(2), 61-66, http://www.statistique-et-enseignement.fr/ © Société Française de Statistique (SFdS), Décembre/December 2015 63 sorties produites et de très brefs commentaires) est fourni aux apprenants. Chaque semaine se termine par deux exercices : un qui se présente sous la forme d’un quizz plus long que les quizz qui correspondent aux diverses séquences vidéos de la semaine et dont le but est de récapituler les notions principales abordées durant le cours. Un second, toujours sous la forme d’un quizz, demande à l’apprenant d’analyser avec la méthode décrite dans le cours de la semaine, un jeu de données réel. Des questions en relation avec les résultats de l’analyse et l’interprétation de ceux-ci sont posées. Enfin, les trois premières semaines se terminent par une séquence vidéo d’approfondissement : la première sur la gestion des données manquantes, la seconde sur une étude de cas d’application de l’AFC à l’analyse de données textuelles et la troisième sur l’imputation de données manquantes. La dernière semaine est une semaine récapitulative qui commence par une vidéo décrivant la démarche générale en analyse de données multidimensionnelles et qui se solde par un exercice récapitulatif global posé sous la forme d’une étude de cas concret (à réaliser avec R) et d’un quizz permettant de vérifier les résultats obtenus et leur bonne interprétation. Tous les exercices des différentes séances sont notés et il est possible de suivre sa progression sous la forme d’un score de réussite aux divers types d’exercices. Tous les exercices peuvent être refaits autant de fois que le souhaite l’apprenant et seule la dernière tentative est comptabilisée. Ainsi, contrairement au parti pris de beaucoup de cours en ligne de type MOOC, il n’y a pas de validation de type « scolaire » dans ce MOOC, avec un exercice à essai unique ou limité ou des devoirs à rendre à date fixe. Après quelques questions sur les jeux de données étudiés, l'interprétation des résultats est laissée à l'apprenant et un Wiki permet de proposer son interprétation. Les autres apprenants peuvent alors corriger et compléter l'analyse. L'interprétation des résultats est ainsi co-construite avec tous les apprenants. Enfin, un forum de discussion, organisé par thématiques et aspects logiciels, permettait les échanges plus directs entre apprenants : son organisation permettait de retrouver facilement les discussions sur chaque sujet. De mon point de vue, l’organisation et la structuration du MOOC est remarquablement claire : les semaines contiennent la juste dose d’information et le cours ne commet pas l’erreur de présenter un trop grand nombre de méthodes au détriment de la compréhension de celles-ci par des apprenants qui n’en ont jamais entendu parler au préalable. Les aspects théoriques des méthodes ne sont pas passés sous silence mais la mise en œuvre pratique sur des jeux de données réels et parlants apportent systématiquement une illustration complémentaire claire des concepts développés. Les supports de cours sont tous d’une grande qualité et les quizz et exercices sont suffisamment nombreux et intelligemment pensés pour permettre l’acquisition des notions abordées. Il semble que le profil idéal d’un apprenant pour ce MOOC est celui d’une personne ayant déjà une formation de base en mathématiques (comme elle peut être enseignée dans la plupart des cursus universitaires de premier cycle en France). Comme la mise en œuvre pratique se fait sous R, il est également préférable que l’apprenant soit un minimum familiarisé avec ce langage de programmation : même si les méthodes peuvent être mises en œuvre via l’interface graphique RCommander, il paraît assez peu réaliste de pouvoir assimiler à la fois les aspects méthodologiques et la mise en œuvre pratique en seulement 5 semaines. Ces caractéristiques correspondent effectivement à la description du cours et des pré-requis qui est faite sur sa page de présentation. Les trois participants qui ont accepté de faire un retour d’expérience sur le MOOC ont tous les trois un profil et des aspirations similaires : de formation scientifique en bio- produit lors de la compilation. ► NOTES DE LECTURE ET DE CONSULTATION Note de consultation uploads/Management/ 493-texte-de-l-x27-article-1922-1-10-20151218.pdf

  • 21
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Apv 14, 2022
  • Catégorie Management
  • Langue French
  • Taille du fichier 0.3419MB