Formation ’initiation aux statistiques’ compl´ ement : TP R ∗ corrig´ e claire
Formation ’initiation aux statistiques’ compl´ ement : TP R ∗ corrig´ e claire Chabanet September 9, 2008 Contents 1 R, logiciel libre pour le graphique et les statistiques 2 2 Installer R 2 3 Documentation en ligne 2 3.1 Manuels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 3.2 Aide en ligne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 4 G´ erer ses projets 3 5 Lire et mettre en forme des donn´ ees 3 6 Tests de comparaison de 2 ´ echantillons 4 6.1 Echantillons ind´ ependants ou appari´ es ? . . . . . . . . . . . . . . . . . . . . . . . . . 4 6.2 Test bilat´ eral ou unilat´ eral ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 6.3 Les ´ etapes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 6.4 Choisir un test : conditions d’utilisation . . . . . . . . . . . . . . . . . . . . . . . . . 5 6.4.1 test du signe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 6.4.2 test de Mann-Whitney signe et rang : wilcox.test . . . . . . . . . . . . . . . 5 6.4.3 test de student : t.test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 6.5 Test param´ etrique ou non param´ etrique ? . . . . . . . . . . . . . . . . . . . . . . . . 5 7 Application 6 7.1 Exercice 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 7.2 Exercice 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 7.3 Exercice 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 8 La puissance d’un test 8 9 Initiation aux graphiques 9 10 Quelques trucs utiles 10 ∗initialement pr´ evu le 11 sept 2008, report´ e debut 2009. 1 2 3 DOCUMENTATION EN LIGNE Ce document est ` a la fois une courte introduction au logiciel R, qui a pour but de permettre un d´ emarrage rapide au d´ ebutant, et un compl´ ement de cours sur les tests dans le cas de 2 ´ echan- tillons ind´ ependants, suivi d’exercices de TP (sections 7, 8). Les fichiers d.cristaux.csv, d.iris.csv, d.poids.csv, d.rdt.csv doivent ˆ etre joints ` a cet ´ enonc´ e (utiles pour les sections 5 et 9). Il existe un document corrig´ e. 1 R, logiciel libre pour le graphique et les statistiques R est un syst` eme d’analyse statistique et graphique (c’est un dialecte du langage S), qui est dis- tribu´ e librement et dont le d´ eveloppement et la distribution sont assur´ es par plusieurs statisticiens rassembl´ es dans le ”R Development Core Team”. Chacun peut sans difficult´ e t´ el´ echarger un ex´ e- cutable pr´ ecompil´ e pour Windows (entre autres), distribu´ e par le site internet du ”Comprehensive R Archive Network”(CRAN : http://cran.r-project.org). L’utilisateur int´ eress´ e trouvera au travers de l’aide en ligne ainsi qu’en faisant une recherche sur internet un grand nombre de documents d’introduction au logiciel. R est gratuit, tr` es facile ` a installer, met ` a la disposition des utilisateurs une grande vari´ et´ e de m´ ethodes, l’utilisateur d´ ebutant pourra facilement r´ ealiser quelques analyses simples (en s’inspirant par exemple d’un document d’introduction en fran¸ cais et des exemples de l’aide en ligne), et l’utilisateur confirm´ e des analyses plus sophistiqu´ ees. 2 Installer R http://cran.cict.fr cliquer successivement sur : windows, base, R-2.7.2-win32.exe, choisir un site miroir (ex : France Toulouse), enregistrer R-2.7.2-win32.exe dans C:/Program Files/R, ex´ ecuter R-2.7.2-win32.exe pour installer R (laisser toutes les options par d´ efaut) . 3 Documentation en ligne 3.1 Manuels Cliquer sur ’aide’, ’Manuels (en PDF)’, pour afficher un manuel d’introduction. A noter : d’autres manuels sont disponibles sur internet, en voici une s´ election, le premier est en fran¸ cais : ’R pour les d´ ebutants’, Emmanuel Paradis ’Using R for Data Analysis and Graphics, an introduction’, J.H. Maindonald ’SimpleR - Using R for Introductory Statistics’ John Verzani. On trouve ´ egalement des cours ou TP : ’Introduction ` a l’analyse des statistiques des donn´ ees : travaux pratiques avec le logiciel R’, C. Pallier, C. Lalanne ’R pour la mod´ elisation et le traitement de donn´ ees - une petite introduction en 8 TP’, C. Jost Et une fiche r´ ecapitulative : ’R/Rpad Reference Card’, T. Short (http://www.rpad.org/Rpad/Rpad-refcard.pdf) 3.2 Aide en ligne Cliquer sur ’aide’, ’aide HTML’, ’search engine and keywords’. Taper par exemple ’wilcoxon’, cliquer sur ’wilcox.test’, revenir ` a la page pr´ ec´ edente, puis cliquer sur ’pairwize.wilcox.test’. Voir la derni` ere rubrique :’Examples’. Ex´ ecuter quelques exemples par ’couper/coller’. Pour visualiser l’aide en ligne de la fonction t.test (test de Student) : taper 3 ?t.test Voir dans la rubrique ’see also’, cliquer sur ’prop.test’. Voir dans la rubrique ’see also’, cliquer sur ’binom.test’. Ex´ ecuter les exemples. Pour en d´ ecouvrir plus sur les tests : help.search("test") Cliquer sur ’Aide’, ’Page d’accueil de CRAN’, ’search’, faire quelques essais (’tutorial’, ’regression’, ’anova’ par exemple). 4 G´ erer ses projets Cr´ eer un environnement de travail par projet : Pour cr´ eer un nouvel environnement de travail, pour un nouveau projet, on peut : cliquer sur l’icone R du bureau, puis sur ’fichier’, ’sauver l’environnement de travail’, et sauver cet environnement dans le r´ epertoire de son choix, en conservant bien le nom propos´ e : .RData. quitter R (cliquer sur la croix rouge en haut ` a droite, ou bien sur ’fichier’, ’sortie’, ou bien taper q() ), r´ epondre ’oui’ ` a la question ’sauver une image de la session ?’. Ainsi, on a cr´ e´ e, dans le r´ epertoire de son choix, un fichier .RData, qui contiendra tous les objets R cr´ e´ es, et que l’on retrouvera d’une session ` a l’autre, ` a moins de les avoir d´ etruits (?rm). Par la suite, pour travailler sur ce projet, il suffira de se positionner dans le r´ epertoire du projet, et de cliquer sur le fichier .RData. On y retrouvera tous les objets R pr´ ec´ edemment cr´ e´ es. 5 Lire et mettre en forme des donn´ ees A partir des fichiers excel ’d.cristaux.csv’, ’d.iris.csv’, ’d.poids.csv’, ’d.rdt.csv’ (format .csv : comma- separated-value), lire les donn´ ees, comme ci-dessous. d.crist=read.csv2("d.cristaux.csv") d.crist str(d.crist) d.iris=read.csv2("d.iris.csv",dec=".") d.iris str(d.iris) Comparer avec : d.iris=read.csv2("d.iris.csv") d.iris str(d.iris) taper ’?read.csv2’ pour comprendre la signification de l’argument ’dec’, et trouver sa ’valeur par d´ efaut’ (’,’). d.poids=read.csv2("d.poids.csv") d.poids str(d.poids) d.rdt=read.csv2("d.rdt.csv") d.rdt str(d.rdt) ls() 4 6 TESTS DE COMPARAISON DE 2 ´ ECHANTILLONS 6 Tests de comparaison de 2 ´ echantillons On compare 2 ´ echantillons pour d´ eterminer si ces ´ echantillons sont issus des mˆ emes populations. L’expression ’comparer 2 ´ echantillons’ n’est pas tout ` a fait correcte, puisque, une fois les donn´ ees recueillies, les valeurs prises pour les 2 ´ echantillons sont connues, elles sont diff´ erentes. La question est plus exactement de comparer des populations, des distributions, ou des moyennes ou m´ edi- anes (valeurs th´ eoriques inconnues, pour la population). Dans la suite, l’expression ’comparer 2 ´ echantillons’ est un raccourci pour ’comparer les param` etres de tendance uploads/s3/ tp-r-corrige 1 .pdf
Documents similaires










-
46
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Fev 01, 2022
- Catégorie Creative Arts / Ar...
- Langue French
- Taille du fichier 0.1375MB