FORMATION AU LOGICIEL R (durée : 2 jours) version du 04 Novembre 2011 André Bou
FORMATION AU LOGICIEL R (durée : 2 jours) version du 04 Novembre 2011 André Bouchier Montpellier 4 Novembre 2011 – Initiation au logiciel statistique R 2006-2011, André Bouchier (4 Novembre 2011) http://creativecommons.org/licenses/by-nc-sa/2.0/fr/ Le document « Formation au logiciel R » by A.Bouchier est mis à disposition selon les termes de la licence Creative Commons Paternité-Pas d'Utilisation Commerciale-Partage des Conditions Initiales à l'Identique 2.0 France. Montpellier 4 Novembre 2011 – Initiation au logiciel statistique R 1-Qu'est ce que R R : logiciel multiplateforme R : système statistique et graphique R : un logiciel et un langage R : logiciel libre R : un logiciel gratuit R : un logiciel au développement très actif Montpellier 4 Novembre 2011 – Initiation au logiciel statistique R 2-Installer le logiciel Obtenir le logiciel (version Windows) http://cran.r-project.org/bin/windows/base/R-2.14.0-win.exe Installer le logiciel Lancez le programme R-2.14.0-win.exe, puis suivez les instructions affichées à l’écran. Montpellier 4 Novembre 2011 – Initiation au logiciel statistique R 3- Prise en main Taper Ctrl L pour nettoyer la fenêtre ‘Rconsole’ Faire des opérations : 5+9 10^2 2^0.5 sqrt(2) Utiliser la flèche (clavier) ñ pour faire défiler les commandes déjà tapées La souris permet de sélectionner (de copier-coller) les lignes dans Rconsole Utiliser les parenthèses 4+9*2-1 = 21 (4+9)*2-1 = 25 (4+9)*(2-1) = 13 Montpellier 4 Novembre 2011 – Initiation au logiciel statistique R 4-Stocker les résultats dans des variables On construit une flèche avec < et - a<-10 b<-3 c<-a+b ou a+b->c Afficher le contenu de la variable c c [1] 13 l’ensemble peut s’écrire : a<-10 ; b<-3 ; c<-a+b ; c Montpellier 4 Novembre 2011 – Initiation au logiciel statistique R 5-Quelques opérations Arithmétique + - * / ^ (puissance) Logique > < <= >= == (égal) != (différent) & (et) | (ou) ! (non) xor (ou exclusif) exemple 8^(1/3) = racine cubique de 8 Attention aux parenthèses ! 8^1/3 = 2.666667 8^(1/3) = 2 Pour citer R dans une publication : citation() Montpellier 4 Novembre 2011 – Initiation au logiciel statistique R 6-Le répertoire de travail Par défaut, R lit et écrit dans le répertoire de travail Connaître le répertoire de travail de R : getwd() [1] "C:/Documents and Settings/bouchier/Mes documents" pour retrouver vos données soyez attentif au répertoire de travail Changer le répertoire de travail de R : Utiliser le menu : fichier-> 'Changer le répertoire courant' Montpellier 4 Novembre 2011 – Initiation au logiciel statistique R 7-Changer de répertoire de travail : fonction setwd() Le chemin du répertoire de travail peut être fastidieux à écrire setwd("C:/Documents and Settings/bouchier/Mes documents/Enquetes") Deuxième solution : setwd("~") # le répertoire perso de l'utilisateur est : ~ setwd("~/Enquetes") # erreur si ce répertoire n'existe pas Remarque : pour connaître le contenu d'un répertoire : dir() dir("~/rgis") [1] "Carto.pdf" "departement" [3] "FRA.dbf" "FRA.prj" [5] "FRA.qpj" "FRA.shp" [7] "FRA.shx" "france" [9] "LR.png" "maps.pdf" dir("~/rgis", pattern=".shp") [1] "FRA.shp" Montpellier 4 Novembre 2011 – Initiation au logiciel statistique R 8-L'environnement de travail Les données créées au cours d'une session peuvent être sauvegardées. Les fichiers de données R portent l'extension .Rdata La commande « sauver l'environnement de travail » copie toutes les données en mémoire dans un fichier à l’extension .Rdata À la fermeture, R vous propose de sauvegarder l'environnement de travail. Montpellier 4 Novembre 2011 – Initiation au logiciel statistique R 9-Lecture de données (données d'exemple) R est fourni avec des fichiers de données d'exemple liste des fichiers disponibles : data() Charger en mémoire le tableau de données "iris" data(iris) Que contient ce tableau ? iris ou head(iris) Une présentation graphique pairs(iris) En savoir plus sur ce tableau de données ?iris Montpellier 4 Novembre 2011 – Initiation au logiciel statistique R 10-Lecture de données (format binaire R) On peut stocker des données au format R (extension .Rdata) Lecture du fichier de données R « voit2005.Rdata » load(file.choose()) Le fichier de données a-t-il été chargé en mémoire ? ls() [1] "voit2005" Sauver un tableau de données Un fichier de données .Rdata peut contenir plusieurs data.frames save(iris, voit2005, file= "test.Rdata") dir(pattern=".Rdata") [1] "test.Rdata" Montpellier 4 Novembre 2011 – Initiation au logiciel statistique R 11-Objets en mémoire La fonction ls() permet de lister les objets en mémoire ls() Plus de détails avec ls.str() ls.str() print(ls.str(), max.level = 0) Effacer des objets en mémoire rm(a,b) Effacer tous les objets en mémoire rm(list=ls()) Montpellier 4 Novembre 2011 – Initiation au logiciel statistique R 12-Types de données : les classes Vector : une variable dans le sens général is.vector(x) ; as.vector(x) Factor : variable qualitative (facteur) is.factor() ; as.factor() Array : une matrice (données du même type) is.matrix() ; as.matrix() Data.frame : un jeu de données composé de vecteurs de même dimension. is.data.frame() ; as.data.frame() Montpellier 4 Novembre 2011 – Initiation au logiciel statistique R 13-Connaître le types de données Une classe d'objet peut être composé de données de différents types numérique, caractère, entier, réel, logique Utiliser la fonction typeof() ou la fonction str() a<-"inra" typeof(a) [1] "character" a<-4 typeof(a) [1] "double" a<-as.integer(a) typeof(a) [1] "integer" Montpellier 4 Novembre 2011 – Initiation au logiciel statistique R 14-Utiliser un data.frame (1) Connaître le nom des variables du data.frame names(voit2005) Les dimensions du data.frame [ lignes , Colonnes ] dim(voit2005) dim(voit2005)[1] # nombre de lignes dim(voit2005)[2] # nombre de colonnes Le nombre de colonnes length(voit2005) Montpellier 4 Novembre 2011 – Initiation au logiciel statistique R 15-Utiliser un data.frame (2) Il existe plusieurs façons d'accéder aux variables du data.frame En précisant le nom du data.frame pour chaque variable plot(voit2005$Longueur, voit2005$Largeur) Par leur numéro ( voir names(voit2005) ) plot(voit2005[,3], voit2005[,4]) En attachant le data.frame (uniquement pour la lecture) attach(voit2005) plot(Longueur, Largeur) detach() Montpellier 4 Novembre 2011 – Initiation au logiciel statistique R 16-Extraire des données d’un data.frame ( indexation ) Les 5 premières lignes avec les variables 2 à 5 voit2005[1:5, 2:5] Les 5 premières lignes mais avec les variables 1, 3 et 6 voit2005[1:5, c(1,3,6)] Toutes les lignes (sauf la 3ème), toutes les variables (sauf la 1ère) voit2005[-3, -1] Les 5 premières lignes, toutes les variables sauf les n° 1, 3, et 5 voit2005[1:5, c(-1,-3,-5)] On conserve les individus pour lesquels la puissance > 10 voit2005[voit2005$Puissance>10, ] Montpellier 4 Novembre 2011 – Initiation au logiciel statistique R 17-Extraire des données d’un data.frame ( fonction subset() ) Ne conserver que les variables "Puissance" et "Vitesse" et que les véhicules dont la vitesse maxi est supérieure à 200 km/h subset(voit2005, Vitesse > 200, select = c(Puissance, Vitesse)) Puissance Vitesse Alfa-Romeo 155 2.0 10 205 Alfa-Romeo 164 2.5 T 7 202 BMW 730i 16 222 Citroen XM 2.0i 11 201 Citroen XM V6 16 222 Ford Scorpio 2900i 15 201 Peugeot 605 Sv24 16 235 Exercice : en utilisant la fonction subset(), sélectionnez les véhicules dont la consommation est inférieure à 6l/100 et la puissance fiscale égale = 4 CV Montpellier 4 Novembre 2011 – Initiation au logiciel statistique R 18-Identifier les lignes du tableau de données Toutes les lignes d'un data.frame ont un identificateur unique row.names(voit2005) On peut accéder à un individu en particulier voit2005["Renault 21 Prima TD", ] Ou à une collection d'individus voit2005[c("Renault 21 Prima TD","BMW 518i"), 1:3] Montpellier 4 Novembre 2011 – Initiation au logiciel statistique R 19-Exercice Représentez graphiquement l'ensemble des relations x-y des données quantitatives du data.frame iris Extraire les données de la variété virginica. Quelles sont les moyennes des variables pour cette variété ( fonction mean() ) Montpellier 4 Novembre 2011 – Initiation au logiciel statistique R 20-Types de données dans un vecteur > is.numeric(iris$Petal.Length) [1] TRUE # test sur toutes les variables : sapply() retourne une liste > sapply(iris, is.numeric) Sepal.Length Sepal.Width Petal.Length Petal.Width Species TRUE TRUE TRUE TRUE FALSE # numéro des variables numériques > which(sapply(iris, is.numeric)) Sepal.Length Sepal.Width Petal.Length Petal.Width 1 2 3 4 # noms des variables numériques > names(which(sapply(iris, is.numeric))) [1] "Sepal.Length" "Sepal.Width" "Petal.Length" "Petal.Width" # Récupération des numéros de variables > as.vector(which(sapply(iris, is.numeric))) [1] 1 2 3 4 # Représentation graphique > numero<-which(sapply(iris, is.numeric)) > pairs(iris[ , numero]) Montpellier 4 Novembre 2011 – Initiation au logiciel statistique R 21-Générer une séquence Répéter une valeur rep("non", 20) Séquence simple z<-2:12 Attention, avec x<-10 comparez 1:x-1 et 1:(x-1) On peut utiliser la fonction seq() pour modifier l'incrément seq(1, 9, 0.5) La fonction seq() peut calculer les éléments de la série seq(length=8, from=1, to=5) [1] 1.000000 1.571429 2.142857 2.714286 3.285714 3.857143 4.428571 5.000000 Montpellier 4 Novembre 2011 – Initiation au logiciel statistique R 22-Les séquences aléatoires Loi normale x<-rnorm(1000,mean=0, sd=1) Loi uniforme x<-runif(100,min=2,max=4) On peut vérifier la précision de ces fonctions avec mean(x) ;var(x) exercice : essayez avec 10 , 100 individus, puis avec 10000 et 100000 Montpellier 4 Novembre 2011 – Initiation au logiciel statistique R 23-Demander de l’aide En savoir plus sur une fonction ?mean ?median ?IQR Comment importe-t-on des fichiers textes ? ?read.table Montpellier 4 Novembre 2011 – Initiation au logiciel statistique R 24-Écrire des scripts avec un éditeur de texte Première solution : éditeur de script R Ouvrez l'éditeur de texte fourni par R Saisissez vos commandes # 1000 valeurs suivant une loi normale {0,1} x<-rnorm(1000,mean=0, sd=1) #Calcul de la moyenne mean(x) #Calcul de la uploads/Litterature/ cours-r-2011.pdf
Documents similaires










-
25
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Nov 11, 2021
- Catégorie Literature / Litté...
- Langue French
- Taille du fichier 0.8641MB