LAB 1: INTRODUCTION AU LANGAGE R (1/2) 2 ème année Génie Informatique Élément:
LAB 1: INTRODUCTION AU LANGAGE R (1/2) 2 ème année Génie Informatique Élément: Data mining Pr : Nabila ZRIRA 2016-2017 1 Plan ■ Langage R ■ Installation sous Windows ■ Premiers pas vers R ■ Les objets en R: vecteurs, matrices, tableaux, listes et data frames 2 Langage R ■ R est un système qui est communément appelé langage et logiciel, il permet de réaliser des analyses statistiques. ■ Plus particulièrement, il comporte des moyens qui rendent possibles la manipulation des données, les calculs et les représentations graphiques. ■ CRAN (Comprehensive R Archive Network) est un ensemble de sites qui fournit ce qui est nécessaire à la distribution de R, ses extensions, sa documentation, ses fichiers sources et ses fichiers binaires. 3 Langage R ■ un système efficace de manipulation et de stockage des données; ■ différents operateurs pour le calcul sur tableaux, en particulier les matrices; ■ un grand nombre d'outils pour l'analyse des données et les méthodes statistiques; ■ des moyens graphiques pour visualiser les analyses; ■ un langage de programmation simple et performant. 4 Installation sous Windows: Console R ■ Rendez-vous sur le site: https://cran.rstudio.com/bin/windows/base/R-3.2.2-win.exe ■ Cliquez sur : « R-3.3.3-win.exe » ■ Ensuite, suivez les consignes d'installation en laissant les valeurs par défaut. 5 Installation sous Windows: Console R 6 Installation sous Windows: RStudio ■ RStudio est disponible à l’identique pour les plateformes Windows, OS X et Linux. Pour une utilisation locale sur son poste de travail, on installera la version libre (Open Source) de RStudio Desktop depuis le site: https://www.rstudio.com/products/rstudio/download/ 7 Installation sous Windows: RStudio 8 Premiers pas vers R: quelques commandes help() L'aide de R sous format html help.start() L'aide de R sous format texte ?nom-commande help("nom-commande") L' aide pour une commande particulière assign("a",5) La fonction assign() pour réaliser une affectation a <- 5 L ’affectation en R #ceci est un commentaire Commentaire en R save.image() sauvegarder l'environnement courant dans ‘.Rdata’ objects() et ls() afficher les objets stockés en mémoire pour le répertoire courant ls.str() détails supplémentaires sur les objets en mémoire rm() ou remove() effacer les objets rm(list=ls()) effacer tous les objets sauf ceux commençant par un ‘.’ rm(list=ls(all=TRUE)) effacer l'ensemble des objets de ‘.GlobalEnv’ q() quitter 9 Les objets en R 10 ■ On appelle objets, les entités créées et manipulées par R (variables, tableaux de nombres, chaînes de caractères, fonctions ou structures construites a partir de ces composants). ■ Les noms d’objets ne peuvent commencer par un chiffre. S’ils commencent par un point, le second caractère ne peut être un chiffre. ■ Les mots réservés pour le système sont : break, else, for, function, if, in, next, repeat, return, while, TRUE, FALSE, diff, c, var… Les objets en R: modes 11 numeric nombres réels complex nombres complexes logical valeurs booléennes (vrai/faux) character chaînes de caractères function fonction list données quelconques expression expressions non évaluées Les objets en R: attributs 12 class affecte le comportement d’un objet dim dimensions des matrices et tableaux dimnames étiquettes des dimensions des matrices et tableaux names étiquettes des éléments d’un objet Les attributs d’un objet sont des éléments d’information additionnels liés à cet objet. Les objets en R: vecteurs § Dans un vecteur simple, tous les éléments doivent être du même mode. § Les fonctions de base pour créer des vecteurs sont : ü c (concaténation) ; ü numeric (vecteur de mode numeric) ; ü logical (vecteur de mode logical) ; ü character (vecteur de mode character). 13 Les objets en R: vecteurs ■ Il est possible (et souvent souhaitable) de donner une étiquette à chacun des éléments d’un vecteur. 14 Les objets en R: vecteurs ■ L’indiçage dans un vecteur se fait avec les crochets [ ]. On peut extraire un élément d’un vecteur par sa position ou par son étiquette. 15 Les objets en R: vecteurs Suites arithmétiques de raison 1 ou -1 se déclare de la manière suivante: c(a:b) > c(1:4) # a<b raison 1 > c(4:1) # a>b raison -1 [1] 1 2 3 4 [1] 4 3 2 1 La fonction c() concatène des scalaires ou des vecteurs : > x=c(1,4,9) > y=c(x,2,3) > y [1] 1 4 9 2 3 Généralisation : seq(a,b,t) où a est premier terme, le dernier b et la raison t. > seq(1,10,2) [1] 1 3 5 7 9 Pour créer un vecteur constitué de l'élément y répété n fois on utilise x=rep(y ,n). > x=rep(2,5) > x [1] 2 2 2 2 2 16 Les objets en R: matrices ■ Une matrice est un vecteur avec un attribut dim de longueur 2. Cela change implicitement la classe de l’objet pour "matrix" et, de ce fait, le mode d’affichage de l’objet ainsi que son interaction avec plusieurs opérateurs et fonctions. 17 Les objets en R: matrices ■ On extrait un élément d’une matrice en précisant sa position dans chaque dimension de celle-ci, séparées par des virgules : 18 Lorsqu’une dimension est omise dans les crochets, tous les éléments de cette dimension sont extraits : Les objets en R: fusion des matrices ■ La fonction rbind permet de fusionner verticalement deux matrices (ou plus) ayant le même nombre de colonnes. ■ La fonction cbind permet de fusionner horizontalement deux matrices (ou plus) ayant le même nombre de lignes. 19 Les objets en R: tableaux La généralisation d’une matrice à plus de deux dimensions est un tableau. Le nombre de dimensions du tableau est toujours égal à la longueur de l’attribut dim. La classe implicite d’un tableau est "array". 20 Les objets en R: tableaux 21 Les objets en R: listes ■ La liste est le mode de stockage le plus général et polyvalent du langage R. Il s’agit d’un type de vecteur spécial dont les éléments peuvent être de n’importe quel mode, y compris le mode list. 22 Les objets en R: listes ■ Pour indicer un élément d’une liste et n’obtenir que cet élément, et non une liste contenant l’élément, il faut utiliser l’opérateur d’indiçage [[ ]]. ■ Une autre — la meilleure, en fait — façon d’indicer un seul élément d’une liste est par son étiquette avec l’opérateur $ : 23 Les objets en R: Data frames ■ Un data frame est une liste de classe "data.frame" dont tous les éléments sont de la même longueur (ou comptent le même nombre de lignes si les éléments sont des matrices). ■ Bien que visuellement similaire à une matrice un data frame est plus général puisque les colonnes peuvent être de modes différents ; pensons à un tableau avec des noms (mode character) dans une colonne et des notes (mode numeric) dans une autre. ■ On crée un data frame avec la fonction data.frame ou, pour convertir un autre type d’objet en data frame, avec as.data.frame. 24 Les objets en R: Data frames vs. listes 25 Les objets en R: Data frames vs. listes 26 Les objets en R: Data frames vs. listes Liste Data frame 27 Les objets en R: Data frames ■ Le data frame peut être indicé à la fois comme une liste et comme une matrice. ■ Les fonctions rbind et cbind peuvent être utilisées pour ajouter des lignes ou des colonnes à un data frame. ■ On peut rendre les colonnes d’un data frame (ou d’une liste) visibles dans l’espace de travail avec la fonction attach, puis les masquer avec detach. 28 Suite séance prochaine! 29 uploads/s3/ r-lab-1.pdf
Documents similaires










-
34
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Aoû 15, 2021
- Catégorie Creative Arts / Ar...
- Langue French
- Taille du fichier 1.1370MB