Data management pdf Gestion des données avec R Christophe Lalanne Bruno Falissard Table des matières Introduction Importation de ?chiers CSV Structure du ?chier de données Le concept data frame Indexation d ? éléments dans un data frame Autres sources de
Gestion des données avec R Christophe Lalanne Bruno Falissard Table des matières Introduction Importation de ?chiers CSV Structure du ?chier de données Le concept data frame Indexation d ? éléments dans un data frame Autres sources de données Fichier binaire RData Fichier SPSS et Stata Base de données relationnelles et autres formats Techniques plus avancées Introduction La gestion des données sous R n ? est pas aussi évidente qu ? il n ? y para? t au premier abord C ? est essentiellement dû au fait que l ? on ne ??voit pas ? les données comme sur un tableur de type Excel Toutefois R o ?re des outils puissants de recodage des variables et de reformatage des tableaux de données et permet de lire quasiment tous les formats de ?chiers de données utilisés dans le domaine statistique Importation de ?chiers CSV Structure du ?chier de données Considérons le ?chier de données smp csv qui regroupe les données sur l ? étude de santé mentale en prison Ce ?chier comporte variables et observations individus ou unités statistiques Il s ? agit d ? un ?chier de type CSV comma separated values que l ? on peut ouvrir avec un tableur de type Excel ou n ? importe quel éditeur de texte Souvent d ? ailleurs lorsque l ? on double-clique sur un ?chier portant cette extension csv c ? est l ? application Excel ou Open O ?ce par exemple qui est proposée pour lire ce ?chier Voici à quoi ressemble ce ?chier en mode texte Ce ?chier est structuré de la manière suivante sur la première ligne ?gure le nom des variables Les données de chaque individu pour chacune de ces variables sont reportées sur une ligne séparée Les données nom de variable sur la première ligne ou valeur prise par une variable pour un individu sur les lignes suivantes appelé ??champ ? sont séparées par un même symbole appelé séparateur de champ ici un point-virgule D ? autres séparateurs de champ peuvent être utilisés par exemple des virgules des taquets de tabulation ou de simples espaces CFIGURE ?? Contenu du ?chier smp csv en vue texte CLe séparateur décimal quant à lui permet d ? indiquer à R comment sont représentés les nombres à virgules Par défaut R utilise la notation anglo- saxonne le séparateur décimal est alors un point par exemple sauf dans le cas de la commande read csv o? l ? on considère que le séparateur décimal suit la notation française une virgule comme dans Évidemment il y a des situations impossibles utiliser comme séparateur de champs des virgules imposera le point comme séparateur décimal autrement R n ? a aucun moyen d ? identi ?er correctement le nombre de champs présents sur chaque ligne du ?chier Si aucune ligne d ? en-tête n ? est présente il faudra préciser l ? option header FALSE et éventuellement fournir le nom des variables sous forme de liste via l ? option col names Cela dit il
Documents similaires
-
28
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise- Détails
- Publié le Jan 30, 2021
- Catégorie Industry / Industr...
- Langue French
- Taille du fichier 89.2kB