See discussions, stats, and author profiles for this publication at: https://ww

See discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/322752457 Formation STATA : Principaux éléments et commandes d'initiation au logiciel Stata Presentation · July 2013 DOI: 10.13140/RG.2.2.30538.67527 CITATIONS 0 READS 21,330 1 author: Some of the authors of this publication are also working on these related projects: MRE Transfers View project Abdeljaouad Ezzrari High Commission of planning - Morocco 12 PUBLICATIONS 44 CITATIONS SEE PROFILE All content following this page was uploaded by Abdeljaouad Ezzrari on 28 January 2018. The user has requested enhancement of the downloaded file. www.hcp.ma Formation STATA Abdeljaouad EZZRARI, Haut-Commissariat au Plan Juillet 2013 01/08/2013 1 www.hcp.ma Plan  Introduction  Présentation du logiciel Présentation de l’interface Comment transférer une base de données en format Stata  Fonctions et expressions  Description des données Describe  List  codebook  lookfor 02/08/2013 2 www.hcp.ma Plan  Les Extensions de fichiers Stata  Fichier programme (*.do)  Fichier données (*.dta)  Fichier résultats (*.log ou smcl)  Commandes de gestion des variables Etiquetage des variables et des modalités  Création d’une nouvelle variable (quintile, décile, etc.) Transformation d’une variable Boucles 02/08/2013 3 www.hcp.ma Plan  Fusion des bases des données  Ajouter des variables Ajouter des observations  Agréger des variables  Pondération  Commandes de base de tabulation statistique Statistique descriptive et fréquence (variables qualitatives et quantitatives) Tableaux de croisements (variables qualitatives) Liaison entre les variables qualitatives et les variables quantitatives Tests usuels 02/08/2013 4 www.hcp.ma Plan  Graphiques dans Stata  Histogramme Diagramme en barre ou en secteurs  Nuages de points, etc.  Matrices dans Stata  Régressions dans stata Moindres carrés ordinaires (MCO) et tests Données de Panel Econométrie des variables qualitatives 02/08/2013 5 www.hcp.ma Plan  Cartographie des indicateurs dans Stata  Ajout de nouveaux modules Stata 02/08/2013 6 www.hcp.ma Introduction  Stata est un logiciel complet permettant l’analyse statistique et économétrique développé par Stata Corporation.  C’est un logiciel particulièrement utilisé en épidémiologie et en économie.  Ce logiciel est actuellement à la version 13.  Il existe pour tous les systèmes d’exploitation (Windows, Linux, Mc, etc.). 01/08/2013 7 www.hcp.ma Introduction  Mode de fonctionnement : Mode commande interactif  Mode Menu  Mode de programmation (fichiers .do)  C’est un logiciel assez flexible et complet. Possibilité de faire de programmation.  Contrairement à d’autres logiciels (SAS, R, etc.), Stata a des problèmes pour gérer de très grosses bases de données. 01/08/2013 8 www.hcp.ma Formation STATA Abdeljaouad EZZRARI, Haut-Commissariat au Plan Juillet 2013 Review Results Variables Commands Do-file Ouvrir un fichier programme Ouvrir l’éditeur des données Browse : voir les données Affiche les commandes tapées par l’utilisateur Affiche tous les résultats des commandes tapées par l’utilisateur Détaille toutes les variables présentes dans la BD Permet à l’utilisateur de taper les commandes Présentation du logiciel 1- Présentation de l’interface 01/08/2013 9 www.hcp.ma Présentation du logiciel 2- Lire ou transférer une BD au format Stata  Si le fichier est déjà au format Stata, pour l’ouvrir il faut taper : use "nom_fichier.dta ", clear (ouvrir la totalité du fichier) use var1 var2 var3 …. using "nom_fichier.dta", clear (n’ouvrir le fichier qu’avec les variables mentionnées var1 var2 var3…) clear pour effacer le fichier de données déjà utilisé par Stata 01/08/2013 10 www.hcp.ma Présentation du logiciel 2- Lire ou transférer une BD au format Stata Si le fichier n’est pas au format Stata :  utiliser le Stat Transfer : c’est un logiciel qui permet de convertir les données utilisables sous un autre format (Excel, SAS, R, Limdep, SPSS, etc.) au format Stata.  Stata peut lire les données également sous format ASCII. Dans ce cas on utilise souvent les trois commandes suivantes :  infile  insheet  infix 01/08/2013 11 www.hcp.ma Présentation du logiciel 2- Lire ou transférer une BD au format Stata  on utilise infile si les données sauvegardées dans un fichier sont séparées par un espace, pour lire les données on utilise : infile var1 var2 var3 ….. using "exercice1.prn" , clear  on utilise insheet si les données sauvegardées dans un fichier sont séparées par des tabulations, pour lire les données on utilise insheet var1 var2 var3 ….. using "exercice1.txt" , clear (le fichier ne contient pas les noms des variables) insheet using "exercice1.txt" , clear (fichier contient les noms des variables) 02/08/2013 12 www.hcp.ma Présentation du logiciel 2- Lire ou transférer une BD au format Stata  on utilise infix s’il n’y aucune séparation entre les données. Dans ce cas, on aura besoin d’un autre fichier qui spécifie la disposition des données, c’est-à-dire un dictionnaire des variables. Exemple : On observe pour 4 ménages, 5 variables : identifiant (premier chiffre), milieu (second chiffre), âge du CM (deux suivants), revenu du ménage (5 chiffres qui suivent) et région (variable alphanumérique : dixième position) : 113007000A 225515000B 314904500A 423409000B Pour lire les données on utilise : infix identifiant 1 milieu 2 age 3-4 revenu 5-9 str region 10 using "classeur1.prn" , clear 01/08/2013 13 www.hcp.ma Présentation du logiciel 2- Lire ou transférer une BD au format Stata  Finalement après avoir lu les données, il faut les sauvegarder dans un fichier stata à l’aide de la commande : save "nom_fichier ", replace replace sert à remplacer le fichier s’il existe déjà  Saisie manuelle des données (peu pratique) : On utilise la commande input input identifiant milieu age revenu str1 region 1 1 30 7000 A 2 2 55 15000 B 3 1 49 4500 A 4 2 34 9000 B end 01/08/2013 14 Var. alphanumérique qui prend une position www.hcp.ma Fonctions et expressions 1. Opérateurs arithmétiques 2. Opérateurs de relation 3. Opérateurs logiques Addition + Supérieur Inférieur > < OU (alt gr + 6) | Soustraction - Supérieur ou égal >= ET & Multiplication * Inférieur ou égal <= Division / Egal Egal (s’il y a if) = == Exposant ^ Différent ~= != 01/08/2013 15 www.hcp.ma Fonctions et expressions 4. Fonctions 5. Expressions by, if et in Racine carrée sqrt by : permet de répéter une commande pour chaque valeur (ou modalité) d’une variable donnée. Syntaxe générale pour by est : by variables : commande … Exponentielle exp Logarithme log ln if : permet de spécifier les conditions dans lesquelles une commande doit être exécutée. Syntaxe générale pour if est : commande …. if condition Valeur Absolue abs Partie entière int in : permet de spécifier les observations auxquelles s’applique une commande. Syntaxe générale pour in est : commande …. in intervalle 01/08/2013 16 www.hcp.ma Description des données Il y a plusieurs commandes qui permettent de décrire et de voir les données :  edit : voir la base de données et permet de la modifier à la main edit ou edit variables  browse : voir la base de données et ne permet pas de la modifier à la main browse ou browse variables  describe : la commande describe permet de décrire les données de façon générale (format de la variable, label des modalités de la variable, label de la variable) describe : décrit toute la base describe variables : ne décrit que les variables indiquées 01/08/2013 17 www.hcp.ma Description des données insheet using "c:\formation_stata\exercice1.txt", clear describe describe age sexe Note: dataset has changed since last saved Sorted by: revenu int %8.0g abonnement byte %8.0g age byte %8.0g sexe byte %8.0g variable name type format label variable label storage display value size: 75 vars: 4 obs: 15 Contains data sexe byte %8.0g age byte %8.0g variable name type format label variable label storage display value 01/08/2013 18 www.hcp.ma Description des données  list : permet d’afficher la base de données ou un extrait de cette base dans la fenêtre des résultats list ou list variables insheet using "c:\formation_stata\exercice1.txt", clear list in 1/6 , voir la base de données pour uniquement les 6 premières observations 6. 1 47 1 2900 5. 0 47 0 2600 4. 0 44 1 3500 3. 0 54 0 1400 2. 0 46 0 1250 1. 0 45 0 1234 sexe age abonne~t revenu 01/08/2013 19 www.hcp.ma Description des données  codebook : permet de créer un dictionnaire des variables indiquant le nom de la variable, son label, son format, l’intervalle de ses valeurs, sa moyenne, son écart type, des quantiles (variable continue), fréquences des modalités et leurs labels (variable discrète) , etc. insheet using "c:\formation_stata\exercice1.txt", clear codebook sexe revenu 1250 2350 3000 4900 6000 percentiles: 10% 25% 50% 75% 90% std. dev: 1743.76 mean: 3356.27 unique values: 15 missing .: 0/15 range: [1234,7000] units: 1 type: numeric (int) revenu (unlabeled) 10 1 5 0 tabulation: Freq. Value unique values: 2 missing .: 0/15 range: [0,1] units: 1 type: numeric (byte) sexe (unlabeled) 01/08/2013 20 www.hcp.ma Description des données  lookfor : c’est une commande qu’on utilise pour chercher les variables d’une grande base de données à partir des libellés des variables. Le cas des Enquêtes DHS (noms des variables représentent le numéro des questions). use "D:\D\ENPSF_2011\Household 1.dta", clear lookfor eau h502d double %10.0g h502d zone souffre d'une éruption des eaux uploads/Ingenierie_Lourd/ formation-stata-hcp-pdf.pdf

  • 13
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager