IUT2 Grenoble Département STID Cours de Logiciel SAS™ 2000/2001 COURS, TP Modul

IUT2 Grenoble Département STID Cours de Logiciel SAS™ 2000/2001 COURS, TP Modules utilisés : Base, Stat, Insight, Ets, Graph, Assist Eric PREUD'HOMME I.G.W.T. Juin 2001 IUT II Dept STID BP 47 38040 Grenoble Cedex 09 Tél: 0476825641 Fax:0476825640 Introduction Le « système SAS™ » est LE logiciel de traitement de données1. Les procédures SAS sont très complètes et dépassent largement le cadre du DUT STID. SAS™ est très répandu. Il a acquis depuis son lancement en 1960 une situation dominante dans beaucoup de secteurs d’activités. En France l’INSEE, ELF, EDF et depuis peu les banques, les assurances, les CAF l’ont adopté. SAS™ peut s’utiliser, dans le cadre de votre formation, en assimilant le langage SAS2 ou en utilisant les modules « cliquer-résultat » comme SAS/ ASSIST ou SAS Enterprise Guide. Nous privilégierons la première approche car elle permet une utilisation plus approfondie de SAS™ même si c’est au prix d’un certain temps d'apprentissage. Ajoutons que SAS™ ne peut être utilisé « convenablement » que par des personnes ayant les connaissances requises en statistiques et en programmation. Il est devenu incontournable dans la majorité des stages et offres d’emplois qui nous arrivent. Le Système SAS™ fonctionne sur plusieurs systèmes (MAC, PC Dos et WINDOWS, UNIX...). La version WINDOWS nécessite: 16 M0 de mémoire vive RAM (minimum) 500 M0 sur le disque dur. (minimum) Ce logiciel est commercialisé par : SAS INSTITUTE B.P.5 77166 GREGY-SUR-YERRES : 0160621111 Fax:0160621199 Contact : Ariane Ligier – Bellair SAS™ est une marque déposée par SAS Institute Inc. 1 SAS commercialise un autre logiciel statistique (très convivial) SAS JMP3.2. Il n’occupe que quelques mégas sur le disque dur. Il est très convivial (menus...) et assez complet (Plans d’expériences, Surfaces de réponse, Régression logistique...) mais malheureusement limité dans certains domaines (importation de données, paramètrage des sorties, des plans d’expériences fractionnés...). Néanmoins, il peut être une alternative intéressante pour ceux qui n’ont pas besoin de toute la puissance du système SAS ou qui sont allergiques au langage SAS ! 2 SAS possède en fait 3 langages. Le langage SAS et son module Macros bien sûr, mais aussi le langage SQL bien connu dans l’univers des SGBD et le langage le SCL pour créer des applications type Visual Basic (SAS/AF, SAS/FSP) IUT II Département S.T.I.D. Cours de logiciel SAS. Page 2 E. PREUD’HOMME © I.G.W.T. Juin 2001 E. Mail :preudhom@iut2.upmf-grenoble.fr SOMMAIRE I. Premier contact avec SAS......................................................................................................8 A. Cinq fenêtres essentielles.............................................................................................................8 B. Mon premier programme SAS..................................................................................................11 1. Saisie du programme..................................................................................................................................11 2. Sauvegarde des instructions du programme...............................................................................................13 3. Exécution du programme (F8)...................................................................................................................13 4. Visualisation des résultats et personnalisation de la fenêtre OUTPUT (complément)...........................14 5. Sauvegarde des résultats contenus dans OUTPUT....................................................................................15 6. Sauvegarde du fichier des données............................................................................................................15 7. Ne confondez pas.......................................................................................................................................16 II. Fichiers de données SAS ...................................................................................................17 A. Préliminaires sur les fichiers de données SAS.........................................................................17 1. Nom logique d’un fichier de données SAS................................................................................................17 2. Les 2 bibliothèques prédéfinies WORK et SASUSER..............................................................................18 3. Comment créer VOTRE bibliothèque ?.....................................................................................................19 4. Visualisation du contenu d’un fichier, modifications...............................................................................22 B. Conversion automatique d’un fichier EXCEL (File/Import).................................................24 1. Choix du type de fichier.............................................................................................................................24 2. Emplacement du fichier à convertir...........................................................................................................25 3. Nom du fichier SAS obtenu.......................................................................................................................25 4. Visualisation du fichier SAS......................................................................................................................26 C. Fichier de données créé dans un programme SAS : étape DATA.........................................31 1. Données incluses dans le programme. (CARDS)......................................................................................31 2. Utilisation de fichiers de données SAS existants : Instruction SET.........................................................36 D. Utilisation de données SAS dans les Procédures ou les étapes DATA)..................................64 1. Sélection sur les variables..........................................................................................................................65 2. Sélection d’individus..................................................................................................................................67 III. L’ODS : Gestion des sorties SAS......................................................................................73 A. Quelques notions basiques sur l’HTML..................................................................................74 B. Utilisation de l’ODS de SAS. Objets de sortie.........................................................................77 C. Trois sorties possibles................................................................................................................79 1. Sortie HTML basique.................................................................................................................................80 2. Sélection d’objets en sortie : ODS TRACE, ODS SELECT, ODS EXCLUDE.......................................82 3. Sorties HTML sophistiquées......................................................................................................................87 4. Sorties HTML pour les graphiques............................................................................................................97 5. Sorties vers des fichiers de données.........................................................................................................107 IV. Analyse interactive de données : SAS/INSIGHT...........................................................112 A. Ouverture d’une table.............................................................................................................112 1. Aperçu rapide de quelques menus............................................................................................................114 B. Analyse d’une Variable qualitative........................................................................................116 C. Variable quantitative ; Analyse univariée.............................................................................120 1. Boxplots, histogrammes, moments..........................................................................................................120 2. Fonction de répartition.............................................................................................................................123 3. Densité de probabilité...............................................................................................................................124 D. Etude de plusieurs variables quantitatives............................................................................126 1. Nuage de points (scatter plot)...................................................................................................................126 2. Stratification par une variable qualitative, ou quantitative agrégée (TOOL).........................................126 IUT II Département S.T.I.D. Cours de logiciel SAS. Page 3 E. PREUD’HOMME © I.G.W.T. Juin 2001 E. Mail :preudhom@iut2.upmf-grenoble.fr 3. Régression (Fit XY).................................................................................................................................129 4. Représentation 3D interactive..................................................................................................................131 5. Lancement d’INSIGHT avec le langage SAS.........................................................................................132 V. Quelques procédures statistiques ...................................................................................134 A. SORT (Trier des fichiers)........................................................................................................135 B. PRINT (Afficher un fichier dans l’OUTPUT).......................................................................136 C. TABULATE.............................................................................................................................139 D. RANK (Calculs de rangs)........................................................................................................146 E. UNIVARIATE (Analyse univariée).......................................................................................148 1. Syntaxe:.....................................................................................................................................................148 2. Détails.......................................................................................................................................................150 3. Exercices ..................................................................................................................................................151 F. TTEST (Tests de Student à un ou deux échantillons, appariés ou non)..............................152 1. Syntaxe simplifiée....................................................................................................................................152 2. Rappels théoriques....................................................................................................................................153 3. Exercices:..................................................................................................................................................155 G. FREQ (tris à plat, tris croisés, test d’indépendance du chi2)...............................................156 1. Syntaxe simplifiée....................................................................................................................................156 2. Exemples...................................................................................................................................................156 3. Quelques options de la commande TABLES..........................................................................................158 4. Exercice....................................................................................................................................................160 5. Cas Particulier important, TEST du chi2 sur un tri croisé existant.........................................................161 6. Rappels théoriques sur le test d'indépendance du χ 2.............................................................................162 H. ANOVA et GLM, Analyse de la variance .............................................................................163 1. Un exemple...............................................................................................................................................163 2. ANOVA à un critère.................................................................................................................................163 3. Mise en pratique sous SAS ......................................................................................................................166 4. Exercices...................................................................................................................................................169 5. ANOVA à deux critères de classification (modèle fixe).........................................................................171 I. NPAR1WAY :Quelques méthodes non paramétriques..........................................................174 1. Préliminaires.............................................................................................................................................174 2. Test de Kolmogorov-Smirnov..................................................................................................................174 3. Test de Mann et Whitney (ou Wilcoxon ou White)...............................................................................179 4. Le test de Kruskal et Wallis ....................................................................................................................182 J. CORR , calcul des coefficients de corrélations.......................................................................184 1. Syntaxe simplifiée....................................................................................................................................184 2. Test de nullité...........................................................................................................................................184 K. PRINCOMP, Analyse en Composantes Principales............................................................189 1. Syntaxe simplifiée....................................................................................................................................189 2. Exercice....................................................................................................................................................191 L. STANDARD , normalisation de variables.............................................................................203 M. CLUSTER : Classification d’individus.................................................................................206 1. But.............................................................................................................................................................206 2. Choix de la distance ................................................................................................................................206 3. Qualité de la typologie.............................................................................................................................206 4. Algorithme................................................................................................................................................207 5. Mise en œuvre (Proc CLUSTER)............................................................................................................208 6. Exercice ...................................................................................................................................................214 N. CORRESP Analyse des correspondances simples.................................................................215 1. Étude des profils lignes............................................................................................................................216 2. Etude des profils colonnes........................................................................................................................223 IUT II Département S.T.I.D. Cours de logiciel SAS. Page 4 E. PREUD’HOMME © I.G.W.T. Juin 2001 E. Mail :preudhom@iut2.upmf-grenoble.fr 3. Lien entre les deux analyses.....................................................................................................................227 4. Syntaxe de PROC CORRESP sous SAS..................................................................................................229 O. CORRESP Analyse des Correspondance Multiples ............................................................231 1. Tableau disjonctif complet.......................................................................................................................231 2. Exemple....................................................................................................................................................231 P. DISCRIM : L’Analyse discriminante.....................................................................................247 1. L’analyse factorielle discriminante..........................................................................................................248 2. L’analyse discriminante Bayesienne........................................................................................................257 Q. La commande FORECAST (Etude de séries chronologiques)............................................269 1. Visualisation de la série............................................................................................................................271 2. Choix d’un modèle de lissage..................................................................................................................272 3. Estimation des paramètres........................................................................................................................273 4. Précision de l’ajustement..........................................................................................................................274 5. Calcul des prévisions................................................................................................................................274 VI. Quelques procédures de gestion de fichiers....................................................................276 A. FORMAT (Créer de nouveaux formats)................................................................................276 1. Objet..........................................................................................................................................................276 2. Syntaxe simplifiée...................................................................................................................................276 3. Exemples...................................................................................................................................................278 4. Visualisation des formats utilisateurs.......................................................................................................279 5. Exercices...................................................................................................................................................280 6. Format permanent Library= ; puis Libname library ‘nom de bibliothèque’ ;........................................281 7. Masques d’affichage (picture)..................................................................................................................283 8. Informat (INVALUE)...............................................................................................................................287 9. Compléments............................................................................................................................................289 B. TRANSPOSE (Transposer un fichier)...................................................................................290 C. CONTENTS (Inventaire d’une bibliothèque).......................................................................293 D. DATASETS (gestion de bibliothèques, de fichiers de données)...........................................296 1. Concaténation de fichiers.........................................................................................................................297 2. Changement de nom d’un fichier.............................................................................................................299 3. Inventaire d’une bibliothèque, informations sur un fichier.....................................................................299 4. Suppression de fichiers.............................................................................................................................299 5. Copie de fichiers.......................................................................................................................................300 6. Modifications sur les variables d’un fichier (format, nom...).................................................................301 7. Réparer des fichiers endommagés par une panne système.....................................................................302 VII. Une autre façon d'utiliser SAS: SAS / ASSIST............................................................303 A. Présentation..............................................................................................................................303 B. Comment lancer SAS/ASSIST ?.............................................................................................304 C. Exemple d'utilisation de SAS/ASSIST: ................................................................................304 D. Comment obtenir les instructions SAS qui ont donné le résultat précédent.......................306 VIII. PETIT DICTIONNAIRE ANGLAIS-FRANCAIS......................................................308 IX. BIBLIOGRAPHIE COMMENTEE................................................................................309 X. ANNEXES.........................................................................................................................312 A. Raccourcis clavier....................................................................................................................313 B. OPERATEURS ET FONCTIONS.........................................................................................314 1. Les opérateurs...........................................................................................................................................314 2. Les fonctions.............................................................................................................................................316 C. Format et Informat..................................................................................................................321 IUT II Département S.T.I.D. Cours de logiciel SAS. Page 5 E. PREUD’HOMME © I.G.W.T. Juin 2001 E. Mail :preudhom@iut2.upmf-grenoble.fr 1. Formats.....................................................................................................................................................321 2. Les Informats............................................................................................................................................329 D. Commande ou fenêtre OPTIONS en langage SAS...............................................................332 1. La fenêtre d’options..................................................................................................................................332 2. L’instruction..............................................................................................................................................333 E. Echange dynamique de données SAS-EXCEL :Liaisons DDE ...........................................335 1. Voyons un exemple de transfert SAS vers Excel....................................................................................335 2. Transfert Excel vers SAS.........................................................................................................................336 3. Applications..............................................................................................................................................337 F. Quelques procédures usuelles..................................................................................................339 G. Execution d’un FICHIER DE COMMANDES SAS depuis le DOS...................................341 H. Importation de fichiers ayant un format connu PROC IMPORT.......................................342 I. Exportation de fichiers PROC EXPORT................................................................................343 J. Complément : Données importées d’un fichier texte ASCII externe ...................................344 1. L’EFI.........................................................................................................................................................344 2. Instruction INFILE : Syntaxe simplifiée..................................................................................................347 3. Données ou fichiers inhabituels...............................................................................................................349 4. Lecture des données par colonnes dans un fichier ASCII externe..........................................................353 K. Utilisateurs du système SAS en France au 1.1.1996..............................................................357 L. INDEX ........................................................................................................................................................358 IUT II Département S.T.I.D. Cours de logiciel SAS. Page 6 E. PREUD’HOMME © I.G.W.T. Juin 2001 E. Mail :preudhom@iut2.upmf-grenoble.fr Pour bien utiliser ce cours... "J'entends, j'oublie J'apprends, je retiens Je fais, je comprends" Proverbe chinois3 Le but de ce cours est de vous présenter une petite palette d’outils SAS afin de mettre en pratique vos connaissances en statistiques et en informatique. On ne peut faire le tour des possibilités de SAS en 50H de TD! Il en faudrait au moins 5 fois plus ! Nous avons donc omis une grande partie des nombreuses options des procédures, commandes et instructions4. L’aide en ligne du logiciel ou l’excellente documentation papier5 sont là pour vous permettre d’approfondir les notions vues en cours. Pour que ce cours soit profitable, il faut le travailler uploads/Management/ cours-tp-sas.pdf

  • 21
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Jui 15, 2022
  • Catégorie Management
  • Langue French
  • Taille du fichier 1.7858MB