SAS v.2.01 Octobre 2005 (c) DESMET Pierre 2005 – sas_2005.doc p. 1 Avertissemen
SAS v.2.01 Octobre 2005 (c) DESMET Pierre 2005 – sas_2005.doc p. 1 Avertissement : Les programmes donnés dans ce document n'ont qu'une vertu pédagogique et ne visent qu'à illustrer les différents concepts et méthodes du marketing sur bases de données. Aucune garantie n'est donnée quant à leur bon fonctionnement. Pour une utilisation professionnelle, consulter les sociétés conseils spécialisées dans le langage utilisé. V2.01 Introduction au logiciel SAS © Pierre Desmet Support en ligne : http://www.marketing-science-center.com SAS v.2.01 Octobre 2005 (c) DESMET Pierre 2005 – sas_2005.doc p. 2 INTRODUCTION A SAS SAS (Statistical Analysis System) est un logiciel de traitement de données adapté au traitement de grosses bases de données et aux besoins de traitement d’information liés à la gestion des relations clients (CRM, Datawarehouse, Datamining). Il est utilisé par de nombreuses grandes entreprises. Il composé d'un ensemble de routines ayant trait à l'analyse statistique univariée, à l'analyse statistique multivariée, à la recherche opérationnelle commercialisés par modules : BASE (éléments de base), STAT (méthodes statistiques), IML (programmation directe en langage matriciel), GRAPH (graphiques), etc. La description d'une tâche soumise à SAS (analyse de variance sur un fichier de données par exemple) se fait en utilisant des instructions propres à SAS (en anglais) et en respectant certaines règles d'organisation de ces instructions et les exigences de SAS. La documentation SAS, très volumineuse, comporte un rappel des éléments statistiques, les nombreuses options de chaque procédure et des exemples. ENVIRONNEMENT SAS FENETRES DE TRAVAIL En mode interactif, un traitement SAS comporte 3 fenêtres : - Une fenêtre d’édition du fichier d’instructions (programme SAS) écrit par l’utilisateur. Il est conseillé de l’organiser pour une lecture et un repérage facile des étapes du traitement. - Une fenêtre LOG décrivant l’exécution, le nombre d’observations et les anomalies éventuelles. Elle doit être consulté AVANT les résultats car il permet de vérifier le nombre de données traitées, la fin normale de chaque procédure, les fichiers créés, ainsi que les erreurs (en rouge). … Chaque exécution d’une instruction est identifiée par un numéro de ligne séquentiel remis à zéro à la fin d’un session SAS. - Une fenêtre OUTPUT présente les résultats demandés. ETAPES 1. Le programme est d’abord écrit dans la fenêtre d’édition. Au cours de l’écriture les couleurs des lettres changent automatiquement selon la nature du texte : commentaire (vert), instructions SAS (bleu), étapes Proc ou Data (gras). Les erreurs apparaissent tout de suite en rouge. 2. Le programme est exécuté (submit) avec F8 ou en cliquant sur l’icône du petit bonhomme qui marche dans le bandeau supérieur après avoir sélectionné la partie du programme que l’on souhaite traiter. La partie exécutée doit OBLIGATOIREMENT se terminer par une instruction RUN (sinon il ne se passe rien !) - En cas de problème pour arrêter un programme (break), utiliser le point d’exclamation ( !). - La croix (X) EFFACE tout le contenu ( !) 3. Le fichier LOG indique les erreurs éventuelles, certaines sont des indications (Note) comme par exemple une taille de format trop petit pour le nombre à afficher, d’autres sont fatales (Errror) et arrêtent l’exécution du programme (les étapes suivantes ne sont pas exécutées). 4. Vous pouvez ensuite étudier les résultats dans le fichier OUTPUT. SAS v.2.01 Octobre 2005 (c) DESMET Pierre 2005 – sas_2005.doc p. 3 La stratégie d’élaboration du programme consiste à exécuter pas-à-pas (par groupes de quelques instructions) sur une petite partie du fichier en vérifiant très précisément - que l’exécution s’est bien déroulée (LOG d’abord !). Tout simplement parce que, si une erreur est intervenue mais que la table avait déjà été créée auparavant, les procédures peuvent être exécutées et, à votre grand désespoir !, aucune modification n'a été effectuée. - que les résultats sont conformes aux attentes, - puis de lancer l’exécution du programme pour l’ensemble du fichier. MISE AU POINT DU PROGRAMME La mise au point définitive d’un programme peut être longue et difficile. Voici quelques conseils : - vérifier que ce que vous souhaitez est bien effectué par les instructions que vous avez écrites soit par des impressions (Print) ou en allant voir directement le contenu du tableau. Une vérification précise des premières observations de chaque tableau est une habitude qui vous fera gagner BEAUCOUP de temps dans la mise au point. - limiter le traitement aux premières observations pour effectuer d’abord la vérification de la syntaxe. DATA in; * tableau de lecture ; IF _N_ <100 ; - exécuter pas-à-pas et successivement chacune des étapes en mettant des RUN après chaque étape. DATA in; …; RUN; * <<<<<< demande d’execution ; PROC PRINT ; RUN; SAS v.2.01 Octobre 2005 (c) DESMET Pierre 2005 – sas_2005.doc p. 4 GESTION DE L’ESPACE DE TRAVAIL EXPLORER (fenêtre à droite) permet de visualiser l’environnement. Dans l’espace temporaire de travail (WORK), on peut faire apparaître les tableaux créés pour (1) visualiser leur contenu sous forme d’un tableur (2) les détruire éventuellement. il faut SAUVEGARDER REGULIEREMENT le travail surtout si les exécutions sont longues et les fichiers volumineux car les plantages de PC sont fréquents. Prévoir aussi des sauvegardes externes (disquette, Zip). AIDE EN LOCAL Cliquer sur le livre rouge (?) sur le bandeau haut à droite. La fenêtre suivante montre un exemple sur une procédure PRINT. - CONTENTS contient des exemples et Tutorials - utiliser l’INDEX, ou SEARCH pour rechercher des informations sur un mot clé ou avoir la description de la syntaxe attendue par SAS. Le mode éditeur permet d’ajuster la taille et la position de ces fenêtres et, à l’intérieur, de couper, coller, vider la fenêtre et facilite la gestion de la navigation dans la fenêtre par l’ascenseur. SAS v.2.01 Octobre 2005 (c) DESMET Pierre 2005 – sas_2005.doc p. 5 LES RESSOURCES EN LIGNE La communauté mondiale des utilisateurs SAS est importante. Des clubs nationaux se réunissent, des journées d’études (club utilisateurs) annuelles sont organisées et de nombreux sites web proposent des ressources complémentaires. - La documentation en ligne : http://www.dms.umontreal.ca/Informatique/Labos/logiciels/sashtml/onldoc.htm - Le serveur officiel SAS ftp : contient des notes techniques (répertoire technote) et des utilitaires et des macros (ensemble d’instructions utilisable comme une sous-routine dont on modifie les paramètres) dans le répertoire stat. http://ftp.sas.com/techsup/download - Exemples de programmes avec données (SAS) : http://ftp.sas.com/techsup/download/sample/samp_lib/statsampSASSTAT_Sample_Programs.html - L ’aide en ligne http://sashelp.com/ - Des macros http://www.sas.com/service/techsup/faq/stat_macro.html - Des astuces avec des exemples http://www.umich.edu/~cscar/sas/code.html - Des supports de cours en français : http://www.ecn.ulaval.ca/aide/sas/index.html http://www.dms.umontreal.ca/~stat/logiciels/sas/mini-guide/SAS.html - des forums SAS-L@listserv.uga.edu pour s’y inscrire envoyer un message contenant seulement SUBSCRIBE SAS-L à l’adresse listserv@uga.cc.uga.edu - Un groupe de discussion comp.soft-sys.sas - Des sites personnels avec macro et réponses aux questions fréquentes (FAQ) http://members.tripod.com/~schick/ SAS v.2.01 Octobre 2005 (c) DESMET Pierre 2005 – sas_2005.doc p. 6 SAS © 1 INTRODUCTION Un programme SAS est une liste d'instructions décrivant au logiciel l'endroit où se trouvent les données à traiter, la manière dont elles se présentent et ce qu'il faut en faire. BASES DU LANGAGE Une instruction Chaque instruction se termine toujours par un point-virgule (;). Son oubli est une erreur (fréquente) qui empêche le bon déroulement du programme. Les lettres autorisées correspondent au code ASCII de base, il faut donc éviter : les espaces, les accentuations (é, à, ç,…) ainsi que les caractères spéciaux qui peuvent avoir une signification particulière pour SAS. Un commentaire Penser à indérer des commentaires pour rendre le programme plus compréhensible. On peut aussi désactiver des lignes de programme sans les détruire en les transformant en commentaires. - pour des caractères : * commentaire sur une ligne ; - pour désactiver un ensemble de lignes /* lignes successives */ Des étapes successives et différentes : PROC, DATA - L’étape DATA, table ou tableau, est la description de l'agencement des données dans le fichier à traiter, - L’étape PROC ou procédurale est la description des manipulations à faire subir à une table spécifiée dans DATA = . Une étape DATA commence par le nom DATA et se finit par RUN ou lorsque le mot PROC est rencontré (et inversement). Il peut y avoir plusieurs phases DATA et phases PROC dans un même fichier d'instructions SAS pour autant que l'on respecte la logique, premièrement de description des données puis, deuxièmement, de traitement de ces données. Chaque étape se termine par l’instruction RUN. Par défaut l’étape PROC travaille sur le dernier DATA créé. /************************************************************/ /* premier programme */ /************************************************************/ DATA in; * tableau de lecture ; Instructions … PROC PRINT data=in ; * impression ; DATA Tab1 ; … PROC SORT data=tab1 * tri des observations ; Une variable Une variable est, par défaut, définie uniquement à l’intérieur de son tableau (data). - Le nom de variable commence toujours par une lettre, contient des lettres ou des chiffres et le caractère souligné (_) mais pas d’espace. Ne pas commencer le nom des variables par un souligné "_" car les noms système commencent par ce caractère (_N_,…). - La taille maximale du nom d’une variable est de 8 caractères, au delà le nom est tronqué (à partir de la version 7, la limite est maintenant de 32 caractères). - Les variables sont, par défaut, uploads/Litterature/ sas-general.pdf
Documents similaires










-
31
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Jui 17, 2022
- Catégorie Literature / Litté...
- Langue French
- Taille du fichier 0.7683MB