Université de Liège Faculté de Psychologie, Logopédie et Sciences de l’Éducatio
Université de Liège Faculté de Psychologie, Logopédie et Sciences de l’Éducation Année académique 2019-2020 © Presses Universitaires de Liège Tous droits de reproduction – par quelque procédé que ce soit – réservés. Presses Universitaires de Liège Problèmes statistiques et utilisation de logiciels Utilisation du logiciel SAS Tome 3 F .P . PÉRÉE BLOC 3 du grade de Bachelier en Sciences psychologiques et de l’Éducation (Orientation générale et Logopédie) BLOC 1 du grade de Master en Logopédie UNIVERSITE DE LIEGE Faculté de Psychologie, de Logopédie et des Sciences de l'Education Problèmes statistiques et Utilisation de logiciels Utilisation du logiciel SAS TOME 3 F.P. Pérée Pour devenir habile en quelque profession que ce soit, il faut le concours de la nature, de l’étude et de l’exercice. Aristote A Christian Heuchenne, Mathématicien, Humaniste, Homme intègre. Problèmes statistiques et utilisation de logiciels – Exercices supplémentaires Problèmes statistiques et utilisation de logiciels ‐ Page 3 ‐ F.P. Pérée – Version 8.2.4 ‐ 2018 AVERTISSEMENT Tous les fichiers proposés pour les exercices sont des fichiers EXCEL récents (suffixe .XLSX) provenant d’une version européenne du logiciel OFFICE de MICROSOFT. Il existe plusieurs possibilités de permettre la lecture du contenu d’un fichier EXCEL par le logiciel SAS : L’exportation du fichier EXCEL en fichier texte ASCII (suffixe .txt). Ce type de fichier a l’avantage d’être lu directement par SAS. Il est aussi facilement accessible et modifiable via n’importe quel éditeur ASCII (y compris le bloc‐notes de MICROSOFT) Remarque : La transformation en fichier texte pose quelques problèmes à régler dans le cas où le fichier EXCEL contient des valeurs manquantes non codées et lorsqu’il y a des données à virgule décimale (comme c’est le cas dans les fichiers EXCEL européens) L’exportation du fichier EXCEL en fichier CSV (séparateur : point‐virgule) Même si elle apparaît parfois plus compliquée de prime abord, cette exportation permet de régler les problèmes liés à la présence de décimales européennes (utilisation de la virgule) et/ou de valeurs manquantes. Remarque : L’utilisation d’un programme Microsoft Office européen fournit un format CSV avec la virgule décimale et le séparateur point‐virgule ( ; ). Une petite opération manuelle est donc nécessaire pour transformer le fichier obtenu en fichier comportant des données avec le point décimal. Réaliser cette opération est assez simple et rapide. Il suffit de procéder de manière ordonnée comme suit : Editer le fichier .csv obtenu avec un éditeur de texte ASCII (par exemple le bloc‐notes) ; Remplacer globalement toutes les virgules par un point ; Sauvegarder le fichier ainsi transformé. N.B. : Il faut aussi prendre garde au problème suivant : Les versions récentes d’OFFICE exportent en CSV les valeurs manquantes en ;; alors que les versions plus anciennes les exportaient en ; ; (les deux points‐virgules étant séparés par un blanc) Dans le premier cas il faut recourir à l’option DSD dans le premier cas, ce qui n’est pas nécessaire dans le second. La lecture directe par SAS du fichier EXCEL Il est possible de lire directement un fichier EXCEL en utilisant la procédure IMPORT de SAS. Certaines contraintes peuvent rendre difficile cette importation (des noms de variables non compatibles SAS, utiliser une colonne de données sans nom, etc…) MAIS, la principale contrainte est que le fichier EXCEL supposé être en format américain, et donc que les nombres décimaux doivent utiliser le point décimal (et non la virgule) !!! Problèmes statistiques et utilisation de logiciels – Exercices supplémentaires Problèmes statistiques et utilisation de logiciels ‐ Page 4 ‐ F.P. Pérée – Version 8.2.4 ‐ 2018 EXERCICES SUPPLÉMENTAIRES ESUPP01 Dans le cadre d’une recherche sur le tabagisme, un chercheur compare trois procédures distinctes de sevrage des fumeurs (sevrage progressif, arrêt brutal, médicament aversif). Cinq sujets sont choisis dans chaque groupe. Il leur est demandé d’indiquer sur une échelle en 10 points (de 0 à 9) leur niveau de « besoin de fumer » dans deux environnements différents (à la maison et au travail) et ce, avant puis après avoir subi la procédure de sevrage. Voici les données qui figurent dans le fichier EXCEL DSUPP01 : Avant Après Maison Travail Maison Travail Sevrage progressif 7 6 6 4 5 4 5 2 8 7 7 4 8 8 6 5 6 5 5 3 Arrêt brutal 8 7 7 6 5 5 5 4 7 6 6 5 8 7 6 5 7 6 5 4 Médicament aversif 9 8 5 4 4 4 3 2 7 7 5 3 7 5 5 0 8 7 6 3 1. Effectuer l’analyse de variance appropriée et déterminez si on peut‐on mettre en évidence un effet significatif de la méthode de sevrage ? Pourquoi ? 2. Peut‐on considérer qu’il y a une différence significative entre les moyennes « avant » et « après » la procédure de sevrage (effet temporel « MOMENT ») ? 3. Compte tenu des résultats obtenus aux points 2 et 3, comment interpréter le résultat obtenu pour l’interaction entre la méthode et l’effet temporel « MOMENT » (avant et après le sevrage) ? 4. Y a‐t‐il une différence significative entre les moyennes des scores à la maison et au travail ? 5. Compte tenu du résultat obtenu au point 5, comment interpréter l’interaction entre la variable METHODE et la variable LIEU (effet « maison » versus « travail ») ? ESUPP02 Un chercheur souhaite ranger les 15 items d’un test de langage en fonction de l’ordre selon lequel les capacités langagières apparaissent dans le développement de l’enfant. N’étant pas certain du classement qu’il a opéré, il demande à un autre spécialiste de ranger ces items de 1 à 15 suivant le même critère. Voici les données qui figurent dans le fichier EXCEL DSUPP02 : Problèmes statistiques et utilisation de logiciels – Exercices supplémentaires Problèmes statistiques et utilisation de logiciels ‐ Page 5 ‐ F.P. Pérée – Version 8.2.4 ‐ 2018 Chercheur 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Consultant 1 3 2 4 7 5 6 8 10 9 11 12 15 13 14 1. Calculez la statistique rs de Spearman. 2. Déterminez la statistique tk de Kendall et donnez la probabilité correspondante. ESUPP03 From [Howell (1992)] The State of Vermont is divided into 10 Health Planning Districts, which correspond to counties. The following data for 1980 represent the percentage of births of babies under 2500 grams (Y), the fertility rate for females younger than 18 or older than 34 years of age (X1), and the percentage of births to unmarried mothers (X2) for each district (both X1 and X2 are known to be risk factors for low birthweight). DISTRICT Y X1 X2 1 6,1 43,0 9,2 2 7,1 55,3 12,0 3 7,4 48,5 10,4 4 6,3 38,8 9,8 5 6,5 46,2 9,8 6 5,7 39,9 7,7 7 6,6 43,1 10,9 8 8,1 48,5 9,5 9 6,3 40,0 11,6 10 6,9 56,7 11,6 1. Calculate the correlations between Y and X1, X2. Test H0 : = 0. 2. Compute the regression equation for predicting the percentage of births of infants under 2500 grams (Y) on the basis of fertility rate for females younger than 18 and older than 34 years of age (X1). What is the standard error of estimate for this regression equation ? 3. Compute a regression equation for predicting this percentage on the basis of variables X1 and X2. Data : DSUPP03 EXCEL file. 1. ESUPP04 2. [Juin 2013] On souhaite déterminer un sous‐échantillon du fichier EXCEL DSUPP04 qui soit constitué par les sujets portant la modalité « B » de la variable GROUPE et pour lesquels la valeur de la variable TEMPS est > 12. 1. Dans ce sous‐échantillon, quelle est la valeur de la médiane de la variable TEMPS ? 2. Combien y a‐t‐il en pourcents, dans ce sous‐échantillon, de sujets pour lesquels TEMPS présente une valeur > 14 et <= 17 ? ESUPP05 Problèmes statistiques et utilisation de logiciels – Exercices supplémentaires Problèmes statistiques et utilisation de logiciels ‐ Page 6 ‐ F.P. Pérée – Version 8.2.4 ‐ 2018 [Juin 2013] On considère la variable métrique SCORE du fichier EXCEL DSUPP05. Les deux modalités de la variable GROUPE (codée 1, 2) caractérisent deux échantillons distincts. Peut‐on conclure que les données observées pour la variable SCORE dans ces deux échantillons proviennent de deux populations ayant des distributions identiques ? 1. Indiquez quel test vous utilisez. 2. Quelle est la valeur de la probabilité obtenue et quelle est votre conclusion ? ESUPP06 Dans une étude portant sur les habitudes alimentaires des adolescents, Gross (1985)1 interroge les différents sujets d’un échantillon d’adolescents sur leur préférence entre trois possibilités : Gagner du poids, maintenir leur poids actuel ou perdre du poids. Après avoir recensé les données relatives aux filles en fonction de la race (race blanche / afro‐américaine), il obtient les résultats suivants : Réduire Maintenir Augmenter Blanches 352 152 31 535 Afro-américaine 47 28 24 99 399 180 55 634 Quelle conclusion peut‐on tirer de ces données ? ESUPP07 Dans le cadre d’une recherche sur l’apprentissage de la uploads/Litterature/ perre-f-stat-3 1 .pdf
Documents similaires










-
30
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Nov 16, 2022
- Catégorie Literature / Litté...
- Langue French
- Taille du fichier 0.9026MB