IPMSH Analyse statistique des données quantitatives CEM L ' A N A L Y S E S T A
IPMSH Analyse statistique des données quantitatives CEM L ' A N A L Y S E S T A T I S T I Q U E D E D O N N É E S 1. Introduction L'analyse des données de recherche en sciences humaines et sociales peut prendre deux formes : l'analyse de données quantitatives et l'analyse de données qualitatives. Ce document portera plus spécifiquement sur l'analyse de données quantitatives. Un autre document traitera des stratégies utilisées dans l'analyse de données qualitatives. Nous entendons ici par données quantitatives toute donnée qui se présente sous la forme de nombres, de chiffres, qu'il s'agisse de variables dites qualitatives (nominales et ordinales) ou de variables quantitatives (à intervalle et à rapport). Nous entendons par données qualitatives toute donnée qui se présente sous une forme langagière ou narrative (compte-rendu d'une entrevue, notes de terrain d'une observation naturelle, éléments d'information provenant d'archives historiques, etc.). L'analyse quantitative de données en sciences humaines et sociales fait généralement appel aux statistiques. Toutefois, selon les besoins particuliers d'une recherche, d'autres formes d'analyses quantitatives de données s'offrent aussi au chercheur en sciences humaines : l'analyse de l'incertain en communication (logarithmes), les analyses de Fourier pour la modélisation de réponses analogiques en psychophysiologie, etc. On retrouve trois grandes familles de statistiques ou d'analyses statistiques : 1) les statistiques descriptives; 2) les statistiques corrélationnelles; 3) les statistiques inférentielles. Voyons brièvement de quoi il s'agit. 1.1 Statistiques descriptives Comme leur nom l'indique, les statistiques descriptives ont pour principale fonction de décrire des données quantitatives. En général, les statistiques descriptives sont utilisées pour décrire une distribution de données, c'est-à-dire un regroupement ou un ensemble de données provenant d'une même mesure ou d'une même collecte de données (ex. : les responses à une question de sondage, les scores moyens à un examen, la distribution des salaires des employés d'une entreprise, etc.). On retrouve trois princpaux types de statistiques descriptives, soit les indices de tendance centrale (moyenne, médiane, mode, etc.), les indices de dispersion (étendue, écart-type, variance, espace inter-quartile, etc.) et les indices de forme (coefficient de symétrie, kurtose, etc.). Session Hiver 2004 1 Alain Saumier © IPMSH Analyse statistique des données quantitatives CEM 1.2 Statistiques corrélationnelles Les statistiques corrélationnelles réunissent un ensemble de tests statistiques qui permettent de quantifier la relation entre deux ou plusieurs variables. Ces statistiques nous informent de la nature et de la force de cette relation. Parmi les tests corrélationnels les mieux connus, on retrouve la corrélation linéaire de Bravais-Pearson, la régression linéaire, la corrélation de Spearman et celle de Kendall. On peut inclure aussi dans cette section, les mesures d'association comme le test du Khi-deux et les analyses factorielles. 1.3 Statistiques inférentielles Les statistiques inférentielles réunissent un répertoire très important de tests statistiques dont la principale caractéristique est qu'ils sont basés sur l'inférence statistique, elle-même construite autour de la notion de probabilité. Ces tests servent à mesure la probabilité qu'une différence entre deux moyennes, qu'une corrélation entre deux variables, qu'une dépendance statistique entre une variable et une autre variable soient dues au hasard. Parmi les tests inférentiels les mieux connus, on retrouve les tests de comparaison de moyennes d'échantillon (test t de Student, analyse de variance, etc.), les mesures d'association telles que le Khi-deux. Dans les pages qui suivent, nous allons présenter une stratégie d'analyse statistique des données quantitatives à l'aide du logiciel Excel de Microsoft. Il peut être intéressant à ce moment-ci d'expliquer le choix du logiciel Excel comme outil d'analyse statistique. Il existe, sur le marché, plusieurs logiciels spécifiquement conçus pour le traitement statistique des données (Statview, SPSS, Mystat, etc.) et même des logiciels spécifiquement conçus pour le traitement des données provenant d'une enquête par questionnaire ou d'un sondage. Pourquoi ne pas utiliser un de ces logiciels plutôt que le logiciel Excel? Voici les principales raisons. D'abord, le logiciel Excel est un chiffrier, c'est-à-dire un logiciel conçu pour le traitement de données chiffrées. À l'origine, il a été conçu pour le traitement de données comptables, se présentant sous la forme de tableau de nombres. Avec le temps, les concepteurs d'Excel ont modifié ce logiciel pour inclure des fonctions plus spécifiques comme les tableaux dynamiques, les fonctions graphiques et les tests statistiques. Bien qu'Excel sera utilisé ici comme logiciel d'analyse statistique, il peut servir à de multiples fonctions d'analyse de données chiffrées. Le tableau suivant réunit les principales raisons qui ont guidé le choix du logiciel Excel pour le cours d'Initiation pratique à la méthodologie des sciences humaines. Session Hiver 2004 2 Alain Saumier © IPMSH Analyse statistique des données quantitatives CEM Les avantages du logiciel Excel comme outil d'analyse statistique de données quantitatives Après le logiciel de traitement de texte Microsoft Word, il est probablement un des logiciels les plus utilisés dans le monde; Il fait partie de l'ensemble Microsoft Office, ce qui le rend accessible à un très grand nombre de personnes; En faisant partie de l'ensemble Microsoft Office, sa compatibilité avec les autres logiciels de cet ensemble (Word, Power Point, etc.) est optimisée; Il s'agit d'un logiciel dont les fonctions sont très larges et qui peut se prêter à une grande variété d'applications dont l'analyse statistique est une partie seulement; L'utilisation de ses fonctions de base est relativement facile et son temps d'apprentissage est souvent plus court que pour la plupart des logiciels spécialisés; La structure de ses opérations est relativement transparente et ouverte ce qui veut dire qu'il est possible de suivre et de comprendre facilement le déroulement de ses principales opérations. De plus, il se prête facilement à des modifications puisqu'il est accompagné de divers langages de programmation; Son coût d'utilisation est relativement abordable si on le compare aux autres logiciels d'analyse statistique. L'achat d'une licence Microsoft Office (qui comprend le logiciel Excel) se compare très avantageusement avec les licences des autres logiciels d'analyse statistique; La plupart des ordinateurs, dont les ordinateurs des laboratoires du collège et les ordinateurs personnels de nombreux étudiants, sont équipés de la suite Microsoft Office. Ceci a comme conséquence de permettre à un étudiant de traiter ses données de recherche dans la plupart des laboratoires du collège ou d'en faire le traitement sur son ordinateur personnel ou sur l'ordinateur familial. Cela a comme effet de réduire significativement l'engorgement des locaux de laboratoire en fin de session et d'éliminer les retards causés par la non-disponibilité des laboratoires informatiques en fin de session. Le logiciel Excel est un des logiciels les plus utilisés dans le monde ce qui veut dire que l'apprentissage d'Excel pourra être rentabilisé à de nombreuses reprises par la suite (à l'université, sur le marché du travail, etc.), ce qui n'était pas nécessairement le cas pour les autres logiciels d'analyse statistique dont l'utilisation était souvent limitée aux seuls cours de Méthodes quantitatives et d'Initiation pratique à la méthodologie des sciences humaines au Cégep. Session Hiver 2004 3 Alain Saumier © IPMSH Analyse statistique des données quantitatives CEM 2. Une stratégie d'analyse statistique des données sur Excel L'analyse statistique des données sur le logiciel Excel doit être guidée par une stratégie explicite et une certaine connaissance de la nature des données, du type de variables et du type d'analyses que l'on souhaite effectuer. Commençons par identifier les trois niveaux de décision à travers lesquels doit cheminer toute analyse de données : 2.1 Les trois niveaux de toute analyse de données 2.1.1. Type d'analyse à effectuer Une première étape consiste à déterminer le type d'analyse qui sera effectué. On identifie généralement deux grandes catégories d'analyses : l'analyse univariée (qui ne s'adresse qu'à une variable à la fois); l'analyse bivariée (qui analyse la relation entre deux variables). 2.1.1.1 L'analyse univariée L'analyse univariée a pour objet de décrire une variable à l'aide de différents indices statistiques. Il s'agit en quelque sorte de dresser un portrait statistique de la variable en question. L'analyse univariée peut porter autant sur des variables indépendantes que dépendantes bien qu'en général, elle est surtout utilisée pour analyser les variables dépendantes. 2.1.1.2 L'analyse bivariée Comme l'indique son nom, l'analyse bivariée porte sur deux variables dont elle cherche à déterminer la relation. En général, une analyse bivariée met en relation une variable indépendante et une variable dépendante. Ainsi, on cherche à déterminer s'il existe une relation entre la variable indépendante et la variable dépendante qui n'est pas due au hasard ou encore si la variable indépendante exerce réellement une influence sur la variable dépendante (ex. : effet de la technique de relaxation sur la gestion du stress). L'analyse peut aussi mettre en mettre en relation deux variables indépendantes (ex. : secteur d'étude en fonction du sexe) ou deux variables dépendantes (ex. : résultats scolaires en fonction du nombre d'heures travaillées à temps partiel par semaine), mais dans ce cas, l'une des variables est temporairement considérée comme une variable explicative et l'autre comme variable expliquée. Il est aussi possible de réaliser des analyses multivariées (analyse simultanée de plusieurs variables), mais la complexité de ce type d'analyse dépasse la portée de ce cours. 2.1.2 Nature de la variable analysée Une deuxième uploads/Management/ analyse-statistique-des-donnees-excel.pdf
Documents similaires










-
30
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Fev 03, 2021
- Catégorie Management
- Langue French
- Taille du fichier 2.4360MB