2. Concevoir et préparer les variables nécessaires à l’analyse Olivier Martin D
2. Concevoir et préparer les variables nécessaires à l’analyse Olivier Martin Dans L'analyse quantitative des données (2020), pages 47 à 62 Chapitre 1. Questions, variables et modalités l est indispensable de distinguer deux niveaux d’information, même s’ils se recoupent largement. Le premier niveau est celui des réponses fournies par les enquêtes aux questions ou les codages de matériaux qualitatifs. Il s’agit d’informations primaires, liées à la logique et aux exigences spécifiques de l’enquête ou du codage : les informations sont réduites, limitées à un aspect précis mais ponctuel. Il s’agit par exemple des titres des livres lus durant le dernier mois, du nombre d’enfants, de la situation professionnelle, de la destination des dernières vacances, de la durée de la dernière période de chômage… 1 I Ce premier niveau d’informations regroupe les variables qualifiées de « primaires » (au sens de « premières ») et qui sont évidemment indispensables : elles constituent le matériau empirique. Pourtant ces variables ne sont pas suffisantes ou satisfaisantes dans bien des cas : elles répondent à des exigences empiriques et aux impératifs méthodologiques de 2 2. Variables qualitatives et variables quantitatives 2.1. Variables quantitatives réalisation de l’enquête ? ; elles ne renseignent que partiellement le sociologue sur ce qui l’intéresse en priorité. Le second niveau est celui des variables « dérivées » (ou « secondaires ») élaborées pour mieux correspondre aux exigences techniques du traitement statistique ainsi qu’aux exigences théoriques de la problématique. Ces variables sont dérivées au sens où elles résultent des variables primaires par recodage ou agrégation de plusieurs informations primaires. Ce sont les « vraies » variables sociologiques, celles directement liées à la problématique ou au questionnement théorique du sociologue. 3 Deux grands types de variables peuvent être distingués : les variables quantitatives, qui expriment des grandeurs quantifiables, et les variables qualitatives, qui reflètent des grandeurs non quantitatives, des « qualités ». En sociologie les secondes sont plus fréquentes que les premières : l’essentiel des informations est de nature qualitative. Ceci résulte de la nature des phénomènes analysés par le sociologue : les pratiques, les opinions, les représentations, les caractéristiques sociales, ou encore les attitudes s’expriment rarement à l’aide de variables quantitatives. Et il n’est pas rare que les quelques variables quantitatives soient recodées en variables qualitatives afin d’harmoniser le statut des variables et d’écarter l’illusion de précision que peuvent incarner les variables quantitatives. 4 La distinction entre variables quantitatives et qualitatives n’est pas anodine. Elle ne résulte pas d’un raffinement conceptuel inutile pas d’une contrainte technique forte : la nature des variables conditionne le type de méthodes d’analyse utilisables. Il est par exemple impossible de calculer un statut matrimonial moyen ou un diplôme moyen. 5 Une variable quantitative permet d’exprimer une grandeur quantifiable, c’est-à-dire une grandeur mesurable à l’aide d’une unité. C’est par exemple le cas de l’âge (exprimables en « années » ou en « mois »), du revenu (en euros ou en yen) ou encore du nombre d’enfants. Une variable quantitative s’exprime à l’aide de nombres et ses diverses valeurs peuvent être numériquement comparées. 6 2.2. Variables qualitatives De manière générale, les sociologues utilisent des variables quantitatives dans deux grands types de situations. Premièrement, lorsqu’ils veulent exprimer des durées (âge, ancienneté d’une pratique, durée d’une expérience professionnelle, temps consacré à une activité, nombre d’années d’études, durée entre deux événements…), des valeurs monétaires (revenus, patrimoine, salaires, montant de l’argent de poche, dépenses, consommation, épargne…), des indicateurs de « volume » (nombre de livres lus, nombre d’enfants, taille du réseau amical…) ou des indicateurs « d’intensité » (fréquence d’une pratique culturelle…). Les variables synthétiques, que nous définirons plus loin et qui jouent un rôle central en sociologie quantitative, relèvent également de cette catégorie : elles expriment grâce à un indicateur quantitatif la position d’un individu selon une grandeur sociologique – par exemple son niveau de participation aux tâches ménagères, son niveau d’investissement sociale, son degré de « religiosité »… 7 Le second cas d’utilisation de variables quantitatives en sociologie est relatif aux situations où les sociologues ne travaillent pas sur des personnes, mais sur des entités collectives (par exemple des familles, ménages, associations, communes, entreprises…). Dans ce cas, ces collectifs peuvent être caractérisés par des variables quantitatives exprimant des parts ou des taux : part des individus de sexe masculin ? ; taux de redoublement ; part des plus de 65 ans ; part de ceux déclarant aimer la musique Rap ou RnB ; probabilité des enfants des différents groupes sociaux d’accéder à une grande école… Dans ce cas, on parle parfois de données agrégées car pour obtenir des caractéristiques relatives à des groupes, il est souvent nécessaire d’agréger les réponses individuelles. 8 Les grandeurs non quantifiables sont celles qui ne peuvent pas s’exprimer en unités : ces modalités marquent des différences qui ne sont pas des différences numériques mais des différences de nature. Le diplôme, le sexe, la catégorie sociale, les sympathies politiques, le titre du dernier ouvrage lu, le statut matrimonial ou encore la couleur des yeux sont non quantifiables : elles s’expriment grâce à des variables qualitatives. Les modalités de ces variables ne sont pas comparables quantitativement : il n’existe aucune mesure commune de la modalité « marié » et de la modalité « divorcé » de la variable « statut matrimonial ». 9 Sont également considérées comme qualitatives les variables qui sont fondamentalement quantitatives mais que le sociologue utilise sous une forme recodée, avec des modalités qui correspondent à des classes. L’âge biologique est une variable quantitative mais elle est presque exclusivement utilisée sous la forme d’une variable qualitative définie à partir de classes d’âge : par exemple [18-25 ans] ; [26-30 ans] ; [31-40 ans] ; [41-55 ans] ; [56 ans et plus]. 10 3. De la nécessité de recoder les variables Parmi les variables qualitatives, il est possible de distinguer les variables à modalités ordonnables et celles à modalités non ordonnables. Comme leur nom l’indique, les modalités ordonnables peuvent être classées, hiérarchisées : c’est notamment le cas de toutes les variables dont les modalités sont semblables à « Tout à fait, assez, peu, pas du tout » ou « Très souvent, assez souvent, de temps en temps, rarement, jamais ». C’est aussi le cas de toutes les variables fondamentalement quantitatives mais qui sont codées selon une échelle comme dans l’exemple suivant : 11 « Au cours de la dernière année, combien de livres avez-vous acheté ? 12 1. Aucun 2. Un ou deux livres 3. Entre 3 et 10 livres 4. Entre 11 et 30 livres 5. Plus de 30 livres » Il est également possible de considérer que les variables « diplôme » voire « opinion politique » sont ordonnables : les diplômes peuvent être classés selon un principe de hiérarchie scolaire et de nombre d’années d’études ; les opinions politiques peuvent être classées en fonction de l’axe gauche-droite (à condition d’ignorer les difficultés concernant les apolitiques ou les écologistes). La catégorie sociale donne également lieu à un classement dans beaucoup de travaux sociologiques : catégories sociales supérieures, intermédiaires ou populaires… 14 Une variable qualitative peut être simple (lorsqu’elle reflète une seule information), multiple (lorsqu’elle reflète plusieurs informations en même temps) ou ordonnées (lorsqu’elle reflète plusieurs informations classées par ordre). La question « quelles sont vos trop stations de radio préférées ? » constitue une variable multiple. S’il est, en plus, demander de classer ces trois stations de radio préférées, elle devient une variable multiple ordonnée. 15 Le travail de recodage résulte de deux nécessités. L’une d’entre elles correspond à des contraintes statistiques et techniques : 1) certaines réponses, notamment les réponses aux questions ouvertes, doivent être recodées de manière à être exploitables dans une perspective quantitative ; 2) certaines modalités de réponses sont rarement choisies et doivent 16 3.1. Techniques de recodage 1 : regrouper des modalités donc être regroupées car les effectifs ne permettent pas de les analyser en tant que telles ; 3) enfin, il est parfois nécessaire, pour pouvoir utiliser certaines méthodes statistiques, de diminuer le nombre de modalités des variables (c’est le cas dans les analyses factorielles). La seconde nécessité correspond aux exigences et choix théoriques : elle résulte de la problématique sociologique choisie. Recoder une variable c’est préparer les données de façon à les rendre adéquates à la problématique. Cette dernière affirmation est essentielle : en dehors des contraintes techniques signalées ci-dessus, le recodage d’une variable doit être réalisé en fonction d’un questionnement et non de présupposés extérieurs à la problématique. 17 Il est donc faux de croire que le recodage est une simple opération technique. Il s’agit d’une opération théorique, visant à rendre les variables les plus adéquates possibles à la problématique et aux notions en œuvre dans celle-ci. Bien recoder les variables est un impératif pour conduire une bonne analyse sociologique. 18 Considérons la question suivante, adressée à des titulaires du baccalauréat : 19 Quelles études avez-vous poursuivies après votre baccalauréat ? 20 Il y a au moins trois manières de recoder cette variable, selon qu’on s’intéresse à l’opposition entre ceux qui ont poursuivi des études uploads/Philosophie/ concevoir-et-pre-parer-les-variables-ne-cessaires-a-l-x27-analyse-cairn-info.pdf
Documents similaires










-
32
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Apv 24, 2021
- Catégorie Philosophy / Philo...
- Langue French
- Taille du fichier 0.4295MB