1 2. Obtenir les Données Les Méthodes d’échantillonnage 2 Développement d’un Pl
1 2. Obtenir les Données Les Méthodes d’échantillonnage 2 Développement d’un Plan d’Echantillonnage 1. Définir la population de référence 2. Définir une base de sondage 3. Choisir une méthode d’échantillonnage 4. Déterminer la taille de l’échantillon 5. Exécution du plan d’échantillonnage 3 Échantillon ou recensement? Objectifs de recherche: obtenir des informations sur les caractéristiques ou les paramètres d’une population. L’information sur les paramètres de la population peut être obtenue par recensement ou à travers un échantillon. Les caractéristiques de l’échantillon, ou statistiques, sont exploitées pour inférer sur les paramètres de la population: estimations et tests d’hypothèse. 4 Statistiques: deux faces de la même pièce (question sur une) Population (question sur une) Population Induction (Inférence statistique) Décision Représentatif? Echantillon (mesure) Echantillon (mesure) Déduction 5 Définitions Population: l’ensemble de tous les éléments présentant le même set de caractéristiques visées par le sujet de l’étude. Recensement: l’énumération complète des éléments d’une population ou de l’objet de la recherche Échantillon: un sous-groupe d’éléments de la population sélectionnés pour être analysés par la recherche. 6 1. Population de référence … l’ensemble des objets possédant les informations désirées pour répondre aux objectifs de l’étude. L’objet peut être le répondant lui-même: on parle d’élément d’échantillonnage... … ou une entité contenant l’objet: on parle d’unité d’échantillonnage. La population choisie peut être associée à un critère de localisation et un critère temporel. 7 Exemple (1) Yves Rocher veut tester l’idée d’une nouvelle crème de beauté: Population : les femmes âgées de 18 ans et plus unité d’échantillonnage: foyer élément d’échantillonnage : personnes de sexe féminin, âge = 18+ ans dans chaque foyer de l’échantillon critère de localisation: canton Genève critère temporel: mars-juillet 2003 8 Activité Perception de l’image de Migros Chailly par rapport à ses concurrents directs (p.ex. Coop). Population : Unité d’échantillonnage : Élément d’échantillonnage : Critère géographique : Critère temporel : 9 2. Base de sondage (sampling farme) … représentation concrète des éléments de la population cible. Consiste en une liste à partir de laquelle la sélection des éléments va être opérée. Liste existante: annuaire téléphonique, annuaire d’entreprise, plan d’une ville, fichier loué à Swisscom… … ou une construction aléatoire (par exemple une liste de numéros de téléphone) Erreur de liste (coverage ou sampling frame error): décalage (positif ou négatif) entre la liste et la population de référence 10 Problème Pour le sondage de Yves Rocher visant les femmes de 18 ans et plus, serait-il possible de créer une liste sur la base de l’annuaire téléphonique? Si oui, comment? Si non, pourquoi pas? 11 3. Méthodes d’échantillonnage Echantillon aléatoire simple Echantillon systématique Echantillon stratifié Echantillon en grappes Méthodes Aléatoires (Probabilistes) Echantillon de convenance Echantillon de jugement (a priori) Echantillon "boule de neige" Echantillon par quotas Méthodes Empiriques (Non-probabilistes) Rôle du hasard augmente Complexité augmente 12 3.2. Méthodes aléatoires Un échantillon est dit aléatoire (probabiliste) lorsque n’importe quel élément de la population cible peut appartenir à l’échantillon, et ceci avec une probabilité connue à l’avance et non nulle, généralement - mais pas nécessairement - la même pour tous les éléments. 13 Échantillonnage aléatoire simple Baser le tirage entièrement sur le hasard… … à partir d’une liste exhaustive de la population (1…N)… … et une procédure aléatoire informatisée (p.ex. fonction RAND)... … ou une table de nombres au hasard. 14 Tirage avec ou sans remplacement Tirage avec remplacement: Les probabilités sont égales Risque de tirer les même élément plusieurs fois Retenir chaque élément une seule fois Tirage sans remplacement: P.ex. la loterie à numéros La probabilité diminue au fur et à mesure que l’on tire des éléments d’échantillonnage. Lorsque l’échantillon est petit par rapport à la population la probabilité reste presque constante. 15 Problème Comment tirer un échantillon aléatoire simple de 61 restaurants lausannois (population=305), pour une enquête sur la perception du label “Fourchette verte” par les clients de restaurants. Tirage Avec Remplacement ? Sans Remplacement ? 16 Échantillonnage stratifié Méthode probabiliste se déroulant en deux étapes: Une partition de la population (strates) groupes mutuellement exclusifs … et collectivement exhaustifs Tirage aléatoire simple dans chacune des strates Échantillonnage stratifié proportionnel La taille de chaque strate dans l’échantillon est proportionnelle à la taille de la strate correspondante dans la population. Échantillonnage stratifié disproportionné La taille de chaque strate dans l’échantillon dépend de la variabilité des strates dans la population. Plus la variabilité est grande plus la strate de l’échantillon est grande 17 Pourquoi un échantillon stratifié? Les strates sont sélectionnées telles que chaque strate soit relativement homogène. Moins de variabilité dans chaque strate Le critère de stratification doit être lié à la caractéristique que l’on mesure Accroît l’efficacité de la stratification. L’estimation de la moyenne est ainsi plus précise. Le prix à payer: nécessite une analyse préalable pour définir les critères de stratification. Coût supérieur à l’échantillonnage aléatoire simple. N’améliore pas la représentativité de l’échantillon 18 Problème Tirage d’un échantillon stratifié d’hôtels (ou restaurants) suisses afin d’estimer la rentabilité moyenne. Quels critère(s) de stratification pourrait rendre les strates plus homogènes? Quelle procédure pour le tirage aléatoire? (proportionnel ou disproportionné) 19 Échantillonnage en grappes (cluster sampling) Méthode aléatoire en une ou deux étapes: Découpage de la population en grappes mutuellement exclusives collectivement exhaustives Très souvent par critère géographique Tirage aléatoire simple d’un échantillon de grappes Recensement dans chacune des grappes retenues (un niveau d’échantillonnage), ou... … tirage au hasard (échantillonnage par étapes) 20 Exemple: grappes géographiques On étudie la consommation de vin par foyer à Lausanne en relation avec le niveau socioéconomique. Grappes: les quartiers lausannois (18) Tirage au hasard de 3 quartiers: analyse de tous les foyers (un niveau d’échantillonnage) Échantillonnage par étapes: par quartier: une rue sur cinq par rue: un immeuble sur trois (si besoin) par immeuble: un foyer par étage 21 Grappes versus Strates Similitudes: On divise la population en sous-groupes Échantillonnage aléatoire Différences: Échantillon stratifié = échantillonnage aléatoire dans chaque strate Objectif: Homogénéité dans chaque strate Échantillonnage par grappes = tirage aléatoire d’une grappe et, éventuellement, échantillonnage aléatoire dans cette grappe. Objectif: Hétérogénéité dans chaque grappe: chacune est la population en miniature. 22 Avantages et limites Méthode moins contraignante que l’échantillonnage stratifié: pas besoin d’une liste exhaustive de la population étudiée. Moins coûteuses que les autres méthodes probabilistes Aussi moins précise Principal problème: effet de grappe si les grappes ne sont pas suffisamment hétérogènes: P.ex. les zones géographiques sont trop spécifiques par rapport au problème étudié. Consommation de vin par foyer: Risque de retenir des quartiers composés essentiellement de logements 23 Échantillonnage systématique Version simplifiée de l’échantillonnage aléatoire simple. Procédure en trois étapes: calcul d’un intervalle de sondage: i=N/n tirage au hasard d’un nombre a entre 1 et i sélection systématique des individus a, a+i, a+2i... Est en réalité un échantillonnage en grappes en une étape. Les grappes sont délimités par l’intervalle de sondage et le début de la liste. 24 Exemple Tirer un échantillon systématique de 5 individus d’une population de 20 individus désignés par les lettres A à T Intervalle de sondage : 20/5 = 4 Tirer un Nombre au hasard entre 1 et 4. 25 3.1. Méthodes empiriques Un échantillon est dit empirique (ou non probabiliste) lorsque les éléments, ou les unités d’échantillonnage, de la population cible sont choisis sur la base de critères purement subjectifs et non systématiques. Aucune propriété de représentativité a priori… … et très faible possibilité de généraliser les résultats. 26 Échantillonnage de convenance … ou échantillon accidentel. Les individus composant l’échantillon sont par hasard là où on collecte l’information pour l’étude. Aucune vérification que les éléments de la population possèdent bien certaines caractéristiques désirées. Impossible de savoir si l’échantillon est représentatif de la population cible. 27 Exemples Questionnaires figurant dans des magazines et renvoyés spontanément. Micro-trottoirs. Enquêtes en sortie de caisse d’hypermarché, si l’on ne dispose d’aucune qualification a priori des interviewés. 28 Échantillonnage «a priori» Consiste à sélectionner des individus dont on pense, avant de les interroger, qu’ils peuvent être détenteurs d’informations cruciales pour l’étude. Avantages: utile dans un cadre exploratoire richesse d’informations obtenues d’experts 29 Problème Étude exploratoire sur les valeurs liées à l’utilisation de la bicyclette. Comment définir un échantillon « a priori »? Qui sont les experts en bicyclette? 30 Échantillonnage «boule de neige» Réservé aux populations composées d’experts, ou d’individus dont l’identification est difficile. Identifier un petit nombre initial (même un seul individu) et leur demander de faire appel à d’autres individus possédant les mêmes caractéristiques. Identifier les paires uploads/Geographie/ cours-2-obtenir-les-donne-es 1 .pdf
Documents similaires










-
29
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Aoû 11, 2022
- Catégorie Geography / Geogra...
- Langue French
- Taille du fichier 0.3992MB