Échantillonnage  Échantillonnage probabiliste  Échantillonnage non probabilis

Échantillonnage  Échantillonnage probabiliste  Échantillonnage non probabiliste Échantillonnage probabiliste : L’échantillonnage probabiliste fait référence à la sélection d’un échantillon d’une population lorsque cette sélection repose sur le principe de la randomisation, c’est-à-dire la sélection au hasard ou aléatoire. Il est plus complexe, plus long à mettre en œuvre et habituellement plus dispendieux que l’échantillonnage non probabiliste. Toutefois, comme les unités de la population sont sélectionnées au hasard et qu’il est possible de calculer la probabilité de sélection de chaque unité dans l’échantillon, il permet de produire des estimations fiables et de faire des inférences statistiques au sujet de la population. Il existe plusieurs méthodes d’échantillonnage probabiliste. Le choix d’un type d’échantillonnage repose sur plusieurs facteurs comme la précision des estimations désirée, la nature de la population d’intérêt, l’information connue sur cette population de même que des contraintes opérationnelles. Certaines contraintes opérationnelles peuvent aussi influencer ce choix, comme les caractéristiques de la base de sondage. Dans cette section, les méthodes d’échantillonnage probabiliste seront décrites brièvement et illustrées à l’aide d’exemples. Échantillonnage aléatoire simple : Dans un échantillonnage aléatoire simple (EAS), chaque unité d’échantillonnage de la population a une chance égale d’être incluse dans l’échantillon. Par conséquent, chaque échantillon possible a aussi une chance égale d’être sélectionné. Pour mettre cette technique en œuvre, il faut d’abord dresser une liste de toutes les unités de la population observée.  Exemple n° 1 : Pour prélever un échantillon aléatoire simple d’un annuaire téléphonique, il faudrait numéroter en ordre séquentiel chaque entrée ou inscription. S’il y avait 10 000 entrées dans l’annuaire téléphonique et si la taille de l’échantillon était de 2 000 numéros, un ordinateur devrait alors générer au hasard 2 000 numéros entre 1 et 10 000. Tous les numéros auraient la même chance d’être générés par l’ordinateur. Les 2 000 entrées de l’annuaire téléphonique correspondant aux 2 000 numéros aléatoires générés par l’ordinateur composeraient l’échantillon. Un EAS peut être effectué avec ou sans remplacement. Un EAS avec remplacement signifierait qu’il est possible que l’entrée échantillonnée dans l’annuaire téléphonique soit sélectionnée deux fois ou plus. Habituellement, l’EAS est effectué sans remplacement parce qu’il est plus pratique et donne des résultats plus précis. Dans le reste du texte, le terme EAS sera utilisé pour faire référence à l’EAS sans remplacement, à moins d’indication contraire. L’EAS est la méthode d’échantillonnage la plus couramment utilisée. L’avantage de cette technique tient au fait qu’elle n’exige pas d’autres données dans la base de sondage que la liste complète des membres de la population observée et l’information pour les contacter. De plus, puisque l’EAS est une méthode simple et que la théorie qui la sous-tend est bien établie, il existe des formules types pour déterminer la taille de l’échantillon, les estimations, etc., et ces formules sont faciles à utiliser. Cependant, l’EAS nécessite une liste de toutes les unités de la population. Si cette liste n’existe pas déjà, il peut être trop dispendieux ou même irréaliste d’en créer une pour de grandes populations. Si une base de sondage est disponible et que cette base contient des informations auxiliaires, l’EAS ne permet pas de tirer parti de ces informations qui peuvent rendre d’autres méthodes d’échantillonnage plus efficaces (comme l’échantillonnage stratifié par exemple). Si la collecte doit être réalisée en personne, l’EAS pourrait donner un échantillon trop dispersé géographiquement qui ferait grimper les coûts de collecte et la durée de l’enquête.  Exemple n° 2 : Imaginez que vous êtes propriétaire d’un cinéma et que vous planifiez y organiser un festival de films d’horreur le mois prochain. Pour déterminer quels films d’horreur vous y présenterez, vous voulez demander à des cinéphiles quels films ils préfèrent parmi les films que vous leur énumérerez. Pour dresser la liste des films nécessaire à votre sondage, vous décidez d’échantillonner 10 des 100 meilleurs films d’horreur de tous les temps. L’une des façons d’obtenir un échantillon consisterait à écrire tous les titres des films sur des bouts de papier, à les placer dans une boîte et à tirer les 10 titres qui constitueront votre échantillon. En utilisant cette méthode, vous auriez l’assurance que chaque film avait une probabilité égale d’être sélectionné. Vous pourriez même calculer cette probabilité, en divisant la taille de l’échantillon (n=10) par la taille de la population des 100 meilleurs films d’horreur de tous les temps (N=100). Cette probabilité serait de 0,10 (10/100), soit une chance sur dix. Échantillonnage systématique : L’échantillonnage systématique signifie qu’il existe un écart, ou un intervalle, entre chaque unité sélectionnée dans l’échantillon. Par exemple, vous pourriez suivre les étapes suivantes : 1. Numérotez de 1 à N les unités incluses dans votre base de sondage (où N est la taille de la population totale). 2. Déterminez l’intervalle d’échantillonnage (K) en divisant le nombre d’unités dans la base de sondage par la taille de l’échantillon que vous désirez obtenir. Par exemple, pour sélectionner un échantillon de 100 unités à partir d’une population de 400, vous auriez besoin d’un intervalle d’échantillonnage de 400/100 = 4. Donc K=4. Vous devrez sélectionner une unité sur quatre pour avoir au total 100 unités à l’intérieur de votre échantillon. 3. Sélectionnez au hasard un nombre entre 1 et K. Ce nombre s’appelle l’origine choisie au hasard et ce sera le premier nombre inclus dans votre échantillon. Si vous choisissiez 3, la troisième unité incluse dans votre base de sondage serait la première unité comprise dans votre échantillon; si vous choisissiez 2, le début de votre échantillon serait la deuxième unité incluse dans votre base de sondage. 4. Sélectionnez chaque Ke (dans cet exemple, chaque 4e) unité après ce premier nombre. L’échantillon pourrait, par exemple, se composer des unités suivantes de façon à constituer un échantillon de 100 : 3 (l’origine choisie au hasard), 7, 11, 15, 19… 395, 399 (jusqu’à N, qui est 400 dans ce cas). Vous pouvez constater que dans l’exemple ci-dessus seulement quatre échantillons sont possibles, soit ceux qui correspondent aux quatre origines possibles : 1, 5, 9, 13… 393, 397 2, 6, 10, 14… 394, 398 3, 7, 11, 15… 395, 399 4, 8, 12, 16… 396, 400 Chaque unité de la population ne fait partie que d’un seul des quatre échantillons et chaque échantillon a une probabilité égale d’être sélectionné. Chaque unité a donc une chance sur quatre de faire partie de l’échantillon, soit la même probabilité que si un EAS de taille 100 avait été tiré. La principale différence tient au fait que dans le cas d’un EAS, n’importe quelle combinaison de 100 unités aurait une chance de constituer l’échantillon, tandis que dans celui d’un échantillonnage systématique, il n’y a que quatre échantillons possibles. L’ordre des unités dans la base de sondage déterminera les échantillons systématiques possibles. Si la population est distribuée au hasard dans la base de sondage, un échantillonnage systématique devrait produire des résultats similaires à ceux d’un échantillonnage aléatoire simple. Cette méthode est souvent utilisée dans l’industrie, où l’on sélectionne une unité pour des essais dans une chaîne de production afin de s’assurer que la machinerie et l’équipement sont d’une qualité uniforme. Un testeur dans une usine pourrait, par exemple, soumettre à un contrôle de la qualité chaque 20e produit sur une chaîne de montage, en commençant par un point initial choisi au hasard entre 1 et 20. Les intervieweurs peuvent mettre en œuvre cette technique d’échantillonnage lorsqu’ils interrogent des gens pour une enquête-échantillon. Le responsable d’une étude de marché pourrait sélectionner, par exemple, chaque 10e personne qui entrerait dans un commerce, après avoir sélectionné au hasard la première personne. Un enquêteur pourrait interviewer les occupants de chaque 5e maison d’une rue, après avoir sélectionné au hasard l’une des cinq premières maisons. Les avantages de l’échantillonnage systématique tiennent au fait que la sélection de l’échantillon ne peut être plus facile : vous n’obtenez qu’un seul nombre aléatoire, l’origine choisie au hasard, et le reste de l’échantillon suit automatiquement. Le plus gros inconvénient de la méthode tient au fait que les échantillons possibles risquent de ne pas être représentatifs de la population s’il existe un trait périodique dans l’ordre d’apparition des unités sur la base de sondage et que ce trait périodique coïncide d’une quelconque façon avec l’intervalle d’échantillonnage. C’est ce que l’on peut constater dans l’exemple qui suit :  Exemple n° 3 : Supposez que vous dirigez une épicerie de grande surface et que vous possédez une liste des employés de chacune de ses sections. L’épicerie est divisée entre les 10 sections suivantes : le comptoir de charcuterie, la boulangerie, les caisses, les stocks, le comptoir des viandes, les fruits et légumes, la pharmacie, le magasin de photographie, le magasin de fleurs et le nettoyage à sec. Chaque section compte 10 employés, incluant un gérant (ce qui fait 100 employés au total). Votre liste est ordonnée par section, le gérant y étant énuméré le premier et les autres employés y étant ensuite inscrits dans l’ordre décroissant d’ancienneté. Si vous voulez sonder vos employés au sujet de leurs opinions sur leur milieu de travail, vous pourriez choisir un petit échantillon pour répondre à vos questions. uploads/Geographie/ echantillonnage-probabiliste.pdf

  • 38
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager