Ecole Nationale de Commerce et de Gestion de Casablanca Année universitaire 202

Ecole Nationale de Commerce et de Gestion de Casablanca Année universitaire 2020-2021 Polycopié de cours de statistique appliquée PR. Rizlane GUATI Présentation du cours Ce polycopié s’adresse aux étudiants de S5 qui ont déjà suivi un cours de statistique descriptive et un cours de probabilité. Le cours a pour objectif de familiariser les étudiants aux techniques d’échantillonnage, leur permettant de maîtriser les outils nécessaires pour le choix d’un échantillon, et pour réaliser des estimations quelque soit le domaine d’application. Un autre objectif majeur de ce cours consiste à former les étudiant à la prise de décision en se basant sur les tests d’hypothèse. Nous allons traiter les points suivant : après un rappel des statistiques descriptives, nous allons dans un première partie présenter les différentes techniques d’échantillonnage, la deuxième partie s’intéresse aux estimations ponctuelles et par intervalle. Dans une troisième partie nous allons traiter les tests d’hypothèse. Plan du cours Introduction Partie 1: techniques d’échantillonnage Partie 2: Estimation Partie 3: Tests d’hypothèse Introduction à la statistique inférentielle Pourquoi un échantillon Les statisticiens ont constaté plusieurs limites pour accéder à la population : -Une étude statistique sur l’ensemble de la population est souvent très onéreuse et parfois même impossible à réaliser. -Difficulté d’obtenir des indicateurs fiables sur diverses caractéristiques d’une population. -Impossibilité d’accéder à tous les individus d’une population ou à la totalité d’une aire. -Fiabilité résultats sur un nombre peu élevé des observations. Ces raisons conduisent à la construction d’un échantillon pour généraliser ses estimations à l’ensemble de la population. Statistique descriptive/ Statistique inférentielle ou appliquée La Statistique descriptive consiste à Organiser, résumer, représenter un ensemble de données. Elle se base sur le calcule des paramètres de tendance centrale et de dipersion/ Statistique inférentielle ou appliquée s’appuie sur le choix d’un échantillon représentatif de la population (techniques d’échantillonnage) afin d’étendre ses propriétés sur toute la population. Elle permet aussi de mesurer et prendre en compte l’erreur d’échantillonnage et vérifier les tests d’hypothèses. Population/ Echantillon Population = C’est l’ensemble des éléments étudiés. (individus, pays, entreprises, …) Echantillon = c’est un sous-ensemble tiré de la population . Partie1 : les techniques d’Echantillonnage 1.1. Echantillonnage aléatoire 1.2. Echantillonnage non aléatoire On distingue deux principales méthodes d’échantillonnage : Les méthodes aléatoires et les méthodes non aléatoires Échantillonnage probabiliste (ou aléatoire) L’échantillonnage aléatoire simple L’échantillonnage systématique L’échantillonnage stratifié L’échantillonnage en grappes Échantillonnage non probabiliste Selon le jugement De convenance Par quota Boule de neige Volontaire 1.1. Échantillonnage probabiliste (ou aléatoire) Echantillonnage aléatoire simple Consiste à prélever dans la population des individus au hasard, sans remise ou avec remise : tous les individus ont la même probabilité d’être prélevés, et ils le sont indépendamment les uns des autres. On choisit un point de départ dans la liste puis on sélectionne séquentiellement tous les nième éléments jusqu’à ce que la taille d ’échantillon soit atteinte. Echantillonnage systématique Parfois appelé échantillonnage par intervalles, l’échantillonnage systématique signifie qu’il existe un intervalle ou un écart entre chaque unité sélectionnée qui est incluse dans l’échantillon. On peut distinguer les étapes de sélection d’un échantillonnage systématique dans la procédure suivante: 1. Élaborer une liste des individus de la population : numérotés de 1 à N; 2. Décider de la taille de l’échantillon n; 3. Déterminer l’intervalle d’échantillonnage (K): en divisant la taille de la population N par la taille de l'échantillon que vous désirez Obtenir (N/n). 4. Sélectionner au hasard un nombre entre 1 et K. Ce nombre s’appelle l’origine choisi au hasard. Il serait le premier nombre inclus dans l’échantillon. 5. Continuer tout au long de la liste, en choisissant les éléments à cet intervalle. Exemple d’un échantillonnage systématique Il y a 400 ménages dans le village, et l’étude se fera sur un échantillon de 100 ménages. Déterminer les échantillons systématiques possibles. Solution Pour trouver I’intervalle entre les éléments choisis, on divise la taille de la population par la taille de I’échantillon; cela donne 4. Il faut sélection au hasard un nombre compris entre 1 et 4 : prenons 3 Les éléments choisis pour l’échantillon sont alors les ménages numérotés 3, 7, 11, 15... 395, 399 Echantillonnage stratifié Plus grandes sont les différences entre les éléments de la population, plus grand doit être l’échantillon pour être représentatif. LA procédure à suivre es la suivante : 1. Découper la population en sous ensembles les plus homogènes possibles appelés strates 2. sélectionner un échantillon dans chacune d’elles : chaque sondage partiel s’effectue de façon efficace 3. Assembler les sondages partiels pour obtenir l’échantillon final. Cette méthode donnera des résultats plus fiables qu’un sondage de même taille effectué “en vrac”. Exemples d’échantillonnage stratifié Nous présentons quelques exemples de l’échantillonnage stratifié. 1. La population est stratifiée suivant les communes 2. Les échantillons d’entreprises sont stratifiés par effectifs salariés ou chiffre d’affaires. 3. Les échantillons d’exploitations agricoles sont stratifiés par tranches de surface. 4. Les échantillons de jeunes sortis de l’enseignement supérieur sont stratifiés par discipline, 5. Dans un lycée, pour sélectionner un échantillon des élèves consommateurs de tabac, on stratifie selon les niveaux d’études. Echantillonnage aléatoire simple stratifié Lorsqu’on utilise l’échantillonnage aléatoire simple à l’intérieur d’une strate, on appelle le plan d'échantillonnage un plan d'échantillonnage aléatoire simple stratifié. Echantillonnage en grappe La technique de l'échantillonnage en grappes entraîne la division de la population en groupes ou en grappes (usines, établissements de santé, écoles, les rues d’une ville). Suivant cette technique, on sélectionne au hasard un certain nombre de grappes pour représenter la population totale, puis on englobe dans l'échantillon toutes les unités incluses à l'intérieur des grappes sélectionnées. Exemple Echantillonnage en grappe La particularité de cette méthode au lieu de choisir au hasard un individu on choisit au hasard un groupe. Il est possible de choisir cette méthode à chaque fois qu’on ne peut pas accéder à la liste des individus de la population, mais qu’on peut joindre des groupes identifiables (exemple: impossibilité de connaitre la liste des étudiant d’une université mais possibilité de voir les listes par cours, pour étudier les voyageurs d’affaires, on choisit les groupes avions ou aéroports) 1.2. Échantillonnage non probabiliste (ou non aléatoire) Après avoir présenté toutes les méthodes d’échantillonnage probabilistes, nous présentons les méthodes non probabilistes qui restent très critiquables Selon le jugement Le chercheur juge que l’échantillon va lui permettre d’atteindre les objectifs de la recherche. Constitue un net avantage lorsque le chercheur a suffisamment d’expérience pour identifier les unités qui représentent adéquatement la population. De convenance (de commodité) On l’utilise dans les cas où les unités d’échantillonnage sont faciles à rejoindre, disponibles et généralement facile à convaincre. (L’échantillon est sous la main du chercheur). Exemple : une classe d’étudiant pour le sondage de la consommation du tabac par les lycéens) Par quota Lorsque le chercheur veut reproduire les caractéristiques d’une population (ex. âge, sexe, revenus, etc.) dans son échantillon. Échantillon dont les sous-groupes respectent les proportions de chacun de ces groupes au sein de l’univers étudié Boule de neige Cette technique est utile dans le cas où les unités d ’échantillonnage sont difficiles à identifier. Elle Consiste à demander à un répondant de nous référer à un autre qui présente les mêmes caractéristiques que les siennes, et ainsi de suite… Donc c’est une construction graduelle d’un échantillon en utilisant des références obtenues des premiers répondants. Volontaire On fait recours à cette méthode dans le contexte où les répondants ont le libre choix de participer à un sondage sans avoir été sélectionnés au préalable. Problème : Après avoir présenté les différentes méthodes d’échantillonnage, on signale qu’un mauvais choix de la méthode adapté à notre échantillon et nos objectifs d’étude peut être sources d’erreurs. Donc l’échantillon doit être représentatif et non pas (biaisé). Les différentes sources de Biais Il existe plusieurs sources de distorsions: 1. Instruments de mesures 2. Organisation 3. Méthode d’échantillonnage 4. Erreurs dues au phénomène de non réponse 5. Erreurs d’échantillonnage Les erreurs dues aux instruments de mesure Pour donner les bonnes mesures, deux conditions sont nécessaires: -un instrument doit être fidèle : répondre exactement de la même façon quand il est placé dans deux situations identiques. -Un instrument doit être valide : mesurer ce qu’il est censé mesurer. Les erreurs dues à l’organisation Ce sont les erreurs qui se glissent lors de la collecte des données. Donc on doit se poser les questions suivantes : 1. Est-ce que les consignes ont été respectées? 2. Les enquêteurs ont-ils agi de la même façon? 3. Les enquêteurs sont ils compétents? Pour éviter ces erreurs il faut utiliser les mêmes instruments, les mêmes conditions. Les erreurs dues à la méthode d’échantillonnage Il faut toujours vérifier, à la lumière des objectifs de l’étude statistique, que la méthode d’échantillonnage est adaptée. En particulier éviter la surreprésentation de certaines parties de la population. Les erreurs dues au phénomène de non-réponse Même avec la meilleure méthode d’échantillonnage, il se présente toujours un certain nombre de non-répondants, ce qui peut influencer la représentativité de l’échantillon et conduire à des conclusions erronées. L’erreur d’échantillonnage Couverture inadéquate de la population étudié: le fait d’étudier un échantillon plutôt qu’un autre engendre forcément une erreur. Echantillon non uploads/Geographie/cours-stat-appliquees.pdf

  • 19
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager