Support de cours de STATISTIQUE INFERENTIELLE 1 Année académique 2021 – 2022 MA
Support de cours de STATISTIQUE INFERENTIELLE 1 Année académique 2021 – 2022 MASTER 1 INFORMATIQUE Soir STATISTIQUE INFERENTIELLE Support de cours ✓ Un cours pédagogique ✓ Des exemples pour comprendre ✓ Des exercices pratiques pour s’entraîner Enseignant : M. KELASSA KODJO Support de cours de STATISTIQUE INFERENTIELLE 2 Avertissement Ce document est conçu comme support de cours. Il ne possède ni la complétude ni l'exhaustivité d'un livre, voire d’un polycopié, qu'il ne saurait remplacer. Merci de contribuer à l’amélioration de ce document en : ➢ nous envoyant vos suggestions et critiques à notre adresse E-mail ➢ ou en déposant vos suggestions et critiques à l’administration de l’établissement. Support de cours de STATISTIQUE INFERENTIELLE 3 SOMMAIRE CH 1 : INTRODUCTION A LA STATISTIQUE INFERENTIELLE I. Lois d'échantillonnage II. Estimations III. Exercices CH 2 : TESTS STATISTIQUES I. Tests d’hypothèses II. Tests d’ajustement du chi-deux III. Tests d’indépendance du chi-deux III. Exercices EXERCICES CORRIGES REFERENCES BIBLIOGRAPHIQUES Support de cours de STATISTIQUE INFERENTIELLE 4 CH 1 : INTRODUCTION A LA STATISTIQUE INFERENTIELLE La statistique inférentielle étudie les valeurs caractéristiques d'une population à partir d'étude sur des échantillons de cette population. En effet pour étudier une population statistique, on peut recenser chacun des éléments de la population, (cette méthode est souvent longue et coûteuse) ou bien examiner qu'une partie de la population (échantillon) et en tirer informations sur la population totale, c'est la méthode des sondages. Cette méthode se compose en deux étapes : L’échantillonnage (choix des échantillons) et l'estimation (utilisation des résultats observés sur les échantillons pour induire des résultats sur la population mère) I. Lois d'échantillonnage : La théorie de l’échantillonnage consiste, connaissant des propriétés d’une population mère, à déterminer des propriétés d’échantillons qui en sont extraits. La constitution d’un échantillon peut s’effectuer : - avec remise ; dans ce cas, l’échantillonnage est dit non exhaustif. - sans remise ; dans ce cas, l’échantillonnage est dit exhaustif Dans la plupart des cas, la population ayant un grand effectif, dans laquelle on tire une faible proportion d’éléments, on assimile un tirage sans remise à un tirage avec remise. Chaque échantillon de taille n constitué, avec ou sans remise, à partie d’une population mère finie, forme une distribution statistique. Celle-ci peut être caractérisée par une moyenne, un écart-type ou une proportion ( fréquence ). La série des valeurs obtenues pour l’une de ces caractéristiques, à partir de l’ensemble des échantillons tirés de la population mère, constitue une distribution d’échantillonnage de moyennes, d’écarts-type, de proportions. De façon similaire, chaque distribution d’échantillonnage sera caractérisée par une moyenne ou un écart-type. Support de cours de STATISTIQUE INFERENTIELLE 5 1.1 Distribution d'échantillonnage des moyennes : On considère une population mère et X une variable aléatoire définissant le caractère étudié de cette population d'espérance mathématique E( X ) = m et d'écart type . On prélève avec remise des échantillons ( non exhaustifs ) de taille n de cette population, ce qui correspond à n variables aléatoires indépendantes X1, X2, X3, ..... , Xn de même loi que X. La loi d'échantillonnage de taille n de la moyenne des n variables aléatoires peut être approchée par la loi normale N ( m ; / ) pour n suffisamment grand ( 30 n ). En effet : E( ) = (1/n) (E(X1) + E(X2) + E(X3) + .....+ E(Xn ) ) = (1/n) (n E(X)) = E(X) = m V( ) = (1/n²)(V(X1) + V(X2) + V(X3) + .....+ V(Xn ) ) = (1/n²) (n V(X)) = V(X)/n ( ) = / Remarques : ▪ Si la population mère est elle-même normale, on peut utiliser ce résultat même si n < 30. ▪ Lorsque les échantillons de taille n sont prélevés sans remise ( tirages exhaustifs ) dans une population d’effectif N, on utilise le résultat précédent en prenant 1 − − N n N n au lieu de n . ▪ 1 − − N n N est appelé « facteur d’exhaustivité » Exemple 1 : Une machine automatique produit des pièces dont le poids moyen est 5 grammes avec un écart-type de 0,25 grammes. Le responsable de la production désire contrôler le poids de ces pièces et prélève à cet effet 100 pièces, à intervalles réguliers. 1) A quelle loi de probabilité obéit la variable aléatoire X de cette distribution d’échantillonnage de moyenne ? 2) Calculer la probabilité que X soit au plus égale à 5,01 grammes. …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… 1.2 Distribution d'échantillonnage de la différence de moyennes : Notons que les prélèvements d’échantillons sont avec remise ( tirages non exhaustifs ). Désignons par A X la distribution d’échantillonnage de moyennes d’une population A B X la distribution d’échantillonnage de moyennes d’une population B Support de cours de STATISTIQUE INFERENTIELLE 6 Pour 30 A n et 30 B n , la variable aléatoire B A X X D − = suit approximativement une loi normale N + − B B A A B A n n m m 2 2 ; . Remarques : ▪ Si la variable X est distribuée dans les populations A et B suivant une loi normale, alors la variable aléatoire B A X X D − = obéit à une loi normale même si nA < 30 ou nB < 30. ▪ Les conditions d’application du facteur d’exhaustivité sont identiques à celles précédemment définies. Exemple 2 : Une société produit des briques dans deux unités : A et B. Ceux produits par l’unité A permettent 150 allumages en moyenne avec un écart-type de 20 allumages. Les briquets produits par B assurent 140 allumages en moyenne avec un écart-type de 15 allumages. Le contrôleur de la société prélève 150 briquets de A et 200 briquets de B. Calculer la probabilité que le nombre moyen d’allumage des briquets de l’échantillon de A soit supérieur de plus de 15 au nombre moyen d’allumage de l’échantillon provenant de B. …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… 1.3 Distribution d'échantillonnage des pourcentages ( fréquences ) : On considère une population mère et A une classe (catégorie) de cette population c'est à dire un sous ensemble de . Soit X une variable aléatoire à valeur dans {0 ; 1 } définie de la façon suivante pour tout élément de : X( ) = 1 si A X( ) = 0 si A On a : P(X = 1) = P(A) = p où p représente la proportion ou fréquence d'éléments de catégorie A dans la population . P(X = 0) = P( ) = 1 - p = q où q représente la proportion ou fréquence d'éléments de n'étant pas de catégorie A dans la population . On prélève avec remise un échantillon ( non exhaustif ) de taille n de cette population, c'est à dire n éléments de ; ce qui correspond à n variables aléatoires indépendantes X1, X2, X3, ..... , Xn de même loi que X. On a : E(X) = 0 P(X = 0) + 1 P(X = 1) = p V(X) = (0 - p)² P(X = 0) + (1 - p) P(X = 1) = p (1 - p) = pq Support de cours de STATISTIQUE INFERENTIELLE 7 La variable aléatoire définie par = ( X1 + X2 + X3 + .....+ Xn ) / n associe à tout échantillon de taille n la fréquence d'éléments de catégorie A de cet échantillon. La loi d'échantillonnage de la fréquence d'éléments de catégorie A peut être approchée par la loi normale N ( p ; ) pour n suffisamment grand ( 30 n ) avec = pq n . En effet : Remarques : ▪ Si la population est distribuée selon une loi normale, alors la loi d’échantillonnage de la fréquence obéit également à une loi normale même si n < 30 . ▪ Les conditions d’application du facteur d’exhaustivité sont identiques à celles précédemment définies. ▪ Les remarques relatives aux lois de probabilités suivies par les distributions d’échantillonnage de moyennes et de différences de moyennes s’appliquent également au cas des pourcentages. Exemple 3 : Le responsable du service abonnement d’une chaîne de télévision codée constate que 2 % des abonnés résilient leur contrat au terme d’un an. Le directeur de la chaîne prélève un échantillon aléatoire de 200 abonnés. - Calculer la probabilité que le nombre de résiliations au terme de l’année soit supérieur à 4 %. - Calculer la probabilité que ce nombre soit au plus égal à 1 %. …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… II. Estimation : C’est le problème inverse de l’échantillonnage ; c'est-à-dire connaissant des renseignements sur un ou plusieurs échantillons, on cherche à en déduire des informations sur la population mère. 2.1 Estimation ponctuelle : a) Moyenne De manière générale, on choisit la moyenne e x d’un échantillon prélevé au hasard dans une population comme meilleure estimation ponctuelle de la moyenne inconnue m de cette population mère : e x m = . Support de cours de STATISTIQUE INFERENTIELLE 8 b) Pourcentage ( ou uploads/Geographie/ support-cours-de-statistique-inferentielle-master-1-info-soir.pdf
Documents similaires










-
26
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Jul 05, 2021
- Catégorie Geography / Geogra...
- Langue French
- Taille du fichier 0.3894MB