BTS DOMOTIQUE Statistiques inférentielles : estimation 2008-2010 Statistiques i
BTS DOMOTIQUE Statistiques inférentielles : estimation 2008-2010 Statistiques inférentielles : estimation Table des matières I Estimation ponctuelle d’un paramètre 2 I.1 Moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 I.2 Écart-type . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 I.3 Fréquence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 II Estimation par intervalle de confiance d’un paramètre 3 II.1 Moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 II.2 Fréquence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 IIITableau récapitulatif 5 http://mathematiques.daval.free.fr -1- BTS DOMOTIQUE Statistiques inférentielles : estimation 2008-2010 Les problèmes de l’échantillonnage et de l’estimation sont illustrés par l’étude de la situation suivante : Exemple 1 Un industriel produit en très grand nombres des yaourts, pour lesquelles l’usinage doit respecter des normes sanitaires draconiennes. Á la suite de mauvais réglages de l’une des machines, l’industriel a produit 1 million de ces yaourts, dont beaucoup risquent ainsi de présenter des dangers pour le consommateur. Il souhaite connaître la proportion de yaourts susceptibles de rendre malade un client, afin de savoir s’il doit détruire sa production, ce qui représentera un fort manque à gagner, ou s’il peut malgré courir le risque de quelques gênes isolées dans la population, sans craindre de campagne médiatique mettant en cause ces yaourts, ce qui lui causerait un préjudice encore plus grand. Il est ainsi prêt à détruire son stock ainsi produit si la proportion de yaourts dangereux pour la santé dépasse les 0, 01% de sa production. Il n’est bien entendu pas question d’analyser un par un tous les yaourts produits : cela lui reviendrait encore plus cher, et de toutes façons, il faudrait ouvrir les yaourts, ce qui les rendrait invendables. Il décide donc d’effectuer un sondage c’est à dire de prélever par exemple 100 yaourts, de les faire analyser, et de relever la proportion de yaourts contaminés dans cet échantillon. Il obtient ainsi la résultat suivant : dans l’échantillon prélevé (au hasard) parmi les yaourts produits, on en a trouvé 2% qui contenaient des germes. Notre industriel est-il plus avancé après ces analyses pour résoudre son problème ? La réponse est bien sûr négative : en effet, il peut toujours se poser les questions suivantes : 1. aurait-on obtenu le même pourcentage en prélevant un autre échantillon ? (autrement dit, la proportion inquiétante relevée dans le premier échantillon est-elle due à de la malchance ?) 2. l’analyse de 100 yaourts sur le million produit est-elle suffisante ? 3. quelle confiance peut-on accorder au fait que l’analyse d’un échantillon de 100 yaourts ait conduit à une proportion de 2% de produits contaminés ? 4. aurait-on gagné en fiabilité du pronostique si l’on en avait fait analyser 200, 1000, 10000 yaourts ? La question 1., elle, relève du champ de l’échantillonnage. Cette théorie répond à la question : "comment varie la proportion relevée d’un échantillon à l’autre, sachant que tous sont de même taille donnée à l’avance ?". Ces questions ont des réponses fournies par le théorème de la limite centrée vue dans un précédent chapitre. Les questions 2., 3. et 4., portant sur la taille de l’échantillon, et sur la confiance que l’on peut accorder au sondage sont du domaine de l’estimation : elles obtiennent une réponse avec les résultats sur la "loi des grands nombres". I Estimation ponctuelle d’un paramètre I.1 Moyenne Propriété 1 La valeur moyenne me d’un paramètre observé sur un échantillon de population, dont la taille est fixée, fournit une estimation x de la moyenne réelle de ce paramètre sur la population considérée. Exemple 2 Une usine produit des vis cruciformes. On souhaite estimer la moyenne des longueurs des vis dans la production de la journée qui s’élève à 10000 pièces. On choisit un échantillon de 150 vis et on obtient une moyenne de me = 4, 57 cm. On en déduit donc que la longueur moyenne des vis de la production journalière est x = 4, 57 cm. http://mathematiques.daval.free.fr -2- BTS DOMOTIQUE Statistiques inférentielles : estimation 2008-2010 I.2 Écart-type Le problème est toujours le même, mais cette fois-ci, l’estimation de l’écart-type est moins intuitive ... Propriété 2 L’écart-type σe d’un paramètre observé sur un échantillon de population, dont la taille est fixée, fournit une estimation faussée de l’écart-type de ce paramètre dans toute la population considérée. Une meilleure estimation σ de l’écart-type réel est obtenue en considérant le nombre σ = σe q n n−1, où n est la taille de l’échantillon servant au calcul de σe. Exemple 3 La mesure de la longueur des vis produites dans l’échantillon précédent de 150 pièces conduit à relever un écart-type de 3 mm. La meilleure estimation possible de l’écart-type de la production journalière n’est pas de 3 mm comme dans le cas précédent pour la moyenne, mais de σ = 3 r 150 149 ≃3, 01 mm. Remarque 1 La correction devient assez rapidement minime lorsque la taille de l’échantillon augmente car lim n→∞ r n n −1 = 1. La correction est ainsi de l’ordre de 0, 5% pour des échantillons de taille 100, et de l’ordre de 0, 05% pour des échantillons de taille 1000. I.3 Fréquence Propriété 3 La fréquence d’apparition fe d’un paramètre observé sur un échantillon de population, dont la taille est fixée, fournit une estimation f de la fréquence réelle d’apparition de ce paramètre sur la population considérée. Exemple 4 Dans l’exemple précédent, On prélève un échantillon de 150 vis et on relève 3 pièces défectueuses. On peut alors donner une estimation de la fréquence f de vis défectueuses dans la production journalière : On a fe = 3 150 = 0, 02 donc, f = 0, 02. Remarque 2 Notons qu’il revient exactement au même d’estimer un pourcentage : dans l’exemple précédent, on peut affirmer que 2% des vis ont une croix mal formée sur la tête. II Estimation par intervalle de confiance d’un paramètre Les estimations ponctuelles proposées ci-dessus dépendent directement de l’échantillon prélevé au hasard. Dans de très nombreux cas, l’importance attribuée au hasard est grande, cela conduit à s’interroger avant d’utiliser ces estimations pour prendre des décisions dont les conséquences peuvent être lourdes ! Aussi, sans rejeter les informations fournies par l’étude d’un échantillon, est-on amené à chercher un nouveau type d’estimation de la fréquence et de la moyenne d’une population, en utilisant le calcul de probabilités qui permet de « contrôler » l’influence d’un échantillon particulier. http://mathematiques.daval.free.fr -3- BTS DOMOTIQUE Statistiques inférentielles : estimation 2008-2010 II.1 Moyenne On souhaite, à partir des observations faites sur un échantillon, déterminer un intervalle de confiance conte- nant la valeur moyenne avec un risque d’erreur décidé à l’avance. On suppose que les conditions sont réunies pour faire l’approximation que la loi d’échantillonnage de la moyenne X est la loi normale N m; σ √n . On pose T = X −m σ √n , T suit donc la loi normale centrée réduite N(0; 1). Soit α la probabilité, fixée à l’avance, pour que T n’appartienne pas à l’intervalle [−t; t], on peut écrire : P(|T| > t) = α ⇐ ⇒1 −P(|T| ≤t) = α ⇐ ⇒P(|T| ≤t) = 1 −α ⇐ ⇒P(−t ≤T ≤t) = 1 −α ⇐ ⇒P −t ≤X −m σ √n ≤t = 1 −α ⇐ ⇒P X −t σ √n ≤m ≤X + t σ √n = 1 −α Autrement dit, m appartient à l’intervalle X −t σ √n; X + t σ √n pour 100(1 −α)% des échantillons. • Cet intervalle est appelé intervalle de confiance, • α est le risque d’erreur ou le seuil de risque, • 1 −α est le coefficient de confiance. Propriété 4 L’intervalle X −t σ √n; X + t σ √n est l’intervalle de confiance de la moyenne m de la population avec le uploads/Industriel/ bts-cours-14-stat-inf-estimation-2.pdf
Documents similaires










-
30
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Aoû 06, 2022
- Catégorie Industry / Industr...
- Langue French
- Taille du fichier 0.0773MB