Chapitre 4 LES LOIS DES PROBABILITÉS Le temps est venu d’étudier les lois des p

Chapitre 4 LES LOIS DES PROBABILITÉS Le temps est venu d’étudier les lois des probabilités les plus courantes et leurs applications. 4.1 La loi binomiale Considérons une population dont les individus en proportion p sont distingués par une caractéristique remarquable : population d’électeurs qui se proposent de voter Clovis (parmi les diverses possibilités qui sont offertes), lot de pièces défectueuses (ou non) que l’on se propose d’acquérir (ou non), boules vertes dans une urne, etc... Dans la population, on tire un individu au hasard, de telle sorte que tous les individus soient équiprobables. Une telle épreuve est une épreuve de Bernoulli (avec un seul "i" !). On construit une variable aléatoire X qui prend la valeur 1 si l’individu tiré au hasard présente la caractéristique remarquable évoquée, et la valeur 0 dans le cas contraire. Une telle variable est une variable de Bernoulli. variable : X = 1 0 probabilité : p q = 1 −p On utilise les déÞnitions pour calculer l’espérance, E(X) = X, de la variable X et son écart-type, σX : E(X) = X = p et σX = √p q = p p (1 −p) On considère une suite de n épreuves de Bernoulli successives et indépendantes. On peut ainsi modéliser un sondage pré-électoral∗, ou un échantillon de pièces tirées du lot à acheter. Un tirage est une succession de 0 et de 1 en nombre n. On additionne toutes les valeurs des n variables aléatoires obtenues. On construit ainsi la variable aléatoire Z = X1 +X2 +... +Xn où Xj est la variable aléatoire X de rang j (ce n’est pas, ici, l’une des valeurs possible de la variable X, comme ce fut le cas dans quelques circonstances précédentes). La valeur obtenue pour Z est un entier, k, qui est égal au nombre de 1 obtenus dans le tirage (nombre d’électeurs qui ont l’intention de voter Clovis). La variable Z suit une loi binomiale : proba [Z = k] = Ck n pk (1 −p)n−k avec Ck n = n! k! (n −k)! (4.1) ∗Le plus souvent, pour des raisons d’économie, les instituts de sondage n’utilisent pas cette méthode mais la méthode des quotas qui consiste à interroger un échantillon réduit que l’on croit représentatif. 56 Les lois des probabilités Ck n est le nombre de suites différentes de n nombres comportant k fois le nombre 1 et n −k fois le nombre 0, tandis que pk q(n−k) = pk (1 −p)n−k est la probabilité pour que l’une quelconque des suites précédentes soit le résultat des n épreuves de Bernoulli. On peut calculer l’espérance, la variance et l’écart-type de la loi binomiale précé- dente, en utilisant les propriétés concernant la somme de variables indépendantes (cf.3.10) : E(Z) = Z = n × E(X) = n p (4.2) V(Z) = n × V(X) = np(1 −p) σZ = p n p (1 −p) = √n σX (4.3) La variable Z est la fréquence absolue des observations X = 1 dans l’échantillon- nage au hasard effectué. Introduisons la fréquence relative. Plus précisément posons z = Z n La valeur observée de z est la moyenne observée de X sur l’échantillon. Les relations 3.10, 3.3 et 3.4 donnent l’expression de l’espérance de z et de son écart type : E (z) = z = 1 nE (Z) = E (X) = p , σz = 1 nσZ = σX √n = r p(1 −p) n La valeur observée de z est le résultat d’une campagne de mesures portant sur un échan- tillon de cardinal n. En répétant les campagnes de mesures, on obtient des valeurs de z dispersées autour de la moyenne, p. L’écart-type σz, permet d’apprécier cette disper- sion : c’est un ordre de grandeur de l’incertitude sur la mesure de p lorsqu’on assimile la moyenne observée, z, à la moyenne réelle, inconnue, p. Lorsque n croît, σz décroît et par conséquent, l’incertitude décroît. Un grand nombre d’observations permet ainsi d’amélio- rer la précision du résultat. C’est cette propriété, présentée ici de façon intuitive, que nous allons maintenant démontrer avec plus de rigueur. 4.2 L’inégalité de Bienaymé-Tchebychev 4.2.1 L’inégalité de Bienaymé-Tchebychev Considérons une variable aléatoire X, susceptible de prendre les valeurs Xk avec la probabilité pk. La moyenne de X est X = P k Xk pk, la variance est σ2 X = P k ¡Xk −X¢2 pk Donnons nous une valeur a, positive, arbitraire. On distingue deux régions : la région I correspondant à ¯ ¯X −X ¯ ¯ ≤a et la région II correspondant à ¯ ¯X −X ¯ ¯ > a (voir la Þgure 4-1 ci-dessous). X a=tσ a=tσ Région I Région II Région II X Figure 4-1 Par déÞnition il vient σ2 X = P I ¡ Xk −X ¢2 pk+P II ¡ Xk −X ¢2 pk ≥P II ¡ Xk −X ¢2 pk. Cependant, dans la région II, il vient ¯ ¯X −X ¯ ¯ > a ; on en déduit L’inégalité de Bienaymé-Tchebychev 57 σ2 X ≥P II ¡Xk −X¢2 pk > a2P II pk or P II pk est la probabilité de la région II, c’est-à-dire la probabilité de ¯ ¯X −X ¯ ¯ > a. On écrit le résultat obtenu sous la forme σ2 X a2 > P II pk = proba £¯ ¯X −X ¯ ¯ > a¤ . Nous avons vu que σX Þxe une échelle naturelle de référence pour apprécier si ¯ ¯X −X ¯ ¯ est grand ou petit (voir la section 1.6 page 20), on préfère donc po- ser a = t σ où t est un nombre sans dimension, positif, arbitraire. L’inégalité précédente s’écrit alors proba £¯ ¯X −X ¯ ¯ > t σX ¤ < 1 t2 (4.4) Cette inégalité est l’inégalité de Bienaymé-Tchebychev† dont nous présentons main- tenant quelques applications. [[Jules Irénée Bienaymé (1796-1878) fut inspecteur des Þnances puis, après la révolution de 1848 professeur à la Sorbonne. Il publia 23 articles scientiÞques durant sa vie, la plupart dans d’obscures revues. Ce palmarès lui permettrait aujourd’hui d’être un candidat pas très bien placé à un poste de professeur des Universités, mais à son époque on lisait les articles avant de porter un jugement, les compter n’était pas suffisant. Il est vrai que dans ce temps là, et jusqu’à un passé récent, on tournait 7 fois son porte-plume dans la main avant d’écrire une première page‡. Quoique de 25 ans son aîné, Bienaymé était très lié avec Tchebychev dont il traduisit les travaux en Français. Toujours très en avance sur son temps dans le domaine des statistique, Bienaymé est à l’origine de l’inégalité 4.4. Pafnuty Lvovich Tchebychev (1821-1894), issu d’une famille aisée de militaires russes, reçu une excellente éducation. Très tôt il apprit le Français à une époque où cette langue était encore magniÞquement écrite et largement répandue dans tous les milieux cultivés, tout particu- lièrement en Europe. Cette connaissance du Français facilita les relations scientiÞque de Tcheby- chev avec de nombreux mathématiciens, parmi eux I. J. Bienaymé dont il utilisa l’inégalité pour exprimer la loi des grands nombres telle que nous l’avons présentée. Depuis, la relation 4.4 est connue comme l’inégalité de Bienaymé-Tchebychev.]] 4.2.2 La loi des grands nombres Appliquons à la variable z de la section précédente, l’inégalité de Bienaymé- Tchebychev 4.4 : proba[ |z −z| > t σz] < 1 t2 Avec z = p et σz = r p(1 −p) n il vient proba " |z −p| > t r p(1 −p) n # < 1 t2 (4.5) Remarquons la relation p ∈[0, 1] ⇒p(1 −p) ≤1/4. †L’inégalité de Bienaymé-Tchebychev est un cas particulier de l’inégalité proba h |Z| > t ( E [|Z|r] )1/ri < 1 tr , valable pour t positif, sous réserve que E [|Z|r] soit déÞni. Cette inégalité se démontre comme l’inégalité de Bienaymé-Tchebychev. Dans le cas Z = X −X et r = 2 on obtient l’inégalité de Bienaymé-Tchebychev ; pour r = 1, c’est l’inégalité de Markov. ‡Allusions aux pratiques (trop) fréquentes en ce début de 21` eme siècle. 58 Les lois des probabilités EIII EII z - p 0 t p p (1- ) n t 1 4 n Figure 4-2 La relation p (1 −p) ≤1 4 est valide pour p ∈[0, 1] . Nous considérons l’événe- ment EII précédent qui correspond à |z −p| > t r p(1 −p) n , ainsi que l’événement EIII correspondant à |z −p| > t r 1 4n (cf. Þgure 4-2). De la relation t r p(1 −p) n ≤t r 1 4n, pour t > 0, on déduit EIII ⊆EII, par conséquent proba [EIII] ≤proba [EII] . L’inégalité de Bienaymé-Tchebychev s’écrit proba [EII] < 1 t2 , on en déduit donc proba [EIII] < 1 t2 , ce qui s’écrit proba " |z −p| > t r 1 4n # < 1 t2 (4.6) Considérons un exemple. Dans une population donnée, nous cherchons à connaître la proportion d’individus appartenant à un sous-ensemble A (le sous-ensemble de ceux qui votent Clovis par exemple). Soit X la variable caractéristique de A, c’est à uploads/Geographie/ les-lois-de-la-probabilite.pdf

  • 25
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager