REVUE DE STATISTIQUE APPLIQUÉE E. J. GUMBEL Méthodes graphiques pour l’analyse
REVUE DE STATISTIQUE APPLIQUÉE E. J. GUMBEL Méthodes graphiques pour l’analyse des débits de crues Revue de statistique appliquée, tome 5, no 2 (1957), p. 77-89 <http://www.numdam.org/item?id=RSA_1957__5_2_77_0> © Société française de statistique, 1957, tous droits réservés. L’accès aux archives de la revue « Revue de statistique appliquée » (http://www. sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright. Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques http://www.numdam.org/ - 77 - MÉTHODES GRAPHIQUES POUR L’ANALYSE DES DÉBITS DE CRUES (I) par E. J. GUMBEL Colombia University (New-York) Le but de cette note est de résumer quelques travaux récents pu~liés aux Etats-Unis en application de la théorie statistique des valeurs extrêmes d’une distribution. Pratiquement de tels problèmes se posent dans de nombreux domaines. -. phénornènes naturels : débits de rivières (plus grande ou plus petite valeur du débit au cours d’une longue période), maxima et minima des précipi- tations de pluie, des pressions atmosphériques, températures, vitesse du vent...; - charge de rupture de matériàux (industrie mécanique ou textile) ; - durée de vie de certains matériels (lampes électriques...). La notre de M. GUMBEL comporte un exposé méthodologique des méthodes graphiques pouvant être employées dans de telles études et des applications à l’étude des débits de crues. Elle est suivie d’une note théorique de M. BERNIER sur diverses lois limites des valeurs extrêmes. 1 . mÉirHODES GRAPHIQUES . Soit x une variable aléatoire continue, soit« et u des paramètres, soit F (x) une fonction de probabilité totale telle qu’on puisse écrire : ( 1.1 ) F (a, u , x) (y) où : (1.2) y =a (x - u) est une variable réduite et t) (y) ne contient plus de paramètres. On construit un papier à probabilité en choisissant x comme ordonnée et y comme abscisse, tous les deux en échelle linéaire. En traçant une échelle ~ (y) parallèle à y, on obtient les valeurs : (1.3) x = u + Y/a en fonction des probabilités ~. Si les observations se passent dans le temps et si les intervalles entre deux observations sont constants, la fonction : (1.4) T (y) = [1 - ci» (y)J-1 = T (x) peut être appelée la durée du retour. C’est le nombre d’observations qu’on doit faire en moyenne pour obtenir une valeur supérieure ou égale à x. On trace T (x) (1) Conférence faite par M. GUMBEL, le 23 avril 1956 à la Société Hydrotechnique de France. - 78 - sur une échelle parallèle à l’abscisse. De cette manière on obtient x en fonction du temps, pourvu que la distribution initiale soit donnée. Pour l’emploi de ce papier, il nous faut une règle (10) qui décide les positions de chaque observation. Soit xi la ième (i = 1, 2... n) parmi n observations. Une méthode générale valable pour n’importe quelle distribution continue est de choisir comme position la moyenne Fi des fréquences des ièmes valeurs qui est : Il en résulte que les durées de retour empiriques deviennent : ce qui donne T (x ~)= 1 + n-1 pour la plus petite valeur et T (xn) = n + 1 pour la plus grande valeur. Si la fonction de.probabilité F(x) est bien choisie, les observations x tracées de cette manière se trouvent dans l’entourage de la droite théorique (3). Pour tracer cette ligne, nous avons besoin d’une estimation des paramètres u et a. La manière la plus simple est l’usage de la méthode des moindres carrés. On peut rendre minimum soit les distances horizontales, soit les distances verticales. Un compromis entre les deux méthodes conduit à l’estimation : Dans ce système m et s sont la moyenne arithmétique et l’écart-type : des valeurs observées, tandis que 7,, et an (y) sont l’espérance mathématique et l’écart-type des valeurs théoriques réduites y obtenus a l’aide de : Reste à savoir si les déviations entre la théorie et les observations peuvent être tolérées ou non. Cela nous intéresse en l’espèce pour les plus grandes valeurs de la variable. Car la ligne droite (3) servira à l’extrapolation dans le temps faite à l’aide de l’échelle des durées de retour. Il est d’usage commun parmi les sta- tisticiens d’utiliser le critère dit X2. On obtient ainsi la probabilité P (x2~ pour que les déviations entre la théorie et les observations soient dues au hasard. Mais ce critère dépend de deux décisions arbitraires, la longueur des classes dont l’influence est connue et le commencement de la première classe dont l’in- fluence est inconnue. J’ai montré par un exemple numérique (9), valable pour les mêmes valeurs des paramètres et les mêmes longueurs des classes, que des petites variations du commencement entrainent des variations de P (X2.) de 0,023 jusque 0,705. C’est pour ces raisons que nous nous opposons à l’emploi de cette méthode pour des variables continues. Il nous faut donc une autre méthode pour contrôler l’accord entre la théorie et les observations. Nous nous bornons ici aux plus grandes valeurs de la variable. Soit T la durée de retour théorique, alors il existe une probabilité de 2/3 pour qu’une durée de retour observée soit contenue dans l’intervalle : 32Tet3.13T La probabilité de 2/ 3 est choisie ici parce qu’elle correspond à la probabilité de l’intervalle x =f Q pour la distribution normale. On tracera cet intervalle autour des plus grandes valeurs théoriques de x et on acceptera la théorie pourvu que les observations soient contenues dans cet intervalle qu’on utilisera aussi pour l’ex- trapolation. - 79 - II - THÉORIE DES VALEURS EXTRÊMES Ces méthodes graphiques seront employées maintenant pour une des distribu- tions asymptotiques de la plus grande valeur. Soit F (x) une fonction de probabi- lité ; alors la probabilité, pour que la plus grande de n observations indépendantes soit inférieure à x, est F" (x). La question de savoir s’il existe une distribution asymptotique valable si n augmente a été étudiée par plusieurs auteurs parmi lesquels FRECHET (8), FISHER et TIPPETT (7) qui ont montré qu’il existait trois distributions asymptotiques liées à certaines conditions analytiques . Nous nous bornerons ici à une de ces distributions. Soit x une variable illimitée vers la droite et soit : la distributioninitiale ; alors on introduit deux valeurs, Unet an étant les solutions de : · Admettons enfin que la probabilité initiale pour des grandes valeurs de x soit telle que : Il alors la distribution asymptotique de la plus grande valeur est : La signification de Un est bien simple, c’est la plus grande valeur la plus probable. La signification de an sera donnée plus tard. Des tableaux numériques donnant ~ en fonction de y, et y en fonction de $,ont été publiés par U.S. National Bureau of Standards (22). Ces tables nous permettent la construction d’un papier à probabilité décrit dans le premier paragraphe. Montrons d’abord une application théorique de cette formule. Uneopinion courante due ~léminent statisticien R.A. FISHER (7) est qu’on ne peut pas utiliser la distribution asymptotique (2.4) pour les plus grandes valeurs normales. Or, tout dépend de ce qu’on entend par l’accord entre cette théorie et les valeurs numériques valables pour la distribution normale. La Fig. 1 compare les mé- dianes des plus grandes valeurs normales en fonction de n calculées par B. de FINETTI (6) aux valeurs obtenues par l’usage de (2.4) à l’aide des paramètres, donnés par (2.1) et (2.2). On voit immédiatement que cette convergence est rapide. L.H.C. TIPPETT (21 ) a calculé les probabilité s F" (x) des plus grandes valeurs normales en fonction du nombre d’observations n. Prenons n = 100. Si l’on calcule les différences des probabilités on obtient une approximation de la distribution exacte des plus grandes valeurs normales. D’autre part, on obtient une approximation de la distribution théorique en prenant les différences des pro- babilités (2.4). Les valeurs numériques et théoriques ainsi obtenues sont tracées dans la Fig.2 qui prouve que les deux distributions sont assez proches. Cette application de la théorie des valeurs extrêmes est basée sur la connais- sance de la distribution initiale. Dans les applications pratiques, on l’ignore. Mais l’hypothèse du comportement asymptotique (2.3) est assez naturelle puis- qu’elle vaut pour la majorité des distributions usuelles en statistique. Dans la première application, les paramètres -cx,n et Un étaient connus, maintenant ils sont inconnus. Ecrivons dorénavant oc et u. L’estimation de ces deux paramètres doit - 80 - . C) n1 Ë 8 . ,.. ::t C) RI .. C) d ’0 0 ’S .3 RI ~ :;¡ t . u dm . t:’. 0 B 0 C) 0 -~0 " c K i~ i 8. A H . i5 1 N M r;: . C) ft1 c Ê . 8 Z C) 0 u Q fi .....N ~ ~ ~ ~ S ~ LAI u :f : o ’0 ". d o C2 RI LAI :a i ’t) F S o ftt Z ...:1 1 .... uploads/Philosophie/ rsa-1957-5-2-77-0.pdf
Documents similaires










-
25
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Jul 08, 2022
- Catégorie Philosophy / Philo...
- Langue French
- Taille du fichier 1.2112MB