Hydrologie Générale Prof. André Musy Section SIE et GC 4ème semestre 2005 L'org

Hydrologie Générale Prof. André Musy Section SIE et GC 4ème semestre 2005 L'organisation et le contrôle des données Exercice 1 Exercice 2 Exercice 1: Homogénéité des données pluviométriques et corrections des données En utilisant les données de précipitations annuelles enregistrées en deux stations P1 et P2 ainsi que les valeurs obtenues pour une station de référence on vous demande de : 1) contrôler le caractère aléatoire des lames précipitées annuelles aux stations P1 et P2 2 ) éventuellement corriger les données erronnées par la méthode du double cumul. Données : Année Référence [mm] P1 [mm] P2 [mm] 1990 806 763 764 1989 912 906 902 1988 931 915 918 1987 766 666 663 1986 1235 1263 1265 1985 964 1070 1072 1984 1145 1035 1051 1983 1218 1065 1063 1982 1269 1155 1120 1981 1360 1132 1195 1980 895 950 930 1979 1021 1014 1135 1978 1100 1022 1292 1977 1080 1037 1166 1976 1025 1012 1150 1975 1175 1100 1300 1974 1088 1041 1250 1973 1105 1021 1242 1972 1208 1165 1356 1971 1125 1050 1275 Ce tableau de données est disponible au format Excell dans le fichier "exercice0801-énoncé.xls" Pistes de résolution :  Une série statistique est aléatoire et stationnaire si les valeurs la constituant fluctuent autour d'une valeur médiane.  Le cumul des lames précipitées se fait à l'inverse de l'ordre chronologique.  La correction des valeurs erronées s'effectue à l'aide du rapport entre les pentes des droites de régression. Réponse Exercice 2 : Analyse et contrôle des données météorologiques On dispose de deux séries de températures enregistrées en deux stations distantes de 30 km environ. On vous affirme que la distance entre les deux stations n'a pas d'importance significative sur les températrues et que les deux séries sont issues d'une même population. Que pensez-vous de ces affirmations ? Données : Température à la station 1 [oC] Température à la station 2 [oC] 26.6 23.5 30.4 26.8 31.4 27.3 31.3 27.0 23.6 20.0 26.8 23.6 27.2 23.6 17.9 15.1 17.4 15.6 24.8 20.3 15.8 14.1 21.7 18.5 24.9 20.7 16.3 16.5 17.5 14.3 17.5 14.7 20.3 17.4 25.2 21.5 23.5 22.0 26.5 24.1 20.5 18.7 19.1 17.2 17.9 16.0 21.8 17.8 20.1 18.3 22.8 19.0 25.8 21.8 23.7 21.0 15.6 13.7 12.6 9.7 9.7 7.4 11.3 8.9 14.3 10.4 17.3 14.7 14.7 11.8 17.5 14.7 17.2 14.5 17.5 13.5 13.0 10.3 13.0 11.4 14.8 14.0 16.8 16.7 19.8 18.5 16.6 14.3 17.7 15.1 13.7 11.5 Ce tableau de données est disponible au format Excell dans le fichier "exercice0802-énoncé.xls" Pistes de résolution : Utiliser le test de Wilcoxon pour affirmer ou infirmer l'appartenance à la même population de données. L'estimateur de la corrélation rxy entre deux variables aléatoires est défini par : avec s2 x : l'estimateur de la variance de la variable aléatoire X s2 y : l'estimateur de la variance de la variable aléatoire Y sxy : l'estimateur de la covariance des variables aléatoires X et Y Remarque: Le quantile à 95 % de la loi normale centrée réduite est de 1.65, alors que le quantile à 97.5 % est de 1.96. Réponse Hydrologie Générale Prof. André Musy Section SIE et GC 4ème semestre 2005 Corrigé des exercices (chapitre 8) Réponse Exercice 1 Démarche à adopter : Caractère aléatoire des lames précipitées : Cette propriété est déterminée à l'aide du test non-paramétrique de la médiane, dont la démarche est exposée au paragraphe 8.5.1.3. Correction des données erronées : 1. Pour la station de référence, calculer la somme cumulée des lames précipitées X(t) de 1990 à 1971. 2. Démarche identique à 1) pour la station à contrôler Y(t). 3. Représenter graphiquement les couples (X(t),Y(t)). 4. Identifier la cassure de pente de la somme cumulée des précipitations, ainsi que la valeur des pentes respectives. 5. En comparant avec le cumul de la station P1, il semble que la dérive de la station P2 se produit entre 1971 et 1980. 6. Il faut multiplier le rapport pente "1990-1980"/ pente "1980-1971" pour corriger les valeurs de la station P2 entre 1980 et 1971. Résultats : 1 ) Caractère aléatoire des lames précipitées. Station P1 : Ns1=10.0 et Ts1=4.0 Station P2 : Ns2=6.0 et Ts2=8.0 = 6.2 La station P2 comporte donc des données dont le caractère n'est pas aléatoire. 2) Correction des données erronées. On obtient le graphique suivant pour le double cumul : Les données erronées de la station P2 sont observées entre 1971 et 1980. Pente de la droite de régression entre 1971 et 1980=1.12 Pente de la droite de régression entre 1980 et 1990=0.96. Réponse Exercice 2 Démarche à adopter : Corrélation entre les séries de température. 1. Calculer la moyenne et la variance de la température aux deux stations. 2. Calculer la covariance sxy et le coefficient de corrélation rxy. Températures issues de la même population - test de Wilcoxon 1. Trier par ordre croissant les valeurs de la série composée des températures de la station 1 et de la station 2. 2. Attribuer à chaque valeur un rang (rang 1 pour la plus petite valeur, rang 92 pour la plus grande valeur). 3. Calculer la somme des rangs des températures enregistrées à la station 1 (Wx). 4. Comparer la valeur estimée du test de Wilcoxon Wx à la valeur critique. Résultats : La distance entre les deux stations ne joue effectivement pas de rôle sur les températures puisque leur corrélation est très élevée (rxy=0.96). Wx=2408 et Wx est distribuée N(2139,16399) La valeur critique est 2390. Wx >2390 et donc pour un test bilatéral on rejette l'hypothèse nulle (températures issues de la même population). Hydrologie Générale Prof. André Musy Section SIE et GC 4ème semestre 2005 L'organisation et le contrôle des données Questions de compréhension  A quelles étapes de leurs existences les données hydrologiques peuvent-elles être entachées d'erreur ?  Quelles hypothèses peut-on vérifier lors d'une analyse statistique ?  Quels types de tests statistiques peut-on utiliser pour vérifier "statistiquement" l’influence des changements climatiques sur les débits d’une rivière ?  La méthode des doubles cumuls sert-elle à vérifier l'homogénéité des données d'un même type mais acquises à des endroits différents ? Hydrologie Générale Prof. André Musy Section SIE et GC 4ème semestre 2005 QUIZ 08- L'organisation et le contrôle des données 1. Vrai - Faux Le traitement des données concerne une série d'opérations effectuées sur des données d'observation pour les mettre sous une forme directement utilisable pour une application donnée. Le traitement primaire des données concerne l'analyse d'une série de données observées ou de plusieurs séries concomitantes. Le traitement secondaire des données concerne le traitement des données d'observation brutes, tel que mise au net, contrôle, correction. Un annuaire hydrologique est un exemple typique de résultats de traitement primaire des données. Le calcul de la répartition statistique d'une chronique est un exemple typique de traitement secondaire des données. Un limnigramme constitue un fichier de travail. 2. Vrai - Faux Les données sont toujours entachées d'erreurs aléatoires. La valeur vraie est la valeur idéale qu'on obtiendrait si toutes les causes d'erreur étaient éliminées. Elle demeure inconnue. Les erreurs systématiques affectent la fiabilité des données mais ne sont pas corrélées. Les erreurs aléatoires tendent à se distribuer autour du zéro, à avoir une somme algébrique nulle et ont une probabilité petite d'être grandes. On appèle aussi l'erreur aléatoire " incertitude ". L'origine des erreurs systématiques est le plus souvent liée à la calibration imparfaite de l'appareil de mesure. 3. Classez par ordre chronologique de 1 à 5 les diverses étapes constituant la démarche d'un test statistique : Etape 1 : Etape 2 : Etape 3 : Etape 4 : Etape 5 : 4. Parmi les six hypothèses de l'analyse statistique, citez-en 4 : 5. Une série de données est réputée non homogène lorsque… elle provient de la mesure d'un phénomène dont les caractéristiques évoluent durant un période de mesure. elle provient de la même population parente, celle-ci étant stationnaire. elle reflète deux ou plusieurs phénomènes différents. Elle provient de la mesure d'un phénomène non stationnaire. ... ... ... ... ... 6. Parmi les méthodes suivantes, lesquelles permettent de tester l'homogénéité d'une série de pluie ? Test de student pour 2 échantillons. Test du chi-carré. Méthode du double cumul. Test z. Test de Wilcoxon pour un échantillon. 7. On désire réaliser les 3 tests A, B, et C suivants. Pour ces trois tests, quelles sont les régions de rejet représentées sur les graphiques de densité 1, 2 et 3. Pour le test A, la figure correspondante est la n° . Pour le test B, la figure correspondante est la n° . Pour le test C, la figure correspondante est la n° . 8. Remplissez les cases ci-dessous avec alpha, beta, 1-alpha, 1-beta représentant respectivement les erreurs de première et deuxième espèce. Situation A : Situation B : Situation C : Situation D : 9. Vrai - Faux Les tests paramétriques sont basés sur l'étude d'une distribution d'échantillonnage. Le test de Wilcoxon est un test paramétrique aussi sensible aux valeurs aberrantes que le test de Student. La façon la uploads/Management/ organisation-et-controle-de-donnees.pdf

  • 34
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Sep 09, 2022
  • Catégorie Management
  • Langue French
  • Taille du fichier 0.1705MB