ANALYSES STATISTIQUES DES DONNÉES DU LAC-TCHAD: DÉTECTION DE RUPTURE Présenté p
ANALYSES STATISTIQUES DES DONNÉES DU LAC-TCHAD: DÉTECTION DE RUPTURE Présenté par: Batbaina Guikoura, Barba Kaokamla, Biaktchebo Tchac-gnané, Khadidja Mahamat, Zouzabe Olivier Superviseur : Dr. Mahamat Ali Issaka 13 janvier 2023 Modélisation Mathématique et Statistique des Systèmes Complexes 1/20 SOMMAIRE 1 Introduction 2 Notions de base 3 Modèles statistiques 4 simulations et applications 5 Conclusions et Perspectives Modélisation Mathématique et Statistique des Systèmes Complexes 2/20 Introduction Introduction Diverses études ont mis en évidence des évolutions des températures, de la pluviométrie ou des débits dans les cours d’eau. L’ampleur et les changements de ces évolutions dépendent des régions et des conditions hydro-climatiques. La détection de rupture est une identification d’un changement, dans une série temporelle, dans le comportement des données à partir d’un certain point. Cette thématique, nous l’abordons avec un intérêt particulier sur les données du Lac-Tchad. Modélisation Mathématique et Statistique des Systèmes Complexes 3/20 Introduction Contexte 1 Contexte hydro-climatique du Lac-Tchad La variabilité et le changement climatique : dégradation de l’environnement observée dans le sahel ; Baisse de la pluviométrie : varie selon l’épaisseur de la mousson. 2 Contexte mathématique Le problème de rupture ou change-point problem ; En statistique, une rupture est le changement brusque ; dans les propriétés statistiques d’un instant t à un instant t + 1. Modélisation Mathématique et Statistique des Systèmes Complexes 4/20 Introduction Objectifs Mettre au point des méthodes statistiques capables de détecter (localiser) le plus rapidement possible un changement de paramètre dans le modèle décrivant le système ; Application à une approche de la détection de rupture sur les données géochimiques du Lac-Tchad. Modélisation Mathématique et Statistique des Systèmes Complexes 5/20 Notions de base Notions d’espace probabilisable Soit (Ω, A, P) un espace probabilisé. Définition (Probabilité) On appelle probabilité P sur l’espace probabilisable (Ω, A), une application P :A 7− →[0, 1] telle que : P(Ω) = 1 et P(∅) = 0 ; Pour toute suite (Ai)i∈N d’évènement incompatible appartenant à A, on a P( [ i∈N Ai) = X i∈N P(Ai) Modélisation Mathématique et Statistique des Systèmes Complexes 6/20 Notions de base Espérance, variance et fonction de répartition d’une v.a.r X On appelle espérance mathématique de la v.a.r(discrète) X notée E(X), la quantité si elle existe définie par : E(X) = X x∈R (X = x)P(X = x) = n X i=1 xiPi (1) On appelle variance de la v.a.r X notéeV (X) , la quantité si elle existe définie par : ∀(X) ∈R , Var(X) = E[(X −E(X))2] On appelle fonction de répartition de X, la fonction positive définie par : ∀x ∈R , F(X) = P(X ≤x) = P i∈N {Pi|xi ≤x} Modélisation Mathématique et Statistique des Systèmes Complexes 7/20 Modèles de détection de rupture Type de modèle étudié La formulation générale d’un modèle à rupture : ( Xt ∼ Pθ0 pour t ≤t0 Xt ∼ Pθ1 pour t > t0 (2) Xt une processus aléatoire θ un paramètre caractérisant le changement P une famille des distributions Modélisation Mathématique et Statistique des Systèmes Complexes 8/20 Modèles de détection de rupture Types de modèles de détection Deux types de détections : Le modèle de détection off-line ; Le modèle de détection on-line. Modèles= Cadre paramétriques Cadre non-paramètriques Modélisation Mathématique et Statistique des Systèmes Complexes 9/20 Méthodes non paramétrique de détection (Test de Pettitt : 1979) 1 Expression mathématique : La statistique Ut,N de Pettitt est définie par : Ut,N = t X i=1 N X j=t+1 Dijoù Dij = Sgn(Xi −Xj) (3) Pour tout 1 ≤t ≤N et avec Xi sont des vecteurs des données triées par observation et Sgn une fonction. 2 Hypothèses : H0 : Absence de rupture H1 ∼KN : Présence de rupture. Pour un seuil de α=0.1, l’hypothèse H1 si p −value < α. Présence de rupture au temps t. Modélisation Mathématique et Statistique des Systèmes Complexes 10/20 Méthodes non paramétrique de détection (Segmentation Neighborhood) 1 Définir le nombre maximum de point de rupture ; 2 Générer par la programmation la fonction coût pour chaque segmentations possibles ; 3 Si les points de changement existent alors ils sont générés par la machine. Modélisation Mathématique et Statistique des Systèmes Complexes 11/20 Simulations (Simulation d’un changement de la moyenne) Pour l’échantillon de taille n=100, suivant la loi normale N(0, 1) et N(5, 1) Figure: Simulation de test de changement de moyenne de la loi normale Modélisation Mathématique et Statistique des Systèmes Complexes 12/20 Applications Applications aux données géochimiques du Lac-Tchad (Modèle de Pettitt) Application à la température du Bahr-El-Gazal : Résultats : U∗= 216 et p-value=0.04992 Observation probable de rupture à t=26. Figure: Localisation de rupture de la température du BEG Modélisation Mathématique et Statistique des Systèmes Complexes 13/20 Applications Applications aux données du Lac-Tchad (Modèle de Pettitt et modèle de Segmentation) Applications à la température et le pH du Barh-El-Gazal : Test Pettitt pH : U∗= 212, p-value=0.05716. Rupture probable à l’observation t=10. Modèles de segmentations : Rupture de la température à l’observation 9 et 11. Pour le pH au 16 et 22. Modélisation Mathématique et Statistique des Systèmes Complexes 14/20 Applications Applications aux données géochimiques du Lac-Tchad (Modèle de Pettitt) Application à la température et le pH du site du lac : Résultats test température : U∗= 116 et p-value=0.5305 Observation probable de rupture à t=8.correspond à l’observation 105. Résultats test pH : U∗= 116 et p-value=0.5305 Observation probable de rupture à t=27.correspond à l’observation 124 dans les données. Modélisation Mathématique et Statistique des Systèmes Complexes 15/20 Applications Applications aux données géochimiques du Lac-Tchad Figure: Rupture selon le test de Pettitt, Température et pH Lac Modélisation Mathématique et Statistique des Systèmes Complexes 16/20 Conclusions L’application à nos données (données géochimique du Lac-Tchad), nous a amené à l’utilisation de deux approches, notamment la méthode de segmentation et le test de Pettitt, aboutissant au résultat qu’il y’a eu effectivement des ruptures. Dans le site de Bahr-El-Gazal, deux variables (température et pH) ont été étudiées. Nous avons pu localiser trois points de ruptures à l’observation 9, 11 et 26 pour la température et trois points de ruptures à l’observation 10, 16 et 22 pour le pH. De même pour le site du Lac, un point de rupture est localisé à l’observation 105 pour la température et un point de rupture à l’observation 124 pour le pH par le test de Pettitt. Modélisation Mathématique et Statistique des Systèmes Complexes 17/20 Perspectives Continuer les travaux sur la détection multiple et on-line ; Faire une analyse des tendances et de décisions de données ; Appliquer les méthodes étudiées sur l’ensemble des variables de données. Modélisation Mathématique et Statistique des Systèmes Complexes 18/20 Bibliographie Bibliographie Basseville, M., Nikiforov, I. V. et al. (1993). Detection of abrupt changes : theory and application, volume 104. Prentice Hall Englewood Cliffs. M. Ali Issaka, Ali S. Dabye and Lamine Gueye (2015). Automatic detection of epileptic seizure by extracting statisticals features from EEG signals. Pushpa publishing Housse, Allahabed, India. 5-8. Paturel, J. E., Servat, E., Lubès, H. et Delattre, M. O. (1998) Analyse de séries pluviométriques de longue durée en Afrique de l’Ouest et Centrale non sahélienne dans un contexte de variabilité climatique. Hydrol. Sci. J. 43(6), 937– 946. P.Barbe et M.Ledoux. (2007) . La probabilité. EDP Sciences 17, 131-135. Modélisation Mathématique et Statistique des Systèmes Complexes 19/20 MERCI DE VOTRE AIMABLE ATTENTION ! ! ! Modélisation Mathématique et Statistique des Systèmes Complexes 20/20 uploads/Geographie/ be-maer-projet-cim-pa.pdf
Documents similaires
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/ZeEjNBTj5SNQ7bPXBLS6QLtn7vvvkQg5xZ1rmouHnsCwXRbl0YzYIMLxoaalge2UmJHkLm8NSyWLG2HYZNqicdWX.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/DJP8sdd0Lj3zdAO2ymv6d0Y8dABcmERIfEDPxbC4ZdEgsU2dEGXaEgZZD3TZwdbyimlwwAAGG3dZjNuQaiRStn7d.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/LR1MjyIYTD3pZfh3lsBedr88qB6WAdIobSW0VdjHvz3AiaY9iJWzUenAlAuKHqQqAbiv5K9IpEEaLowl0jgqal7u.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/X9s6dWTQxJizLeQo99TDvLEnWjUvELOAS0wMirEDw4LnW8ABMpRBfdptMzEaLS2uAAVmI2IHDJjK6aIXIMsHAGNH.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/5H5r97FuzZ8KErKpg1PH1xXTxCM74YsZfNxOXFzn0Bv8KHM58rLxGDu7ssDD6z6zSFJjAjL1wAixB4dg7XmhKOt9.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/cjnGCeM5DBBzpyaGaEw016x25TIJxlo9ZkG2YT37PxBUwLMN11d8L2lT3kDPHa3qnhkG3zIkX6MpvTjk1wgegPcX.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/tnqtHDlPGmznGLqCkYRnJ4IDV52InfuwzuM202ef2THB3xT2Imb9fdnGqjsLMjnoAbd93JoDAFpRkWo2gb9BpEfY.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/tdzqhpsnuKj4igJV0IjssLGdggAwMSBEURVQQyqih8uQ0AYCQAeDhCMoSWptqOVlorzCKBNOkVzRnkynOSJ3PUUc.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/3ninjhwytS9yR39jgB9HDvNMjM61NhC0hIFvw5tgVwEntu1uURzm93Czf5syBVrmDp0c9iEjoBhTutL0oV7lMyF1.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/Mv7dFYf370TE29YJah0TvtrYgz1bWGQKsp1TKIgU8n7j2ERXBvs5CE826wYQE1iGptpl3miGY4GuaVY4rvVjmK6k.png)
-
26
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Oct 01, 2021
- Catégorie Geography / Geogra...
- Langue French
- Taille du fichier 0.7233MB