CHAPITRE 8 L'ORGANISATION ET LE CONTROLE DES DONNEES 8.1 L'organisation des don

CHAPITRE 8 L'ORGANISATION ET LE CONTROLE DES DONNEES 8.1 L'organisation des données La compréhension des processus intervenant dans le cycle de l'eau ainsi que l'étude de leurs variations spatiales et temporelles nécessitent de disposer de données. Celles -ci sont essentielles et constituent un pr éalable à toute analyse hydrologique, que ce soit dans le but de proc éder à une étude du cycle de l'eau, d'impacts environnementaux ou pour procéder au dimensionnement d'ouvrages hydrauliques. De façon générale, pour permettre le passage de l'acquisition des données à leur utilisation effective dans le cadre d'une analyse hydrologique on distingue les étapes suivantes : acquisition, traitement, contrôle et validation, organisation, diffusion et publication. Une collaboration entre l'Institut d'Aménagement des Terres et des Eaux de l'EPFL et des bureaux priv és a permis par exemple la création d'un logiciel complet de traitement des données hydrologiques nommé CODEAU qui comprend une partie de ces étapes. 8.1.1 Acquisition des données L'acquisition de données consiste à procéder, par le biais d'un instrument de mesure, à acquérir de l'information (par exemple : hauteur d'eau d'une station limnim étrique, comptage des basculements d'un pluviographe à augets, vitesse du vent etc…). Le chapitre 7 traite en détails de la mesure hydrologique. Le proc édé peut être automatisé ou non. Ceci aura une influence sur le type d'erreurs que l'on peut commettre. 8.1.2 Traitement primaire des données La donnée acquise pr écédemment nécessite souvent un traitement préalable - ou traitement primaire - afin de la rendre pertinente et exploitable. Il s'agit pour l'essentiel de la conversion de la mesure effectu ée en une grandeur qui soit hydrologiquement significative (par exemple : transformation d'impulsions électriques en intensit és de précipitations, de hauteurs d'eau en débits, génération de données à pas de temps constant à partir de mesures effectuées à pas de temps variables etc. Le traitement des donn ées inclut aussi le contrôle primaire des données qui comprend les contrôles de cohérence à l'exclusion de tous traitements statistiques. Il s'agit par exemple, dans le cas d'une acquisition manuelle des données, de les convertir en fichiers informatiques. Dans ce cas, on procède généralement à une double saisie des données puis les fichiers sont comparés afin de déceler d'éventuelles erreurs de saisie. Dans la situation où l'on procède à l'acquisition de donn ées de précipitations et de débits, on vérifie encore la coh érence temporelles des données acquises, à savoir par exemple qu'une crue est bien la conséquence d'un épisode pluvieux 8.1.3 Contrôle des données Avant de pouvoir exploiter les données et bien qu'elles soient dans un format adéquat, il importe de contrôler la fiabilité et la précision de ces dernières. Le contrôle permet de valider les données avant leur organisation au sein d'une banque de données pour leur mise à disposition à des fins opérationnelles. Lors de cette opération, on introduit des indices de qualité de la donnée ainsi que des indices indiquant que celle-ci est reconstituée, calculée voire manquante. Par exemple, le logiciel CODEAU utilise pour ce faire toute une série d'indice ou flags permettant de qualifier des donn ées présentant une rupture de continuité, une ou plusieurs mauvaises valeurs, des valeurs manquantes ou à vérifier etc. 8.1.4 Organisation des données Au vu de l'importance quantitative et qualitative des données, il importe de les organiser avec soin. Ceci se fait à partir d'un corpus de documents originels (formulaires de terrain, diagrammes, unité de stockage électronique) constituant les archives Page 1 sur 20 Chapitre 8 - L'organisation et le contrôle des données 12.03.2004 http://hydram.epfl.ch/e-drologie/chapitres/chapitre8/chapitre8.html qui sont en r ègle g énérale accessibles uniquement à un personnel spécifique (responsable du centre de collecte, archiviste…). La traduction des archives sous la forme de fichiers de base g énère les "fichiers en l'état" et fournit une indication sur la provenance de la donnée (mesure, calcul, copie etc.) ainsi que sur sa qualité (fiable, compl ète ou non) et sa précision. Enfin, on constitue un fichier de travail provisoire permettant une visualisation des données et permettant de procéder aux différents tests de qualité et de précision des données qui seront développés tout au long de ce chapitre. L'élément ultime de cette chaîne opératoire est la constitution des fichiers opérationnels avec indices de qualit é pouvant être publiés et distribués auprès des utilisateurs. 8.1.5 Diffusion et publication La diffusion des données en vue de leur utilisation opérationnelle peut-être faite selon deux modes : l Publication papier : Il s'agit par exemple de la publication d'annuaires comme l'annuaire hydrologique de la Suisse ou de bulletins journaliers tels ceux émis par MétéoSuisse accessible par une ligne téléphonique (fax). l Diffusion informatique : Actuellement et grâce aux développements des interfaces liées au r éseau Internet, les données sont de plus en plus accessibles de manière conviviale et en tout temps. Le site de MétéoSuisse (http://www.meteosuisse.ch) présente notamment des cartes de situation météorologique. L'annuaire hydrologique de la suisse est également publié par le Service hydrologique et géologique national : http://www.admin.ch/lhg/daten/f/index.htm. Le shéma suivant présente les différentes étapes de la cha îne d'acquisition et de traitement des données : 8.2 Le contrôle des données La constitution d'une série de valeurs, constituant un échantillon au sens statistique du terme, est un processus long, parsemé d'embûches, et au cours duquel de nombreuses erreurs, de nature fort différentes, sont susceptibles d'être commises. Des erreurs peuvent en effet être perpétrées lors de l'une ou de l'autre des quatre phases du déroulement classique des opérations, à savoir : la mesure ; la transmission de l'information ; le stockage de l'information ; le traitement de l'information (prétraitement et analyse). Il est donc indispensable, avant d'utiliser des séries de donn ées, de se préoccuper de leur qualité et de leur repr ésentativité en utilisant diverses techniques en général de type statistique ou graphiques. Une erreur de mesure est définie comme étant la différence entre la vraie valeur (qui est l'id éal recherché, mais qui n'est en principe et malheureusement jamais connue) et la valeur mesur ée. Il est commode, tant pour les présenter que pour Page 2 sur 20 Chapitre 8 - L'organisation et le contrôle des données 12.03.2004 http://hydram.epfl.ch/e-drologie/chapitres/chapitre8/chapitre8.html différencier la façon de les aborder, de considérer deux types d'erreur : les erreurs al éatoires et les erreurs systématiques. l Les erreurs al éatoires (ou accidentelles) - Elles affectent la précision des données et sont non corrélées. Ce type d'erreur est d û à des raisons nombreuses et variées, généralement inconnues, affectant différemment chaque mesure individuelle. G énéralement on considère que ces erreurs sont les réalisations d'une variable aléatoire normale centrée en 0 et de variance s 2. Ces erreurs étant inévitables, il faut en estimer l'importance afin de pouvoir en tenir compte lors de l'évaluation de l'incertitude finale. Dans la mesure du possible, la technique de mesure induisant les erreurs aléatoires les plus faibles devrait être préférée. l les erreurs syst ématiques - Elles affectent la fiabilité des données et sont totalement corrélées. On parle aussi d'inconsistance. Supposons qu'aucune erreur aléatoire n'affecte les mesures. La différence entre la vraie valeur et la valeur mesur ée, si elle existe, est alors due à une erreur systématique. L'origine des erreurs systématiques est le plus souvent li ée à la calibration de l'appareil de mesure qui n'est pas parfaite ou à un phénomène extérieur qui perturbe la mesure (erreur d'appareillage, changement d'observateur…). 8.3 Recherche des erreurs et corrections des mesures Selon la nature des erreurs constatées ou supposées la recherche de ces dernières fait appel à différentes techniques et méthodes l « in situ » qui consiste à vérifier sur place la manière dont les données ont été organisées, traitées et/ou transformées. l Investigation de bureau qui consiste à vérifier la cha îne de traitement de la mesure/donnée à chaque étape de son élaboration, tout comme la manière dont on a constitué les séries de données soumises à contrôle et/ou publication. l Investigation statistique qui, à l'aide d'outils spécifiques, permet de mettre en évidence certaines erreurs ou inconsistance. Ces techniques efficientes ont largement été utilisées dans la pratique professionnelle et se basent sur des hypothèses spécifiques qu'il convient de bien connaître. Hypothèses de l'analyse statistique : Les calculs statistiques sont bas és sur un certain nombre d'hypoth èses qui doivent en principe être vérifiées. Parmi celles - ci, citons : l Les mesures reflètent les vraies valeurs - Cette hypothèse n'est malheureusement jamais r éalisée en pratique, du fait des erreurs systématiques ou aléatoires. l Les données sont consistantes - Aucune modification dans les conditions internes du système n'intervient durant la période d'observation (position du pluviomètre, procédures d'observation, observateur unique). l La série de données est stationnaire - Les propriétés de la loi statistique qui régit le phénomène (moyenne, variance ou moments d'ordre supérieur) sont invariantes au cours du temps. l Les données sont homogènes - Une série de données est réputée non homogène lorsque: l elle provient de la mesure d'un phénomène dont les caractéristiques évoluent durant la p ériode de mesure; le phénomène est alors dit non-stationnaire (par exemple: variations climatiques, variations du régime des débits dues à une uploads/Management/ control-datos-chapitre8.pdf

  • 25
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Fev 13, 2022
  • Catégorie Management
  • Langue French
  • Taille du fichier 0.6065MB