Chapitre III : BASE DE DONNEES REPARTIE III.1 DEFINITION Base de données repart

Chapitre III : BASE DE DONNEES REPARTIE III.1 DEFINITION Base de données repartie : Une base de données répartie est vue comme une collection des données qui sont réparties sur différents ordinateurs d’un réseau informatique. Une base de données répartie est aussi vue comme une collection de bases de données logiquement reliées, distribuées sur un réseau et apparaissant à l’utilisateur comme une base de données unique. Cette observation met en évidence deux aspects : 1. Distribution : Les données ne résident pas dans le même site. 2. Corrélation logique : Les données possèdent des propriétés qui les tiennent ensemble. Exemple de BD répartie III.2 CARACTERISTIQUES : 1. Une structure de contrôle hiérarchique basée sur un administrateur de base de données global, qui a la responsabilité centrale sur la base de données répartie entière et sur les administrateurs des bases de données locales, qui ont la responsabilité de leurs bases de données locales respectives. 2. À l’indépendance des données est ajoutée la transparence de répartition qui signifie que les programmes peuvent être écrits comme si les données n’étaient pas réparties. 3. La redondance des données est une caractéristique désirable pour croître l’autonomie des applications et la disponibilité du système (fiabilité) du système en cas de panne. 4. Un plan d’accès réparti peut être écrit par un programmeur ou produit automatiquement par un optimiseur. La conception d’un optimiseur est un problème qui peut être subdivisé en deux catégories. a) L’optimisation globale : qui consiste à déterminer les données à mettre dans les sites, et celles qu’il faut transmettre entre les sites. b) L’optimisation locale : qui consiste à décider comment développer les accès aux bases de données locales au niveau de chaque site. 5. Dans une base de données répartie, la confidentialité ou la protection des données est assurée par les administrateurs locaux. Les problèmes de sécurité sont intrinsèques aux systèmes répartis. 6. Un système de bases de données réparties ne doit être confondu avec un système multibase. Dans ce dernier cas, chaque utilisateur accède à différentes bases de données en spécifiant leur nom et adresse, et le système se comporte alors simplement comme un serveur de BD et n'apporte aucune fonctionnalité particulière à la répartition. Au contraire, un système de bases de données réparties est suffisamment complet pour décharger les utilisateurs de tous les problèmes de concurrence, fiabilité, optimisation de requêtes ou transaction sur des données gérées par différents SGBD sur plusieurs sites. III.3 PRINCIPES D’UNE BASE DE DONNEES REPARTIE Le principe fondamental des BDR est la transparence pour l'utilisateur. Cette transparence s'exprime sous trois formes : a) Principe de transparence de localisation : Les utilisateurs accèdent à la BD soit directement par le schéma conceptuel soit indirectement au travers de vues externes (Figure ci-dessus). Mais en aucun cas ils n'ont les moyens d'accéder aux schémas locaux ni de préciser le site. C'est le système qui recherche le site où sont mémorisées les informations de l’utilisateur et non l'utilisateur qui doit l'indiquer. b) Le principe de transparence de partitionnement De même, les utilisateurs n'ont pas à connaître les partitionnements de la base de données. Les utilisateurs ne doivent pas savoir si telle information est fractionnée, et ne doivent donc pas se préoccuper de la réunifier. C'est le système qui gère les partitionnements et les modifie en fonction de ses besoins, et c'est donc lui qui doit rechercher toutes les partitions et les intégrer en une seule information logique présentée à l'utilisateur. c) Le principe de transparence de duplication Enfin, les utilisateurs n'ont pas à savoir si plusieurs copies d'une même information sont disponibles. La conséquence directe est que lors de la modification d'une information, c'est le système qui doit se préoccuper de mettre à jour toutes les copies. Dans une BDR, les sites ne sont donc pas autonomes, bien que chaque site possède une machine (serveur) avec un SGBD et une partie de la base de données, et pourraient effectuer certains traitements localement. En effet, les utilisateurs accèdent aux données par l'intermédiaire du schéma conceptuel global et non par l'intermédiaire du schéma d'un site, et c'est uniquement le système qui désigne le ou les sites qui sont concernés par la demande de l'utilisateur. L'indépendance physique, assurée dans les bases de données traditionnelles, est donc conservée dans les BD réparties. III.4 NIVEAU DE REPARTITION La répartition d'une base de donnée intervient dans les trois niveaux de son architecture, en plus de la répartition physique des données : 1. Niveau externe : Les vues (schémas externes) sont distribuées aux utilisateurs sur leurs sites, les sites utilisateurs. 2. Niveau conceptuel :Le schéma conceptuel des données (schéma logique) est associé, par l'intermédiaire du schéma de répartition (lui-même décomposé en un schéma de fragmentation et un schéma d'allocation) aux schémas locaux qui sont réparties sur plusieurs sites, les sites physiques. 3. Niveau interne : Le schéma interne global n'a pas d'existence réelle mais fait place à des schémas internes locaux répartis sur différents sites (en principe les sites d'accueil des schémas logiques répartis). Architecture de schémas d'une BDR Tous les niveaux doivent être concernés par la répartition pour que l'on puisse parler d'une vrai BD répartie. Sinon on n'a affaire qu'à des clients éloignés (répartition externe) ou à un stockage physique multi machines ( répartition interne). On doit aussi remarquer que la distribution de la base de donnée se fait plus ou moins conformément à la répartition logique des utilisateurs et à la répartition physique des moyens informatiques. III.5. DIFFERENTS NIVEAUX DE TRANSPARENCE DE LA REPARTITION Définition : La transparence de répartition est l’indépendance du programme d’application à la répartition des données ; elle est équivalente, conceptuellement, à l’indépendance des données dans les bases de données centralisées. Il existe plusieurs niveaux de transparence de répartition : 1. Transparence globale : La transparence globale définit toutes les données qui sont contenues dans la base de donnée répartie comme si la base de donnée n’était pas répartie. Pour cette raison, la transparence globale peut être définie comme une base de donnée non répartie. Le modèle de données qui est utilisé pour la définition d’une transparence globale doit être commode pour la définition de la présentation des autres niveaux de la base de donnée répartie. Si on utilise le modèle relationnel, la transparence globale consistera en la définition d’un ensemble de relations globales. 2. Transparence de fragmentation : Chaque relation globale peut être répartie en plusieurs portions (disjointes) appelées fragments. La fonction entre les relations globales et les fragments est définie par la transparence de fragmentation. Cette fonction est multivaluée, c'est-à-dire plusieurs fragments correspondent à une relation globale, mais une seule relation globale correspond à un seul fragment. Les fragments sont indiqués par un nom de relation globale et un indice de fragment, par exemple : Ri indique le deuxième fragment de la relation globale R. 3. Transparence d’allocation : Les fragments sont des portions logiques des relations globales qui sont physiquement situés dans un ou plusieurs sites du réseau. La transparence d’allocation définit dans quel(s) site(s) est situé un fragment. Le type de relation défini dans la transparence d’allocation définit si la base de donnée répartie est redondante ou non. Tous les fragments qui correspondent à la même relation globale et qui sont situés dans le même site j constituent l’image physique de la relation globale R dans le site j. Les images physiques peuvent être indiquées par un nom de relation et un indice de site. Pour les distinguer des fragments, nous utilisons la notation Rj qui indique l’image physique de la relation globale R dans le site. Le schéma ci-après représente les fragments et les images physiques pour une relation globale. Les fragments et les images physiques pour une relation globale Dans ce schéma, une relation R est divisée en 4 fragments R1, R2, R3, R4. Ces fragments sont dupliqués dans les 3 sites d’un réseau informatique. Ainsi sont construites les images physiques R1, R2, R3. Une copie d’un fragment dans le site donné sera noté en utilisant le nom d’une relation globale et 2 indices (Un indice de fragment et un indice de site). Par exemple la notation R32 indique la copie d’un fragment R2 situé dans le site 3. Deux images physiques peuvent être identiques. Dans ces conditions, on dira qu’une image physique est une copie d’une autre image physique. R1 est une copie de R2. NB : Les trois niveaux ci-dessus sont indépendants des sites. Donc ils ne dépendent pas des modèles de données des SGBD locaux. 4. Transparence conceptuelle locale : A ce niveau il est nécessaire qu’il y ait une fonction qui associe chaque image physique aux objets qui sont manipulés par les SGBD locaux. Cette transparence dépend du type de SGBD local. Les caractéristiques de cette architecture sont : - La séparation des fragmentations et d’allocation des données. - Le contrôle de la redondance et l’indépendance vis-à-vis des SGBD locaux. III.6 INCONVENIENTS DES BASES DE DONNEES REPARTIES 1. Complexité : Un SGBD distribué qui masque sa nature répartie aux yeux des utilisateurs et fournit un niveau acceptable de performances, de uploads/Philosophie/bases-de-donnees.pdf

  • 23
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager