Page 1 Architecture des Serveurs : Architecture des Serveurs : Architecture des

Page 1 Architecture des Serveurs : Architecture des Serveurs : Architecture des Serveurs : Architecture des Serveurs : Évolution des technologies Évolution des technologies Évolution des technologies Évolution des technologies René J. Chevance Octobre 2001 Page 2 © RJ Chevance Contenu  Revue des besoins  Transactionnel et décisionnel - Web  Introduction aux options d’architecture  Évolution des technologies - Matériel  Semi-conducteurs et microprocesseurs  Notions de hiérarchie de mémoire  Notions de parallélisme  Compatibilité binaire - Java  Entrées-sorties  PCI, SCSI et Fibre Channel  Nouvelles architectures d ’entrées-sorties (InfiniBand)  Stockage des données  SAN et NAS  RAID  Communications  Évolution des technologies - Logiciel  Mémoire virtuelle  Architecture 64 bits  Systèmes d’exploitation  Client/serveur  Middleware  Quelques considérations économiques  Évolution de la structure de l’industrie  Perspectives concernant la technologie Page 2 Page 3 © RJ Chevance Revue des besoins  Disponibilité de packages d'application et d'outils  Intégrité des données  Disponibilité du serveur  Sécurité  Performance  Scalabilité (capacité de traitement, de stockage, de communication)  Prix (coût de possession et d'opération - TCO Total Cost of Ownership)  Support du Client/Serveur  Maturité de l’architecture  Pérennité des investissements Page 4 © RJ Chevance Transactionnel et décisionnel  Partage:  en Lecture et Écriture  par l’ensemble des utilisateurs  Propriétés ACID  Flux de requêtes irrégulier  Travail répétitif  Répertoire de fonctions pré-défini typiquement O(100) fonctions  Fonctions simples  Fonctions peu complexes (typiquement de 105 à 107 instructions et 10 E/S)  Possibilité de traitement de type batch (avec respect des propriétés ACID)  Grand nombre de terminaux (1000-10000)  Clients intelligents (stations, PC, autres systèmes, terminaux)  Partage base de données  en lecture (essentiellement)  base spécifique (≠ ≠ ≠ ≠ base de production)  bases spécialisées (Datamarts)  Flux de requêtes irrégulier  Travail non répétitif  Pas de répertoire de fonctions pré- défini ❏ Fonctions complexes  Requêtes souvent complexes mettant en jeu de grands volumes de données  Batch pour requêtes longues  Petit nombre de stations de travail  Clients intelligents (stations, PC) Caractérisation du transactionnel (OLTP - On Line Transaction Processing) et du décisionnel (DSS - Decison Support Systems) Systèmes Transactionnels Systèmes d'aide à la décision Page 3 Page 5 © RJ Chevance Transactionnel et décisionnel (2) Systèmes d'aide à la décision Systèmes Transactionnels  Haute disponibilité requise  Recouvrement effectué par le système  Fondé sur les propriétés ACID  Taille des bases de données  Proportionnelle à l'activité de la Société  Peu de données "touchées" par une transaction  Équilibrage de charge automatique  Recherche de la performance au moyen du parallélisme inter-requête  Performance : haut débit et temps de réponse garanti  Scalabilité : exigence typique  La haute disponibilité n'est pas une exigence typique  Le temps de génération/régénération de la base est un paramètre important  Taille des bases de données  Proportionnelle à l'histoire de la Société  Beaucoup de données "touchées" par une requête  Pas d'équilibrage de charge automatique  Recherche de la performance au moyen du parallélisme intra-requête  Performance : recherche de temps de réponse courts  Scalabilité : exigence typique Page 6 © RJ Chevance Caractéristiques du Web  Les utilisations des sites Web se rangent dans deux grandes catégories non-exclusives :  Serveurs de documents avec des procédures de recherche et de navigation particulières (moteurs de recherche, liens)  Serveur transactionnel pour l ’enregistrement de commandes (e-commerce)  Note : Une opération commerciale est précédée d’une ou plusieurs phases de recherche d’information  Différentes études ont permis de mettre en évidence les caractéristiques des sites :  Martin F Arlitt, Carrey L Williamson " Web Server Workload Characterization : The Search for Invariants " Department of Computer Science University of Saskatchewan March 1996  James E Pitkow « Summary of WWW Characterizations » Xerox Palo Alto Research Center 1998  Daniel A Menascé et al. « In Search of Invariants for E- Business Workloads » Proc. Second ACM Conference on Electronic Commerce, Minneapolis MN, October 17-20, 2000 Page 4 Page 7 © RJ Chevance Caractéristiques du Web(2)  Invariants de Arlitt/Williamson 1996  Dérivés de l’observation de 6 sites Web Invariant Nom Description 1 Taux de succès Le taux de succès pour les accès sur le serveur est ≈ 88% 2 Types de fichiers 90 à 100% des requêtes pour des fichiers HTML et des images 3 Taille moyenne des transferts Taille moyenne des transferts <= 21 Ko 4 Requêtes distinctes Moins de 3% des requêtes sont relatives à des fichiers distincts 5 Références uniques Environ un tiers des fichiers et des octets accédés ne le sont qu’une seule fois 6 Distribution des tailles de fichiers La distribution des tailles des fichiers accédés est une loi de Pareto avec 0,40<k<0,63 7 Concentration des références 10% des fichiers accédés représentent 90% des requêtes au serveur et 90% des octets transférés 8 Intervalles entre références Les intervalles entre références (à des documents distincts) suivent une distribution exponentielle et sont indépendants 9 Requêtes provenant de sites distants ≥70% des accès au serveur proviennent de sites distants et ≥60% des octets transférés le sont vers des sites distants 10 Distribution géographique Les serveurs Web sont accédés par des milliers de domaines mais 10% des domaines comptent pour ≥75% des utilisations Page 8 © RJ Chevance Caractéristiques du Web(3)  Synthèse de Pitkow 1998  Synthèse des mesures publiées Numéro Caractéristique Description 1 Popularité des fichiers accédés Distribution de Zipf avec a = 1 2 Taux de ré- occurrence des références Environ 50% des fichiers sont requis plus d’une fois par le même client. La probabilité de re-référence dans les t minutes étant proportionnelle à log(t) 3 Taille des fichiers Loi de Pareto avec une taille moyenne de 4 à 6 Ko (médiane 2 Ko) pour HTML, taille moyenne des images de 14 Ko 4 Trafic Les images de petite taille représentent la majorité du trafic et la taille des documents est inversement proportionnelle à la fréquence des requêtes 5 Trafic HTTP auto- similaire Trafic avec pics, auto-similaire entre les domaines allant de la seconde à la minute 6 Caractère périodique du trafic HTTP Le caractère périodique du trafic peut être représenté par des séries portant sur des domaines allant de l’heure à la semaine 7 Popularité des sites 25% des serveurs représentent 85% du trafic 8 Durée de vie des documents Environ 50 jours, les fichiers HTML étant modifiés et supprimés plus fréquemment que les autres types de fichiers 9 Taux d’occurrence de liens brisés durant le surf De 5 à 8% de l’ensemble des fichiers requis 10 Taux d’occurrence des redirections De 13 à 19% de l’ensemble des fichiers requis 11 Nombre de visites à une page Distribution gaussienne inverse avec une moyenne de 3, une déviation standard de 9 et un mode de 1 12 Temps de lecture par page Distribution avec une moyenne de 30, une médiane de 7 et une déviation standard de 100 secondes Page 5 Page 9 © RJ Chevance Caractéristiques du Web(4)  Invariants e-commerce de Menascé/Almeida 2000  Étude de deux sites de e-commerce :  Vente d’ouvrages (uniquement par e-commerce)  Vente aux enchères de noms de domaines Internet  Résultats :  La plupart des sessions durent moins de 1 000 secondes  Plus de 70% des fonctions exécutées sont relatives à la sélection des produits  Le nombre d’accès à un document suit une distribution de Zipf en relation avec la popularité du document (représentée par son rang r). Nombre d’accès au document de rang r :  N = k / r (où k est une constante positive)  Il existe une très forte corrélation dans l’arrivée des requêtes :  longues séquences de variations à la hausse et à la baisse  caractère auto-similaire  Au moins 16% des requêtes sont engendrées par des agents (robots)  88% des sessions ont moins de 10 requêtes  La longueur des sessions, mesurée en nombre de requêtes, est une distribution à queue importante « heavy tailed » (si la valeur moyenne est faible, des valeurs très grandes sont possibles bien que peu probables), tout particulièrement pour les sites recevant des requêtes engendrées par des agents Page 10 © RJ Chevance Rappel : Loi de Zipf  Loi de Zipf  Le linguiste George Kingsley Zipf, professeur à l’Université de Harvard (1902-1950), s’est intéressé à l’utilisation des mots de la langue anglaise. Il a dérivé une loi qui relie leur popularité et leur fréquence d’utilisation. Dans le cas d ’un site Web, si l ’on classe les documents en fonction de leur popularité désignée par r (i.e. leur rang en fonction du nombre de fois qu’ils sont requis), le nombre de références, désigné par N, au document est exprimé par la loi :  N = k/r où k >0 Exemple de loi de Zipf (Source Mesnacé/Almeida) 0 100 200 300 400 500 uploads/Finance/ architecture-des-serveurs-technologies.pdf

  • 70
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Dec 16, 2022
  • Catégorie Business / Finance
  • Langue French
  • Taille du fichier 1.5409MB