Remerciez-le!

Remerciez @Admin pour avoir partagé cet document gratuitement, de la manière la plus simple, en partageant sur les réseaux sociaux.

Page 1 Architecture des Serveurs : Architecture des Serveurs : Architecture des

Page 1 Architecture des Serveurs : Architecture des Serveurs : Architecture des Serveurs : Architecture des Serveurs : Évolution des technologies Évolution des technologies Évolution des technologies Évolution des technologies René J. Chevance Octobre 2001 Page 2 © RJ Chevance Contenu Revue des besoins Transactionnel et décisionnel - Web Introduction aux options d’architecture Évolution des technologies - Matériel Semi-conducteurs et microprocesseurs Notions de hiérarchie de mémoire Notions de parallélisme Compatibilité binaire - Java Entrées-sorties PCI, SCSI et Fibre Channel Nouvelles architectures d ’entrées-sorties (InfiniBand) Stockage des données SAN et NAS RAID Communications Évolution des technologies - Logiciel Mémoire virtuelle Architecture 64 bits Systèmes d’exploitation Client/serveur Middleware Quelques considérations économiques Évolution de la structure de l’industrie Perspectives concernant la technologie Page 2 Page 3 © RJ Chevance Revue des besoins Disponibilité de packages d'application et d'outils Intégrité des données Disponibilité du serveur Sécurité Performance Scalabilité (capacité de traitement, de stockage, de communication) Prix (coût de possession et d'opération - TCO Total Cost of Ownership) Support du Client/Serveur Maturité de l’architecture Pérennité des investissements Page 4 © RJ Chevance Transactionnel et décisionnel Partage: en Lecture et Écriture par l’ensemble des utilisateurs Propriétés ACID Flux de requêtes irrégulier Travail répétitif Répertoire de fonctions pré-défini typiquement O(100) fonctions Fonctions simples Fonctions peu complexes (typiquement de 105 à 107 instructions et 10 E/S) Possibilité de traitement de type batch (avec respect des propriétés ACID) Grand nombre de terminaux (1000-10000) Clients intelligents (stations, PC, autres systèmes, terminaux) Partage base de données en lecture (essentiellement) base spécifique (≠ ≠ ≠ ≠ base de production) bases spécialisées (Datamarts) Flux de requêtes irrégulier Travail non répétitif Pas de répertoire de fonctions pré- défini ❏ Fonctions complexes Requêtes souvent complexes mettant en jeu de grands volumes de données Batch pour requêtes longues Petit nombre de stations de travail Clients intelligents (stations, PC) Caractérisation du transactionnel (OLTP - On Line Transaction Processing) et du décisionnel (DSS - Decison Support Systems) Systèmes Transactionnels Systèmes d'aide à la décision Page 3 Page 5 © RJ Chevance Transactionnel et décisionnel (2) Systèmes d'aide à la décision Systèmes Transactionnels Haute disponibilité requise Recouvrement effectué par le système Fondé sur les propriétés ACID Taille des bases de données Proportionnelle à l'activité de la Société Peu de données "touchées" par une transaction Équilibrage de charge automatique Recherche de la performance au moyen du parallélisme inter-requête Performance : haut débit et temps de réponse garanti Scalabilité : exigence typique La haute disponibilité n'est pas une exigence typique Le temps de génération/régénération de la base est un paramètre important Taille des bases de données Proportionnelle à l'histoire de la Société Beaucoup de données "touchées" par une requête Pas d'équilibrage de charge automatique Recherche de la performance au moyen du parallélisme intra-requête Performance : recherche de temps de réponse courts Scalabilité : exigence typique Page 6 © RJ Chevance Caractéristiques du Web Les utilisations des sites Web se rangent dans deux grandes catégories non-exclusives : Serveurs de documents avec des procédures de recherche et de navigation particulières (moteurs de recherche, liens) Serveur transactionnel pour l ’enregistrement de commandes (e-commerce) Note : Une opération commerciale est précédée d’une ou plusieurs phases de recherche d’information Différentes études ont permis de mettre en évidence les caractéristiques des sites : Martin F Arlitt, Carrey L Williamson " Web Server Workload Characterization : The Search for Invariants " Department of Computer Science University of Saskatchewan March 1996 James E Pitkow « Summary of WWW Characterizations » Xerox Palo Alto Research Center 1998 Daniel A Menascé et al. « In Search of Invariants for E- Business Workloads » Proc. Second ACM Conference on Electronic Commerce, Minneapolis MN, October 17-20, 2000 Page 4 Page 7 © RJ Chevance Caractéristiques du Web(2) Invariants de Arlitt/Williamson 1996 Dérivés de l’observation de 6 sites Web Invariant Nom Description 1 Taux de succès Le taux de succès pour les accès sur le serveur est ≈ 88% 2 Types de fichiers 90 à 100% des requêtes pour des fichiers HTML et des images 3 Taille moyenne des transferts Taille moyenne des transferts <= 21 Ko 4 Requêtes distinctes Moins de 3% des requêtes sont relatives à des fichiers distincts 5 Références uniques Environ un tiers des fichiers et des octets accédés ne le sont qu’une seule fois 6 Distribution des tailles de fichiers La distribution des tailles des fichiers accédés est une loi de Pareto avec 0,40<k<0,63 7 Concentration des références 10% des fichiers accédés représentent 90% des requêtes au serveur et 90% des octets transférés 8 Intervalles entre références Les intervalles entre références (à des documents distincts) suivent une distribution exponentielle et sont indépendants 9 Requêtes provenant de sites distants ≥70% des accès au serveur proviennent de sites distants et ≥60% des octets transférés le sont vers des sites distants 10 Distribution géographique Les serveurs Web sont accédés par des milliers de domaines mais 10% des domaines comptent pour ≥75% des utilisations Page 8 © RJ Chevance Caractéristiques du Web(3) Synthèse de Pitkow 1998 Synthèse des mesures publiées Numéro Caractéristique Description 1 Popularité des fichiers accédés Distribution de Zipf avec a = 1 2 Taux de ré- occurrence des références Environ 50% des fichiers sont requis plus d’une fois par le même client. La probabilité de re-référence dans les t minutes étant proportionnelle à log(t) 3 Taille des fichiers Loi de Pareto avec une taille moyenne de 4 à 6 Ko (médiane 2 Ko) pour HTML, taille moyenne des images de 14 Ko 4 Trafic Les images de petite taille représentent la majorité du trafic et la taille des documents est inversement proportionnelle à la fréquence des requêtes 5 Trafic HTTP auto- similaire Trafic avec pics, auto-similaire entre les domaines allant de la seconde à la minute 6 Caractère périodique du trafic HTTP Le caractère périodique du trafic peut être représenté par des séries portant sur des domaines allant de l’heure à la semaine 7 Popularité des sites 25% des serveurs représentent 85% du trafic 8 Durée de vie des documents Environ 50 jours, les fichiers HTML étant modifiés et supprimés plus fréquemment que les autres types de fichiers 9 Taux d’occurrence de liens brisés durant le surf De 5 à 8% de l’ensemble des fichiers requis 10 Taux d’occurrence des redirections De 13 à 19% de l’ensemble des fichiers requis 11 Nombre de visites à une page Distribution gaussienne inverse avec une moyenne de 3, une déviation standard de 9 et un mode de 1 12 Temps de lecture par page Distribution avec une moyenne de 30, une médiane de 7 et une déviation standard de 100 secondes Page 5 Page 9 © RJ Chevance Caractéristiques du Web(4) Invariants e-commerce de Menascé/Almeida 2000 Étude de deux sites de e-commerce : Vente d’ouvrages (uniquement par e-commerce) Vente aux enchères de noms de domaines Internet Résultats : La plupart des sessions durent moins de 1 000 secondes Plus de 70% des fonctions exécutées sont relatives à la sélection des produits Le nombre d’accès à un document suit une distribution de Zipf en relation avec la popularité du document (représentée par son rang r). Nombre d’accès au document de rang r : N = k / r (où k est une constante positive) Il existe une très forte corrélation dans l’arrivée des requêtes : longues séquences de variations à la hausse et à la baisse caractère auto-similaire Au moins 16% des requêtes sont engendrées par des agents (robots) 88% des sessions ont moins de 10 requêtes La longueur des sessions, mesurée en nombre de requêtes, est une distribution à queue importante « heavy tailed » (si la valeur moyenne est faible, des valeurs très grandes sont possibles bien que peu probables), tout particulièrement pour les sites recevant des requêtes engendrées par des agents Page 10 © RJ Chevance Rappel : Loi de Zipf Loi de Zipf Le linguiste George Kingsley Zipf, professeur à l’Université de Harvard (1902-1950), s’est intéressé à l’utilisation des mots de la langue anglaise. Il a dérivé une loi qui relie leur popularité et leur fréquence d’utilisation. Dans le cas d ’un site Web, si l ’on classe les documents en fonction de leur popularité désignée par r (i.e. leur rang en fonction du nombre de fois qu’ils sont requis), le nombre de références, désigné par N, au document est exprimé par la loi : N = k/r où k >0 Exemple de loi de Zipf (Source Mesnacé/Almeida) 0 100 200 300 400 500 uploads/Finance/ architecture-des-serveurs-technologies.pdf